什么是诗词的韵律?
一、什么是诗词的韵律?
文学研究的数学方法 课程分享32
这是通识选修课《社会科学与数学》第二讲《文学与数学》的第五节,探讨文学研究中的数学方法。
第二讲 文学与数学
第五节 文学研究的数学方法
一、律诗和绝句的平仄格式的数学公式
律诗和绝句的平仄格式各有16种,可以用一个公式来表示,而且,只须知道第一句的平仄格式,就可以推出所有的平仄格式。格律诗是在字数、韵脚、声调、对仗各方面都有许多讲究的诗。它规定诗有定句,句有定字,字讲平仄,严格压韵,而且律诗的中两联要对仗等。格律诗对声律的要求极为严格。声律包括压韵和平仄,其中又以平仄最重要。(王谅儒的论文)
我认为对诗词而言,宁失对仗,勿破平仄。
未知是否有此说法,没找到出处。没有就是我的发现了。
例如,白居易的《长恨歌》。
《长恨歌》是中国唐朝诗人白居易的一首长篇叙事诗。这首诗是作者的名篇,作于公元806年(元和元年)。全诗形象地叙述了唐玄宗与杨贵妃的爱情悲剧。诗人借历史人物和传说,创造了一个回旋宛转的动人故事,并通过塑造的艺术形象,再现了现实生活的真实,感染了千百年来的读者。
……
在天愿作比翼鸟,在地愿为连理枝。
天长地久有时尽,此恨绵绵无绝期。
这是《长恨歌》的最后几句。如果保持对仗,“有时尽”应为“有尽时”,与“无绝期”对应,而这两句为了保平仄没有这样写,显然是为了保平仄而失对仗的结果。平平仄仄仄平仄,仄仄平平平仄平。古人吟诗像唱歌一样,一点都不能走调。
将律诗和绝句的平仄格式数学化,方法很简单,首先约定,用0代表平,用1代表仄。然后规定两种运算:把0变为1,或把1变为0,叫做取补运算,简称取补;把一句中最后一字与倒数的第3字的平仄对换,其余不变,叫做对换运算,简称对换。现举例说明如下。
例1.唐诗•李商隐《无题》无题 平仄格式 二进制数表示昨夜星辰昨夜风 仄仄平平仄仄平 1100110(第1句)画楼西畔桂堂东 平平仄仄仄平平 0011100(第2句)身无彩凤双飞翼 平平仄仄平平仄 0011001(第3句)心有灵犀一点通 仄仄平平仄仄平 1100110(第4句)隔座送钩春酒暖 仄仄平平平仄仄 1100011(第5句)分曹射覆蜡灯红 平平仄仄仄平平 0011100(第6句)嗟余听鼓应官去 平平仄仄平平仄 0011001(第7句)走马兰台类转蓬 仄仄平平仄仄平 1100110(第8句)例2.唐诗•杜甫《闻官兵收河南河北》闻官兵收河南河北 平仄格式 二进制数表示剑外忽传收蓟北 仄仄平平平仄仄 1100011(第1句)初闻涕泪满衣裳 平平仄仄仄平平 0011100(第2句)却看妻子愁何在 平平仄仄平平仄 0011001(第3句)漫卷诗书喜若狂 仄仄平平仄仄平 1100110(第4句)白日放歌须纵酒 仄仄平平平仄仄 1100011(第5句)青春作伴好还乡 平平仄仄仄平平 0011100(第6句)即从巴峡穿巫峡 平平仄仄平平仄 0011001(第7句)便下襄阳向洛阳 仄仄平平仄仄平 1100110(第8句)
诗中第一句和第二句的最后一字有相同韵,就把第一句叫做入韵。第一句和第二句的最后一字有不同韵,就把第一句叫做不入韵。例1的第一句入韵,例2的第一句不入韵。
设A1、A2、 A3 、A4、 A5、 A6、 A7、 A8分别表示第1、2、3、4、5、6、7、8句平仄格式的二进制数。第一句A1只有四个值:{0011001,1100110;0011100,1100011},其中0011001与1100110互补;0011100与1100011互补,因此,只需记住0011001、0011100和取补运算,也就记住了第一句A1的四个值。
律诗和绝句的各种平仄格式可以用的统一的数学公式表示如下:A1(入) A1(不入) A2 A3 A4 A5 A6 A7 A8● 对换 ● 取补 ● 对换 ● 取补 ● 对换 ● 取补 ● 对换 ● 取补 ●公式的用法:①第一句A1的值,可以作为A1(入)或是A1(不入)的值,按箭头指示方向依次进行对换取补运算。②当从A1(入)开始计算时,必须经过A1(不入),切不可由A1(入)直接计算出A2。③当从A1(不入)开始计算时,则A1(入)可以略去不计。④去掉七言A1的值最左边的两个数字,即为五言第一句A1的值,公式依然成立。⑤按“对换-取补”循环,可进行任意次数运算。
二、计算风格学
语体风格是人们在语言表达活动中的个人言语特征,是人格在语言活动中的某种体现。这种风格可在一定程度上通过数量特征来刻画。计算风格学就是通过量化的方法反映语体或作家风格的研究。
能够区别文学作品的特征主要有:用词、句式、修辞手法、中心意象、主题等等。但是能用于统计的特征有语音、字、词、句子、段落,语篇结构等等可以量化考察的信息。因此它反映的不是作者想表现的内容,而是作者行文中不经意间体现出的用词造句习惯。
最常用的方法是字、词频率统计。
句长是句子中的单词数,词长是词中的音节数,反映作者风格的不是单个词的词长和单个句子的句长,而是以一定数量的语料为基础的平均句长和平均词长。
平均词长M=语料中音节总数L/单词总数N
平均句长=语料中音节总数L/句子总数N
此外还有作者在同义词使用中的倾向性,是值得利用但较困难的。
计算风格学可用来解决“作者考证”的问题。当然,由于没有严格的可行性标准,操作要十分谨慎。
例1.《红楼梦》作者研究
我们知道,学界的主流观点是,《红楼梦》后四十回并非出自原作者曹雪芹之手。下面让我们通过一系列的研究来看计算风格学是如何考证《红楼梦》作者的统一性的。
1970年,赵冈提出了使用“的”、“了”、“在”、“几”、“着”5个字的出现频率来研究《红楼梦》的作者问题,得出了前80回和后40回出自不同人之手的结论。
陈炳藻教授的研究:
1980年,在威斯康辛大学举办的首届国际《红楼梦》研讨会上 ,陈炳藻发表《从词汇上的统计论〈红楼梦〉的作者问题》一文。
1986年,陈炳藻教授公开发表了《电脑在文学上的应用:〈红楼梦〉与〈儿女英雄传〉两书作者用词的比较》一文;之后又出版了《电脑红学:论〈红楼梦〉作者》的专著。
陈炳藻将《红楼梦》一百二十回本按顺序编成三组,每组四十回。并将《儿女英雄传》作为第四组进行比较研究。
从每组中任取八万字,分别挑出名词、动词、形容词、副词、虚词这五种词,通过计算机程序对这些词进行编排、统计、比较和处理,进而找出各组相关程度。
结果发现《红楼梦》前八十回与后四十回所用的词汇正相关程度达78.57%,而《红楼梦》与《儿女英雄传》所用词的正相关程度是32.14%。由此推断得出前八十回与后四十回的作者均为曹雪芹一人的结论。
张卫东、刘丽川的反驳:
深圳大学学报(人文社会科学版)1986年 01期 发表了《〈红楼梦〉前八十回与后四十回语言风格差异初探》一文。利用某些用字、用词及回尾处理等差异做了比较研究。
(一)、在录入文本时使用了GB2312汉字编码体系。在GB2312的6763个汉字以外,还有240个汉字,这其中只有10个字同时出现在前后两部分。其中210字只出现在前80回,20字只出现在后40回。而重要的是,有些字并非只出现了一次。
1、有些脏字在前80回多次出现,且为日常骂人话,然而在后40回根本没有出现。
2、���、嗐、搳 (空白字可能不雅,所以未明写,下同)
“���”通“嘻”,前80回混用,后四十回统一为“嘻”
“嗐”与“咳”,前80回混用,后40回只用“嗳”
“搳”是“划(拳)”的异体字,前80回用“划”,后40回用“搳”
(二)、每一回结尾的格式
前八十回大致有五种
1.要知端的(端详),(且听)下回分解。
2.正是—— (或者后跟一联韵文)
3.自然终止行文
4.不知……,((且听)下回分解。)
(……),(且听)下回分解。
5.后(下)回再(便)见
后四十回基本都是“未知(不知、要知、欲知)……(如何),(且听)下回分解。”
因此前后两部分并非一人所作。
李贤平的进展:
1987李贤平发表了《〈红楼梦〉成书新说》作者选择了四十七个虚字的出现频率,有时还用到句长分布。
(1)十三个文言虚字:之、其、或、亦、方、于、即、皆、因、仍、故、尚、乃
(2)九个句尾虚字:呀、吗、咧、罢咧、啊、罢、罢了、么、呢。
(3)十三个常用的白话虚字:了、的、着、一、不、把、让、向、往、是、在、别、好。 (4)十个表示转折、程度、比较等意的虚字:可、便、就、但、越、再、更、比、很、偏。
(5)后缀于名词的“儿”字和后缀于副词、形容词和动词的“儿”字。
李贤平采用了各种统计分析方法(主要有主成份分析,典型相关分析,多维尺度法,广义线性模型,类卡方距离与相关系数等等) ,利用以上信息,推断出结论:
《红楼梦》前八十回是曹雪芹据《石头记》增删而成,其中插入他早年著的《金瓶梅》式小说《风月宝鉴》,并增写了具有深刻内涵的许多内容。
《红楼梦》后四十回是曹家亲友在曹雪芹全书尚未完成就突然去世之后,搜集整理原稿并加工补写而成。程伟元将全稿以活字版印刷刊行。高鹗校勘异文补遗订讹。
1)聚类分析方法
所谓聚类分析,就是按照某种量化标准,将样本数据进行分类。举个很通俗的例子,对某一人群进行抽样调查,分别抽取100个男性和女性,记录其身高和体重数据,这样共获得200个样本。将200个样本的性别标签去掉,混合在一起,对这200组数据进行聚类分析,如果方法得当的话,这200组数据应该聚集为两类,一类为男性,另一类为女性。基本思想:我们所研究的样品(网点)或指标(变量)之间存在程度不同的相似性(亲疏关系——以样品间距离衡量)。于是根据一批样品的多个观测指标,具体找出一些能够度量样品或指标之间相似程度的统计量,以这些统计量为划分类型的依据。把一些相似程度较大的样品(或指标)聚合为一类,把另外一些彼此之间相似程度较大的样品(或指标)又聚合为另一类,直到把所有的样品(或指标)聚合完毕,这就是分类的基本思想。
为了进行聚类分析,首先需要定义样品间的距离。 常见的距离有 : ① 绝对值距离 ② 欧氏距离 ③ 明科夫斯基距离 ④ 切比雪夫距离
常用的几种聚类方法:
(1)直接聚类法
先把各个分类对象单独视为一类,然后根据距离最小的原则,依次选出一对分类对象,并成新类。如果其中一个分类对象已归于一类,则把另一个也归入该类;如果一对分类对象正好属于已归的两类,则把这两类并为一类。每一次归并,都划去该对象所在的列与列序相同的行。经过m-1次就可以把全部分类对象归为一类,这样就可以根据归并的先后顺序作出聚类谱系图。
(2)最短距离聚类法
最短距离聚类法,是在原来的m×m距离矩阵的非对角元素中找出 ,把分类对象Gp和Gq归并为一新类Gr,然后按计算公式 计算原来各类与新类之间的距离,这样就得到一个新的(m-1)阶的距离矩阵;再从新的距离矩阵中选出最小者dij,把Gi和Gj归并成新类;再计算各类与新类的距离,这样一直下去,直至各分类对象被归为一类为止。
(3)最远距离聚类法
最远距离聚类法与最短距离聚类法的区别在于计算原来的类与新类距离时采用的公式不同。最远距离聚类法所用的是最远距离来衡量样本之间的距离。
2)相关分析方法相关系数r的定义与说明。相关系数是变量之间相关程度的指标。样本相关
系数用r表示,总体相关系数用ρ表示,相关系数的取值范围为[-1,1]。|r|值越大,误差Q越小,变量之间的线性相关程度越高;|r|值越接近0,Q越大,变量之间的线性相关程度越低。
相关系数,又称皮(尔生)氏积矩相关系数,说明两个现象之间相关关系密切程度的统计分析指标。
相关系数用希腊字母γ表示,γ值的范围在-1和+1之间。
γ>0为正相关,γ<0为负相关。γ=0表示不相关;
γ的绝对值越大,相关程度越高。
两个现象之间的相关程度,一般划分为四级:
如两者呈正相关,r呈正值,r=1时为完全正相关;如两者呈负相关则r呈负值,而r=-1时为完全负相关。完全正相关或负相关时,所有图点都在直线回归线上;点子的分布在直线回归线上下越离散,r的绝对值越小。当例数相等时,相关系数的绝对值越接近1,相关越密切;越接近于0,相关越不密切。当r=0时,说明X和Y两个变量之间无直线关系。通常|r|大于0.8时,认为两个变量有很强的线性相关性。
相关矩阵(Correlation Matrix)
定义
相关矩阵也叫相关系数矩阵,是由矩阵各列间的相关系数构成的。也就是说,相关矩阵第i行第j列的元素是原矩阵第i列和第j列的相关系数。
性质
相关矩阵的对角元素是1。
相关矩阵是对称矩阵。
例2.《静静的顿河》是不是抄袭?
长篇小说《静静的顿河》是一部既磅礴壮观又委婉细腻、扣人心弦的史诗性长篇小说,是当代世界文学中流传最广泛、读者最多的名著之一。他的作者肖洛霍夫因此获得1965年诺贝尔文学奖。但小说出版后即有人说这本书是肖洛霍夫从一位名不见经传的哥萨克作家克留柯夫那里抄袭来的。
俄国流亡在国外的一些作家如索尔仁尼琴、麦德维杰等,认为《静静的顿河》的大部份内容是抄袭哥萨克作家克留科夫的作品,理由是该书第一卷出版时,肖洛霍夫年纪尚轻,并无生活经历;另外,他以后未能写出具有同样文学价值的作品。肖洛霍夫充其量是合作者罢了。
为了弄清楚谁是《静静的顿河》的真正作者,捷泽等学者采用计算风格学的方法进行考证。具体办法是把《静静的顿河》四卷本同肖洛霍夫、克留柯夫这两人的其他在作者问题上没有疑问的作品都用计算机进行分析,获得可靠的数据,并加以比较,以期澄清疑问,得出谁是真正作者的结论。
捷泽等学者从〈静静的顿河》中随机地挑选出2000个句子,再从肖洛霍夫、克留柯夫的各一篇小说中随机地挑先500个句子,总共3组样本,3000个句子,输入计算机进行处理。
根据6个方面的统计结果与分析,捷泽等人已可以下结论:《静静的顿河》的真正作者是肖洛霍夫。然而,捷泽等人对于这样一部世界名著,这样一个世界文学界的重大疑案,采取了十分谨慎的态度,为了精益求精,他们在更大规模基础上进行研究,最终确定《静静的顿河》确实是肖洛霍夫的作品,他在写作时或许参考过克留柯夫的手稿。后来,原苏联文学研究者从另外一些方面又进一步证实了肖洛霍夫是《静静的顿河》的真正作者。
米哈依尔·肖洛霍夫(M.A.Sholokhov)(1905-1984),是二十世纪苏联文学的杰出代表,也是我国读者十分熟悉且至今仍给予特殊关注的作家。这不仅仅因为他给世界人民留下了《静静的顿河》、《新垦地》(旧译《被开垦的处女地》)、《一个人的遭遇》等珍贵的文学遗产,还因为他一生的创作和文学活动与我国文化事业的发展始终存在着或直接或间接的联系,并产生了一定影响。
计算风格学不仅能考证作者,还作者一个清白,在更广阔的范围内,通过对不同时期的文学家作品的统计计算,还可以反映一个时代的文化风格变迁。曾有人对20位德语作者的22部著作的平均词长和平均句长进行过计算,从而发现了德语书面语言的句子有变短的趋势。
现在用电脑通过数据处理分析的文学作品越来越多。日本有两位作者多久正和安本美典大量应用频谱分析来研究各种文学作品,最后竟然达到这样的程度:随便拿一篇文章来,不用讲明作者,也可以知道作者是谁,就像法医根据指纹抓犯人一样,准确无误!
我们再来看两个“作者考证”的例子:
例3.出现于16世纪90年代的一部五幕剧《爱德华三世》,表现了14世纪英王爱德华三世统治时期勇武的骑士精神。但该剧作者究竟是谁,戏剧界争论了几百年。不久前,通过电脑对该剧的语言风格进行分析,莎翁作品的权威机构——阿顿公司正式确认,《爱德华三世》是莎士比亚的一部早期作品。莎剧专家说,这部作品本身所表现出的深刻人性、博大精神和文辞语言的华丽无可辩驳地“用莎士比亚自己的声音”证明了它的来源。
例4.1964年,美国统计学家摩斯泰勒和瑕莱斯考证了12篇署名“联邦主义者”的文章作者,可能的作者是两个人,一个是美国开国政治家汉密尔顿,另一位是美国第四任总统麦迪逊。究竟是哪一位呢?统计学家在进行分析时发现汉密尔顿和麦迪逊在已有著作中的平均句长几乎完全相同。这使得这一能反映写作风格特征的数据此时失效了。于是,统计学家转而从用词习惯上来找出这两位作者的有区别性的风格特征,而且终于找到了两位作者在虚词的使用上有明显的不同。
汉密尔顿他已有的18篇文章中,有14篇使用了“enough”一词;而麦迪逊在他的14篇文章中根本未使用“enough”一词。汉密尔顿喜欢用“while”,而麦迪逊总是用“whilst”。汉密尔顿喜欢用“upon”,而麦迪逊很少用。然后,再把两位可能的作者的上述风格特征指标,与未知的12篇署名“联邦主义者”的文章中表现出来的相应的风格特征进行比较。结果发现那位署名“联邦主义者”的作者就是美国第四任总统麦迪逊。这样就了结了这一考据学上长期悬而未决的公案。两位统计学家所使用的数学方法也得到了学术界的好评。
二、诗词的韵律怎么分别?
简单的说,诗词分平仄相对的格律和各行末字的押韵,这是到唐朝以后才严谨起来的,以前的古体诗并不要求平仄、押韵、对仗等。
唐代的诗词格式已经有了定式,不管是五绝五律还是七绝七律,一般都是押平水韵,也就是诗词结尾的字都要在一个韵部里、诗的韵一般是压平韵,词有仄韵,这个具体可以查看平水韵啦。
三、什么是诗词的韵律?
古诗词韵律,是指韵是诗词格律的基本要素之一。诗人在诗词中用韵,叫做押韵。从《诗经》到后代的诗词,差不多没有不押韵的,民歌也没有不押韵的。
韵是诗词格律的基本要素之一。诗人在诗词中用韵,叫做押 韵。所谓韵部,就是将相同韵母的字归纳到一类,这种类别即为 韵部。
句子押韵,不仅便于吟诵和记忆,更使作品具有节 奏、声调谐和之美。一首诗有没有韵,一般人都能觉察得出来, 而要说明什么是韵却不那么简单。但是,今天我们有了汉语拼音字母,对于韵的概念还是容易说明的
四、诗词韵律入门?
(1),平仄正确。
因为古韵中有入声字,在使用时只要把这些入声字作为仄声字就行了。其实远非如此简单,还有很多非入声字,古今读音也有很大的区别,写诗词时要记住这些字。
(2),用韵正确。
对于用古韵来说,写诗用《平水韵》,写词用《词林正韵》,这是常识。写诗很容易错用邻韵,因为平水韵的邻韵很多。而用词林正韵因用邻韵而出错的机会就少得多了,词林正韵填词用韵较宽,仅第六部的真、文、元韵和第十三部的侵韵因韵母相同而容易混淆,第七部的元、寒、删、先韵和第十四部的覃、盐、咸韵也因韵母相同而容易混淆。初学者最有效的办法就是记住各韵部的字,在使用时稍加注意完全可以避免。
(3),句式正确。
写诗的句式比较简单,五言诗的基本句式是2-3,七言诗的基本句式是4-3,一般不会出错。
词句的字数变化较多,节奏变化也多,所以句式变化也较多
五、原创的诗词?
1、十年惟悟吟诗句,待得中原欲铸兵。——出自唐·崔涂《夏日书怀寄道友》
2、子胥既弃吴江上,屈原终投湘水滨。——出自唐·李白《行路难三首》
3、落日鸟边下,秋原人外闲。——出自唐·王维《登裴秀才迪小台》
4、灞原风雨定,晚见雁行频。——出自唐·马戴《灞上秋居》
5、白鹿原头回猎骑,紫云楼下醉江花。——出自唐·杜牧《长安杂题长句六首》
六、诗词的平仄韵律?
平仄,是中国诗词中用字的声调。“平”指平直,“仄”指曲折。根据隋朝至宋朝时期修订的韵书,如《切韵》《广韵》等,中古汉语有四种声调,称为平、上、去、入。除了平声,其余三种声调有变化,故统称为仄声。
诗词中平仄的运用有一定格式,称为格律。平声和仄声,代指由平仄构成的诗文的韵律。平仄是四声二元化的尝试。四声是古代汉语的四种声调。平仄是在四声基础上,用不完全归纳法归纳出来的,平指平直,仄指曲折。上声,去声,入声为仄,剩下了的是平声。
七、诗词的节奏、韵律统称什么?
你问的这个问题,是不是可以回答你:诗词的节奏、韵律统合起来是为词牌名?
节奏,大概有两种:一是音乐中长短不一的音符的组合。二是指有一定规律的进程,即自然、社会和人的活动中一种与韵律结伴而行的有规律的突变。
韵律,“韵”字本义是和谐悦耳的声音。“韵”,是诗词的基本要素之一,从《诗经》直到后代的诗词,几乎没有不押韵的。律,是指诗词中的平仄格式和押韵规则。引申为音响的节奏规律。韵和律合起来叫韵律。
你提的问题是问节奏、韵律,并没有提及粘、对、救拗(粘、对是律诗的基本要求),所以,是否可以理解为某种文学载体要求长短结合、抑扬顿挫的节奏,又要符合平仄、押韵的格式?如果是这个意思,那么,你提的问题,可能是想问词牌名吧。🙏
八、诗词平仄韵律?
这个问题就多了。还分平水韵和中华通韵。
九、诗词韵律表初学?
答曰:
初学诗词者确实要查韵律表,这个表叫做《平水韵》。当下全国诗词界均以《平水韵》为标准。边写边查表是初学者的必要途径。
十、节约的原创诗词?
1、《悯农二首 其一》唐代:李绅
因为:
春种一粒粟,秋收万颗子。
四海无闲田,农夫犹饿死。
译文:春天只要播下一粒种子,秋天就可收获很多粮食。普天之下,没有荒废不种的田地,劳苦农民,仍然要饿死。
2、《悯农二首 其二》唐代:李绅
原文:
锄禾日当午,汗滴禾下土。
谁知盘中餐,粒粒皆辛苦?
译文:盛夏中午,烈日炎炎,农民还在劳作,汗珠滴入泥土。有谁想到,我们碗中的米饭,粒粒饱含着农民的血汗?