当5万首《全唐诗》遇到大数据分析,惊现出来的秘密是你可能永远都想不到的

2018-07-17信息快讯网

当5万首《全唐诗》遇到大数据分析,惊现出来的秘密是你可能永远都想不到的-信息快讯网

你知道

唐诗中出现频率最高的字是什么?

你知道

唐诗中描写最多的季节是哪一个?

你知道

唐诗描写最多的感情是哪一种?

唐诗、宋词、元曲又有哪些区别呢?

今天,带着这些问题,

通过基于人工智能的语义分析技术,

对《全唐诗》进行深度的文本数据分析,

发现了一些有趣的秘密。

《全唐诗》是清康熙年间编校的一本唐诗合集,历时一年多编校成文。收录诗人,凡二千二百余人,收录诗作四万八千九百余首。

当5万首《全唐诗》遇到大数据分析,惊现出来的秘密是你可能永远都想不到的-信息快讯网

《全唐诗》中出现频率最高的字:人

去掉一些常见的虚词,

如“之”、“乎”、“者”、“也”。

出现频率最高的字是“人”。

人生得意须尽欢,莫使金樽空对月。

清明时节雨纷纷,路上行人欲断魂。

故人西辞黄鹤楼,烟花三月下扬州。

千山鸟飞绝,万径人踪灭。

故人具鸡黍,邀我至田家。

当5万首《全唐诗》遇到大数据分析,惊现出来的秘密是你可能永远都想不到的-信息快讯网

其它高频字如

“山”“风”“月”“日”“天”“云”“春”

等都是在写景的诗句里经常出现的意象。

海上生明月,天涯共此时。

大漠孤烟直,长河落日圆。

黄河远上白云间,一片孤城万仞山。

东风不与周郎便,铜雀春深锁二乔。

人面不知何处去,桃花依旧笑春风。

当5万首《全唐诗》遇到大数据分析,惊现出来的秘密是你可能永远都想不到的-信息快讯网

《全唐诗》中最常见的148个字排名如下:

当5万首《全唐诗》遇到大数据分析,惊现出来的秘密是你可能永远都想不到的-信息快讯网

《全唐诗》中出现最多的季节:春

诗人们最爱写哪个季节?

经过分析,依次排名为:

春、秋、夏(暑)、冬。

当5万首《全唐诗》遇到大数据分析,惊现出来的秘密是你可能永远都想不到的-信息快讯网

在唐诗里,

伤春、惜春是常见的春诗题材,

事实上,写春的诗俯拾皆是,

标题中带春的就有不少,

如张若虚的《春江花月夜》

韩愈的《春雪》

杜甫《春望》

白居易《钱塘湖春行》

孟浩然《春晓》

……

这些都是耳熟能详的名篇。

当5万首《全唐诗》遇到大数据分析,惊现出来的秘密是你可能永远都想不到的-信息快讯网

《全唐诗》中出现最多的颜色:绿、白

小编找了51个古语中常用的颜色的单字。

注意是古汉语语境中的颜色称谓

其中以红色系(红、丹、朱、赤、绛等)、

黑色系(暗、玄、乌、冥、墨等)、

绿色系(绿、碧、翠、苍等)及

白色系(白、素、皎、皓等)为主,

这些颜色及其对应的字频如下表所示:

当5万首《全唐诗》遇到大数据分析,惊现出来的秘密是你可能永远都想不到的-信息快讯网

绿色和白色占比最高

在唐诗中,

“绿”“碧”“苍”“翠”等大都用于写景,

“绿树”“碧水”“苍松”“翠柳”等,

这些高频字从侧面反映出全唐诗中描写

景物、寄情山水的诗句占比很大,

透露出平静、清新和闲适之感。

绿树村边合,青山郭外斜。

碧玉妆成一树高,万条垂下绿丝绦。

孤帆远影碧空尽,唯见长江天际流。

天门中断楚江开,碧水东流至此回。

映阶碧草自春色,隔叶黄鹂空好音。

当5万首《全唐诗》遇到大数据分析,惊现出来的秘密是你可能永远都想不到的-信息快讯网

在唐诗中

白色常渲染出一种韶华易逝、悲凉的气氛,

常见的有“白发”“白云”“白雪”。

白头搔更短,浑欲不胜簪。

白雪却嫌春色晚,故穿庭树作飞花。

君不见,高堂明镜悲白发,朝如青丝暮成雪。

白云一片去悠悠,青枫浦上不胜愁。

唐诗中出现最多的感情:悲

根据诗歌中常见的主题类别,

情绪类别分为:

悲:愁、恸、痛、寡、哀、伤、嗟…

惧:谗、谤、患、罪、诈、惧、诬…

乐:悦、欣、乐、怡、洽、畅、愉…

怒:怒、雷、吼、霆、霹、猛、轰…

思:思、忆、怀、恨、吟、逢、期…

喜:喜、健、倩、贺、好、良、善…

忧:恤、忧、痾、虑、艰、遑、厄…

下面是对《全唐诗》近5万首诗的情绪分析结果,展示如下:

当5万首《全唐诗》遇到大数据分析,惊现出来的秘密是你可能永远都想不到的-信息快讯网

出乎很多人的意料,

代表大唐气象的唐诗应该以

积极昂扬的情绪为主,

可最后却是“悲”“思”“忧”

这样的情绪占据主流,

而 “喜”“乐”这样的情绪却占据末流!

比如唐诗中常见的几种情结,

如“悲秋情结”“别离情结”

“薄暮情结”和“悲怨情结”

都体现出浓重的“悲情”色彩。

当5万首《全唐诗》遇到大数据分析,惊现出来的秘密是你可能永远都想不到的-信息快讯网

在唐诗名句中,“悲”随处可见:

前不见古人,后不见来者。

念天地之悠悠,独怆然而涕下。

从时间与空间两个角度把悲凉拉长了。

君不见,高堂明镜悲白发,朝如青丝暮成雪

感慨时间流逝,这种伤悲超越时间。

无边落木萧萧下,不尽长江滚滚来。

万里悲秋常作客,百年多病独登台。

老病残躯,孤苦无依独登台,

心中悲凉陡然而生。

在天愿作比翼鸟,在地愿为连理枝。

天长地久有时尽,此恨绵绵无绝期。

相爱而不能相聚,生死遗恨,没有尽头!

当5万首《全唐诗》遇到大数据分析,惊现出来的秘密是你可能永远都想不到的-信息快讯网

《全唐诗》VS《全宋词》VS《全元曲》

通过文本对比《全唐诗》《全宋词》《全元曲》,

发现它们特点如下:

唐诗:雄浑高华

用字清澹高华、含蓄,诗味较浓,寄情山水和金戈铁马的特征明显,可以联想到唐诗流派中典型的山水田园派和盛唐边塞诗,它们大都反映大唐诗人志趣高远、投效报国的情怀。

大漠孤烟直,长河落日圆。

此地一为别,孤蓬万里征。

三顾频烦天下计,两朝开济老臣心。

秦时明月汉时关,万里长征人未还。

黄河远上白云间,一片孤城万仞山。

当5万首《全唐诗》遇到大数据分析,惊现出来的秘密是你可能永远都想不到的-信息快讯网

宋词:婉约柔美

宋词中所用的字多婉约、宛转柔美,表现的多是儿女情长,生活点滴,这也难怪,由于长期以来词多趋于婉约柔美,人们便形成了以婉约为正宗的观念。

月上柳梢头,人约黄昏后。

一曲新词酒一杯,去年天气旧亭台。

十年生死两茫茫,不思量,自难忘。

槛菊愁烟兰泣露,罗幕轻寒,燕子双飞去。

红酥手,黄滕酒,满城春色宫墙柳。

当5万首《全唐诗》遇到大数据分析,惊现出来的秘密是你可能永远都想不到的-信息快讯网

元曲:通俗率真

元曲中所用的字生活气息浓重,通俗易懂、接地气、诙谐、洒脱和率真,充分反映了其民间戏曲的特征,这与蒙元治下的汉族知识分子被打压,很多文人郁郁不得志、转入到民间戏曲的创作中来有关。

枕上十年事,江南二老忧,都到心头。

伤心秦汉,生民涂炭,读书人一声长叹。

人生百年有几,念良辰美景,休放虚过。

问从来谁是英雄?一个农夫,一个渔翁。

离了利名场,钻入安乐窝,闲快活!

当5万首《全唐诗》遇到大数据分析,惊现出来的秘密是你可能永远都想不到的-信息快讯网



编辑:朱颖婕、实习生奚清逸
责任编辑:李雪林

来源:公众号花非凡

©2014-2024 dbsqp.com