*细化文学史的时间粒度
以往的文学史研究,时间信息往往比较模糊,只能考察大时段的文学现象。而文学编年地图,可以呈现每一年度的作家活动和创作情况。因此,以后的文学史研究,不再只有断代史,还可以有年度文学史、小时段的文学史研究,比如安史之乱期间的诗歌研究,就可以考察每一年的诗歌创作情况。又如,唐宋诗歌史上,上元开元、中元元和、下元元祐的“三元”说,这三个时期,诗歌变化 的节点究竟在哪一年,以前无法知晓。如今可以用数据来描绘。王兆鹏又用具体数据例举了20世纪古代文学研究的发展情况数据显示,1949年到1951年古代文学研究的成果并无多少变化。1956年“双百方针”发布后,文学研究成果才逐步增多。也就是说,政治大变化的1949年,并不是学术变化的关键时间节点。王兆鹏预测,“唐宋文学地图平台”将会带来研究视角和研究范式的新变化。
*展开历史交通图线
台湾中研院院士严耕望先生著有《唐代交通图考》,令学界羡慕不已。严先生从1946年开始,以考释唐代交通路线和制度为目标,累积的资料超过十万件,全书原定十卷,依次出版了《京都关内区》《河陇碛西区》《秦岭仇池区》《山剑滇黔区》《河东河北区》五卷,共1792页,超过二百万字,被公认是一部学术巨著。直至他逝世,整个计划仍未完成。但是有了新技术,可以非常容易地验证严老的交通图,也可以考订宋代交通图。以苏轼为例,苏轼第一次从蜀地进京,是走了唐宋时的驿路;第二次是沿江而下,顺着宜宾-重庆-襄州-唐州-洛阳-开封走。王兆鹏举证杜甫诗《闻官军收河南河北》“即从巴峡穿巫峡,便下襄阳向洛阳”,也是规划走这条路线。但苏轼第三次返乡时却从南京到淮阴再至扬州。“因为这一次苏轼兄弟俩是扶着父亲苏洵的灵柩回乡的。”至此,四川到汴京有三条路线清晰可见。
另有一件令后人大跌眼镜的事,也是从路线中考察出来。辛弃疾自镇江回到铅(yan)山。本来可以走京杭运河,行程790里路,但辛弃疾偏偏避开杭州绕道而行,结果走了900多里。《宋会要辑稿》中有记录,当时任镇江知府辛弃疾因为“好色贪财、淫刑聚敛”而被罢官。弹劾者在杭州,杭州是他心头之痛。
苏轼进京回乡路线图(李念摄于现场PPT)
*助探文学现场
如果能够还原唐朝诗人的行走路径,对理解唐朝的制度、诗人心情都有很大益处。
王兆鹏以韩愈两次被贬经过今天西安的蓝田县为例,演绎了唐朝的律法。在唐朝,贬罚的法律非常严格,要求必须在规定期限内到达被贬地。贞元十九年(803年)十二月,韩愈被贬到连州阳山县,他经过蓝田县武关驿,《南山诗》回忆道:“初从蓝田入,顾盻劳颈脰”,山坡非常险峻,“峻涂拖长冰,直上若悬溜。蹇衣步推马,颠蹶退且复”。朝前走几步,因为结冰太滑,马车无法前行,只能下去推行,常常推了又滑回去。王兆鹏介绍,唐朝人如有马车上这样的山巅,一般是拆卸了,过山顶后再拼装。第二次是在元和十四年(819年),也就是16年后,韩愈又被贬至潮州。照例经过蓝田县,他在诗作中写道:“一封朝奏九重天,夕贬潮阳路八千。云横秦岭家何在,雪拥蓝关马不前”,那年冬天,韩愈的小女儿在路途中被冻死,他悲愤交加。
而这条路白居易也曾走过,并留有诗句“下视千万峰,峰头如浪起,朝经韩公坡,夕次蓝桥水。浔阳近四千,始行七十里。”记者在去年、今年清明节两次徒步走商鞅路,也曾路过诗作中所说的蓝田县的秦岭山峰,对白居易诗中另一句“绝顶忽上盘,众山皆下视”有深刻体会,文学地图上显示了蓝田“绝顶忽上盘”的地理说明——从蓝田县城出发,第五公里开始上坡,第六公里到第一层棱线,第七公里到第二层棱线,快速攀援,上盘绝顶,实际海拔为1041米。至于在风雪中,还要日行70里,记者也深有体会。两次徒步行走中,日行30公里一般需要6-7小时,如果70里,正常速度也要8个多小时,虽有马匹,但遇到过“绝顶”山,难度可想而知。“每首诗就是一部微电影!”王兆鹏的形容非常贴切。
白居易、韩愈多次走过的蓝田县的秦岭山峰(李念摄于现场PPT)
全球“数字人文”图谱下的展望
这些非传统的功能带来了崭新的视角,对唐宋文学的研究颇有裨益,即便是文史爱好者、旅游爱好者、教育游戏开发等都是宝贵的资源。王兆鹏为此普及了“数字人文”概念和海内外发展生态。
*国际元年为2008年,中国2009年起步
与《国学宝典》《四库全书》等数字化文献资源库不同,唐宋文学编年地图平台是活态化数据,这意味着数据可以任意重新组合关联,形成新知识,发现新问题;数据还可以进行语义检索和时空定位,且可以可视化。由此可以理解维基百科上“数字人文”的定义:电脑运算或信息科技与人文学的交叉学科。数字人文是数据、平台、团队三方面的结合。2011年开始筹划、2017年正式上线的唐宋文学编年地图平台,就是典型的数字人文项目,有数据,有平台,有团队。
举目海内外,“数字人文”源于“人文计算”。1960年代的《计算机与人文科学》杂志和1970-1980年代的人文计算机研究中心是其标志。进入新世纪后,2004年,John Unsworth等人所编的文选A Companion to Digital Humanities中强调,数字人文领域非仅仅数字化,而是以现代人文方法来研究数字化对象,以信息科学方法来研究传统人文问题。2006年,美国人文学科国家基金发起成立“数字人文倡议组织”,2008年改名为“数字人文办公室”,从此,“数字人文”就在美国传开了。
随后,斯坦福大学、伦敦大学、弗吉尼亚大学、英国国王学院纷纷成立了“数字人文”研究机构。截至2019年4月20日,在数字人文组织下登记的数字人文研究中心已经达201个,大多在美国、加拿大和欧洲。目前世界上最大的协会组织是国家数字人文联盟。《数字人文季刊》和《数字人文学刊》是两大学术杂志。
中国在“数字人文”方面也不落伍。2009年,武汉大学信息管理学院王晓光教授在个人博客上发表《“数字人文”的产生、发展与前沿》,被学界视为国内数字人文正式起步。目前,大陆拥有数字人文研究中心的有武汉大学、北京大学、南京大学和王兆鹏所在的中南民族大学等。
国外数字人文的进展标志之一是研究机构遍布全球(李念摄于现场PPT)
*LCM十年磨一剑,目标是建成知识图谱
在唐宋文学编年地图平台上线之前,已经有两家同行。一是2007年上线的中国历代人物传记资料数据库(CBDB),是由哈佛大学费正清中国研究中心、台湾中研院和北京大学中国古代史研究中心共同研发。这是一个非常专业的平台,使用比较复杂 ,普通人不容易记住查询方式;第二家是中国历史地理信息系统(CHGIS),由哈佛大学和复旦大学共同研发,2016年12月上线了第六版。
王兆鹏的目标,没有止步于文学编年地图,而是以文学地图为平台,建构文学知识图谱,他总结了三句话:“智能集成文史资源,构建文学知识图谱,还原文学历史现场”。与当下的数字化资源库不同,今后的结构化数据库,可以“一键生成、个性定制”。文学知识图谱,集纳了时、地、人、文、事、物。他举例,可以把《全唐诗》《全宋诗》里诗歌进行语义分类。如果要研究唐宋时期诗人笔下的动物和植物,就非常容易。他的数据里,可以查出每年从中央到地方哪年人做什么官,各个地方有哪些人中进士,哪个时间段作家出生最多。每个人可以形成一个自主的资源库。
中国文学编年地图知识图谱,将集纳时、地、人、文、事、物六个维度(李念摄于现场PPT)
2017年3月,唐宋文学地图平台刚上线时,一夜之间的流量就突破了110万,平日有时空距离和语言距离的唐宋诗人们在便捷的搜索功能下,如同“千树万树梨花开”般呈现在当代人视野中;朋友圈,旅游线路图等和当代人共时空的话题,也如同“百舸争流”般涌入了寻常百姓家。如今,LCM还是免费网站,“用户是最好的老师”,王兆鹏自称十年中自己已经变成半个工程师了,“寻找既懂点文史又懂技术的复合人才确实是不太容易,只好自己赤膊上阵。”然而,就是这样的敢于吃螃蟹者,赢得了国内外同行的无限尊重,而6月刚到花甲的他丝毫没有生理年龄之状,或许,LCM这样的项目前景本身就具有基因编辑里的“增长功能”,只不过是精神助推而非生理改变。
作者:李念
编辑:袁琭璐
责任编辑:李念
*独家稿件,转载请注明出处。