“计算人文”  离我们有多远?-LMLPHP

《复杂系统的计算实验方法——原理、模型与案例》

薛 霄著    

科学出版社出版

一个文史研究者,听闻“计算实验方法”,总是有些隔膜,也感觉是一件与自己毫不相干的事情。2017年夏天在美国麦迪逊市,我第一次碰到薛霄教授。席间我们聊起中国历史上的权力制衡和演变问题。薛教授对这个问题极有见地,说起来头头是道,但当他说中国历史上的权力互动大概也能用一种方法找到规律时,我对这种可能性深表怀疑。回国后不久,薛教授转岗至天津大学。最近他寄我一本新书《复杂系统的计算实验方法——原理、模型与案例》,特嘱我闲时翻翻。前几天,半夜睡不着,拾起翻览,发现这是一本直指人心的“大书”,其娴熟的理论驾驭能力,着实令人佩服。

经典物理时代,一项研究成果首先要有实验支撑,其次,别人还能重复这项实验,这是科学成果获得认可的基本要求。但是,随着相对论和量子力学的出现,我们发现这个世界在很多领域充满了不确定性,并非是达尔文、培根、牛顿、伽利略、笛卡尔等建立的近代科学体系和相应的数学方法可以完全解释和说明的。这种不确定性在物理学、化学、生物学和信息科学、社会学等领域普遍存在,而这些无法用传统实验方法得以认知和确指。即使一定要通过实验验证,也会面临经济、法律和道德等社会问题和高危风险。那么如何分解还原复杂系统,只能另辟蹊径,计算实验方法应运而生。

在秩序与混沌的边缘,认识到世界的复杂性和不确定性本身就是科学观念的巨大转变。20世纪80年代中期以来,一些富有远见的科学家已经意识到,复杂系统科学是21世纪的科学。1999年,美国《自然》杂志出版一期以“复杂系统”为专题的专刊,对化学、物理、神经学、动物学、自然地理学、气候学和经济学等领域的复杂性进行了报道和研究,归纳出复杂系统具有开放性、自组织性、非线性、涌现性和层次性等特征。复杂系统不可能利用某一个学科门类加以研究,计算实验必须是多学科协同合作,是典型的交叉研究。在历经统计物理、进化论、控制论、信息论等不同发展阶段后,计算实验方法已经进入建模仿真所需要的大数据研究,复杂网络模型和平行系统理论也进入研究视野,在流行病学、经济学、交通系统、战争模拟系统、矿山应急服务等领域,计算实验方法逐渐推广,而在社会学领域,计算实验方法更是风生水起。2009年2月,哈佛大学、麻省理工学院等世界一流大学的15位顶尖学者在美国《科学》杂志上联名发表了《计算社会科学时代的到来》一文;2012年,14位欧美学者又联合发表了《计算社会科学宣言》,计算社会科学(Computational social science)为观察和分析人类社会的复杂行为模式提供了重要方法。

薛教授的《复杂系统的计算实验方法》分为“方法理论篇”、“计算模型篇”、“应用案例篇”三个部分,对复杂系统计算实验的系统框架、核心技术和具体应用做了全面的论述,其中人工社会的糖域模型(SugarScape)和社会生态系统(SLE模型)涉及性别、出生与死亡,文化与冲突、组织演化、社会变迁等问题。而对于人文学科中的一些重要问题,在计算模型和应用案例方面的论述并不充分。但我在跟薛教授的进一步交流中得知,他目前正致力于“反事实算法”下的计算实验方法与人文学科的交叉研究,即针对某个历史节点的重大历史事件进行推演和计算,进而得出值得借鉴的历史教训和发展规律。

计算方法与计算实验方法,虽然只有两字之别,但有本质不同。计算方法应用于人文学科,在前数字化时代就已存在。比如日本学者深泽一幸在讨论韦应物抒情诗“清赏”风格时,就据《韦苏州集》571篇诗作统计出含有“清”的词语有134个,占23%;王维432篇诗作中有60个,占比13%;孟浩然218篇诗作有42个,占19%;而六朝时期的谢灵运92首诗作中43个,谢朓136首诗作有62个,二者都接近50%,进而指出,韦应物在“清”这个审美特征上,与谢灵运、谢朓更有相通之处(深泽一幸《韦应物的抒情诗》,见《诗海捞月—唐代宗教文学论集》,王兰、蒋寅翻译,中华书局,2014年)。现在大多数历史文献都已经数字化,展示方式更加多样,百分比统计更加便利,复杂检索更加迅捷,但有一些数字人文研究,究其路数,并没有根本性的改进。

计算实验方法是在反事实思维(Counter Factual Thinking)基础上,针对在相同条件(因)下,社会复杂系统中未曾发生的事情(果)的一种因果推演。这里的社会复杂系统,可以是当下的、现实的社会系统,也可以是根据历史文献构建出来的、模拟的社会复杂系统。反事实思维是美国心理学家诺贝尔经济学奖获得者丹尼尔·卡尼曼1982年发表的一篇名为《模拟式启发》(The Simulation Heuristic)论文时首次提出的。它是基于人类非理性假设的前提下提出的,简单来说,就是人类意识普遍存在“如果当时……,就会/就不会……”这样一个反事实的思维过程。目前,文献数字化的量级已经从TB级发展到PB级,随着5G网络的发展,大数据技术已经为人文学科的计算实验方法打下良好基础。但人文学科的海量文献数据,往往面临真伪、重复、歧义与校释问题,文献考订工作,非人力不能为之,如果这个问题也能通过计算实验方法得以解决,那么人文学科的计算实验方法将会获得突破性进展。

我们现在的人文学科研究方法,即所谓的“近代学术”,是在自然科学研究方法上得以延伸和发展的,然而自然科学研究早已经走出经典实验阶段,而人文学科仍在文献考据、逻辑推理的框架内因循踯躅。数字人文学研究已经引起学界的广泛重视,前不久上海图书馆召开的“积淀与超越:数字人文与中华文化”会议积极推进了数字人文的纵深研究。而把人文学科问题也看作一个社会复杂系统中的问题,进而采用计算实验方法来回看历史问题的全新视角,似乎离我们并不遥远,也许有朝一日,相较“数字人文”更进一步的“计算人文”,也能崭露头角而日新月异。

03-26 13:40