加拿大作家史蒂芬·马尔什(Stephen Marche)说,将文学当做数据会失去文学本身丰富的意蕴,文学应该与数据截然对立。然而,被以他为代表的作家、学者斥为“文学病毒”的“文本数据挖掘”(text data mining)如今已广泛“侵入”文学作品研究领域,悄然造就新的研究范式。

斯坦福人文实验室的创立者弗朗哥·莫雷蒂(Franco Moretti)教授利用计算机分析了 1740—1850 年间出版的英国小说,发现这个时期内长标题的作品数量明显下降,有的作品题目中惯用形容词。在莫雷蒂看来,这一系列发现或许能解释这个时期文体风格的发展变化。

内布拉斯加大学(The University of Nebraska)英语系教授马修·乔卡斯(Matthew Jockers)利用文本数据挖掘技术,对 1780—1900 年出版的 3592 部著作进行了词频和主题分析,并在自己的新书《宏观分析:数字化方法和文学史》(Macroanalysis: Digital Methods & Literary History)中表示,数据能窥探出简·奥斯汀等著名作家的写作风格是受何人影响。

1条评论

  1. […] 将原本需要通过品读进行研究的大量著作作为大数据交由计算机来处理,从而产生新的见解——这是“离经叛道”的文学批评家、斯坦福大学文学实验室的创办人弗朗哥·莫雷蒂提出的一种他称之为“远读”(distantreading)的阅读哲学和方法。“书太多读不过来?干脆不用读了,喂电脑吧!”他在《世界文学的猜想》中如是说。他近年来的10篇文章便以《远读》为题结集出版。 […]

    0