- ISBN:9787544792783
- 装帧:一般胶版纸
- 册数:暂无
- 重量:暂无
- 开本:16开
- 页数:517
- 出版时间:2022-10-01
- 条形码:9787544792783 ; 978-7-5447-9278-3
本书特色
清华大学、南京大学、芝加哥大学、弗吉尼亚大学、斯坦福大学等世界名校知名教授联合编写,是国内蕞早的数字人文文学文化研究著作,对国内新文科方面的教学研究建设具有不可忽视的探索性意义。
内容简介
随着20世纪90年代以来信息技术的发展,计算的方法逐渐深入人文学科领域,并悄然改变着其研究方法。各种电子资料库、数据库的建立和阅览检索方式的改变,正在改变传统意义上的以纸质媒体为主要对象、细读为主要方法的人文学研究。本书讨论东西方人文社会科学学术中数字人文与语言文学研究方面的蕞新进展,以及在中国人文社会学术中开展涉及文学研究、计量语言学等跨学科范围的数字人文研究的语境条件和技术需要。所选文章从文学研究的内部需求出发,针对传统意义上的文学文化研究方法进行反思,深入研讨作为一种方法的数字人文对于传统人文社会科学研究之意义,探索新的技术和媒体环境下各学科间融合之可能性,希望能对人文社会科学的进一步发展有所贡献。
目录
**部分:国内外研究和现状分析
数字人文作为一种方法:西方研究现状与展望
数字人文在中国
北美与西欧的中文数字人文研究状况
印刷文化与数字人文文学文化研究
平台重构与交流复兴:媒介变革为学术期刊带来新契机
朝向“数字人文”的文学批评实践:进路与反思
忠实的工人和杰出的学者:大人文学科与知识伦理
批评的共情:弗农·李的美学及细读的起源
第二部分:研究案例
文学模式识别:文本细读与机器学习之间的现代主义
小说信仰:皈依阅读,计算建模,及现代小说
社会网络分析与“《大波》三部曲”
《盗墓笔记》与《鬼吹灯》的计量风格学研究
女性的友谊与诗
《围城》“像型”比喻的提取与研究
自我重复与东亚现代性:1900-1930
第三部分:学者访谈
人文研究中的数字:弗兰科·莫雷蒂访谈
如何进入数字人文研究:霍伊特·朗访谈
NovelTM:安德鲁·派博访谈
数字人文与传统学科:苏真访谈
第四部分:历史分析与反思
文化的数字丈量——“数字人文”下的人文学科
神圣阅读:从奥古斯丁到数字人文主义者
正典/档案:文学场域大型动力学
缺席的图像
致谢
节选
朝向“数字人文”的文学批评实践:进路与反思 但汉松?? 摘 要:在“数字人文”的研究浪潮进入欧美人文学科之后,如何将文学批评与数字人文进行有益结合,是一个亟待思考的议题。本文回顾了在近几十年来自然语言处理和基于语料库和话语/叙事分析的文学文体学的发展,指出面向文学研究的数字人文应该继承但有别于这些领域已经做出的跨学科尝试。在大数据时代,数字化的文学批评可以充分借助人工智能中机器学习的方法,并在一种弗朗西斯·培根式“新工具”的思维下,开展对于海量文本内部与外部模式的勘察。这样的文学批评*后并非是彻底走向“远读”,或者将阐释的任务交给“自动化”的学习算法来完成,而是让机器阅读成为对传统阅读的一种激发与挑战。构建一种具有独特的数字化思维,但又根植于传统文学批评观念和认知模式的新型文学批评,是本文无法给予回答但却迫切希望能展开讨论的议题。 关键词:数字人文 文学批评 算法 文体学 Abstract: Since the digital humanities (DH) has burst upon the scene of the Western humanities, how to combine literary studies and DH in a mutually beneficial way has become a burning issue for us. This article, in a retrospective manner, at first considers the evolution of natural language processing (NLP) and the corpus-based, discourse- & narrative-oriented literary stylistics over the last few decades. I then point out that a literary DH approach should learn from NLP and literary stylistics and distinguish itself from these old inter-disciplinary endeavors. In the age of Big Data, a digitalized literary criticism can make best use of artificial intelligence (AI) and in particular, machine learning. Equipped with Francis Bacon’s idea of novum organum, our DH scholars can pry into massive texts for their internal and external patterns. Such a new mode of literary criticism doesn’t mean an eager embrace of “distant reading”; nor is it to give over interpretation to an “automated” learning algorithm. Rather, in this scenario machine reading is employed to challenge and stimulate human readers, so as to foster a brand-new digital thinking, or an algorithmic criticism deeply rooted in traditional literary criticism and epistemology. The aim of this article is to address, but not to answer, these above-mentioned questions. Key words: digital humanities, literary criticism, algorithm, stylistics 一 上世纪60年代初,一个来自南非的年轻人游荡在昔日帝国的首都伦敦。虽然他暗地里憧憬成为一个艺术家,但凭着不赖的智商还是在IBM公司谋到了编程的差事。他工作的对象是全英国当时只有四台的Atlas计算机。工作之余,他琢磨着用计算机来统计聂鲁达(Pablo Neruda)诗歌中的高频词,然后将这些词打散后重新排列组合,*后再连缀成“诗”。这些聂鲁达伪作被署上假名,然后投稿到南非的文学期刊,其中几首甚至得到了发表。他在想,或许有一天这个笨拙的机器能凭借着“非此即彼”(either-or)的计算逻辑,写出伟大作品打败莎士比亚。 这个年轻人后来去美国德克萨斯大学奥斯丁分校留学,并在那里完成了一篇关于萨缪尔·贝克特(Samuel Beckett)小说文体分析的博士论文。后来,这个人成为了职业作家,拿到了诺贝尔文学奖,成为了那个叫库切(J. M. Coetzee)的人,并把这段往事写在了自传体小说《青春》(Youth)里。 如果我们将库切与Atlas计算机的这段遭遇,定义为“数字人文”(Digital Humanities)前史中计算与文学相遇的某个象征事件 ,或许并不为过,因为在六十年代库切的这段经历中体现了数字人文两条主要的隐线:自然语言处理(NLP)和文学文体学(Literary Stylistics)。前者发轫于1950年计算机科学之父阿兰·图灵(Alan Turing)所提出的“图灵测试”(Turing Test),他将机器智能的判定标准定义为人与机器交流的无差别性,这实际指向了机器是否能获得与人类一样的自然语言处理能力。然而,在自然语言处理研究的前三十年,计算机专家和语言学家的合作走了很大弯路。当时普遍的认识是,可以借助传统语言学研究,将自然语言的语法规则一网打尽,并在此基础上人类学习语言的知识全部以符号、代码的方式教给计算机,从而实现用电脑模拟人脑来处理自然语言。但事实上,基于乔姆斯基形式语言的编译器技术很快遇到了瓶颈。首先,自然语言真实词句的形态是极其庞杂的,仅仅依靠知识工程的方式由人工来穷尽文法规则是不现实的;其次,即使这样的规则集合可以写出来,那么它们必然是与语境相关的语法(context dependent grammar),而人工设计的计算机程序语言使用的是与上下文无关的语法(context independent grammar)。如果考虑自然语言的上下文,那么“计算复杂度基本上是语句长度的六次方”,以当时IBM公司大型计算机的运算能力都无法完成这样的计算量。 七十年代统计语言学的出现改变了自然语言处理的窘境,也为数字人文的出现奠定了方法论基础。从规则到统计的变化,让计算机科学家不再执迷于对自然语言进行深层研究,而是利用统计模型在语料中寻找自然语言的浅层规律。这其中的一个核心模型就是隐含马尔可夫模型,它被证明能有效计算出句子内相邻词同时出现的概率。 于是,计算机面对自然语言需要做的不是根据人工规则来挖掘出语义,而只是按照训练数据后得出的统计经验,去预测出哪一种词与词的连缀组合方式具有*大可能性。随着计算机运算能力的飞跃发展,以及互联网技术下自动抓取的自然语言数据量的激增,这种基于统计的自然语言处理技术已经成为当下的主流。“大数据”时代下,自然语言处理的人工智能技术为计算机去进行数字人文中的文本挖掘——无论是词语共现(concurrence)的规律,还是文本的情感分析(sentiment analysis)——提供了前所未有的便利。 但是,这一条隐线是以计算机科学为主导的,同时辅之以统计学方法,并未向文学批评伸出橄榄枝。换言之,转向统计思维的自然语言处理技术无意去探索文学文本这种更加复杂的自然语言形式,它服务于特定的日常生活情境(如语音识别、输入法、垃圾邮件分类、网络舆情监控等等),仅满足于在普通的语言质料中寻找人类语言使用的近似规律与模式。真正矢志于将计算与文学相结合的,其实是另一条更重要的隐线,那就是以应用语言学家为主导的文体学研究。1958年在美国印第安那大学召开的“文体学研讨会”被视为是语言学与文学之间的交叉学科在英美诞生的标志。所谓的文体学,按照辛普森(Paul Simpson)的定义,是“一种将语言置于主要位置的文本阐释方法” 。库切在60年代初对贝克特小说的文体分析,就是这个新兴学科的产物。而更早期的“新批评”(New Criticism)的先驱瑞恰兹(I.A. Richards)等在提出Basic English的时候,其实也是在对英语文学的文体特征做一种定量的统计计算。 作为一种将文学和语言学相结合的跨学科研究,文学文体学在*近五十年已经有了非常迅猛的发展。尤其是英国和美国,这两个地区是西方文体研究事实上的中心。我们甚至可以这样说:远在*近关于“数字人文”的概念被炒热之前,应用语言学的学者们早已跨越文学和语言学的鸿沟,在文学的人文计算领域耕耘了半个多世纪。然而,和自然语言处理一样,文学文体学的发展同样经历了曲折道路。当六七十年代“新批评”在美国逐渐式微时,文学文体学曾短暂接过了其衣钵,因为两者都关注文学语言的形式。但在后来解构主义、后结构主义的冲击下,这种过分依赖传统语言学去定量分析文学的形式文体学好景不长,很快被视为是一种保守的、孤立的、机械的文学研究方法。美国重要的文体学杂志要么停刊,要么转而刊登叙事学(Narratology)方面的论文。 面对瓶颈,文体学几乎与自然语言处理同时在八九十年代出现了重大转向,不过后者是得益于统计与概率,而前者则是因为英国语言学家韩礼德(M.A.K. Halliday)带来的系统功能语法(systemic functional grammar)。 文体学的这种功能转向,对我们之后理解数字人文与文体学的异同颇为关键。韩礼德*大的理论贡献,是不再像索绪尔、乔姆斯基那样将语言视为一个符号系统,而是将语言作为一个社会的、文化的现象,转而去关注语言具体情境下的使用。韩礼德将意义理解为一个在语境中生成的复杂系统,进而区分了三种意义:概念意义(ideational),人际意义(interpersonal)和语篇意义(textual)。 同时值得注意的是,韩礼德用于阐述这种功能文体学具体实践的,正是依靠他一篇经典的文学文体学论文,个案就是戈尔丁(William Golding)的短篇小说《继承者》(The Inheritors)。通过对该小说中两类人(分别是尼安德特人和智人)语言的及物性过程(transitivity)做定量统计与分析,韩礼德以可视化图表的方式展现了小说语言是如何形塑世界和世界观的。 随着功能文体学的日益蓬勃发展,文体学家从分析语气、情态、语调、人称、自由间接引语、及物性、表达情感色彩与态度的形容词和副词入手,探讨文学文本中反映的作者/叙述者与人物、读者之间的关系以及由此产生的文本意义。 然而,韩礼德及其追随者的这种功能文体学分析较为精细,更适合篇幅较短的文学作品分析,如诗歌和中短篇小说等。将文体学进一步推向“人文计算”方向的,则是八十年代进入研究视野的语料库语言学(corpus linguistics),其中*具代表性的人物要算辛克莱尔(John Sinclair)。辛克莱尔代表了英国“伯明翰学派”所走的话语分析(discourse analysis)之路,而以文学文本为语料库来驱动自然语言中的话语研究,这对未来的数字人文发展具有重要的方法论启示。辛克莱尔早期研究以文学文体学为主,分析过拉金、华兹华斯和莎士比亚等人的诗歌,后期则倾向于将文学作为一个数据库,因为他相信“只有通过亲近文学,才能找到一种系统化工具来描述语言” 。不难想象,辛克莱尔选择了从语料库语言学发展出一种适合文学的语料库文体学(corpus stylistics)。用现在的时髦术语来说,它比中规中矩的文学文体学研究更像“大数据”,毕竟前者可以介入到对长篇小说的分析,甚至包括相关性高的多部小说的聚类分析(cluster analysis)。 必须特别指出的是,语料库文体学并不等同于文体测量学(stylemetics)和文体统计学(statistical stylistics)。后面两种研究虽然听上去更强调计算,也像是严格意义上的纯实证研究,但它们往往并不关注文本阐释,而是“通常以词频为研究变量来判断语篇的统一性,作者的身份和语篇产生的年代。” 它们*重要的应用,是对所谓“莎士比亚伪作”(Shakespeare Apocrypha)的文体测量,比如确定《爱德华三世》(The Reign of Edward III)和《托马斯·摩尔爵士》(Sir Thomas Moore)等争议作品的归属。但我们很难说这种以文本“指纹”来推断作者身份的研究是一种文学阐释方法,而在面向文学的语料库文体学中,阐释应为研究的题中之义。研究者对语料库的使用,比如“在对语料进行加工标注的基础上,通过词频统计、主题词检索、索引、词类分布以及特殊结构的人工标注与检索统计等手段”,目的是为了阐释“文学作品的主题、人物形象的塑造、叙事的发展以及作家风格等”。 辛克莱尔的一句名言是,“当你同时看大量的语言时,它就会显得不一样。” 这句话自然也适用于对文学文本做语料库驱动的话语分析。正是因为对很多作品同时进行分析,批评家才能发现那些在传统方法的阅读下无法找到的意义模式。一个经典的例子,就是辛克莱尔在语料库词汇搭配(collocation)研究中特别强调的“语义韵”(semantic prosody) 。 将韩礼德和辛克莱尔结合得*好的,或许当属英国文体学家图兰(Michael Toolan)。一方面,他像韩礼德那样拓宽了文体学研究的对象,将“文体”和“话语”视为写作技巧的一体两面,从而将文体学与叙事学糅为一体,使之成为了“叙事文体学”(narrative stylistics)。在研究“文体”时,他聚焦于语言成分,包括“词语选择、小句模式、[文字]节奏[如韵律、词语或句子的长短]、语调、对话含义、句间衔接方式、语气、眼光、小句的及物性等等”;而在探讨“话语”时,图兰关心的是“讲故事的人选定创造事件的特定顺序,选定用多少时间和空间来表达这些事件,选定话语中(变换的)节奏和速度[究竟是快速简要概述还是慢慢地详细描述]。此外,还需要选择用什么细节、什么顺序来表现不同人物的个性”等等。 另一方面,图兰又续接了辛克莱尔的语料库文体学,尤其是在近年来,开始将研究方向转向如何通过语料库的文体研究方法,来探究短篇小说的叙事进程(narrative progression)和叙事性(narrativity)。图兰的语料库中涵盖了20世纪短篇小说的代表作,使用了一些经典的统计语言学分析工具(如Word-Smith Tools,Wmatrix)以及特别的软件程序,追踪文本中高频词和新词汇的分布规律,并以此来揭示短篇小说文本叙事进程的规律。 ……
作者简介
刘颖: 中国科学院计算技术研究所博士,清华大学中文系教授。研究领域为计算语言学、语料库语言学和计量语言学。著有《计算语言学》等六部著作。在国内外计算语言学期刊和国际会议发表论文八十余篇。 姜文涛: 美国纽约州立大学石溪校区哲学博士,北京大学人文社会科学研究院邀访学者(2021)。研究方向为英国长18世纪的情感研究与印刷文化、比较文学、文艺理论和数字人文。自2016 年起与戴安德(Anatoly Detwyler)主持《山东社会科学》“数字人文:观其大较”学术专栏。 陆晓芳: 山东大学文学博士,《山东社会科学》杂志社副社长、副主编,编审。研究方向为文艺学、编辑学和数字人文。策划编辑的跨学科专栏“数字人文:观其大较”获国家社科基金资助 期刊特色栏目专项资助两次。
-
十三邀2:偶像是生意,是符号,是忍辱负重(八品)
¥23.4¥60.0 -
事已至此先吃饭吧
¥16.5¥55.0 -
孤独海子:海子经典诗选
¥16.7¥45.0 -
理想青年:朱光潜谈修养
¥14.7¥49.0 -
我是一只骆驼
¥19.2¥32.0 -
祖国旅店
¥15.2¥49.0 -
藏族民间故事-中国少数民族经典民间故事
¥18.9¥63.0 -
长篇小说:一句顶一万句
¥57.1¥68.0 -
诗经演
¥14.0¥39.0 -
我与地坛
¥27.2¥28.0 -
战争与和平(上下)
¥31.2¥78.0 -
又得浮生一日闲
¥15.9¥49.8 -
汉字里的中国
¥17.1¥45.0 -
茶馆
¥9.0¥36.0 -
美好的生活:失败与想象力不可或缺(中英文对照)
¥12.8¥39.9 -
我从未如此眷恋人间
¥32.4¥49.8 -
活出生命的本真
¥14.4¥45.0 -
一曲难忘
¥13.3¥35.0 -
在荒乱的生活中,求一点上进
¥8.1¥30.0 -
有苦有甜过生活
¥13.5¥45.0