1. 引言
(一) AntConc与语料库语言学
AntConc语料库是一个功能全面、使用简单的语料库检索软件,适用于语言文字等方面的研究,提供了Word List、Concordance Plot和Collate等功能,便于快捷分析文本词汇与主题。
语料库语言学作为一门新兴学科,首次提出于20世纪80年代,其目的是通过分析大量数据来观察人们使用语言的特点,其优势体现在发现词汇用法、使用频率、搭配、中心词索引等方面。同时随着信息技术不断发展,人文领域研究所受影响也在逐步加深。在文学研究中以语料库检索软件作为技术辅助,可以对文本主题、人物性格塑造以及情节发展进行数理分析,有利于为文本挖掘提供客观证据[1]。通过AntConc语料库软件对小说进行多维分析,既能让准备读此著作的读者初步了解文中主要人物及其性格,也能帮助读者深入理解小说主题与内容,增强了品读文学作品的多样性与可能性。
(二) 卡森·麦卡勒斯与《心是孤独的猎手》
卡森·麦卡勒斯是二十世纪美国南方著名女作家。1940年,麦卡勒斯以长篇小说《心是孤独的猎手》横空出世。凭借其独特的艺术风格、新颖的作品视角、娴熟的艺术表现和深刻的思想内涵,麦卡勒斯一跃成为一颗璀璨的文学新星。
小说《心是孤独的猎手》以20世纪美国南方工业小镇为故事背景,描述了乐于助人的聋哑人辛格(Singer)、热爱音乐的少女米克·凯利(Mick Kelly)、善于观察思考的餐馆老板比夫·布瑞农(Biff Brannon)、心怀宽广的工人杰克·布朗特(Jack Blount)和充满责任感的黑人医生马迪·考普兰德(Mady Copeland)之间动人的故事。
辛格慷慨大方,总是耐心倾听人们的痛苦,深受小镇居民敬仰;米克热爱音乐,尽管不被家人所支持,她仍然满怀激情努力创作;比夫在镇上与妻子经营着一家咖啡馆,他最喜欢观察咖啡馆里形形色色的顾客;考普兰德怀有强烈的责任感和使命感,奋力挽救病人于危难之中;杰克总是满怀热情地向周围人宣扬真理,渴望遇到一个理解自己的人。在这些人物身上,我们可以发现:尽管面对沉重而复杂的生存困境,他们却努力以巨大的思想张力透视着整个世界和人生。在孤独意识的生命体验和人生实践中,他们摆脱不了纷繁的事务性琐事,却保持一种清醒的意识、一种怀疑的精神以及一种关怀自身的方式进行突破[2]。他们始终努力自己让自己成为自身命运的真正主人,敢于和善于满足自身的审美愉悦快感。
2. 采用语料库工具AntConc从三个方面分析《心是孤独的猎手》
本文通过语料库检索的研究方法,以麦卡勒斯的代表作《心是孤独的猎手》为研究文本,利用AntConc语料库检索软件中的“索引”“索引定位”“词丛”“关键词单”等核心功能分析其人物塑造、情节发展与语言特点。同时,在选择过程中借助AntCont索引功能对一些词进行了初步考察,剔除了绝大部分在例证中语义价值不大的词,进一步确保了数据的有效性与真实性,增强说服力。
(一) 利用Word List和Collocate分析小说人物塑造
首先,利用Word List功能对小说文本中出现频率排名前10位的数据进行考察(见图1),我们可以清楚地发现:排在开头前两位的单词分别为“the”和“and”,符合英文的使用习惯。单词“he”出现了3189次,排名第三;“his”出现2171次,排名第八;“she”出现1500次,排名第十。女性代词“she”和“her”出现的频率总计为2507次,而男性代词“he”和“his”出现的频率次数总计为5360次,几乎是前者的两倍。关于男性代词的频繁出现说明了本文的主要人物大部分是男性,男性角色占比大于女性角色占比,符合小说文本事实。在《心是孤独的猎手》小说五个主要角色之中,辛格、比夫、杰克、考普兰德都是男性角色,只有米克是女性角色。结合小说创作背景为20世纪中期,在当时的传统文学中,关于男性主体的成长一般谈论较多,而女性的成长常常被忽视,这是父权制意识形态占据统治地位的结果。
Figure 1. Frequency of the top 10 words in the novel
图1. 小说中排在前10位的单词出现频率
其次,在名词方面,使用频率最高的名词是“Singer”,出现次数达344次,其后是“room”,共出现339次。因此我们可以发现,小说文本主要是以辛格为人物中心,围绕特定具体地点而展开故事情节。在《心是孤独的猎手》中,辛格租住在米克家的一个房间里。因为辛格在小镇上人缘很好,其他人物经常会来到辛格房间与他进行交谈,与他一起共进午餐等。
同时,使用Collocate功能进行查询人物相关联的高频词汇,能够进一步帮助读者梳理人物之间的关系,深入分析各个人物的性格与形象塑造。比如,通过查询单词“Singer”,结果见图2。
我们可以发现:“Singer”这个人物通常与“mister”、“nodded”、“friend”搭配在一起,这从侧面反映出在小说中辛格是一个彬彬有礼的绅士,总是礼貌地对待他人,因此大家都很喜欢他,愿意把他当作是自己的知心朋友而向他倾诉。同时,在上图数据中出现了一个人物名“Antonapoulos”,查看可知这个人物出现频率为1410次。这说明人物安东尼帕罗斯与辛格之间存在着一定的联系,并且两者之间的联系是非常紧密的。
接着,我们依次查询“Mick”“Biff”“Blount”和“Copeland”。通过查询米克的相关词丛搭配,我们可以发现:米克经常搭配的词语前三名分别是“his”“said”和“asked”。单词“his”表明了在小说中米克的互动对象往往大部分都是男性人物,而不是女性人物;单词“ask”有询问、提问的意思,这反映出处于青春期的米克对于自己的生活充满了困惑,试图通过询问他人来回答自己的不解。这与小说文本是非常吻合的。小说中,米克是一个极具风格的假小子。从外表到内心,她都非常坚决地拒绝做一个传统南方淑女。她不喜欢和同龄女孩子们待在一起,却喜欢和哥哥们一起玩。在她看来,男性占有大部分财富,作为一个男性能够更好地获得社会地位。因此她希望自己像男性一样充满魅力,试图通过音乐以把握未来。她不断寻找着自我实现的可能性,困惑于成长中女性身份的认同危机。
Figure 2. Utilize Collocate to search the word “Singer”
图2. 通过Collocate功能查询单词“Singer”
通过查询比夫的相关词丛搭配,我们可以发现:与比夫相关的词汇有“abruptly”“perfume”和“lotion”等,这让我们产生了一种矛盾感。我们可以推断:比夫这个人物角色具有两面性,一方面,他是有些冷漠而生硬的;另一方面,他又流露出一种优柔气质。小说中,比夫是一个咖啡馆老板。在妻子爱丽丝去世后,他变得很沉默。在白天,他默默地观察着形形色色的顾客。在深夜,出于对过去生活与妻子的怀念,比夫开始逐渐使用爱丽丝生前用过的东西,想要承担起照顾米克和贝贝的责任。但他没有把这些想法告诉任何人。因此比夫的性格是具有双面性的。
通过查询布朗特的相关词丛搭配,我们可以发现:与布朗特相关的词汇有“lee”“git”等,这些词汇大多在英语中作为俚语使用。这说明布朗特的性格比较粗犷、不拘小节,同时也说明了他的社会阶级较低,生活贫困而艰辛。小说中,杰克·布朗特是一个贫穷的工人和流浪者。他个子不高,膝盖骨处有些畸形残疾。严酷的生活经历使布朗特遭受了很多痛苦,一直处于生存困境之中。因此这几个词语与比夫的个人形象是相符的。
通过查询考普兰德的相关词丛搭配,我们可以发现:与考普兰德相关的词汇有“doctor”“Portia”等。单词“doctor”直观地说明了此人物的职业是一个医生,而“Portia”是一个人名,说明考普兰德与波茜娅之间存在着某种关系。小说中,作为一名医生,考普兰德怀有强烈的责任感和使命感,而波茜娅是他的女儿,在米克家工作。
通过以上分析,我们可以发现,利用AntConc查询得出的数据与小说文本大致上是吻合的,能够在一定程度上直观地反映出人物关系、人物性格等,有利于帮助读者深入理解人物形象。
(二) 运用Word List和Concordance分析小说的语言特点
AntConc具有统计研究文本的形符(Token)与类符(Type)的功能,形符指文本中的词汇总数,类符则指不重复计算的形符数,即文本中重复出现的形符仅算作一个类符。通过类符形符比可计算得出形次比(Type Token Ratio, TTR)。形次比是衡量文本词汇密度的常用方法,可辅助说明文本的词汇难度及词汇多样性程度[3]。通过点击上传小说文本,我们可以得到具体数据见图3。
Figure 3. The number of type and token in the novel
图3. 小说中的形符数与类符数
通过数据统计我们可以发现,小说《心是孤独的猎手》的形符数值为124,015,从总词数量上看,篇幅较长,是一部长篇小说。同时,小说的类符数值为7673,在未进行词形归化条件下进行计算,得出这部作品的形次比约为0.07左右。形次比低,即说明词汇类符占比低、词汇重复度高。由此可推断得出,麦卡勒斯小说的创作在词汇多样性方面属于中等水平,作者并不过度追求用词的复杂性、独特性,从而印证了先有研究中关于麦卡勒斯创作语言以平实朴素为主的结论,亦如李文俊对麦卡勒斯语言的评论:“她的语言是以一种非常漂亮但却非常简单的形式表现出来,而这种简单的形式更加深了其话语的意义。”[4]因此,从词汇多样性的角度可以分析得出麦卡勒斯的小说创作词汇多样性较低、用词重复度高、语言平实朴素的特征,据此推测得出作品可读性强,受众群体广泛。
除此以外,通过AntConc的Word List和Concordance功能生成词表,能够进一步帮助读者欣赏其独特的语言风格。现频率前100位的词见图4。
如图所示,单词过去式的相关形式频繁出现。例如“was”出现2376次,“had”出现1170次,“were”出现751次。包括图中列出的动词大多也为过去时态,说明这部小说主要讲述的是过去的故事。从图表还可以看出,“I”“you”“me”等称谓的频率分别排名第十一、第十八、第六十一,而第三人称称谓“he”“his”“she”“her”“they”“them”等第三人称出现次数比前者要多,分别排名第三、第八、第十、第十七、第二十三、第三十八,从而证实这部小说主要采用第三人称视角进行写作,能够更客观地叙事[5]。
另外,从生成词表中可以看出“and”在小说中出现了4981次,起到了保持语言连贯性的作用。而“that”出现了1164次,这展现出在小说中麦卡勒斯并没有使用很多从句,相对而言文章的句式没有那么复杂,语言简单易懂。同时,上图列出的动词中,“said”一词共出现561次,位居第31位,这从侧面反映出小说中有许多对话描写。通过观察“have”、“come”“did”等动词出现的频率相对较高,由此可以推断小说有很多直接描写,并集中于动作描写上。
通过以上对大规模数据的分析,我们可以进一步归纳出这部小说的语言特点,有利于帮助读者深入感受麦卡勒斯朴实直白、简单优美的语言风格。
Figure 4. The top 100 words by frequency
图4. 频率前100位的词
(三) 利用Concordance Plot和File View分析情节发展
要理解一部小说的核心,把握小说的写作顺序和贯穿全文的情节非常重要。借助AntConc语料库检索软件中的索引定位(Concordance Plot)和文件视图(File View)功能,我们可以分析整部小说来把握情节的发展[6]。
首先,借助主要功能索引定位,可以对比出五个人物的出现频率及范围,见图5。
上图中显示的是从上到下依次为“Singer”、“Mick”、“Blount”、“Biff”、“Copland”在全文的出现范围及频率。根据索引定位,我们可以清楚地看到:“Singer”这一人物是贯穿全文的,人物“Singer”的情节密集度明显高于其他几个角色,这直观地反映出辛格是这部小说的核心人物。另外,我们可以发现除辛格以外的其他四个人物的出现范围大致上彼此互补,同时四个人物的情节范围始终与辛格的情节范围相互重叠。这说明小说的每个章节分别于四个人物的各自经历中交叉进行,并且始终围绕辛格为中心而展开故事情节。
除此以外,根据生成词表,我们可以看到小说中一个容易被忽视的次要人物——安东尼帕罗斯。根据查看小说人物“Antonapoulos”的索引定位,我们可以发现:人物“Antonapoulos”出现的情节总是非常集中,依次出现在故事的开头、后半部分以及结尾,同时“Antonapoulos”和“Singer”的情节位置总是有所重合。因此,我们能够推测出安东尼帕罗斯和辛格之间可能存在某种联系。为了进一步了解与探索两个人物之间的关系,我们可以打开文件视图(File View)功能仔细阅读相关部分。通过阅读上下文本,我们能够发现安东尼帕罗斯与辛格一样都是聋哑人。两人之前一起居住在偏远的南方小镇,平静地生活多年。后来安东尼帕罗斯患上了精神病,不得不住院接受治疗。因此辛格被迫与安东尼帕罗斯分离,一个人搬去了新地方生活。在新的南方小镇上,辛格租住在米克家中,逐渐结识了米克、比夫、布朗特与考普兰德医生。但是每隔一段时间,辛格就会独自乘车去病院探望安东尼帕罗斯。全文中,辛格一共去探望了三次安东尼帕罗斯,这与索引定位中“Antonapoulos”出现的频次是相吻合的。
我们也可以发现“Antonapoulos”每次出现之间留有大部分空白。空白部分说明在此部分该人物并未出现,也没有被书中的其他人物提及。这与小说中安东尼帕罗斯出现的频率与情节相吻合。小说中,一开始辛格与安东尼帕罗斯居住在一个偏远的地方。当辛格独自搬去另一个南方小镇生活后,他并没有告诉其他人他自己的过去。因此辛格的过去对于其他人物而言是一个无从得知的秘密,其他人物如米克、比夫、布朗特、考普兰德等人他们并不知道辛格有一个挚友安东尼帕罗斯,自然也就无从谈起他的存在。
Figure 5. Five main characters’ concordance plot
图5. 五个主要人物的索引定位
通过借助AntConc语料库中的索引定位(Concordance Plot)和文件视图(File View)功能,我们可以发现这些功能能够帮助读者进一步了解文本情节的发展,能够更加直观地把握故事的主要脉络。
3. 结语
AntConc语料库提供了Word List、Concordance Plot和Collate等多种功能,满足了读者快捷分析文本的多方面需求。这不仅为文学研究提供了一种全新视角,同时为感性解读文学作品插上了理性翅膀,有利于增强品读文学艺术的多样性。使用语料库对文学作品《心是孤独的猎手》进行检索、分析与研究,有助于归纳总结作品的人物形象、语言特点和故事情节的具体数据信息,从整体上把握小说的主要人物、语言特色与情节发展。同时,我们可以发现:借助数字人文的手段能够为文本研究提供详细全面的数据支撑。不同于传统的定性分析,这种方法更加理性客观,结构层次清晰有序,分析结果具有很强的说服力,较好地弥补了传统解读文本过程中可能出现的主观性、片面性等问题,值得我们在学习研究中使用。