黑色之花:基于语料库的哥特小说《呼啸山庄》文本分析
Black Flower: A Corpus Approach to the Gothic Novel Wuthering Heights
DOI: 10.12677/WLS.2018.62003, PDF, HTML, XML, 下载: 1,616  浏览: 4,278  科研立项经费支持
作者: 孙玉晴, 赵 硕:西北工业大学,外国语学院,陕西 西安
关键词: 《呼啸山庄》语料库文体学语料库检索文学批评Wuthering Heights Corpus Stylistics Corpus Retrieval Literary Criticism
摘要: 通过自建“《呼啸山庄》语料库”和“对比语料库”,本文利用语料库检索分析工具和语料库文体学研究方法,对《呼啸山庄》文本进行分析。基于对关键词表、词图和词丛的检索,从故事情节、主题表现、叙事风格和人物形象四个方面对小说进行了解读。分析发现,小说语言特征的出现频率和分布规律反映出了哥特式小说的元素。由此,也在一定程度上证明了把语料库运用于文学批评领域的巨大潜力。
Abstract: The novel Wuthering Heights is analyzed through the corpus retrieval tools and the theory of corpus stylistics based on the self-constructed Wuthering Heights corpus and the comparative corpus of ten English novels in 19th century. The methods of retrieving keyword list, concordance plot, and clusters are applied to investigate the novel in four aspects: plots, themes, stylistics and characters. The appearance frequency and distribution patterns of the novelist language confirm the Gothic feature of the novel itself, which also show the huge potential of applying corpus in literary criticism field.
文章引用:孙玉晴, 赵硕. 黑色之花:基于语料库的哥特小说《呼啸山庄》文本分析[J]. 世界文学研究, 2018, 6(2): 19-26. https://doi.org/10.12677/WLS.2018.62003

1. 引言

英国女作家艾米莉·勃朗特被誉为文学的“斯芬克斯”,其代表作《呼啸山庄》是世界文学的经典。作者继承了传统的哥特式创作手法,使得小说在叙述手法和主题表现上取得了巨大的成功而蜚声中外,小说中所蕴含的哥特式元素也受到文学批评界的极大关注。国内对小说的研究颇多,以中国知网为例,以“呼啸山庄”为主题词检索发现有1842篇相关论文。这些论文主要从主题表现、叙事技巧、人物分析、哥特性解读、象征主义、女性主义等角度入手对文本展开分析。虽然研究的覆盖面比较广,但是所采用的方法都是以描述性为主,至今很难发现有借助语料库对该文本进行分析的论文。因此,本文以语料库为基础对文本展开研究,以期能够对文本有一个更加客观、更加理性的认识。另一方面,哥特式小说作为一个文学类型,它是英美文学史上一朵永远绽放的“黑色浪漫主义”之花,国内外对于哥特式小说的研究也非常之多,但基本上都是通过直觉的文字论述来建构小说的特征,如背景一般在“古堡、废墟、荒郊野外、神怪幽灵、不符合人类合理想象的超自然现象等,小说的主要内容被认为是描写暴力、仇恨以及凶杀等内容,情节设置得跌宕起伏,小说的气氛神秘、恐怖阴森” [1] ,鲜有从语料库着手进行分析论证的研究。本文以哥特式小说代表作《呼啸山庄》为例,借助19世纪(同时期)英国具有代表性的小说文本为对比语料库,从语料库文体学的角度出发,对检索到的数据进行整理和分析,力求挖掘出小说中所隐含的文体特征,并总结出其特征背后的深层原因,从而试图促进语料库和文学批评之间的有机融合。

2. 文献综述

语料库文体学作为对文体学研究领域的一种延伸,主要存在两个研究基础:其一是“形式(form)与意义(meaning);其二是频率(frequency)与意义(meaning)” [2] 。语言的表现形式是由不同的选择来决定的,一种选择也就意味着一种特定的含义,语料库文体学就是要挖掘其中隐藏的深意;在语料库检索中,出现频率高的词相对于出现频率低的词更具有显著性。语料库可以实现对文学文本的量化分析和统计,同时也为文体学研究提供视角,也减少了其中的主观臆断性。

我国对于语料库文体学的研究甚晚,并且研究的领域也非常有限,主要集中在一些应用性文本的分析上面,如法律文本、科技文本、商务文本等语篇的特征。根据所获得的真实语料,研究的内容主要包括:词汇、词组和句子三方面的分析。针对于词汇研究,可以考察词的出现频率、词的长度等;词组主要通过检索词丛或词簇等,以及句子和语篇层面的检索。从方法上来看,主要分为以语料库为基础的研究和语料库驱动的研究。

随着语料库文体学的不断普及,其被运用到的领域也不断地扩大,尤其在文学批评方面产生了很大的影响。例如Hori对狄更斯作品中的搭配模式进行了较为系统的探讨 [3] ,Tabata研究了狄更斯小说中的文体风格变化 [2] 。由此看出,语料库与文学研究日益融合的趋势,在研究内容方面也变得更加丰富。由词的分析逐渐扩展到语篇的检索分析,由单个的小说文本样本分析逐渐转化为多个文本的检索与对比分析。所以,借鉴语料库文体学的方法研究《呼啸山庄》的文体特征,分别从故事情节、主题表现、叙事风格和人物形象四个方面证明了小说的哥特元素及其“神秘的恐怖性,使小说进入扑朔迷离的境界,令人欲罢而不能,荒诞离奇增强了读者的好奇心理,增加作品的吸引力” [4] ,也可以为哥特式小说的语言特征的总结提供更多的思路和方法,这也丰富了文学研究的多样性,在方法上也变得更加地灵活。

3. 语料库的建立及数据的提取

为了增强数据的客观性和准确性,笔者自建了《呼啸山庄》的语料库(以下简称语料库Ⅰ),总词数为30,734。同时选取与艾米莉·勃朗特同时代,英国19世纪代表作家查尔斯·狄更斯(《大卫·科波菲尔》、《远大前程》、《艰难时刻》、《雾都孤儿》、《双城记》、《亚当比德》、《荒凉山庄》)、夏洛特·勃朗特(《傲慢与偏见》)、乔治·艾略特(《织工马南》)和威廉姆·萨克雷(《名利场》)共10部作品作为对比语料库(以下简称语料库Ⅱ),总次数为1,723,080。两部作品的英文文本均从互联网上下载之后进行编辑,去除了正文之外的所有内容。通过语料库检索软件AntConc3.4.4生成词表(wordlist)、关键词表(keywords)、词图(concordance plot)和词丛(cluster)的检索信息并结合语料库文体学的方法实现对小说的主题情节、叙事风格、人物特点的分析,旨在以语料库为切入点揭示出传统哥特式小说所具有的特征。

4. 数据的处理及分析

本研究主要借助于语料库检索软件,通过语料库Ⅰ与语料库Ⅱ进行对比获取显著性数据源(语料库Ⅱ作为对比语料库,是获取显著性数据的途经),并对数据进行单项或多项特征分类得出词的列表、词图分布以及词簇规律,从而直观地把握和归纳出作品整体的语言色彩。以此为基础追根溯源这些语言运用背后的原因,即这些文体特征有利于揭示小说的主题情节、再现叙事风格、塑造人物形象。得力于量化检索和真实语言分析法,这也充分证实了语料库文体学运用于文学批评所具有的巨大潜力。

4.1. 小说故事情节检索

首先将语料库Ⅱ作为对比语料库,利用AntConc中的主题词检索功能,得到《呼啸山庄》的主题词表(表1)。“在语料库文体学研究范式中,词表和主题词检索是鉴别作家创作意图和风格的重要途径” [5] 。通过检索出现频率高,关键值大的词,可以确定并串联起文本的故事情节。其中关键值越大,说明这个词的重要性越大,在推动故事情节发展方面起的作用越大。

从关键词表中选取前20个主题词,可以清晰地看到文本中出现频率最高的人名包括Heathcliff (116)、Edgar (82)、Cathy (52)、Linton (49)、Hindley (34)、Hareton (29)、Isabella (20)、Catherine (38)。其中关键值最高、排在第一位的是Heathcliff (希斯克利夫)。另外,wuthering (52)和thrushcros (67)频率也很高。毫无疑问,可以得出故事发生的地点在“呼啸山庄”和“画眉山庄”。希斯克利夫是整个故事的核心人物也就是主人公,而整个故事也是围绕着这些人物所展开。故事从一开始就围绕着Heathcliff的复仇而展开,从小受到辛德雷的虐待和唾弃,接着,伴随着他度过童年、从小就青梅竹马的凯瑟琳选择嫁给林顿,使他对辛德雷和林顿充满了仇恨。当他的眼中钉辛德雷和林顿都死去时,他的报复延伸到了辛德雷与妻子伊莎贝拉的儿子哈林顿以及林顿的女儿小凯瑟琳身上。然而,从故事发生到故事结束的31年里,辛德雷夫妇、凯瑟琳、林顿、伊莎贝拉、伊莎贝拉的儿子小林顿都相继死去。当希斯克利夫的复仇计划一步步实现,当所有人因他而离世,最后他也选择了以不吃不喝的方式了解自己的生命。他的死是对凯瑟琳生

Table 1. The first 20 keywords in Wuthering Heights

表1. 《呼啸山庄》的前20个主题词

死不渝的爱的一种殉情,他由爱生恨,十八年来一直为爱做着疯狂的事情。同时,我们可以根据检索到的Heathcliff词图(图1)看出,他在故事中出现的频率非常密集,这说明他作为主人公始终贯穿于整个故事情节之中,直到复仇以他的自杀而告终,小说也随之结束。

4.2. 小说主题检索

通过统计、分析和处理关键词表中的前100个关键词(完整词表略),除去其中的功能词汇和人物名字的词汇,我们可以得出《呼啸山庄》中出现频率在五次以上、关键值大的实义词(名次、动词、形容词),如表2

从表中可以看出,其中“love”一词出现频率较高,共出现37次,而这一事实巧好证实了小说的主题是关于希斯克利夫与凯瑟琳之间的爱情,他们青梅竹马,童年唯一让他感到欣慰的就是和凯瑟琳之间的真挚感情。但是为了让希斯克利夫摆脱辛德雷的迫害,凯瑟琳违背自己的意愿决定嫁给林顿。从此之后,希斯克利夫开始为爱展开复仇计划。他为了爱不顾一切,惊天动地,同时也使他成为了典型的“恶棍英雄” [6] 。因此,如词表中的“wicked”、“hate”等词的出现频率也同样较高。在爱情主题之下,最扣人心弦的部分是把希斯克利夫与凯瑟琳疯狂的爱恋注入了哥特式元素。从表中可以看出有“moors”、“bedroom”、“window”、“door”、“face”、“room”这些词出现频率也比较高,而这些词都是集中在描写希斯克利夫在凯瑟琳死后的癫疯状态。小说中经常夹杂着这样的场景:大雪夜,荒野深处的古堡山庄,夜深人静之时,凯瑟琳的鬼魂经常哭着要进他的房间,睡梦中被噩梦惊醒。“十八年来,凯瑟琳的孤魂萦绕在山庄附近,在旷野上彷徨哭泣,等待着希斯克利夫。整整十八年,希斯克利夫对她也念念不忘、朝思暮想,执意睡在她小时候住过的房间里,期望着梦中与她的鬼魂相见” [7] 。

Figure 1. The concordance plot of the word “Heathcliff” in Wuthering Heights

图1. 《呼啸山庄》中“Heathcliff”的词图展示

Table 2. Content words in the word list that appear more than 5 times (noun, verb and adjective)

表2. 《呼啸山庄》关键词表中出现频率5次以上的实义词统计(名词、动词、形容词)

当凯瑟琳与希斯克利夫分开之后,她这样说:“我过去整整七年的生活成个空白!我回忆不起来有这么七年的生活” [8] 。即使在病中,她也要求耐莉把窗户打开,这样可以让她看到呼啸山庄,精神上回到那长满石楠丛的小山头上与希斯克利夫重逢。在凯瑟琳死后希斯克利夫说:“又有哪样东西不令我想起她呢?我低头看着这屋内的石板地,她的容貌就出现石板上面!在每一片云里,每一棵树上,她的形象环绕着我。整个世界成了一个可怕的纪念品汇集,告诉我她存在过,而我失去了她” [8] 。他寝不安席、夜不能寐。在小说的最后,他们的魂魄在荒野上自在游荡,所以他们的爱情可歌可泣,“既超越了生死又成为了永恒” [7] 。这些都一贯是哥特体小说的特色,即:死亡、神秘、恐怖、阴暗。

4.3. 小说叙事风格检索

表1主题词表中可以看出,除了出现频率较高的人物名字以外,还有诸如:“I”、“I’ve”、“I’ll”、“I’m”的第一人称代词。他们的出现频率是关键词表中的又一大亮点。当然,在前20个主题词中还可以发现排在代词之后的第二人称代词“you”和第三人称代词“he’s”并列,但是它们的出现频率明显低于第一人称代词的出现。为了更加准确的说明问题,笔者以主题词表中的出现的人称代词为指南,利用AntConc的concordance检索功能统计出整个文本的人称代词(单项词)的出现次数,柱状图(图2)如下。

通过上述表格和柱状图分析可知,小说中的第一人称使用频率远高于第二人称和第三人称。由此可以得出小说是以第一人称视角来叙述的。在第一人称叙述中,叙事者属于非全知型,可以使读者在理解故事的过程中站在与叙述者类似的立场,又使得读者仿佛直接参与到情节的安排之中,这样以来,故事将变得更加可信。在《呼啸山庄》中,洛克伍德是整个故事的叙述者,他以第一人称首先讲述了他在呼啸山庄居住时的所见所闻。在病倒之后,好奇的耐莉·丁思对他的经历产生了兴趣而引发了他接下来的叙述。他既是叙述者又是小说中的人物,但他并不参与到故事中发生的活动中去。如此,他只是一个冷眼旁观的观察者身份,客观冷静地叙述着过去和眼前正在发生的事情。

洛克伍德四次拜访呼啸山庄,从他的所见所闻逐渐把读者带入到一个神秘莫测、充满恐惧与仇恨的世界。一开始洛克伍德连无法理清山庄里互相仇恨的三个人之间的关系。先是他自己梦见凯瑟琳的鬼魂,亲身讲述了整个恐怖的过程。随着他以第一人称进一步叙述,使整个故事情节变得更加扑朔迷离,哥特体小说的阴森氛围至此跃然纸上。此时,读者和他一样感到想迫切知道人们如此仇视的原因,他们结下了什么样的恩怨?之后,耐莉把故事的前因后果讲给了洛克伍德:希斯克利夫被恩肖先生领养并带回呼啸山庄,与凯瑟琳两小无猜一起长大并决定私定终身,却受到辛德雷的百般陷害,最后得知心爱之人将

Figure 2. The appearance frequency of personal pronoun in Wuthering Heights

图2. 《呼啸山庄》中人称代词出现频数统计

嫁给林顿之时,愤然出走远离他乡,多年之后开始回归故里,开始了他残忍地报复计划。此时,无论是读者还是洛克伍德都对小说中三人之间的仇恨根源感到恍然大悟,同时也为凯瑟琳与希斯克利夫之间的爱情故事而感到震撼。但小说中的人物结局仍然不得而知。于是叙述洛克伍德最后一次来到呼啸山庄,再一次通过耐莉对他讲述了解他离开之后庄园里所发生的事情。

可以看出,小说自始至终都是通过洛克伍德的第一人称叙述构建故事的脉络,形成了一个叙事框架。他对现在正在发生事情的叙述加上耐莉第三人称对过去发生的事情的补充使得整个小说文本如同真实发生的故事一样,如此黑暗、残忍、暴力和不择手段因而不言而喻。透过这种叙事的互动,不断地激发起了读者的阅读兴和好奇心,使得小说中的哥特元素和氛围既真实又刺激。图3对第一人称“I”的词图检索也能清晰地看出小说中第一人称叙述的密集度。

4.4. 小说人物特点检索

利用软件AntConc的Concordance(索引行)检索功能对Heathcliff进行检索得到116条结果,因此Heathcliff在文中出现了117次。再通过File View功能对Heathcliff出现的语境进行逐条分析发现,除了极少的中性描述以及凯瑟琳叙述其对希斯克利夫的感情以外,其中有100多处的语境都是消极的,也就是说伴随着希斯克利夫这个名字的出现,其前后搭配的词都是具有消极语义韵的。笔者摘取部分索引行如下:

There were no other servants, it seems that Mr Heathcliff hardly ever received guests./Mr Heathcliff certainly does not like a farmer. His skin and hair are dark./Mr Heathcliff asked me rudely, when he finally entered the room./I did not feel at all comfortable at last Mr Heahcliff came in./That horrible old servant Joseph is always angry with Mr Heathcliff because we don’t pray or study Bible./In a while, I saw Mr Heathcliff walking through the gate, and I was shocked to see him alone./I saw that Heathcliff had caught him and he stared down at the children he was holding./I can’t marry Heathcliff now because Hindley has made him poor./If Heathcliff

Figure 3. The concordance plot of first pronoun “I” in Wuthering Heights

图3. 《呼啸山庄》中第一人称“I”的词图检索

and I married, we would become very poor./That devil Heathcliff told you he could never love Miss Isabella./Her loving husband repeated Heathcliff scornfully./I tried to persuade Cathy that Heathcliff could not be telling the truth. /Treating a dying child as cruelly and wickedly as we later discovered Heathcliff had done./I told him how Heathcliff had trapped us./ I am sure that Mr Heathcliff was going to hit her and he took hold of her with his one strong hand./

Heathcliff 所在索引行的描述性搭配都是一些带有消极感情色彩或者是贬义色彩的。一方面对他的外貌用了“dark”来形容;说话口气是“rudely”;对待孩子也是“wickedly”;另外,文中还多次用到“holding”一词来形容希斯克利夫的残暴行为。这些描写与搭配有力地烘托出了他在小说中的“恶棍”和“魔头”形象。希斯克利夫偏执地爱着凯瑟琳,狂暴而又炙热的爱恋导致了他最终自绝于人世。当知晓凯瑟琳已死之时,他“把头朝那多节疤的树干撞,抬起眼睛,吼叫着,不像一个人,却像一头野兽被刀和矛刺得快死了” [8] 。十几年里如痴如狂地期待着与凯瑟琳的鬼魂对话,所以他脾气古怪、性情乖戾,是“提取了虎、狼、恶狗、野猫的显著特征” [9] ,为爱不顾一切的活生生的异化人形象。为了达到报仇的目的,他不惜以亲生儿子作为代价和诱饵,把上一代的仇恨无情地抛掷在无辜的哈里顿和小凯瑟琳头上,对他们实施肉体和精神上的双重折磨。

追溯这种形象的根源,一开始希斯克厉夫是一个“弃儿”的身份,如同“一匹来自荒原的野兽,‘外来者’和‘他者’形象” [10] 的标签伴随他的一生,这样的“野孩子”难以摆脱受人欺凌和嘲笑的命运。再加上生活在荒凉偏僻的山庄,约克郡是渺无人烟的长满石楠的荒野,这样冷峻阴凄的生活环境促成了他内心的孤僻与缄默。凯瑟琳曾今是他从小到大的心灵支撑,当唯一的依赖将要被夺走离他而去时,他的整个世界都崩塌了,刻骨铭心的爱变成为了痛心疾首的恨,逐渐沦落为爱疯狂的“拜伦式英雄”。这种野性异化的生命力是“原始的、野性的和具有异教精神的” [11] ,既爱又恨的主人公也正是哥特体小说的独特魅力之处。

5. 结语

本文选取小说文本建立微型语料库和对比语料库,通过语料库检索软件AntConc来分析《呼啸山庄》的主题情节、叙事风格和人物特色,试图为研究哥特体小说提供新的思路。通过大量数据的量化分析,也可以实现对文本更加直观和客观的解读。从词表、关键词表、词图分析、索引行检索、语境检索入手对真实语料出现频率、密度和规律分布、语义域特征进行归纳并制成图表,再结合语料库文体学的角度进行分析是探讨《呼啸山庄》作为典型哥特体小说文本的又一例证。因此,跳出传统个案式的、动态的语篇研究方法,运用语料库手段对文本进行量化的、静态的、从形式到意义的新型研究理念有助于丰富文学批评的研究方法,促进文学批评与实证研究的进一步融合。这不失为一个有意义的创新尝试。

基金项目

2017年度中央高校基本业务费科研项目(编号:3102017JC19006);2017年西北工业大学研究生创新创业课程建设项目阶级成果。

参考文献

参考文献

[1] 霍书海. 从《呼啸山庄》与《简爱》赏析哥特式小说风格[J]. 山东社会科学, 2015(S2): 477-478.
[2] 任艳, 陈建生, 丁峻. 英国哥特式小说中的词丛——基于语料库的文学文体学研究[J]. 解放军外国语学院学报, 2013, 36(5): 16-20.
[3] 卢卫中. 语料库文体学: 文学文体学研究的新途径[J]. 外国语, 2010(1): 47-53.
[4] 杨春会, 于馨. 《呼啸山庄》中悬念与人物性格和情节的关系[J]. 大连海事大学学报(社会科学版), 2013, 12(2): 89-91.
[5] 凤群. 基于语料库的意识流小说《达罗卫夫人》文体学分析[J]. 山东外语教学, 2014(1): 43-47.
[6] 贾晓霞. 从女性哥特式视野探析《呼啸山庄》[J]. 吉林工程技术师范学院学报, 2016, 32(2): 68-70.
[7] 高继海. 《呼啸山庄》的主题与叙事[J]. 外国文学研究, 2008, 30(3): 108-115.
[8] 艾米莉•勃朗特. 呼啸山庄[M]. 杨苡, 译. 南京: 译林出版社, 2001: 156, 195, 512.
[9] 邓颖玲. 在希斯克利夫形象的后面——《呼啸山庄》中希斯克利夫创作模型考证[J]. 外语与外语教学, 2003(6): 36-37.
[10] 胡素情. 两种生成观: 兼论《呼啸山庄》中的女性歇斯底里[J]. 外国文学, 2013(4): 119-126.
[11] 王喆. 《圣经》原型对《呼啸山庄》的影响[J]. 北京航空航天大学学报(社会科学版), 2014, 27(4): 94-98.