1. 引言
文体学是研究语言在文学文本中使用方式及其风格构建的学科,兼具语言学与文学研究的双重属性[1]。随着语料库语言学的发展,传统依赖直觉和个案分析的文体学研究逐渐与计算机辅助的定量方法结合,形成了“语料库文体学”(Corpus Stylistics)这一新兴交叉领域[2] [3]。语料库文体学借助搭配词、关键词、关键词丛等工具,可以从宏观视角揭示文本中潜在的语言模式与风格特征,弥补了传统方法在数据规模和客观性方面的不足[4] [5]。
近年来,国内外学界在语料库文体学的理论建构和实证研究方面均取得了丰富成果。例如,Mahlberg以“词丛”切入狄更斯文体并展示“词丛”在叙事功能识别中的作用[5];Martin Wynne则从方法论层面指出语料库方法为文学风格研究提供了“基于语言事实的实证路径”[6];Basant等学者亦尝试以关键词丛分析非裔文学中的人物刻画与主题焦点[7]。然而,尽管已有研究多聚焦于文本风格、人物描写或主题结构的量化呈现,对于“意象”这一兼具语言形式与象征意义的核心文学概念,其在具体文本中的构建机制与语料特征尚缺乏系统探讨。
托妮·莫里森作为非裔美国文学代表作家,其小说《最蓝的眼睛》通过细腻的语言与象征体系,深刻揭示了主流美学标准对非裔群体心理和文化的深远影响[8] [9]。学者们普遍认为,莫里森通过对角色的细致刻画与社会背景的紧密联系,真实描绘了社会中的不平等机制[10]。近年来,越来越多的研究聚焦于莫里森作品中的“主体建构”主题,特别是关注人物心理的复杂变化如何反映社会文化对个人的影响[11]。然而,针对这些主题的语料库研究仍较为稀缺,本研究将填补这一空白,通过量化分析方法进一步探讨莫里森如何利用语言构建复杂的文化身份。本文拟引入语料库文体学的关键词丛分析方法,围绕小说中的典型意象展开多维度探讨,旨在量化揭示小说中的关键词丛及其背后的意象系统;结合文本细读,探讨这些意象在文化身份、身体经验与空间结构上的象征功能;以此回应当前非裔文学研究中“意象批评”与“数字方法”脱节的研究空白,并为语料库方法在文学批评中的拓展提供理论与实践支持。
2. 意象的艺术与力量
2.1. 文学意象的定义与作用
“意象概念属于诗学与美学的本体范畴,也属于心理学的范畴,它贯穿于创作、接受与翻译的多个层面,既是作者主客交融的产物,也是读者与文学文本审美交流的结果,更是翻译者在双语交互过程中对文化价值及美感的一种传递”[12]。而且意象在文学中扮演着至关重要的角色,它不仅是文本中具象或抽象的象征,更是作者情感、思想和主题的载体。文学意象的定义广泛,可以是通过感官体验到的任何事物,如色彩、声音、气味等,它们在读者心中唤起特定的情感和联想。例如,《杀死一只知更鸟》中的“知更鸟”意象是哈珀·李精心构建的一个核心象征,它不仅贯穿了整部小说,而且深刻地反映了作品的主题和作者的思想。“知更鸟是一种报晓鸟,它歌声婉转如珠、悠扬,而且还专吃害虫,深受人们喜爱,它代表一种天真无邪与纯洁无瑕的事物。而《杀死一只知更鸟》讲述的是一群天真无邪、无辜的人被罪恶毁灭的故事。当你杀死这样一只鸟儿的时候,就好像在杀死无辜的人”[13]。在这个故事里,“知更鸟”代表着那些无辜、善良且对他人无害的人们,他们如同知更鸟一样为人们带来美好的事物,却因为社会的偏见或误解而遭受不公正的对待。根据文学理论家罗兰·巴特的观点,意象是文本中“可读的”和“可写的”层面之间的桥梁,它既承载了作者的意图,也为读者提供了丰富的解读空间。意象在英文小说中的运用尤为显著,它们通过特定的文化符号和象征意义,加深了作品的主题,丰富了情节的层次,塑造了人物的性格,从而在文学创作中占据了不可或缺的地位。
2.2. 意象研究的重要性
意象艺术在外国英文小说中的研究,不仅丰富了文学批评的维度,而且深化了我们对文本内在意义的理解。通过对意象的深入分析,我们能够揭示小说中隐藏的主题和作者的深层意图。在弗·斯科特·菲茨杰拉德的《了不起的盖茨比》中,绿灯的意象贯穿全书,成为盖茨比对理想化爱情和美国梦追求的象征。盖茨比的信念就在那盏绿灯上,它代表着主人公对未来的希望与自己所追逐的梦想。
“这盏绿灯就像是在茫茫黑夜中大海里面的一盏导航灯一样,指引着盖茨比走出黑暗,脱离他人生中的困境,使他迈向新生”[14]。绿灯这一意象不仅推动了情节的发展,也加深了读者对盖茨比悲剧命运的同情。意象通常是作为文学作品中一种通过感官印象来表达思想和感情的手段,它通过对抽象概念具体化,使读者能够更加直观地感受到作品的情感色彩和主题深度。研究外国英文小说中的意象,有助于我们理解不同文化背景下作者如何运用意象来传达特定的文化观点和价值观,从而在跨文化交流中促进更深层次的理解和共鸣。
2.3. 流派视角下的意象运用
不同文学流派在意象的选取、组织与阐释路径上各具侧重。现实主义文学流派,如查尔斯·狄更斯的作品,倾向于使用意象来描绘社会现实和人物心理,通过具体的象征物来反映社会不平等和人性的复杂性。《雾都孤儿》中,雾不仅是伦敦环境的写照,也象征着主人公奥利弗所面临的道德和物质的迷雾[15]。现代主义文学流派,如弗吉尼亚·伍尔夫的作品,意象的运用则更为抽象和内省,意在探索人类意识的深层结构。在《到灯塔去》中,灯塔的意象反复出现,既代表了人物的希望和追求,也反映了时间的流逝和人类存在的孤独感[16]。后现代主义文学则常常打破传统意象的界限,通过拼贴和混杂的手法,创造出新的意象,如托马斯·品钦的《万有引力之虹》中,火箭的意象既是对科技的讽刺,也是对人类命运的隐喻[17]。这些流派对意象的运用和理解,不仅丰富了文学的表现手法,也深化了对文学作品主题和文化背景的理解。
3. 语料库视角下文学意象的深度挖掘与剖析
3.1. 研究设计与方法
3.1.1. 语料构建与可比性控制
以托妮·莫里森长篇小说《最蓝的眼睛》(The Bluest Eye, 1970)为目标语料库(T-corpus),用于提取与检验其意象构建的语言学特征。经标准化预处理后,目标库总词次为54,770。参照语料库(R-corpus)选取1965~1975年间美国当代五位作家的五部经典长篇小说,总词次为853,255。采样准则包括:
① 体裁一致(叙事长篇),排除诗歌、戏剧及非虚构文本;
② 年代与语域接近(十年内的美国英语文学叙事);
③ 文学史地位与文本长度具有可比性,以减少主题与规模差异带来的偏差。
两者均仅包含小说正文,确保比较基准的一致性。
3.1.2. 文本来源与预处理
电子文本来自公开获取的馆藏型电子资源库。下载后进行统一的“降噪与规范化”处理:
① 去除与正文无关的副文本与外部噪声(封面、版权页、目录、致谢、版本说明、广告与读者评论等);
② 编码统一为UTF-8;引号、破折号与连字符规范化;数字、专名与复合词按英语书写习惯处理;
③ 大小写策略为保持专有名词首字母大写,其他词形不做全局小写化,以保留大小写在风格层面的区分信号;
④ 不进行自动词形还原与停用词剔除,避免削弱文体差异与叙事短语(如固定色彩搭配、身体感官短语)的识别。
处理后的文本仅保留小说正文,以确保统计的纯净性与可复现性。
3.1.3. 工具与统计指标
关键词丛为以LL与PMW (百万词频)为依据,在目标库中显著过度出现并同时满足词丛阈值的Cluster/N-gram单位。本研究使用AntConc 3.5.9进行2~5元词丛的对比检索与统计,最小频次阈值设为≥5 (T-corpus内)。以目标库为检验库、参照库为背景库,采用对数似然(Log-Likelihood, LL)计算“关键性”,以此为基础提取关键词丛。显著性阈值设为p < 0.001 (对应LL > 10.83),并报告标准化频率PMW以用于跨库对比。
3.1.4. 分析流程与判别准则
流程分两步:
(1) 生成词丛与关键词丛:T-corpus与R-corpus分别生成词表并计算关键性,得到候选关键词丛集合;
(2) 提取与筛选词丛:在候选关键词丛中提取2~5元词丛,按频次、LL、MI与T-score综合排序。
3.2. 数据分析:意象的选取
3.2.1. 描述性统计(表1)
Table 1. Descriptive statistics of target and reference corpus
表1. 目标库与参照库的描述性统计
语料库 |
包含小说 |
形符数 |
目标语料库(T-corpus) |
The Bluest Eye |
54,770 |
参照语料库(R-corpus) |
The executioner’s song, Rabbit run, Cats cradle, In cold blood, Humboldt’s gift |
853,255 |
3.2.2. 关键词丛提取与结果概览
AntConc 3.5.9下设定N-gram Min size为3,Max size为4,Min Freq为5,分别生成T/R两库词丛;随后以R-corpus为背景对照,筛得T-corpus的关键词丛并按频次排序。为消除长度效应,附上PMW (以54,770词次为基数),见表2。
Table 2. Key cluster list (TOP 10)
表2. 关键词丛列表(TOP 10)
关键词丛 |
标准化频率(PMW) |
词频 |
The Maginot line |
310.4 |
17 |
I don’t |
310.4 |
17 |
Frieda and I |
292.1 |
16 |
Play with Jane |
219.1 |
12 |
Aunt Jimmy’s |
182.6 |
10 |
Don’t know |
164.3 |
9 |
A hotel room |
146.1 |
8 |
Black emo |
127.8 |
7 |
Little black girl |
127.8 |
7 |
You don’t |
127.8 |
7 |
3.2.3. “名词实义”关键词丛与意象阐释(四例)
为凸显意象载体的名词性与象征密度,选取四条具备明确指称中心的关键词来做分析:
The Maginot Line (310.4 PMW):绰号将“堡垒–防御–失陷”的历史隐喻迁移到人物身上,形成“防御性主体”与“被凝视的女性/少数族裔身体”的张力场,映射族裔与性别的双重脆弱性。
Aunt Jimmy’s (182.6 PMW):以亲属称谓为中心的所有格结构,将家族记忆、血缘关系与身体叙事捆绑,构成“家庭–身体–历史”的意象链条。
Play with Jane (219.1 PMW):与启蒙读本Dick and Jane 的互文使“学习–模仿–规训”的文化编码显形,展现出主流中产日常作为“规范模板”所具有的隐性影响。
A hotel room (146.1 PMW):临时空间与匿名栖居指向了人物身份悬置与社会游离,强化了“阈限性(liminality)”与“过渡性”体验的空间意象。
4. 数据分析:意象的解读与深度剖析
4.1. “The Maginot Line”意象的阐释与功能
4.1.1. 指称确证与语料证据(见图1)
对“the Maginot Line”相关索引行(图1)进行KWIC检视可见,其前后高频伴随女性指称代词(she, her, herself)以及表征具体行动的实义动词(如eat, put, slipped, smiled, yawned)。这类指称共现链与人类行为动词共同指向了the Maginot Line在文本中并非军事设施的直称,而是对女性人物的绰号式命名,具有人称化与叙事参与的属性。此处的“命名–指称–行动”三联关系,为后续意象阐释提供了可复核的语料依据。
Figure 1. The Maginot Line KWIC
图1. The Maginot Line索引行
4.1.2. 命名策略与隐喻结构
在The Bluest Eye中,the Maginot Line作为人物绰号具有明显的反讽性命名特征:其语源指向法国战间期的边境防御体系,而小说语境中该人物被描写为“肥胖、生活放纵”的女性形象,并在社区舆论场中承受负面标签与回避态度。从隐喻映射看,军事防线的语义场(防御、阻隔、坚固与失效)被转写为一种身体和空间的象征复合体:防御和阻隔被转化为对外界目光与评价的一种所谓的“自我防护层”;堡垒意象与原文中“一座肉山,以一种几乎占据了整个摇椅的方式坐着”[18]等细节描写共同形成体量空间占据的可视化;历史上“马奇诺防线的失败”隐含着一种反向讽喻:被命名者表面“厚重如防线”,实则社会地位脆弱、难以抵御主流社会施加的排斥。
事实上The Maginot Line这一绰号不仅象征着人物的防御性和脆弱性,还反映出她对社会标签的抵抗。通过这一意象,莫里森揭示了一个深刻的矛盾:表面上,这一“防线”象征着人物对于外界评判的防御和隔离;然而,历史上“马奇诺防线的失败”也隐含了这一防御机制的失败,暗示着个体如何在强大的社会审美压力下,逐渐瓦解或变得脆弱[19]。通过这一多重含义的解读,我们看到的是一种身体与空间的象征性映射,人物“自我防御”的表象与实际“防线失效”的结局形成强烈张力,体现出被边缘化人物内心无力感与试图反抗之间的冲突张力。
4.1.3. 身体书写与审美标准
The Maginot Line这一意象的文本意义在于展示主流审美被角色内化后引发的心理影响。小说中,与主流“纤瘦–克制–优雅”审美不相符合的身体,往往迅速被置入“庸俗–放纵–可鄙”的负面话语框架中。The Maginot Line作为带有贬义的绰号,恰恰体现了从审美约束到社会排斥的连续作用机制。如果将这一现象置于更广阔的文化视角,我们可以看到:主流审美标准借助“普遍性标准”的话语,如何将不符合主流的身体类型推向边缘[20]。而小说中这一蔑称在社区中的传播,正是在日常生活层面上这种边缘化企图的具体体现。
4.2. 身体部位意象的解读与应用
4.2.1. 语料证据与指称模式(见图2)
对“Aunt Jimmy”相关索引行(图2)进行KWIC检视可见:每当该人物被提及,身体词项(如“皮肤、手指、手掌”等)呈现高密度共现,且常与表征具身行动或生理状态的动词搭配(如表示触摸、握持、呼吸、疼痛、肿胀之类的述谓)。这类“人物指称–身体词项–行动述谓”的稳定组合,提示文本通过局部身体细节来完成对人物状态、情绪与处境的刻画,并以提喻(synecdoche)修辞机制,将个体的生命境况外化为可被感知与评判的可视化意象。
Figure 2. Aunt Jimmy KWIC
图2. Aunt Jimmy索引行
4.2.2. 身体作为社会话语的建构
社会学与身体研究为该类意象提供重要解释路径。Turner指出“身体既是个体生存之具身本体,亦是社会观念与话语实践的产物”[21];Francoeur强调身体形象铭记了自我观察、他人反应与个体经历情感等多维度信息[22]。由此可见,文本中的“身体”并非单一生理事实,而是记忆、身份与社会权力交互作用的产物。因此“Aunt Jimmy”的身体部位高频呈现,并非单纯地写实,而是将人物经历与其社会处境铭刻于肉身的一种叙事策略。
围绕“Aunt Jimmy”的身体描写在局部层面承担情绪标注与性格显影功能(如粗糙的皮肤、劳作痕迹指向生活压力与阶层位置);在宏观层面构成“衰退、病理、消逝”的时间化轨迹,逐步铺陈健康状况的下滑直至死亡。身体部位因而成为“生命史的可感媒介”:一方面将个体遭遇转译为可见的物理特征,另一方面也在叙事节律上形成“由局部到整体”的推进,强化读者对脆弱性与无常感的体会。
同时该人物的身体化书写,与文本对审美标准的批评紧密相连。那些不符合主流中产审美脚本(追求纤瘦、克制等)的身体,更容易被归入“庸俗、失序”的负面范畴,从而引发羞辱与排斥的社会反应。身体细部被过度放大与反复指称的书写方式,揭示了审美判断如何在日常语言中滑向道德评判,并用于塑造社会边界。与此相呼应的是,《最蓝的眼睛》中反复出现的“眼睛颜色”意象所折射出的内化的他者凝视:个体对自身外貌与价值的认知,深受主流审美标准的影响和左右。
4.3. Dick and Jane儿童读物意象的解读与应用
4.3.1. 语料证据与互文指向(见图3)
Figure 3. Play with Jane KWIC
图3. Play with Jane 索引行
对“Play with Jane”相关索引行进行检视可见,高度重叠指向同一来源段落:即以“Who will play with Jane?”为核心的启蒙读本片段。该段落在小说中并非独立叙述,而是作为互文性引导与叙事参照物反复出现,一方面提供理想化家庭的可视化模板(整洁房屋、温顺宠物、循规父母、快乐孩童),另一方面以可复制的语言模式(祈使、感叹和呼告)设定行为脚本与情感脚本。因此,出现的高频式样“play with Jane”并非单纯口语结构,而是指向一种模范性文本,一种以可读性与可模仿性为要义的文化范本。
4.3.2. 排版三式与秩序坍塌:从可读到不可读
小说将该读本段落以三种递进式排版呈现:其一为规范标点与句法;其二删去标点、加速节奏;其三进一步撤去空格并连缀词形,构成视觉与语义的混乱。这一从“可解析→半可解析→近乎不可解析”的排版梯度,映射了女主人公精神状况的崩溃进程,构成了文本可读性与角色心理秩序之间的隐喻关联:语言表层的“失序”,与角色在主流文化模板持续影响下的自我裂解互为表里。排版作为“外文本装置”,不仅是装饰性的版式变化,更是叙事学意义上的结构性隐喻。
4.3.3. 对照结构与价值批评:理想模板的反讽化
Dick and Jane 段落在叙事结构上起到“镜面文本”功能:以被过度美化的家庭图景作为对照面,反衬贫困、歧视与身份危机的现实。随着文本推进,读本的语块被不断截取、重排与失序化,读者的注意力也从“模板所呈现的秩序”转向“秩序如何失效”,从而完成对“普适审美与社会理想”的一种反讽处理。这个过程不仅揭示了“中产日常”作为规范性文化脚本是如何被自然化的,也呈现出这一理想模板对边缘人物所造成的心理伤害与自我价值感降低。
通过设置“可读性–可模仿性–可进入性”的层层限制,Dick and Jane意象实现了对主流审美观和家庭理想的范本化;而随后在版式和语序上的逐步失序,又揭示了这一范本在边缘角色主观经验中的崩塌。由此可见,读本意象不仅服务于叙事节奏和结构安排,更提供了关于审美与社会排斥之间关系的文本化证据。
4.3.4. 规范与认同之间的冲突
作为小说中的重要意象,Dick and Jane启蒙读本不仅仅是主流文化的规范模板,它还揭示了非裔角色在这种文化影响下所面临的困境。通过这一意象,小说一方面展现了中产家庭所代表的规范性标准,另一方面也呈现了非裔角色对这些标准的内化和反思。值得注意的是,这一“理想模板”的影响并非单向作用:它不仅塑造了主流文化的规范,同样也在无形中对小说中非裔角色的身份认同和自我表达产生了限制和影响。随着文本的推进,读本段落的语句逐渐被打乱和难以辨识,这种文本混乱映射出非裔角色在迎合这些规范的过程中所经历的心理变化和文化冲突。因此,Dick and Jane 意象所体现的并非只是文化规范的作用,它也成为促使人物对这种规范进行深入反思的起点[23]。
4.4. Hotel Room意象的解读与应用
4.4.1. 语料证据与叙事语境(见图4)
Figure 4. Hotel room KWIC
图4. Hotel room索引行
对图4所示KWIC进行检视可见,hotel room周边高频共现分离类动词(leave)与情感感受类动词(feel),并与人物关系变动的语段相邻。这一“空间指称–离去动词–情感述谓”的稳定搭配提示:文本将“酒店房间”标定为关系松动与情感撤离的触发节点,而非单纯场景说明。
4.4.2. 空间叙事框架与层级定位
Zora在《走向叙事空间理论》(Towards a Theory of Space in Narrative, 1984)一文中首次提出了叙事空间的三个层次:地志学层次(静态实体的空间结构)、时空体层次(事件或行动发生的空间结构)与文本层次(符号文本的空间结构层次) [24]。“酒店房间”归属时空体层次:它不是固定地景(非“地志学”意义上的稳定空间),而是与具体事件和行动紧密绑定的临时性情境空间。在《最蓝的眼睛》中,hotel room的反复出现与人物关系变化同步,构成一种阈限性(liminal)场所:功能优先、匿名可替换、停驻短暂。此类空间的时间粒度与事件密度明显高于家庭或社区等稳定场域,强化了叙事中的过渡。
4.4.3. 隐喻机制:从临时居所到关系修辞
文本以“离开酒店房间”比拟Velma离开Elihue的方式,将“酒店房间”的匿名性与可替代性转译为人际关系的低承诺低粘连结构:酒店房间“被占用而不被拥有”,对应关系中的“被使用而未被承诺”;停留的短时化与即时性,映射情感的快速建立与消散;凸显人物关系的浅表化。由此,“酒店房间”成为一种关系修辞:表层为住宿场景,深层为“无根的亲密”的叙事标记。
此外,还反映了更广泛的社会和文化议题,即在一个物质主义和表面化的社会中,人们追求的往往是对地位、外貌或物质的占有,而非真诚的人际交往和深层次的情感交流。作者通过反思Elihue与Velma的关系,以及自己对待他人的方式,实际上是在探索人性的复杂性,以及在缺乏稳定情感支撑下的生存状态。如果我们有阅读过莫里森的小说,就会发现其实这种深刻的反省和对人际关系本质的挖掘,是莫里森作品中一种常见的主题[25]。
Hotel room在文本中完成了从“功能性场所”到“关系隐喻”的转化:它以临时、匿名、可替代的空间属性,承载离去叙事功能,并与人物情感的脆弱化与被弃经验同构。在Zoran的空间叙事框架下,该意象清晰地指向时空体层次上的阈限结构;与全书关于审美标准与社会排斥的主题并置时,则构成对浅表化人际关系的批判。
5. 结语
以语料驱动的文体学考察表明,《最蓝的眼睛》的意象系统呈现出结构化的多维网络:一方面,“身体、护理、病理”的身体化链条、以Dick and Jane为中心的儿童读本意象链,以及“hotel room”所指涉的“空间阈限”链,与“Maginot Line”这类隐喻性人物命名共同构成了可被量化捕捉的意象谱系;另一方面,关键词、词丛与共现模式在章节位置上的聚集,揭示出“目光、羞耻、排斥”的叙事实效与情感导向。语料指标与文本细读的互证显示:主流审美标准在叙事中通过语块复现与话语程式自然化,进而使小说中的人物产生了对自身外表与价值的自我否定。相应的身份断裂、童年创伤与伦理困局,皆以可复核的语言模式被深藏于意象链之中。
方法论层面,语料库路径为“意象”的操作化提供了清晰流程:由词项–词丛–共现–位置分布的多层证据链,既能够量化呈现主题的突出度与扩散度,又能在KWIC语境核验与修辞、叙事功能标注中回落到文本内部,从而实现“宏观模式–微观证据–解释框架”的闭环。这一方法也为非裔美国文学主题的阐释增添了可复用的技术路线和评估指标。
面向后续研究,若在更大规模与更精细控制的参照库上展开(扩充同期作家、比较中译本和跨语种文本),并联用情感立场标注、意象网络可视化等工具,有望进一步刻画不同文化语境下“身体、空间、标准”叙事结构的异同,检验意象系统在作家群与时期层面的稳定性与变化性。因此语料库文体学与批评话语分析的结合,不仅拓展了《最蓝的眼睛》在主题与形式上的理解角度,也为数字人文语境中的文学批评提供了可复制、可比较、可视化的研究范式。
NOTES
*通讯作者。