1. 引言
随着语料库语言学的发展,将语料库技术应用于文学文本分析已成为当代文体学研究的重要趋势。语料库文体学融合了定量分析与定性解读的方法优势,不仅为文学批评提供了数据支持,也为揭示文本深层结构和解读作家风格提供了新的视角。近年来,越来越多的学者开始关注其在文学作品中的应用,尤其是在研究人物形象构建、主题演化与叙事空间等方面的潜力。语料库文体学逐渐成为中外学界关注的热点,相关研究主要聚焦于语篇模式、风格特征与文本结构的定量解读[1]。Marija (2015)提出,词簇分析可揭示特定作家的语言风格与叙事节奏[2],而Semino与Short (2004)则系统构建了以语料为基础的演讲与思想呈现模式[3]。国内学者亦逐步将语料库技术引入文学文本研究,取得了诸多有益成果。例如,任艳等通过构建“英国哥特式小说语料库”,对四词词簇进行了系统分析,揭示了该类小说在时间与空间描写上的语言特征及其文体风格[4];陈婵以爱丽丝·门罗的12部小说集为语料,探讨了3至6词词簇在塑造作家风格与主题表达中的作用[5];姜晓艳与张蓊荟则借助AntConc软件对《简·爱》的高频三词词簇进行细致分析,发现其在刻画人物心理和推动情节发展中的文体功能[6]。这些研究不仅拓展了经典文学作品的语言研究路径,也为理解文学作品提供了新的视角与方法。然而,以语料库方法深入剖析《绿山墙的安妮》语言结构的研究仍较为有限。
《绿山墙的安妮》作为露西·莫德·蒙哥马利的代表作[7],长期以来受到学界广泛关注。早期研究主要从成长小说、女性意识、教育伦理等主题入手,着重讨论人物性格、情节结构与文化接受[8]-[10]。近年来,研究视角更趋多元,涉及生态女性主义[11] [12]、心理发展[13] [14]、文学原型[15]等领域。此外,部分学者结合接受美学、叙事结构、宗教批评等理论,从文本与读者互动及文化符号角度出发,阐释小说的艺术魅力与文化影响[16]-[18]。
尽管研究成果丰富,但现有研究多依赖文本细读与主题式解读,缺乏对语言层面文体特征的系统量化分析,尤其缺少以语料库工具为基础对小说人物网络、语言风格与词语结构的实证探究。为弥补这一研究空白,本文以语料库文体学为方法论基础,构建《绿山墙的安妮》电子文本语料库,并以小说同作者的其他作品为参照语料库,通过WordSmith 4.0软件对小说中的主题词与高频三词词簇进行提取与分析。本文将从词汇层面与句法层面出发,重点探讨小说中人物关系的语言建构、女性主义主题的表达路径、地点意象的象征功能以及整体语言风格的分布特点,旨在借助语料证据深化对蒙哥马利文体特征的理解,并进一步拓展语料库方法在文学研究中的应用实践。
2. 语料库的建立及数据的提取
分别建立观察语料库和参照语料库。观察语料库为《绿山墙的安妮》小说的电子文本,总词数为103,258。这本书是一部由露西·莫德·蒙哥马利创作的经典长篇小说。这本书不仅描绘了安妮在绿山墙的成长经历,也展现了她如何以积极的态度面对生活中的挑战,包括友谊、学业、以及个人成长的烦恼。参考语料库是自建的与《绿山墙的安妮》作者的其他作品语料库,选取了20部小说,这些小说包括Emily of New Moon、The Blue Castle、The Story Girl等,总词数为1,724,707。
3. 词汇层面分析
检索并提取语料库中的关键词,有助于识别文学作品的主题特征,是分析语言风格和作家个性的重要方法。本研究使用WordSmith 4.0构建《绿山墙的安妮》的词表(Wordlist),并与参照语料库对比生成主题词表(Keyword list),根据关键值(Keyness)排序得出排名前50位的主题词(表1)。关键值反映某个词汇在目标语料中相较于参照语料的显著性,数值越高,表明该词更具文体代表性与叙事功能。正如Stubbs所指出的,Keyness排名前列的词语往往体现出文本的意识形态取向与结构焦点[19]。
Table 1. The first 50 keywords in Anne of Green Gables (noun)
表1. 《绿山墙的安妮》的前50个主题词(名词)
N |
key word |
Freq. |
Keyness |
N |
key word |
Freq. |
Keyness |
1 |
Marilla |
794 |
2981.57 |
26 |
Pye |
48 |
128.39 |
2 |
Matthew |
336 |
1743.05 |
27 |
you |
1449 |
122.78 |
3 |
Anne |
1102 |
1562.58 |
28 |
Rachel |
83 |
121.76 |
4 |
Diana |
384 |
1077.99 |
29 |
Green |
134 |
98.06 |
5 |
Barry |
117 |
509.81 |
30 |
Matthew’s |
24 |
95.65 |
6 |
Josie |
69 |
316.26 |
31 |
gable |
36 |
93.9 |
7 |
Lynde |
133 |
296.05 |
32 |
Diana’s |
29 |
93.62 |
8 |
Stacy |
58 |
277.76 |
33 |
sleeves |
31 |
86.59 |
9 |
Cuthbert |
61 |
249.86 |
34 |
Andrews |
45 |
86.42 |
10 |
Ruby |
84 |
238.6 |
35 |
school |
150 |
85 |
11 |
Phillips |
44 |
230.94 |
36 |
don’t |
326 |
82.26 |
12 |
I |
2472 |
219.85 |
37 |
picnic |
33 |
80.47 |
13 |
Anne’s |
100 |
212.06 |
38 |
Avery |
15 |
78.85 |
14 |
Gables |
91 |
188.62 |
39 |
Minnie |
21 |
78.83 |
15 |
Marilla’s |
54 |
183.69 |
40 |
I’d |
129 |
78.57 |
16 |
imagine |
75 |
177.76 |
41 |
puffed |
22 |
78.23 |
17 |
Allan |
73 |
175.91 |
42 |
geometry |
20 |
75.91 |
18 |
Gillis |
51 |
172.97 |
43 |
Spurgeon |
19 |
73 |
19 |
Mrs |
405 |
155.46 |
44 |
orphan |
23 |
71.1 |
20 |
brooch |
34 |
155.45 |
45 |
Spencer |
41 |
70.82 |
21 |
I’m |
362 |
153.13 |
46 |
so |
639 |
70.26 |
22 |
imagination |
57 |
148.99 |
47 |
class |
46 |
69.51 |
23 |
It’s |
296 |
146.53 |
48 |
to |
3041 |
68.89 |
24 |
Avonlea |
92 |
142.98 |
49 |
Cordelia |
20 |
68.89 |
25 |
asylum |
37 |
133.69 |
50 |
Elaine |
14 |
68.64 |
排在前三位的主题词是“Marilla”、“Matthew”和“Anne”,其关键值分别为2981.57、1743.05和1562.58,表明此故事的男女主人公为Marilla、Matthew和Anne,整个故事是围绕着这三位主人公展开的。另外的几个人物Diana (384)、Barry (117)、Josie (69)、Lynde (133)、Stacy (58)和Ruby (84)也高频出现,表明小说《绿山墙的安妮》拥有结构丰满的人物网络。他们都在小说中扮演着十分重要的角色,在整个故事情节的展开中发挥着不可忽视的作用。
尽管小说标题为Anne of Green Gables,表明Anne是故事的主角,但关键词分析揭示出另一种结构性焦点:在关键值排序中,Marilla (2981.57)和Matthew (1743.05)分别位列前两位,而Anne仅排第三。这表明,Marilla与Matthew在文本中的语言显著性超过了Anne本身。
从“Matthew”和“Marilla”的关键词索引行语料来看,Marilla与Matthew高频出现在家庭场景与情感交流的语境中。例如,在Anne初到绿山墙之际,邻居议论道:“It’s no wonder Matthew and Marilla are both a little odd, living away back here by themselves…”,揭示出他们长期生活在偏远地带、未曾抚养过孩子的背景,这也直接为Anne的到来与三人的改变埋下伏笔。在Anne逐渐融入Green Gables的过程中,“After supper Anne sat before the fire between Matthew and Marilla, and gave them a full account of her visit.”这样的表达展现出她与他们之间逐渐建立起的亲密与信任关系。而在她努力学习的阶段,“She wanted to ‘pass high’ for the sake of Matthew and Marilla—especially Matthew.”更突显了她将两人视作亲人、努力以成绩回馈他们的情感动机。
这些语料语境表明,“Matthew”和“Marilla”作为高频关键词,并非只是叙述对象的名称标签,更是文本中情感结构与家庭纽带的载体。他们在故事中的角色从“养育者”发展为“情感依附核心”,构成了Anne成长轨迹中不可分割的一部分。关键词排名与文本分布共同揭示出小说并非仅描绘Anne的个体成长,而是通过她与Marilla、Matthew之间的互动,共同构建了一个以家庭为中心的温情叙事框架[20]。
在表1的关键词统计中,与女性相关的人物词汇排名靠前。“Mrs”作为指代女性社会身份的称谓词,在目标语料中出现405次,其关键值显著高于在参照语料中的预期频率。该迹象反映出小说文本对女性角色的社会称谓与身份标签具有高度关注,与小说中女性群像的集中描写及角色之间的社会关系建构密切相关。主要女性人物如Marilla、Anne、Diana、Josie、Lynde、Stacy、Ruby、Allan、Minnie、Cordelia和Elaine的人名累计出现2752次,在关键词前列中占据主导地位,体现出女性角色在文本中的显著语言可见度。
Table 2. The male referential terms among the first 150 keywords in Anne of Green Gables (noun)
表2. 《绿山墙的安妮》前150个主题词中的男性指称词(名词)
N |
key word |
Freq. |
Keyness |
57 |
Gil |
11 |
56.46 |
59 |
Gilbert |
108 |
55.1 |
121 |
man |
43 |
−30.84 |
130 |
father |
28 |
−45.92 |
145 |
him |
174 |
−151.85 |
146 |
uncle |
3 |
−154.19 |
147 |
his |
216 |
−169.31 |
148 |
he |
430 |
−292.43 |
相较之下(表2),与男性相关的指称词在关键词排名中普遍靠后。以“he”(430)、“his”(216)和“him”(174)为例,虽然它们在小说中出现频率不低,但其关键值分别为−292.43、−169.31和−151.85,呈现出显著的负值,这表明相对于参照语料库,这些词在《绿山墙的安妮》中出现频次更少,因此并不具有文本特异性。尽管这些男性代词作为基础语言单位自然存在,但它们在该文本中并不构成具有显著意义的关键词,无法反映文本的叙事重心或人物聚焦。此外,具有男性指称功能的词汇如“father”(28次,−45.92)、“uncle”(3次,−154.19)、“man”(43次,−30.84)等,也多呈负关键值。结合前文的对比,再加上这种“高频负Keyness”的反向分布现象,表明在小说文本内部的词汇选择上,女性角色具有更强的文本显著性与主题聚焦力。关键词排名的结构性偏向,也从侧面反映出小说在人物构建和叙事组织中以女性经验为核心[21],强化了女性视角的表达与情感结构的铺陈。
然而,仅凭称谓和词频并不能直接推出文本具有明确的女性主义立场。因此,为增强论述的合理性,还需结合情节结构与人物功能来研究。小说的核心叙事围绕Anne的成长经历展开,其成长过程中最为关键的关系网络——Marilla的养育、Diana的友情、Miss Stacy的教育等——几乎全部由女性角色构成。男性角色虽然存在,但大多边缘化,或扮演辅助性角色。由此可见,《绿山墙的安妮》不仅在语言使用层面体现出以女性为中心的特征,在叙事结构和情感推进方面更鲜明地体现了女性视角与性别意识。这种结构性特征,使得文本在一定程度上具备女性主义叙事的内核。
由于语义上相类似的关键词会表达相似的话题,按语义域对主题词进行分类(表3)。对除专有名词的主题词进行分类得到以下几组:
Table 3. Classification of the first 50 keywords in Anne of Green Gables (noun)
表3. 《绿山墙的安妮》的前50个主题词分类(名词)
前50位的主题词分类 |
人名 |
Marilla, Matthew, Anne, Diana, Barry, Josie, Lynde, Stacy, Cuthbert, Ruby, Phillips,
Allan, Gillis, Pye, Rachel, Andrews, Minnie, Spencer, Spurgeon, Cordelia, Elaine |
所属关系 |
Anne’s, Marilla’s, Matthew’s, Diana’s |
地点 |
Gables, gable, Green, Avonlea, asylum, school, class |
动作/状态 |
puffed, picnic, imagine, imagination, geometry, Avery, orphan |
物品 |
brooch, sleeves |
其他 |
It’s, I’m, don’t, I’d, so, to, Mrs, You, I |
在《绿山墙的安妮》中,人名频繁出现,这反映出小说中人物群像的丰富性与立体性。每位角色不仅推动了情节发展,也共同构建了作品完整的叙事世界。这种高频出现的人物名称强化了小说的群体感,表明人物之间的互动与交流构成了叙事结构的重要组成部分。因此,《绿山墙的安妮》不仅是一部描绘主人公Anne成长的小说,也是一部深入刻画人际关系与社会纽带的文学作品。
在《绿山墙的安妮》这部小说中,Anne与Marilla、Matthew以及Diana之间的情感纽带构成了故事的核心。“Anne’s”出现频率最高,通过“Anne’s”这一所有格形式,作者细腻地描绘了Anne经历的特定事件、情感状态或人生阶段,强调了Anne个人经历的独特性和她对各种事件的主观感受,例如索引行中的“Anne’s Apology”、“Anne’s Confession”、“Anne’s consequent humiliation”、“Anne’s consequent excitement”、“Anne’s cup of happiness”、“Anne’s dejection”、“Anne’s disposition”、“Anne’s fuss”等等。这些表达不仅凸显了Anne在不同情境下的情感状态,而且深化了读者对Anne性格多面性的理解。这些描述贯穿全书,反复出现,成为刻画Anne与周围人物之间复杂关系的重要线索。
表地点的专有名词“gables”、“Avonlea”、“Asylum”、“green”、“school”等等,表明故事发生的主要地点在gables,即与小说同名的地点Green Gables。至此我们可以对故事有一个大概的了解,该小说是发生在加拿大的绿山墙(Green Gables)。主人公Anne的活动地点较多,Avonlea、Asylum、garden、school等等这些地点能反映了她丰富多彩的生活经历和成长过程,这些地点共同构成了一个温馨而生动的故事背景。
在《绿山墙的安妮》这部作品中,“imagine”和“imagination”这两个词高频出现。“imagine”后面紧接的内容以及语境中“imagination”所指代的,根据对应的索引行我们可以得出它们通常是Anne想象的内容,例如:
(1) Now, it’s so easy to imagine Mrs. Allan as a little girl.
(2) …until I put the pie in, and then an irresistible temptation came to me to imagine I was an enchanted princess shut up in a lonely tower with a handsome…
(3) How could I? Just imagine if you were a poor little orphan girl that kind people had adopted and…
(4) Her imagination began to suggest all manner of gruesome possibilities to her.
(5) “Even my imagination has its limits, for I can’t imagine THAT.” (Anne said to Diana)
(6) “Isn’t it fortunate I’ve got such an imagination?” said Anne.
(7) “Oh, there’s so much scope for imagination in a wind!” (Anne said to Marilla)
这些词汇的高频出现揭示了主人公Anne丰富而生动的内心世界。“imagine”和“imagination”是她个性中最鲜明的特征之一[22],它们为她的日常生活注入了诗意与活力。通过这些词,我们不仅得以窥见Anne如何以想象力构建她独特的精神世界[23],也能感受到她在与Marilla、Matthew、Diana等人物互动中展现出的情感张力与表达方式。正是这种想象力,使Anne的故事更具感染力与吸引力。因此,“imagine”和“imagination”不仅体现了Anne的个性特质,更在推动情节发展和深化主题表达中发挥着关键作用。
4. 句法层面分析
作为语料库语言学研究的一个重要领域,词簇虽然是小说文本的表层特征,但是他们指向小说的局部文本功能[24],具备“语境化”和“凸显”等功能,在人物塑造上具有重要功能,是甄别作家风格的一个重要工具。通过探索高频词簇的搭配与类连接可以了解小说的内容、主题及小说的话语结构。在本研究中主要考察3词词簇,本文以WordSmith 4.0的Concord功能提取作品中的3词词簇,得到如下表的3词词簇(图1)。
Figure 1. High-frequency lexical bundles with three words in Anne of Green Gables
图1. 《绿山墙的安妮》中高频3词词簇
在得到的所有3词词簇中,大部分是与地点相关的词簇,共9个,占总数(15个)的60%,这说明作者露西·莫德·蒙哥马利在构建叙事时,高度重视地点与环境的描写,并利用这些具体而富有象征意义的场所作为情感和情节发展的载体。例如:
(1) The kitchen at Green Gables was a cheerful apartment--or would have been cheerful…
(2) …until he was safely back at Green Gables.
(3) …a cheerful light gleamed out through the trees from the kitchen at Green Gables.
(4) she said frankly. “I’m awfully glad you’ve come to live at Green Gables. It will be jolly to have somebody to play with.”
(5) Anne and Matthew had the cheerful kitchen at Green Gables all to themselves.
(6) You’ll always have a home at Green Gables as long as Matthew and I are here…
(7) …a horrible choke came into her throat as she thought of her own white room at Green Gables, where she would have the pleasant consciousness…
(8) A good cry, indulged in the grateful solitude of the east gable, had soothed her nerve…
(9) Diana and I were only over in the Haunted Wood. It’s lovely in the woods now.
(10) The Haunted Wood mistake cured me of letting my imagination run away with me.
(11) …and I never feel very comfortable coming through the Haunted Wood in the dark now.
(12) The firs in the Haunted Wood were all feathery and wonderful;
这些索引行表明作者露西·莫德·蒙哥马利通过细致描绘地点,尤其是绿山墙农庄(Green Gables),创造了一个充满情感和象征意义的空间。上述索引行例子中的“cheerful”、“safely”、“glad”、“home”和“pleasant”等词语,不仅描述了绿山墙的物理环境,更重要的是,它们传达了这个地方对Anne以及故事中其他人物的情感意义。在索引行中,“cheerful”这个形容词被用来描述绿山墙的厨房,暗示这是一个充满欢乐和温暖的地方。厨房作为家庭的心脏,它的“cheerful”氛围反映了绿山墙作为一个家的温馨和舒适。“safely”这个词表明绿山墙是一个避风港,一个可以提供保护和安全感的地方。在索引行中“glad”这个词表达了Diana对于Anne的到来的喜悦,为Anne与Diana的友谊让绿山墙变得更加生动和充满乐趣做铺垫。“home”一词强调了绿山墙不仅仅是Anne居住的地方,更是她真正的家,“home”所在的索引行表明“home”也是Marilla和Matthew给予Anne的爱和接纳。“pleasant”这个词暗示绿山墙是Anne内心的避难所,是一个可以让她感到舒适和平静的地方。即使面临挑战,她也知道在绿山墙有一片属于自己的宁静角落。通过这些表达,作者成功地将绿山墙塑造成了一个充满温馨和安全感的场所。“Green Gables”成为了一种情感寄托,象征着爱和归属感[11]。
“Diana and I”这一词簇的高频出现,凸显了Anne与Diana之间深厚而纯真的友谊,是《绿山墙的安妮》中不可忽视的情感亮点。索引行中多次呈现她们日常相处的场景(图2)——无论是游戏中的欢笑,还是午后时光的分享——都生动地展现了两人之间细腻而真挚的情感。这种高频的语言搭配不仅丰富了人物塑造,也增强了文本的温情氛围。
词簇Matthew and Marilla出现频次也较高,索引行“I behaved terribly to you--and I've disgraced the dear friends, Matthew and Marilla, who have let me stay at Green Gables…”和索引行“Anne went home to Avonlea with Matthew and Marilla that evening. She had not been home since April…”均表明Matthew和Marilla在Anne的生活中占据着不可替代的位置。他们不仅是养育她、陪伴她成长的重要人物,更是她获得情感支持与归属感的核心来源。
从语料中的搭配频率与语境来看,“Matthew and Marilla”不仅是两个角色的并置,更是小说中“家庭”这一情感主题的象征[25]。词簇的反复出现强化了Anne与Matthew and Marilla之间深厚的亲情联系,也从侧面凸显出绿山墙不仅是地理空间,更是一种温暖、安定、可以依靠的“家”的象征[20]。这种家庭纽带的呈现,不仅丰富了小说人物之间的情感层次,也深化了文本的情感基调,提高了文本的叙事温度。
Figure 2. KWIC of lexical bundles “Diana and I”
图2. 词簇“Diana and I”的索引行
5. 结语
本文通过构建《绿山墙的安妮》文本语料库,借助WordSmith 4.0对关键词与三词词簇进行分析,从词汇与句法两个层面揭示了小说在人物塑造、叙事结构与主题表达中的语言特征。结果显示,尽管Anne是叙事核心,“Marilla”与“Matthew”在关键词排序中的显著性更高,体现出一种以家庭关系为支点的“共同成长”叙事。词簇分析进一步呈现了“Green Gables”的情感空间、“Diana and I”的友情互动,以及“imagination”所映射的精神世界,丰富了文本的主题层次。
语料库文体学在本研究中展现出明显优势,即关键词与词簇的定量分析为理解人物关系与主题表达提供了数据支撑。然而,该方法对修辞策略、象征意象等深层文体特征的识别能力有限,仍需结合文本细读。正如本文所示,女性称谓“Mrs”的高频出现虽具统计特征,但若脱离语境分析,难以支撑文本具有女性主义立场的论述。这进一步说明,语料库方法适用于结构性描写的提取,但其解释性仍需传统文体学作为补充。
综上,本文在深化《绿山墙的安妮》语言结构理解的同时,实证展现了语料库方法在青少年文学与女性叙事研究中的应用潜力。未来可通过引入跨文本比对、多模态分析或角色语体建模,进一步拓展对蒙哥马利文本风格与叙事策略的系统性探索。