1. 引言
语言具有动态性,会随着社会、文化和历史的发展而变化。词汇作为语言的重要组成部分,其意义通常被认为是固定的或约定俗成的,然而实际应用中的词汇含义并不是一成不变的,因此可以说构成语言的成分也是动态的[1]。词汇“increase”是表示增长与变化的语言标记,虽在书面或口语中经常被使用,但该基础词汇在不同时期的历时变化尚未得到充分关注与探讨。基于语料库的历时研究能够捕捉特定词汇在不同时期的使用特征,为揭示语言与社会的关系提供实证支持。
历时研究主要是对语言随时间的推移而产生变化的动态研究,早期已有许多学者开展历时语料库研究[1]。其中具有代表性的包括Leiv E. Breivik对there语法化过程的调查。Breivik (1983)基于历时语料发现古英语中表存现的there2与表方位的there1在用法上出现分工[2]。随后又分别与学者Swan (2000)和Martínez-Insúa (2008)从共时与历时的角度研究了there一词的语义语用发展[3] [4]。另一位学者Bente Altenberg主要从事跨语言对比研究,其众多研究成果基于英瑞平行语料库探讨语言现象。其中Altenberg (2010)基于双向翻译语料库,对比了英语和瑞典语中“然后”一词,发现两个词在功能、位置等方面存在显著差异[5]。除英瑞对比,瑞典语与德语的对比也在其研究范围,此类研究提供了丰富的跨语言图景,揭示了语言使用的跨文化差异。
本研究在前人语料库研究的基础上,补充了词汇层面历时变化的实证案例,借助布朗家族语料库从使用频率、分布情况和搭配变化等方面探究“increase”一词的历时演变。布朗家族语料库涵盖了约70年的英式英语文本,为学者观察词汇如何适应社会变化提供了可能[6]。以往研究虽强调了语料库在追踪词类分布和语篇迁移方面的价值,但大多研究仅聚焦特定语法结构或某个词汇的单一特点,而对词汇(尤其是含多种词性)的多维分析却较为少见[6] [7]。此项研究旨在明确“increase”一词在上述四个子语料库中呈现的变化,丰富英语本族语词汇内部的历时演变案例,进而揭示词汇变化与社会活动间的相互作用,帮助语言学习者更好地理解词汇的语义及语境变化,在实际交际中准确、灵活且恰当地运用词汇。
2. 文献综述
布朗家族语料库涵盖1931年Lancaster语料库、1961年LOB语料库、1991年FLOB语料库和2006年BE06语料库等,已成为历时语言学研究的重要数据源,为观察英语语言变化提供了纵向视角。袁新华(2016)基于该语料库对英语词类分布展开研究,重点分析了不同文体中特定频率模式的演变,这一演变反映了社会与交际的变化[6]。章柏成、许家金(2013)考察了英语现在进行体主语的形式分布及意义演变的历时变化[8]。这些研究均凸显了布朗家族语料库在捕捉语言历时变化方面的价值。
语篇层面的历时研究进一步将语言变化置于具体语境中。徐铭霞(2024)对《自然》杂志论文摘要语态的演变进行研究,揭示了科学语篇如何随时间推移适应学科规范[7]。历时研究还延伸至学习者语料库,为二语习得领域的变化研究提供了新视角。柴能(2022)探讨了英语学习者纵向语料库的构建,强调追踪中介语发展对教学的影响[9]。
在基于语料库的历时研究中,词频是最常分析的内容之一。赵秋荣、谢雪娥(2024)通过历时复合语料库考察了汉语虚义动词“做”的语用变化,其研究方法与利用布朗家族语料库开展英语研究的思路相似[10]。搭配分析进一步丰富了词汇历时研究的维度。Prihantoro (2022)基于布朗家族语料库研究“energy”一词的搭配情况,揭示了语义关联的变化规律[11]。孔敏(2014)则对形容词“good”与名词的搭配进行研究,为教师教学和学生学习提供了词汇学习策略[12]。
然而,多数历时语料库研究虽能有效捕捉较长时间范围内的数据,却缺乏对各子语料库间的对比分析。此外,尽管以往研究充分利用布朗家族语料库或其他大型语料库开展词频、搭配等方面的研究,但大多聚焦于某一方面的特征,对单个词语进行多维度分析的研究相对较少。
3. 研究方法
3.1. 理论框架
本研究以语料库研究方法及语言与社会共变理论作为支撑,从语言学和社会语言学双重视角为分析“increase”的历时变化提供依据。
Tognini-Bonelli (2001)提出的语料库研究方法,主张利用语料库中的定量证据支持定性语言分析,而非单纯依赖研究者的主观感受与观察[13]。该方法强调相关语料库研究需采用样本充足的真实语言数据。本研究的数据均来源于CQPweb语料库检索平台,符合这一要求,为开展英语词汇的历时研究奠定了基础。此外,词汇的历时变化不可避免地受到社会变化的影响。和纪翠(2020)运用美国语言学家布赖特的“语言与社会共变”理论研究网络热词变化,再次印证了语言与社会相互影响、相互作用[14]。因此,词汇的变化往往能够反映社会文化、价值观、生活方式和意识形态等多方面的变化。对“increase”一词进行历时研究,可揭示不同时期所呈现的社会特征。
3.2. 研究设计
3.2.1. 研究问题
1) “increase”一词的使用频率在布朗家族语料库的四个子语料库中呈现出怎样的变化?
2) “increase”一词在四个子语料库中的分布具有哪些特征?
3) “increase”一词的搭配关系和语义韵在不同时期有何变化?这些特征与社会变化之间存在怎样的关联?
3.2.2. 数据收集
本研究依托布朗家族语料库的四个子语料库——1931年Lancaster语料库、1961年LOB语料库、1991年FLOB语料库和2006年BE06语料库,通过CQPweb语料库检索平台获取数据。布朗家族语料库是拥有百年历史的重要语料库之一,包含了过去六七十年间的英式英语历时文本[15]。每个子语料库均收录了约100万词,涵盖4大体裁和15种文本范畴,是对比不同时期语言使用的最佳语料库之一。
在CQPweb平台,选择“Brown Family (extended)”语料库组,分别检索“increase”一词在上述四个子语料库中的使用频率、分布情况和搭配关系等信息。检索采用CQP简单通配符格式:(increase|increases|increased|increasing),检索结果涵盖“increase”的动词、名词和形容词形式,即不区分词类,检索所有词形。
在正式检索前进行先导研究,以确保对“increase”一词的检索具有可行性与合理性。分析过程采用定量与定性相结合的方法,使用CQPweb语料库平台检索出目标词汇的各项数据后,借助Excel软件进行数据整理与核对,并利用SPSS软件进行统计检验。
4. 结果与讨论
4.1. 词频分析
本研究以每百万词为单位,统计“increase”一词在四个子语料库中的使用频率。通过CQPweb平台提取词频数据,使用Excel进行交叉核对,结果见表1。数据显示,“increase”一词的使用频率随时间推移呈现出明显变化。该词在1931年Lancaster语料库中的使用频率为每百万词356.916次;到1961年LOB语料库中,频率显著上升至每百万词443.963次;1991年FLOB语料库中,频率略有下降至每百万词386.716次;而在BE06语料库中,频率再次呈上升趋势,达到每百万词461.164次,为四个语料库中的最高值。四个语料库中increase的平均使用频率为每百万词400.724次。总体来看,increase一词的使用频率呈上升趋势,在20世纪90年代前后经历了短暂下降。
Table 1. Frequency (per million words) of “increase” in four corpora
表1. Increase在四个子语料库的百万词频
Corpora |
Lancaster (1931) |
LOB (1961) |
FLOB (1991) |
BE06 (2006) |
Whole corpus |
Size of corpus |
1,162,739 |
1,141,986 |
1,142,958 |
1,147,097 |
6,897,517 |
increase |
356.916 |
443.963 |
386.716 |
461.164 |
400.724 |
4.2. 卡方检验
由于检索时仅考虑词形,未对词类进行限制,因此本研究使用SPSS软件对“increase”一词进行卡方检验,以判断其不同词形在四个时期的分布是否存在显著差异。根据相关数据,四个子语料库(Lancaster, LOB, FLOB and BE06)的词汇量均约为110万词,本研究认为各语料库的规模差异可忽略不计,因此直接采用原始频率进行分析。
4.2.1. 词形分布
表2呈现了increase的九种词形,覆盖动词、名词和形容词三大词类。此分布数据可在CQPweb检索后,选择“Frequency breakdown-Frequency breakdown of words and annotation”得到。
数据显示,increase不同词形的分布存在显著差异。九种词形中,单数名词形式“increase_NN1”在所有语料库中均为最常用词形(总计462次);其次是过去分词形式“increased_VVN”(共238次)和动词原形“increase_VVI”(共230次)。从词类来看,总体使用频率从高到低依次为动词(839次)、名词(568次)、形容词(443次)。此外,对三种词类在四个时期的使用频率分别统计后发现,动词形式(VVI、VVZ、VVD、VVN、VVG)的使用频率在每个时期均为最高(分别为139次、209次、203次、234次),这表明“increase”一词在文本中主要以动词形式出现,印证了动词在英国的学术英语和通用英语中的频数呈现出相对稳定的分布特点[6]。名词形式在LOB (1961)显著增长,至FLOB (1991)又显著下降,这一变化趋势与袁新华(2016)研究的名词历时变化趋势一致[6]。值得注意的是,在Lancaster (1931)、LOB (1961)、FLOB (1991)三个子语料库中,名词形式(NN1、NN2)的使用频率均高于形容词形式(increasing_JJ、increased_JJ);而在BE06语料库中,形容词形式的使用频率(143次)超过了名词形式(136次),这一变化表明“increase”的形容词形式在文本中的重要性逐渐凸显。周国辉(2013)指出词汇化与语法化存在着交叉或平行发展,且词的使用频率越高越容易被语法化[16]。各时期词形分布的演变背后也映射着各词类的语法演变,因此对词汇词形分布进行分析,本质上也是对Leiv E. Breivik (1983)词汇语法化研究的继承。
Table 2. Word form distribution of “increase” in four corpora
表2. Increase在四个子语料库的词形分布
|
Word form |
Lancaster (1931) |
LOB (1961) |
FLOB (1991) |
BE06 (2006) |
Total |
1 |
increase_VVI |
40 |
68 |
63 |
66 |
237 |
2 |
increases_VVZ |
20 |
23 |
38 |
32 |
113 |
3 |
increased_VVD |
13 |
41 |
34 |
36 |
124 |
4 |
increased_VVN |
83 |
54 |
35 |
66 |
238 |
5 |
increasing_VVG |
37 |
23 |
33 |
34 |
127 |
6 |
increase_NN1 |
108 |
134 |
103 |
117 |
462 |
7 |
increases_NN2 |
14 |
52 |
21 |
19 |
106 |
8 |
increasing_JJ |
45 |
63 |
53 |
52 |
213 |
9 |
increased_JJ |
44 |
44 |
51 |
91 |
230 |
10 |
total |
404 |
502 |
431 |
513 |
1850 |
4.2.2. 卡方检验结果
为检验“increase”的词形分布是否具有统计显著性,本研究采用卡方检验,结果如表3所示,皮尔逊卡方值为105.431 (自由度 = 24, p < 0.001),这表明检验结果拒绝原假设,具有统计显著性。由此可见,“increase”一词的不同词形在四个子语料库中的分布存在显著差异。词形分布的变化证明“increase”一词的用法随时间推移发生了改变。
Table 3. Chi-square test result
表3. 卡方检验结果
|
Value |
df |
p |
Chi-square |
105.431 |
24 |
<0.001 |
4.3. 分布情况
在CQPweb,通过“限定检索”功能将检索范围限定在四个子语料库内,随后选择“Distribution”,即可获取“increase”在不同文体和不同时期的分布信息,如表4、表5所示。
4.3.1. 按体裁分布
表4呈现了“increase”在四种不同文体(小说、非虚构散文、学术类、新闻类)中的百万词频。其中,该词在学术文本中的使用频率最高,达到每百万词906.55次;其次是非虚构类散文,每百万词459.2次;新闻类文本中每百万词389.52次;而在小说文本中,该词的使用频率大幅下降,仅为每百万词54.21次。结合文本类别的细分数据(见附录1),学术写作(J类)中“increase”的使用频率同样为每百万词906.55次,这表明“increase”一词多用于正式文本。许家金(2020)在历时语言研究综述中提到,学术文本中的话语在历时演变中更加客观,话语叙述性减弱,因此increase作为描述数据、趋势、变化等特征的常用词汇,在学术体裁中的需求度较高[17]。与之形成鲜明对比的是,在通俗小说(K类,每百万词61.74次)、推理侦探小说(L类,每百万词30.38次)和幽默类文本(R类,每百万词35.39次)中,“increase”的使用频率极低,因为小说等体裁在语篇演变过程中逐步口语化、平易化[17]。总体而言,“increase”一词更常用于客观、非个人化且正式的文本中。
Table 4. Word frequency distribution of increase based on broad genre
表4. Increase基于体裁的词频分布
Category |
Frequency (per million words queried within category) |
Fiction |
54.21 |
General prose (non-fiction) |
459.2 |
Learned (academic) |
906.55 |
Press |
389.52 |
Total |
411.99 |
4.3.2. 按语料库(时期)分布
“Increase”一词在不同时期语料库中的分布数据(表5)显示,其使用频率总体呈上升趋势:从Lancaster (1931)语料库中的每百万词356.92次,逐步上升至BE06 (2006)语料库中的每百万词461.16次;其中典型表达如“促进经济增长(increase economy)”、“拉动消费增长(increase consumption)”等。在1931至1961年间出现大幅上升,这一数据变化与英国战后经济重建及一系列经济政策的实施紧密相关[18]。“increase”的使用需求逐步增加更是受到经济全球化、科学技术发展要求等因素的催化。
Table 5. Word frequency distribution of increase based on corpus
表5. Increase基于语料库的词频分布
Category |
Frequency (per million words queried within category) |
Lancaster 1931 Corpus |
356.92 |
LOB 1961 Corpus |
443.96 |
FLOB 1991 Corpus |
386.72 |
BE 2006 Corpus |
461.16 |
Total |
102.94 |
4.4. 搭配关系及语义韵
本研究运用CQPweb的搭配检索功能,将检索跨度设定为左右各3词,与“increase”的最低共现频率为5次,基于对数似然值分析“increase”在四个子语料库中的搭配差异。对数似然值越大,表明该词与“increase”的搭配强度越高,搭配结果见附录2。从历时视角来看,搭配关系的变化能够反映不同时代的社会经济特征,也为追踪语义韵变化提供了依据。
Lancaster (1931)语料库中,与“increase”搭配紧密的名词性词汇有“消费(consumption)”、“失业(unemployment)”、“压力(pressure)”、“成本(cost)”等,词汇多涉及公共政策与经济问题,大多为事实性表述。第一次世界大战后英国的财政状况每况愈下,工业纠纷频发,促使1926年爆发英国工人大罢工,整个英国社会的经济、阶级矛盾尖锐[19]。随后,1929年美国股市崩盘引发全球经济危机,英国受其影响导致失业率大幅上升,1931年达到峰值[20]。可以看出,这一时期英国民生压力增大,increase的搭配词以传递英国社会情况的客观事实为主,恰恰反映出这些特点,读者仅通过搭配也可了解到英国此时的经济处于消极状态,可能含有对英国经济状况负面的评价或态度。
LOB (1961)语料库时期,“消费(consumption)”、“产量(output)”、“工资(wage)”等事实性名词仍占据主导地位,同时“需求(demand)”、“利润(profits)”、“比例(proportion)”等抽象名词的占比开始上升。结合当时的社会情况可以发现,20世纪60年代正值战后重建阶段,经济增长需求旺盛,继续延续着50年代的高经济增长率和家庭收入继续增长的态势,工业产值与工资水平稳步上升,与之相伴的还有英镑贬值带来的通货膨胀,GDP增长但相对疲软[18]。这一阶段各类报道、文章需要对经济数据进行描述分析,如进出口、盈利、财政支出与回报比例等,于是increase这类反映数量变化的词的需求量也随之升高。这一时期increase的搭配词未表现出明显的情感倾向。
在FLOB (1991)语料库中,与“increase”搭配强度较高的多为经济类词,如“养老金(pensions)”、“收入(earnings)”、“福利(benefit)”等;表示比例和规模的词汇,如“数量(numbers)”、“规模(size)”、“比率(rate)”等的使用也有所增加。20世纪80年代的英国经济出现两种现象,即失业率增加和经济恢复增长以及通货膨胀大幅度降低并存[21]。英国政府实行宏观经济政策,完善社会福利应对一系列经济问题,这些政策几年中开始发挥作用。值得注意的是,此时出现了“风险(risk)”这类新的搭配词,这可能是因为经济发展催生出了新的产业。与“increase”搭配的经济类词表现出积极的经济态势,risk则呈现出负面倾向,而与比例规模类词的搭配没有明确的语义倾向,因此可以说increase本身的语义韵总体偏中性。
BE06 (2006)语料库中,“increase”出现了许多新的强搭配词,如“舒适度(pleasantness)”、“肥胖症(obesity)”、“创新(innovation)”、“头痛(headache)”等;与数据相关的如“数量(amount)”、“平均值(average)”、“水平(level)”等词的重要性仍未下降。现代全球化在21世纪初出现新趋势,英国实施创新与可持续发展战略,重视科技开发,鼓励科技创新,发展知识经济,因此社会关注点逐渐多元化,进而推动词汇搭配范围扩大至经济、社会、科技、公共卫生等领域[22]。从“increase”的搭配词不难看出英国当前的发展方向与突出问题,再一次印证了语言与社会之间相互作用。同样,“increase”本身的语义韵仍保持中性,未表现出强烈的语义倾向。
5. 结论
本研究对“increase”一词在布朗家族语料库四个子语料库中的历时变化进行了系统分析,得出以下三个核心结论:首先,“increase”的使用频率呈波动上升趋势,从1931年的每百万词356.92次上升至2006年的每百万词461.16次,与袁新华(2016)基于布朗家族语料库发现的英语词类频率随社会发展变化的规律相契合[6]。两者均证实,词汇使用并非静态稳定,而是会随时间推移动态调整。其次,从文体分布来看,“increase”具有表达量化趋势的功能,因此在学术写作中的使用频率极高(每百万词906.55次),而在小说中的使用频率极低(每百万词54.21次)。最后,“increase”的搭配范围随时间推移逐渐多元化,语义韵根据搭配词的正面或负面呈现出相应的语义倾向,但该词本身为中性含义,仅对量化数据或事实客观陈述。本研究与Prihantoro (2022)对“energy”一词的研究逻辑相通[11]。两者均发现,词汇搭配范围的拓展与社会议题的丰富度同步。“increase”的搭配变化反映了社会关注点从单一领域向经济、科技、公共卫生等多领域的延伸,这与“语言与社会共变”理论的核心观点形成呼应。
本研究的局限性主要体现在两方面。一是布朗家族语料库仅聚焦于英式英语,对其他英语变体的探究不足;二是词汇搭配及语义韵分析中,未能结合具体索引行文本,语境分析深度不足,语义倾向可能判断不准确。因此,未来研究可以进行跨语料、跨地区的历时变化对比,同时将研究对象置于具体文本中,结合语境深化分析。
6. 结束语
本研究通过对布朗家族语料库的四个子语料库进行分析,揭示了“increase”一词近70年的历时演变特征,这些演变不仅印证了语言的动态性本质,更揭示了词汇使用与社会变化的深度相关性。“increase”的使用变化是社会经济发展、信息传播、社会关注多元化等因素影响的共同结果。本研究再次凸显了语料库语言学在历时研究中的实证价值,通过定量与定性分析的结合,为词汇演变研究提供了科学、系统的方法路径。还可帮助学习者在学术写作、正式报告等场景中精准运用词汇。
附 录
Appendix 1. Distribution of increase based on text category
附录1. Increase基于细分文本范畴的分布
Category |
Frequency (per million words queried within category) |
A. Press: Reportage |
443.42 |
B. Press: Editorial |
507.34 |
C. Press: Reviews (theatre, books, music, dance) |
69.75 |
D. Religion |
155.64 |
E. Skills and Hobbies |
393.44 |
F. Popular Lore |
358.09 |
G. Belles Lettres, Biography, Memoirs, etc. |
226.53 |
H. Miscellaneous non-fiction |
1479.12 |
J. Learned (academic writing) |
906.55 |
K. General Fiction |
61.74 |
L. Mystery and Detective Fiction |
30.38 |
M. Science Fiction |
157.7 |
N. Adventure and Western Fiction |
50.78 |
P. Romance and Love Story |
54.39 |
R. Humor |
35.39 |
Total |
411.99 |
Appendix 2. Collocation results of increase in four corpora
附录2. Increase在四个子语料库的搭配结果