基于COCA语料库的动词“Create”扩展意义单位研究
A Corpus-Based Study on the Extended Unit of Meaning of the Verb “Create” in COCA
DOI: 10.12677/ml.2025.139947, PDF, HTML, XML,   
作者: 胡 婷, 陈景杭:浙江工商大学外国语学院,浙江 杭州
关键词: 扩展意义单位语料库Create语义韵EUM Corpus Create Semantic Prosody
摘要: 在二语习得蓬勃发展的背景下,语言学习已超越传统的形态句法层面,更加关注特定语境中语言的整体意义。随着语料库语言学的发展,研究者开始利用大规模语料库探究词汇的深层使用特征与语义表现。本研究基于美国当代英语语料库(COCA),对动词“create”的扩展意义单位展开深入分析,重点考察其在不同语境中的搭配模式及语义韵特征,包括与形容词、副词、名词、介词的共现关系及其对语义倾向的影响。研究发现,虽然“create”通常被视为积极词汇,表示创造、发明或产生新事物,常与创新、想象力和生产力相关联,但在特定搭配中也可能呈现消极语义韵。例如当表达“制造问题”(creates a problem)或“引发混乱”(creates confusion)时,该动词往往带有负面含义。本研究不仅揭示了“create”在实际语用中的动态语义特征及语境依赖性,还为英语学习者提供了更为精细全面的词汇学习策略,即建议学习者在掌握词汇基本意义的同时,应关注其扩展意义单位,从而更准确地理解和使用目标词汇。
Abstract: Under the boom of second language acquisition, language learning has transcended the traditional levels of morphology and syntax, focusing more on the holistic meaning of language in specific contexts. With the development of corpus linguistics, researchers have begun to utilize large-scale corpora to explore the deep usage and semantic features of vocabulary. This study conducts an in-depth analysis of the extended meaning units of the verb “create” using the Corpus of Contemporary American English (COCA). The research focuses on the collocational patterns and semantic prosody of “create” in different contexts, examining its collocations with adjectives, adverbs, nouns, and prepositions, and how these collocations influence its semantic tendencies. The study finds that although the word “create” is generally considered a positive term, meaning to create, invent, or produce something new, often associated with innovation, imagination, and productivity, it can also carry negative connotations, especially when associated with negative outcomes. For example, if someone “creates a problem” or “creates confusion”, in such cases, “create” may be perceived as negative. This research not only reveals the semantic dynamics and context-dependency of “create” in actual language use but also provides English learners with more detailed and comprehensive vocabulary learning strategies. The study suggests that learners should pay attention to the extended meaning units of a word, in addition to mastering its basic meaning, to more accurately understand and use the vocabulary.
文章引用:胡婷, 陈景杭. 基于COCA语料库的动词“Create”扩展意义单位研究[J]. 现代语言学, 2025, 13(9): 43-51. https://doi.org/10.12677/ml.2025.139947

1. 引言

二十世纪以来,二语词汇习得研究成为多学科领域的热点议题,尤其在语料库语言学界备受关注。随着语言研究的深入,学者们日益重视语言所处的语境及其生成的整体意义[1]。扩展意义单位模型的提出堪称语料库语言学发展的里程碑,为学者研究语言的整体性提供了基础框架。因此,分析扩展意义单位成为我们理解语言构成与结构、明晰意义有效表达方式的关键环节。该模型能有效拓展词汇知识的广度与深度——学习者通过掌握词汇搭配模式及语义倾向,可在同一语义场中习得大量词汇并建立语义关联网络。

在英语表达体系中,谓语动词是句子构建的核心要素,其中create作为高频日常交际动词,在表达“使某物出现或存在”等核心意义时具有重要作用。本文在前人研究基础上,采用扩展意义单位模型,深入探究create在美国当代英语语料库(COCA)中的使用特征。通过多维度分析其在不同语境中的搭配词、类联接、语义倾向及语义韵表现,旨在帮助二语学习者深入理解该动词在实际语用中的复杂性与多样性,从而提升其语言运用能力与语境适应力。

2. 扩展意义单位理论框架

2.1. 理论概述

意义单位是由辛克莱(J. Sinclair)于1996年基于词语搭配理论提出的语言描述模型,该模型包含五个构成要素:意核、搭配、类联接、语义倾向及语义韵。其中“意核”是意义单位的中心要素,意义扩展以该核心为原点向外辐射。弗斯(Firth 1968: 182)认为搭配词是习惯性共现的词语,这种习惯性与倾向性均以高复现率为特征,体现了这些词语在词汇结构中的重要性。分析搭配词是深化词汇理解、熟悉其用法的重要途径,搭配在扩展意义单位中的位置与作用也反映出其对后续成分的基础性地位,以及对扩展意义单位存在的最强证明力[2]

“类联接”指核心词与周边元素倾向形成的语法模式,体现核心意义与周边元素构成的语法结构,反映词汇在语法层面(尤其是句法)的组合关系[3]。“语义倾向”指向搭配词的语义特征,反映核心意义与周边词项的习惯性共选关系,概括共现词项的语义特点。“语义韵”则反映核心意义自身的语义特征,用以表达交际态度。语义倾向与语义韵共同体现核心意义与搭配词的语义关系,承载核心意义与共现词项的语用特征。扩展意义单位模型的各要素从不同维度展现了话语意义的丰富内涵,既反映语言横向的搭配特征,又从内部语义与语用层面探索语言纵向的意义传递关系。因此,扩展意义单位的五要素实现了词法、句法、语义与语用功能的协同配置。

2.2. 相关研究现状

自约翰·辛克莱(1991)发现语义韵现象以来短短二十余年间,学者们从不同视角对这一独特语言现象展开了大量研究与探讨,成果丰硕。代表性研究如辛克莱本人通过“naked eye”“true feelings”“brook”“place”四个核心词的案例分析,论证了扩展意义单位的结构成分[4]。在研究方法上,多数研究采用基于语料库的实证路径;在研究对象方面,大量扩展意义单位研究聚焦高频动词、近义词及同义短语辨析。卫乃兴通过对比本族语语料库与中国学习者英语语料库中“commit”“effect”“cause”的语义韵,发现学生英语中存在大量中介语搭配,这些搭配虽语法正确却违反搭配惯例,且语义韵强度较弱[5]。华烨(2023)对比分析了汉语母语者与二语学习者“表示”类动词的搭配、类联接、语义倾向及语义韵,发现本族语语料库的扩展意义单位分析存在共性与差异[6]。杨子璇(2022)以扩展意义单位模型为理论基础,借助语料分析软件WordSmith Tools 6.0对“ability”一词的扩展意义进行分析,发现中国在疫情期间积极表达立场[7]。杨春霞(2014)利用BNC语料库,通过词频、语域、搭配及语义韵等维度区分近义动词“suspect”与“doubt”[8]。可见现有研究多基于扩展意义单位理论,聚焦特定词汇的扩展意义分析或一组近义词的语义韵对比研究。

3. 研究方法

3.1. 数据收集

辛克莱(2004: 24-28)主张将语料库语言学与扩展意义研究相结合以探究意义本质[9]。通过语料库方法采集大量真实语料,可从众多实例中发现规律并总结语言使用习惯与特征,进而挖掘话语中隐含的意义倾向与情感态度,这对语言研究与探索具有重要价值。本研究采用COCA (Corpus of Contemporary American English)语料库作为分析对象,其全称为“美国当代英语语料库”,是目前最大的免费平衡美式英语语料库,由Mark Davies教授于2008年创建,收录超过10亿词次(1990~2019年间每年新增2500万词次),涵盖口语、小说、流行杂志、报纸、学术文本、影视字幕、博客及网页等八大语域。

3.2. 研究问题

(1) “create”在COCA语料库中的搭配与类联接呈现何种特征?

(2) 不同搭配模式与类联接中,“create”相关搭配词的语义倾向及语义韵有何特点?

(3) 对“create”扩展意义单位的分析能为中国英语学习者提供哪些启示?

3.3. 研究步骤

本研究基于语料库的操作主要分为四个步骤:

首先,在COCA语料库界面以−4/+4跨距检索“create”,考察该词前后4个词位范围内出现的搭配词。跨距指节点词两侧词项构成的上下文范围,其长度需根据研究文本领域特征确定,−4/+4或−5/+5跨距被证明最为合理。

其次,专项查询“create”所在上下文信息,分析其类联接特征。鉴于索引行的行数庞大,从语料库中随机抽取200行进行人工检视,建立类联接类型并制表统计。

再次,分析“create”相关搭配词的语义倾向特征。

最后,对随机选取的200条concordance行进行语义韵信息检视,经统计分析后形成数据表格。

4. 动词Create的语域分布特征

以“create”为检索词在COCA语料库进行分析时,点击“frequency”功能键可显示该词在COCA各文本类型中的出现频次,具体数据如表1所示。

Table 1. Register distribution of “create” in COCA corpus

1. COCA语料库中“create”的语域分布

排名

文本类型

词频

占比

1

博客

24,799

19.35%

2

网站

24,450

19.08%

3

杂志

22,679

17.70%

4

学术文献

21,892

17.08%

5

新闻

15,031

11.73%

6

口语

11,349

8.86%

7

电视

4844

3.78%

8

小说

3112

2.43%

总数

128,156

100%

表1的统计结果显示:首先,在八类文本语域中,“create”在博客、网站、杂志及学术文献中的使用频率显著高于后四类语域。排名第四的学术文献(17.08%)与第五位的新闻(11.73%)之间存在5.35%的占比差。在前四位高频语域中,博客以19.35%的占比居首;网站(19.08%)次之;杂志与学术文献分别占17.7%和17.08%。值得注意的是,“create”在口语、电视及小说语域中的使用频率最低,四类语域合计占比仅26.8%,其中小说语域的占比仅为2.43%,处于绝对低位。

5. 动词Create的扩展意义单位分析

5.1. 搭配分析

在语言学领域,搭配力(collocability)是指两个或多个词语在特定语言中作为搭配共现的倾向性或程度。该概念通过量化词语间的关联强度,反映它们在特定语境或语料库中的共现频率,对理解词语在语言中的自然组合模式至关重要,能揭示词语惯用性搭配的语义表达规律。正如弗斯(Firth)所言:“观其伴而知其义”,要真正掌握一个词汇,必须了解其共现伙伴。词汇学习不仅涉及词义认知,更需要掌握其组合关系、搭配模式及语义韵特征,且应在具体语境中习得[10]

在COCA语料库中,以“create”为节点词设置−4/+4跨距进行检索,按搭配频率排序提取前15个显著搭配词(如表2所示)。操作步骤包括:点击“Collocates”功能键,在“Word/phrase”栏输入“create”,在“POS”标签下选择“noun.ALL”限定搭配词语法属性,设置跨距为“−4/+4”,忽略语域限制(Ignore),筛选条件设为相关性排序(Relevance),互信息值(MI)设定 > 3,点击“Find collocates”获取全部搭配词。鉴于篇幅限制,本研究选取频率最高的15个搭配词制成表2

Table 2. Top 15 collocates of “create” in the COCA corpus

2. COCA语料库中“create”的前15个搭配词

排名

搭配词

词频

MI值

1

illusion

10,597

6.24

2

diversion

3857

6.13

3

jobs

118,556

6.09

4

havoc

3763

5.8

5

incentives

12,694

5.39

6

environments

13,230

5.12

7

atmosphere

33,390

4.99

8

opportunities

50,216

4.97

9

custom

14,576

4.87

10

impression

23,637

4.77

11

sustainable

16,369

4.48

12

chaos

17,853

4.39

13

spaces

17,103

4.36

14

wealth

35,690

4.21

15

tension

20,303

4.08

表2中“create”的搭配词按词性分类可见:在互信息值(MI)最高的15个词汇中,14个为名词,仅“sustainable”构成形容词性搭配。这些词汇不仅使用频率普遍较高,通过词性归类分析可发现,其语义均与人类感知、行为或状态密切相关。动词“sustain”意为维持或支持,直接关联人类活动延续或状态保持的行为,如“create sustainable success (创造可持续的成功)”。名词性搭配中,“illusion (错觉)”“incentives (激励)”“impression (印象)”“wealth (财富)”“tension (紧张)”等普通名词涉及人类感知与心理状态;“diversion (转移)”“jobs (工作)”“opportunities (机会)”“custom (习惯)”等词关联职场与工作场景;而“havoc (混乱)”“environments (环境)”“atmosphere (氛围)”“chaos (混沌)”“spaces (空间)”则与社会环境及生存条件紧密相关。这些词汇既反映个体的主观体验,又体现客观环境对其行为与心理的影响。进一步分析表明,上述词汇多数为抽象名词。

5.2. 类联接分析

“类链接”指围绕核心词形成的语法结构组合。类联接的重新定义被描述为“与其他语法范畴或结构模式共现的语法范畴或结构模式,或与特定词语或短语共现的语法关系”。因此词汇研究不仅需从词法角度分析其搭配特征,更需从句法层面考察其语法结构,即对词汇进行类联接分析。本研究通过随机抽取200条“create”的共现行分析发现,该动词的类联接主要呈现以下类型(如表3所示)。

Table 3. Colligation distribution of “create” in COCA corpus

3. COCA语料库中“create”的类联接分布

类联接

词频

索引行

N + be/has been + created + (by + sb.)

23

…was being implemented at the same time homesteads were created and counties and territories were forming.

…the problems created by students admitted under affirmative-action quotas.

N+ create + N

183

…the U.S. Government procurement system has created a hostile environment in the defense…

…performances are razor sharp. Kidman creates a character scary in her unerring ability to zero…

…The new product launch created a buzz in the tech community.

N + created+ V

8

The relationships created have spawned some important and interesting research.

create+ to+ V

1

…the R&D director constantly reminds the team that our mantra’ create to innovate’ is not just a slogan…

表3所示,动词“create”的类联接主要呈现五种类型,七种子类的联接强度分布不均。其中主导结构为“N + create + N”,这是“create”最常见的句式结构。首先,在该语法结构中,“create”作为及物动词,通常在句中充当谓语成分,与主语及后续名词构成最基础的“主–谓–宾”(SVO)结构,此时该词的语义为其本义“创造”或“引发、带来”。在“N + be/has been + created + (by + sb.)”结构中,其为被动语态句式,用于描述事物的创造过程,部分句子会明确创造者(by + sb.),该结构通常强调事物的被动状态及创造者的作用。

在“N + created + V”结构中,整体句式可视为“N + (过去分词) + 谓语”,“created”作为过去分词起修饰作用,实质上弱化了“create”的实际动作意义,主要强调被创造事物对另一事物的重要性。而最终出现的“create + to + V”结构仅出现一次,这是表示目的或目标的短语,描述创造行为的目的——即为创新而创造,通常用于表达组织或个人的理念策略。

5.3. 语义倾向分析

在短语结构中,有时会明显倾向于选择具有特定语义特征的词汇。此时词性并不重要,任何符合语义要求的词项皆可。常规共现关系仅限于具有某种共同语义特征的词项,例如都与运动或苦难相关(Sinclair, 2004)。因此需根据语义特征对“create”的搭配词进行分类,结果如表4所示。

Table 4. Semantic preferences of “create” in the COCA corpus

4. COCA语料库中“create”语义倾向

分类

搭配词

语义倾向

Concepts or Goals

Job,chance,destination, etc.

the objectives, strategies, and activities that individuals or groups set out to achieve

Negative States or Conditions

Havoc, chaos, problems, racket, confusion, fear, suffering, etc.

a sense of disruption, discomfort, or negativity, and are used to highlight undesirable aspects of situations or experiences

Mental or Emotional Experiences

Thought, illusion, sense, feeling, etc.

how humans mentally engage with, perceive, and experience the world around them.

Contextual or Situational Elements

Environment, atmosphere, scene, etc.

the concept of setting or context, whether it’s the physical environment, or the visual or descriptive elements that define a situation.

观察发现,“create”的名词搭配词可分为四大类型。在“create + N”结构中,右侧名词首先如“job”“chance”“destination”等,与个体或群体的规划目标相关;其次如“havoc”“chaos”“problem”“fear”等形式各异的词汇,均隐含破坏性或负面情绪;而“thought”“feeling”“sense”等词则关联人类心理体验;“environment”“atmosphere”等词则指向事件发生的情境要素。由此可见,"create"的搭配词呈现显著差异化语义倾向。

5.4. 语义韵分析

语义倾向特指词汇搭配的语义特征,而语义韵关乎整个扩展意义单位。节点词的语义韵反映其核心意义本身的特征,用于表达交际态度,强调节点词与其他词搭配时呈现的态度倾向。根据搭配词的不同语义倾向,节点词展现的语义韵也存在差异,且在不同类联接模式中可能发生变化。

5.4.1. 积极语义韵

例1:In the heart of the bustling city, the visionary architect, inspired by the harmony of nature and the ingenuity of human design, embarked on a groundbreaking project to create a sustainable urban oasis that not only revitalized the community but also served as a beacon of innovation, attracting tourists and residents alike to marvel at the fusion of ecological consciousness and architectural splendor.

在此句中,“create”的使用语境突显了建筑师创作成果的积极效益,既强调了对社区的好处,又展现了作品所获的赞誉,从而彰显了该动词的积极语义韵特征。

例2:The dedicated team of scientists, driven by a shared passion for environmental conservation, worked tirelessly to create a groundbreaking biodegradable material that could revolutionize the packaging industry, significantly reducing waste and its impact on our planet, thereby fostering a cleaner, healthier environment for future generations.

此处的“create”用于描述新型环保材料的研发过程,既传递了科研突破的成就感,又暗示了推动积极变革的潜能,与动词“create”固有的积极语义韵相契合。

5.4.2. 中性语义韵

例1:The artist’s latest painting was intended to create a feeling of tranquility in the viewer.

在这句话中,“create”用于描述艺术家通过作品唤起特定情感的意图。其语义韵呈现中性特征,因为句子既未暗示艺术家是否成功达成这一目标,也未对结果作出任何正面或负面评价,仅是客观陈述艺术家的创作意图。

例2:The composer’ s new piece was designed to create a feeling of suspense during the film’s climactic scene.

此句中,“create”用于说明作曲家创作音乐的目的。语义韵之所以为中性,是因为句子没有表明悬疑感是否被有效传达,也未提及观众的最终反应,仅仅陈述了作曲家的创作目标而未隐含成功或失败的判断。

5.4.3. 消极语义韵

例1:The unexpected storm created havoc in the coastal town, uprooting trees, damaging homes, and leaving thousands without power for days, as emergency services worked tirelessly to restore order and provide relief to the affected residents.

在此句中,“create havoc”用于描述风暴造成的破坏性影响。其消极语义韵通过“连根拔起树木”、“损毁房屋”、“导致数千人断电”及“紧急救援服务”等词语得以体现,这些表达共同强化了风暴引发的混乱与负面后果。

例2:The controversial policy, hastily implemented without proper consultation, created a divide among the citizens, sparking protests and fueling discontent, which ultimately undermined the government’s credibility and strained community relations.

该句中“create”用于描述一项导致社会分裂与动荡的政策实施。消极语义韵通过“争议性政策”、“民众对立”、“引发抗议”、“激化不满”、“削弱政府公信力”及“恶化社区关系”等短语得以凸显,这些表述均强调了政策制定所带来的负面影响。

语义韵既非由节点词本身单独决定,亦非由积极、消极或中性的词汇搭配直接决定,更不受情态动词、否定词、副词等表语气的成分所支配。然而,它与这些要素均存在间接关联。实际上,语义韵是由节点词与其各类搭配词(排除表语气成分)共同构成的复合词项所决定的,体现为该复合词项内隐的、不言自明的整体态度意义。这种态度意义虽与言外行为相关,却不可与之等同。通过分析可见,“create”的语义韵可呈现积极、消极或中性特征,具体取决于其使用语境。要准确判断该词的语义韵,必须综合考虑包括搭配词在内的整体语境及其所处的语篇环境。

6. 研究结论

本研究以美国当代英语语料库(COCA)为依托,聚焦动词“create”的扩展意义单位展开系统探究,通过对其语域分布、搭配模式、类联接结构、语义倾向及语义韵特征的全面分析,得出如下研究结论。在语域分布方面,“create”在学术文本、新闻报道、网络博客等多元媒体中均保持较高使用频率,未呈现显著的语体偏向性,这与其作为基础行为动词的通用性特征密切相关。搭配分析显示,该词与名词的共现最为频繁,搭配词涵盖抽象概念(如“illusion”“opportunity”)、具体事物(如“jobs”“spaces”)及状态描述(如“chaos”“harmony”),其中抽象名词占比显著。类联接结构以“N + create + N”为主导,同时包含被动语态(“N + be created + by”)、不定式结构(“create to + V”)等变体,句法功能的多样性使其能够适应不同的语境需求。语义倾向层面,“create”的搭配词呈现明显的两极分化,既与“incentives”“sustainable”等积极词汇关联紧密,也常与“havoc”“tension”等消极词汇共现,这种双重倾向使其语义内涵具有显著的语境依赖性。语义韵特征则进一步印证了这一点,积极语义韵(如描述创新成果、社会价值)与消极语义韵(如描述混乱、问题)在不同语篇中形成互补,而中性语义韵多出现于客观陈述性语境中,共同构成了该词复杂的意义网络。这印证了卫乃兴关于“语义韵多向性”的观察,即核心词的语义倾向并非固定不变,而是通过与不同搭配词的共现形成动态平衡[11]。这为解释“创造”概念为何既能关联“创新”等积极意义,又能与“混乱”“问题”等消极结果相联系提供了线索。

基于上述发现,在教学实践中,教师应引导学生通过扩展意义单位模型探析语义倾向与语义韵特征,从而提升其口语表达与写作输出的准确性,最终强化语用能力。该模型不仅为语篇构建提供理论参照,对日常语言交际亦具有重要启示意义。未来研究可通过扩大语料范围、引入计算语言学工具提升分析精度,并开展“词汇–语境–认知”的关联研究,进一步完善动词扩展意义单位的理论框架与实践应用。

参考文献

[1] 骆雅莹, 陈婵. 基于COCA语料库的动词keep的扩展意义单位研究[J]. 外国语言与文化, 2023, 7(2): 135-145.
[2] Firth, J.R. (1957) Papers in Linguistics 1934-1951. Oxford University Press.
[3] 濮建忠. John Sinclair的短语理论与意义研究[J]. 当代外语研究, 2021(6): 60-76, 160.
[4] Sinclair, J. (2004) Trust the Text: Language, Corpus and Discourse. Routledge.
https://doi.org/10.4324/9780203594070
[5] 卫乃兴. 基于语料库学生英语中的语义韵对比研究[J]. 外语学刊, 2006(5): 50-54, 112.
[6] 华烨. 基于扩展意义单位模型的“表示”类动词研究[D]: [硕士学位论文]. 武汉: 华中师范大学, 2023.
[7] 杨子璇. 基于语料库的扩展意义单位研究——以China Daily语料库中ability一词为例[J]. 海外英语, 2022(12): 78-80.
[8] 杨春霞. 基于语料库的近义词辨析研究——以suspect和doubt为例[J]. 西南科技大学学报(哲学社会科学版), 2014, 31(5): 45-49, 86.
[9] Sinclair, J. (1991) Corpus, Concordance, Collocation. Oxford University Press.
[10] Firth, J.R. (1968) Selected Papers of J. R. Firth, 1952-1959. Indiana University Press.
[11] 卫乃兴. 语义韵研究的一般方法[J]. 外语教学与研究, 2002(4): 300-307.