1. 引言
词汇是语言学习的基础。一直以来,掌握和熟练运用词汇都是英语学习中的重点,而近义词辨析则是其中的一大难点。在学生学习的过程中,经常会出现滥用或误用近义词的现象,尤其体现在汉英翻译和英语写作当中。为了增加语言表达的丰富性,学生会选用一些近义词来替换使用,由于缺乏真实的语境练习,对于近义词的用法容易混淆,出现搭配不当的情况,不能体现词语地道的用法。传统的分辨近义词教学方法是在教学中老师直接给出定义和描述,加上少量的例句和习题辅助,学生在实际使用中会依赖词典的帮助,也通常会凭借自己的经验和直觉进行定性等等[1],这些方法对于学生辨析近义词能力的提高有一定帮助,但效果不佳,学生的困惑不能得到更好地解决,无法对近义词进行细微的区分。
语料库语言学是20世纪中后期新兴的一门语言研究科学,它将真实的语言数据作为研究对象,从宏观的角度分析大数量的语言事实,研究词汇、句法、语篇等各种层次的语言描写,从而得到语言使用的规律[2]。语料库语言学的繁荣发展让语料库在语言教学和语言研究等方面都得到了广泛应用,也为近义词研究提供了新的视角。语料库能够提供大量英语本族语者的真实语料,学习者通过对近义词进行检索,得到更加细节的情景例句,通过具体分析从而对比出异同之处。最早的计算机语料库是1960年由Francis和Kusera创立的Brown语料库,它是由大量的书面语汇集而成的电子化共享语料库。现代常用的英语语料库除了Brown语料库外,还有英语国家语料库(简称BNC)、美国当代英语语料库(简称COCA)、美国国家语料库(简称ANC)和柯林斯英语语料库(简称BOE)等等。常用的语料库工具有Concordance、AntConc和WordSmith等等。本文将选用美国当代英语语料库(Corpus of Contemporary American English,简称COCA),它涵盖了博客、网页、电视电影、口语、小说、流行杂志、报纸以及学术期刊八种类型的文本数据,是美国最大、最新的免费当代英语语料库,每年实时扩充数据,具有很高的实时性,可以很好的反映英语本族语者的词汇使用情况。本文通过检索使用COCA语料库的数据,对比一组近义形容词unbelievable和incredible的异同,旨在帮助学习者更深入的了解两词各自呈现的特点。
2. 语料库应用于英语教学的背景
以语料库为基础的语言研究方法有两个方向,一是对自然语料进行加工和标注,二是对已经标注好的语料进行语言研究和应用开发。我们在此使用的是第二类研究方法,也就是使用语料库中已有的真实语言数据资源来对词汇进行分析研究。语料库是语言学习中重要的例句来源,可以向学生展示在真实的文本或交际情景中出现的词汇、句子和语篇,对外语教学起着重要作用[3]。Sinclair在上世纪80年代根据Bank of English语料库的研究提出了一种新的观点,即将语法形式和词汇相结合来描述英语,打破了一直以来以传统语法描述为依据的英语教学方法[4]。在英语教学中,如何区分近义词是学习者在学习掌握词汇时的一大障碍,Biber和Reppen通过语料库的方法分析了近义词使用的语境和语域的区别,探讨了近义词的用法[5]。Thomas用基于语料库的方法对比了“keep”和“get”的不同用法[6]。我国的不少学者都曾利用语料库来进行英语词汇中的近义词研究,主要分为两类,一类是直接利用英语本族语语料库中的数据进行分析研究,例如,侯丽对rather和quite进行了研究,得出它们在不同语域、语义韵和词频分布方面都具有差异,“rather”偏书面语,具有消极语义韵,而“quite”更偏口语,具有积极语义韵[7];杨霞分析了suspect和doubt在不同语域的分布频数,认为近义词在实际使用中存在着语域优先的原则[1]。另一类是通过英语本族语语料库和中国学习者语料库进行对比研究,例如,陆军以CAUSE、LEAD to、RESULT in/from和BRING about为例,对比了本族语和学习者语料库中的内容,认为英语学习者难以区分近义词搭配行为和语义韵特征,并对英语教学改革提出了建议[8];王春燕以true和real为例进行分析,发现中国学习者和本族语者在搭配词语义韵和非词语化用法方面有很大差异,提出可以将语料库引入至英语教学中[9]。本文以前人的研究为基础,通过语料库的方法,从两词的语域频数分布差异、搭配词差异和语义韵差异三个方面深入探讨近义词unbelievable和incredible的异同,希望对英语教学中的近义词辨析难题提供一些启示和帮助。
3. 基于语料库的数据分析
Unbelievable和incredible是一对易混淆的近义词,它们都是比较常用的形容词,unbelievable有时也可做副词使用,我们在这里只分析它的形容词用法。下面是Longman词典对这两个词的定义和例句:
unbelievable:
(1) very good, successful, or impressive; e.g.: The opportunities are unbelievable.
(2) very bad or shocking; e.g.: The pain was unbelievable.
(3) so extreme that it hardly seems possible; e.g.: He is so lazy, It’s unbelievable.
(4) very difficult to believe and therefore probably untrue. e.g.: Yvonne’s excuse for being late is totally unbelievable.
incredible:
(1) extremely good, large, or great; e.g.: There were blood everywhere and the pain was incredible
(2) too strange to be believed, or very difficult to believe. e.g.: It’s incredible how much Tom has changed since he met Sally.
通过词典我们可以看到这两个词都有“难以置信的”的意思,但又有不同之处,即它们的意义不是完全对等的。词典对于词汇的定义一般只有几个义项,例句也只是简单的一两个,对于学生来学过于抽象,难以有效地区分近义词。我们将通过语料库对其进行具体分析:首先在COCA语料库中的“list”栏中分别对两个节点词unbelievable和incredible进行搜索,得到它们的出现频数,再到“chart”栏中检索得到两词在不同语域中的分布情况,对比二者的语域频数差异,随后在“collocate”栏中检索出两词各自的搭配情况,得到它们的搭配词和显著搭配词,对比二者各自的搭配词的异同,最后以二者共同的显著搭配词来检索,对词条信息显示的语境进行人工语义标注,根据得到的搭配词和语境来共同分析两个近义词的语义韵差异。
3.1. 语域频数差异
语域(register)是人们在实际的语言活动中,出于交际的需要,根据职业和兴趣爱好不同或是交际情景、对话双方、物理地点和讨论的话题不同而产生的一种言语变体,具体体现为语言中的不同语体风格、用语格调等等[10]。频数是指语料库中的某个词汇或短语在每百万词中出现的次数,频数的分布能够反映出词义的差异,在一定程度上能体现语言系统的概率属性。通过统计近义词在整个语料库中的频数差异,可以帮助人们更加准确的理解在实际交际中哪些词使用的更多,由上述Longman词典对unbelievable和incredible的定义可知,近义词本身在意义上就具有差异,因此它们在不同的语域中的分布也具有差异,近义词在不同的语域中会有不同的用法,显示出不同的分布特征。根据统计分析两词在不同语域的分布特征可以帮助我们在使用词汇过程中选择合适的语境。首先,通过COCA中的“list”栏分别对unbelievable和incredible进行数据搜索,unbelievable出现的频数为12,323次,incredible出现的频数则为32,004次,incredible出现的次数远比unbelievable要高,说明在实际的使用中,英语本族语者更倾向于使用incredible。随后我们分别将两词放到“chart”栏中搜索,可以得到他们在博客、网页、电视电影、口语、小说、流行杂志、报纸以及学术期刊的文本数据中的分布情况,如表1所示:
Table 1. Register distribution of unbelievable and incredible
表1. Unbelievable和incredible的语域分布
词汇 |
项目 |
博客 |
网页 |
电视电影 |
口语 |
小说 |
流行杂志 |
报纸 |
学术期刊 |
unbelievable |
频数 |
1257 |
1063 |
3867 |
3355 |
722 |
794 |
1128 |
138 |
每百万词频 |
12.41 |
9.77 |
8.56 |
30.91 |
26.60 |
6.10 |
9.27 |
1.15 |
incredible |
频数 |
4712 |
3969 |
6031 |
7950 |
1981 |
3575 |
3019 |
750 |
每百万词频 |
32.21 |
36.64 |
31.94 |
47.09 |
63.03 |
16.74 |
28.35 |
6.26 |
表1中的数据表明,在COCA语料库里的不同语域中,incredible无论是使用情况还是出现频率都均高于unbelievable,其中口语是二者使用频率相差最大的语域,说明英语本族语者在日常交际中更常使用incredible用来表示惊讶的情绪。数据显示,incredible在口语语域中的使用频率远远高于其他语域,在电视电影中的使用频率也比较高,其次是博客、网页和流行杂志。而unbelievable在电视电影中的使用频率最高,其次才是口语语域。在学术期刊中,无论是unbelievable还是incredible的使用频率都是最低的。由此可以看出,这两个词都是偏口语化的形容词,在正式的文章中需要谨慎使用。两者对比来看,unbelievable的使用更戏剧化,在编剧想要表达戏剧冲突的时候会首选使用unbelievable作为电影电视中的人物台词,人们在日常交际或社交媒体中则会更常使用incredible。
3.2. 搭配词差异
语言交际主要是由词语驱动的,词语搭配(collocation)处于语料库语言学研究活动的中心地位,弗斯认为:“搭配即词项的习惯性结伴使用”[11]。词语搭配的重要表现形式是词语的共现关系,即一个词与另一个词共现达到统计学上的显著程度,它们就构成搭配,反复共现是词语构成搭配的界定标准。也就是说,在大量的语料中,一个词与另一个词多次反复共现,它就是另一个词的搭配词。在计算机语料库的辅助下,可以对人工无法统计的大量自然语言的使用情况进行统计并分析。在通过对大量真实数据中词语搭配的观察,我们可以发现使用词语的规律,做到更加地道的分别使用一对近义词。使用语料库对词语搭配进行量化分析涉及到几个概念,包括节点词(node)、跨距(span)、搭配词(collocate)和共现信息值(Mutual Information Score,简称MI值)。节点词又叫搜索词或关键词,人们在语料库中带有目的的查询感兴趣的某个词,这个词就是节点词,得出结果后,该词处于词语索引的居中位置。跨距是指节点词左右的语境内容,以词汇为单位。搭配词指的是与节点词有句法限制关系的共现词,一般将跨距设置在−4/+4或−5/+5能够得到更多的搭配信息,也就是选取靠近节点词左边4或5个单词到靠近节点词右边4或5个单词。MI值用来计算搭配强度,MI值越大,节点词对语境的影响越大,两个词的搭配强度越高,一般来说,MI值等于或大于3的词就是显著搭配词。我们在“collocate”栏中以unbelievable和incredible分别作为节点词,将跨距设为−4/+4来检索,得到它们的搭配词、频数和MI值。unbelievable和incredible作为形容词,主要用于修饰名词,因此在这里只提取和分析名词搭配。我们分别选取unbelievable和incredible各自频数最高的前20个搭配名词,如表2和表3所示:
Table 2. Nouns collocated with unbelievable
表2. 与unbelievable搭配的名词
No. |
搭配词 |
频数 |
MI值 |
No. |
搭配词 |
频数 |
MI值 |
1 |
story |
186 |
2.12 |
11 |
coincidence |
12 |
3.15 |
2 |
amount |
130 |
3.36 |
12 |
obsession |
11 |
3.60 |
3 |
feeling |
47 |
2.06 |
13 |
tragedy |
10 |
2.10 |
4 |
pain |
46 |
2.19 |
14 |
miracle |
10 |
2.18 |
5 |
speed |
34 |
2.43 |
15 |
proportion |
10 |
2.20 |
6 |
talent |
30 |
2.76 |
16 |
announcer |
10 |
3.42 |
7 |
courage |
17 |
3.04 |
17 |
array |
9 |
2.40 |
8 |
mess |
13 |
2.13 |
18 |
corruption |
10 |
3.42 |
9 |
joy |
13 |
2.13 |
19 |
touchdown |
8 |
2.03 |
10 |
horror |
12 |
2.37 |
20 |
complexity |
8 |
2.20 |
Table 3. Nouns collocated with incredible
表3. 与incredible搭配的名词
No. |
搭配词 |
频数 |
MI值 |
No. |
搭配词 |
频数 |
MI值 |
1 |
story |
775 |
2.80 |
11 |
feeling |
119 |
2.03 |
2 |
amount |
635 |
4.27 |
12 |
strength |
115 |
2.70 |
3 |
experience |
297 |
2.31 |
13 |
pain |
111 |
2.08 |
4 |
hulk |
288 |
9.24 |
14 |
pressure |
107 |
2.70 |
5 |
opportunity |
260 |
2.74 |
15 |
gift |
102 |
2.57 |
6 |
talent |
183 |
3.99 |
16 |
feat |
92 |
5.84 |
7 |
journey |
182 |
4.21 |
17 |
diversity |
78 |
3.39 |
8 |
speed |
154 |
3.23 |
18 |
sight |
67 |
2.44 |
9 |
success |
150 |
2.40 |
19 |
adventure |
66 |
3.19 |
10 |
ability |
147 |
2.21 |
20 |
potential |
65 |
2.66 |
通过表2和表3的数据,我们可以看出unbelievable和incredible的搭配词有相同的部分:story、amount、feeling、pain、speed和talent,但是占比不高,仅有30%,剩余大部分都是不同的。另外,通过观察unbelievable和incredible的搭配词的MI值可以得到它们的显著搭配词,即MI值等于或大于3的词汇,其中unbelievable的显著搭配词有6个:amount、courage、coincidence、obsession、announcer和corruption;incredible的显著搭配词有8个:amount、hulk、talent、journey、speed、feat、diversity和adventure。incredible的显著搭配词在数量上要多于unbelievable的搭配词,这与上述的频数差异也相吻合,它们共同的显著搭配词有且仅有一个,即“amount”,其他都是不同的。以上搭配词和显著搭配词的差异表明,unbelievable和incredible这一组近义词在语义上是有差异的,但具体如何不同还需要更加细节地分析。下面我们将它们的搭配词根据不同的语境和意义做出分类,并进行对比分析,如表4所示:
Table 4. Comparison of collocations with unbelievable and incredible
表4. Unbelievable和incredible的搭配词对比
语义偏好 |
unbelievable的搭配词 |
incredible的搭配词 |
和情感相关 |
feeling、pain、courage、joy、horror、obsession、mess |
feeling、pain、pressure、 |
和事件相关 |
story、coincidence、tragedy、miracle、corruption、touchdown、complexity |
story、experience、opportunity、journey、adventure |
和品质相关 |
amount、speed、proportion、array |
amount、strength、speed |
和身份相关 |
announcer、talent |
talent |
和事物相关 |
|
hulk、gift、sight |
和能力相关 |
|
success、ability、feat、diversity、potential |
从表4可以看出,unbelievable和incredible的搭配词在语义的分布和范围都有差异。unbelievable在语义范围上相对狭窄,用来修饰和情感、事件、品质和身份相关的搭配词,主要分布偏向于和情感、事件相关。incredible的搭配词在语义范围上更加广泛,不仅可以修饰和情感、事件、品质和身份相关的搭配词,还可以修饰与事物和能力相关的搭配词,它的分布更偏向于和事件、能力相关。通过对unbelievable和incredible搭配词的语义偏好对比分析,可以帮助学习者更直观的了解两词的不同搭配对象,在选择用词时做到更加客观。
3.3. 语义韵差异
如上文所述,词语搭配是词与词结伴使用的一种语言现象,搭配词之间会相互吸引、相互期待和相互预见。一些词语的搭配行为有着特殊的趋向,即习惯性地吸引某一类具有相同或相似语义特点的词,并和它们构成搭配。这些具有相同或相似语义特点的词会与节点词一起反复地在文本中共现,造成节点词也被染上相似的语义特点,整个语境就形成了一种特殊的语义氛围,这种现象就被称之为语义韵(prosody)。Louw将语义韵定义为“一种连贯的意义氛围,一种形式被其他搭配物所渗透”[12],Stubbs根据搭配词的总体语义特征将语义韵大体分为三类:消极语义韵(negative prosody)、积极语义韵(positive prosody)和中性语义韵(neutral prosody)。消极语义韵中,所涉及的词项能吸引的大多都是具有强烈或鲜明的消极语义特点词语,它们使整个语境弥漫着强烈的消极语义氛围。积极语义韵与消极语义韵相反,节点词会吸引具有强烈的积极语义特点的词语,形成积极语义氛围。而中性语义韵中的词项即有消极语义特点,也有积极语义特点,也可能未呈现任何积极或消极的特点,形成错综的语义特点。在上文中,我们已经得到了unbelievable和incredible的搭配词,现在按照它们的语义特点对其分别进行分类,得到表5和表6:
Table 5. Classification of semantic features for collocated words with unbelievable
表5. Unbelievable的搭配词语义特点分类
语义特点 |
unbelievable的搭配词 |
占比 |
消极语义特点 |
pain、horror、obsession、tragedy、corruption、complexity、mess |
35% |
积极语义特点 |
courage、joy、miracle、touchdown、talent |
25% |
中性语义特点 |
feeling、speed、story、coincidence、amount、proportion、array、announcer |
40% |
Table 6. Classification of semantic features for collocation words with incredible
表6. Incredible的搭配词语义特点分类
语义特点 |
incredible的搭配词 |
占比 |
消极语义特点 |
pain、pressure |
10% |
积极语义特点 |
opportunity、journey、adventure、talent、gift、sight、success、ability、feat、diversity、potential |
55% |
中性语义特点 |
feeling、story、experience、amount、strength、speed、hulk、 |
35% |
根据表5和表6,我们可以看到unbelievable和incredible的搭配词的消极语义特点和积极语义特点分布差异很大。与unbelievable搭配更多的是具有消极语义特点的词汇,其中大部分都是表达消极情感的词汇,例如,pain、horror、mess等等。而incredible的搭配词多数是积极语义特点的,表达成功机遇、个人能力的词汇,例如,opportunity、talent、ability等等。它们的中性语义特点的搭配词分布比较均匀,但是这一类词所呈现的语义韵我们无法只依靠词项进行判断,只看单独的词汇也无法得到它们所处语境的语义氛围。因此,我们选取unbelievable和incredible都包含的、具有中性语义特点的唯一显著搭配词“amount”进行检索,分别得到包含语境的信息条,各自抽取其中的20条,并对它们所呈现出来的语境进行人工标注,对于无法通过信息条区分语义特点的,继续展开更多的语境信息进行人工判断,从而区分出消极语义韵、积极语义韵和中性语义韵。整理出表7和表8:
Table 7. Classification of contextual semantic characteristics of unbelievable and amount
表7. Unbelievable与amount搭配的语境语义特点分类
语义特点 |
语境信息 |
个数 |
占比 |
消极语义特点 |
It’s getting an unbelievable amount of attention |
9 |
45% |
I’ve had to throw out an unbelievable amount of stuff that won’t survive the journey |
Given the unbelievable amount of leaks that poured forth |
An unbelievable amount of resources have gone into putting the case together |
He has done unbelievable amount of good for children |
They have an unbelievable amount of need for trust in elected officials |
We have an unbelievable amount of leftovers |
You’re willing to suffer an unbelievable amount of pain just to get to them |
His unbelievable amount of middle class frustration and anger in this country |
积极语义特点 |
We’re talking an unbelievable amount of hours |
6 |
30% |
I got an unbelievable amount of experience |
Soon after, an unbelievable amount of people joined the NABS |
I have an unbelievable amount of respect for guitarist Neal Schon and the rest of the band |
We move unbelievable amounts of materials. We transform vast quantities of energy |
Paying coaches unbelievable amounts of money, but that’s what you do |
中性语义特点 |
There has been extensive, unbelievable amount of commitment (to keep him here) |
5 |
25% |
Wore a tight evening gown that displayed an unbelievable amount of cleavage |
It’s not some unbelievable amount of pressure |
It’s that the projects take an unbelievable amount of work from start to finish |
Table 8. Classification of contextual semantic characteristics of unbelievable and amount
表8. Unbelievable与amount搭配的语境语义特点分类
语义特点 |
语境信息 |
个数 |
占比 |
消极语义 特点 |
Is that there is an incredible amount of gratuitous violence, gore, truly horrendous behavior |
5 |
25% |
But people are assuming an incredible amount of ignorance on my part |
And the act of suicide takes an incredible amount of courage, because we can’t be sure that what comes after death |
We already have an incredible amount of cynicism and bile and negativity in this industry |
We have spent years and incredible amounts of resources on what is a monstrous fraud |
积极语义 特点 |
The 2000s has produced a shocking amount of incredible music |
11 |
55% |
It can theoretically hold huge amounts of data at incredible density, and kept in cool, dry, and dark conditions |
The incredible amount of knowledge I have acquired is unbelievable and I know I don’t need |
It takes an incredible amount of courage for women to stand up and confront their rapist and demand justice |
I have an incredible amount of respect for science and think we will develop a variety of things |
Unlike Willard, Park has an incredible amount of tolerance, love and acceptance for all people |
One of the best things about Windows 8 is that it adds an incredible amount of functionality to your arsenal with swipes and taps |
There is an incredible amount of energy and creativity taking over our public spaces |
They are spending incredible amounts of money in search of the “next big Google thing” |
This bundle includes an incredible amount of bonus value - more than $30 in total |
I realize that you guys do an incredible amount of comedy ... that is very high level |
中性 |
And so a hundred tons multiplied by that amount gives you this incredible total. But in fact, this is crazy. |
4 |
20% |
It is an incredible amount of work, especially on the preparation and support front |
These large airframes are designed to take an incredible amount of punishment, largely by yielding and flexing rather than excessive rigidity |
But dove for over 2 hours, observed an incredible amount of reef, coral, marine life, swim through and the hole was |
经过检索分析得知,我们提取出amount在与unbelievable搭配时的20条文本信息中,所呈现的语义韵特点是:9个消极语义特点,占比45%、6个积极语义特点,占比30%和5个中性语义特点,占比25%。amount与incredible搭配时的20条文本信息中的语义特点是:11个积极语义特点,占比55%、5个消极语义特点,占比25%和4个中性语义特点,占比20%。经过进一步分析,无论是二者的搭配词汇的语义特点还是显著搭配词语境的语义韵特点,最终得到的结果都互相吻合,其中unbelievable的搭配词和语境的语义特点分布比较平均,呈现错综的语义特点,具有中性的语义韵倾向,而incredible的搭配词和语境的积极语义特点占比最多,表明它具有积极的语义韵倾向。由此可知,unbelievable和incredible这一组近义词在语义倾向上存在差异,形成了不同的语义氛围。
4. 结语
本文基于语料库的方法,使用COCA语料库工具,从语域频数、搭配词和语义韵三个方面对一组近义形容词unbelievable和incredible进行了辨析。研究结果显示:从语域频数来看,incredible的出现频率更大,它是本族语者在交际中更常使用的词汇。另外,unbelievable和incredible都是偏向口语化的形容词,都较少被用于正式语体中。从搭配词来看,unbelievable的语义范围相对狭窄,常与事件和情感相关的词汇相互搭配,incredible的语义范围相对广泛,经常搭配的词汇是与事件和能力相关的。在语义韵方面,unbelievable呈现中性语义韵倾向,incredible具有积极语义韵倾向。结果表明,unbelievable和incredible除了在语域分布方面没有较明显的差距外,无论是在使用频数、搭配词还是语义韵上,都有显著差异。综上所述,语料库中包含大量的自然真实语料,通过科学的计算可以得到可靠的研究数据,让分析结果更客观。将语料库运用到英语教学中,能让学习者更容易分辨近义词之间的细微差别,在使用近义词时更有把握。语料库的及时更新也能为学习者提供更加真实有效的素材,避免出现误用和滥用的情况,让学习者能够更加地道的使用英语。