语料库视角下的物流英语语篇中过渡词研究
Research on Transition Words in Logistics English Discourse from the Perspective of Corpus
DOI: 10.12677/ML.2023.114177, PDF, HTML, XML, 下载: 152  浏览: 254 
作者: 柏 薇:上海海事大学外国语学院,上海
关键词: 语料库物流英语语篇过渡词Corpus Logistics English Discourse Transition Words
摘要: 过渡词是一种很好的语篇衔接方式。本文拟从词汇密度、词频、空间分布、语义分布四个角度,对物流英语语篇中的过渡词语进行基于语料库的定性与定量分析,揭示其在物流英语语篇中过渡词的使用特征。笔者期望本研究能为我国物流英语专业的学生在学习和运用英语方面提供一些参考。
Abstract: Transition words are a good way to connect the discourse. This paper intends to make qualitative and quantitative analysis of transition words in logistics English discourse based on the corpus from the perspectives of vocabulary density, word frequency, spatial distribution and semantic distribution, to reveal the characteristics of the use of transition words in logistics English discourse. It is hoped that this study will have implications for the learning and use of professional English in logistics.
文章引用:柏薇. 语料库视角下的物流英语语篇中过渡词研究[J]. 现代语言学, 2023, 11(4): 1326-1333. https://doi.org/10.12677/ML.2023.114177

1. 引言

由于传统的语法侧重于个别的句子或词汇研究,因此,在语法体系中,句子是最上层的结构。而语篇分析则以句子关系,语篇中的过渡与连贯为重点。从篇章分析的视角来看,篇章并非单纯的语句的组合,它是由多个具有一定联系的语句所组成的一个整体。为了达到篇章的连贯性,有许多方法可供选择,其中之一就是过渡词。

2. 研究的问题

本文主要从四个角度来探讨过渡词。

2.1. 词汇密度

词汇密度(TTR)是衡量篇章难度的一个重要指标。由于TTR作为一个样本函数,受到文本长度的影响较大,因此笔者选择对长文本进行分段,然后对每个段落进行分析,这样可以分散文本长度带来的影响。在这篇文章中,TTR是一个特定篇章中过渡词语的类符号与形符号的比例。通过类符/形符可以一定程度上反映文本的特征,即用词的变化性 [1] 。词汇的密集程度越高,其所包含的信息就越多,其表达的意义也就越严密。在外语学习中,可以用来表示文章的难易程度。所以,在编写教材的时候,要把词汇的密度问题考虑进去。

2.2. 词频

“高频词”是一种普遍使用的文体标记。高频率词汇既可以用来展示文章的内容,又可以用来做阅读前的预设“模式”。所以,很多学者都在努力构建能够用基本英语表述各种思想的“核心词汇”,或者是为以后的阅读做好准备。词汇在各种文章体裁中出现的频率是不一样的。

2.3. 空间分布

过渡词在句子中的空间位置也有变动,可以在句子的开头,中间,结尾三种情况。过渡词在所有空间位置都可以使用,但在特定空间位置使用的几率要大得多。在词位上,词位的不同会引起词义的差异,词位的选取会受到具体因素的影响。1) 句子开头。在句子的开头,可以清楚地将语篇的各个单元联系起来。过渡词可以使读者准确地了解后文与前文的关系。因此,句子的开头一般都是不带标志的。2) 句子中间。Quirk [2]曾说过,“句中”是一种介于“主题”和“陈述”两个部分之间的“位置”,其实“句中位置”是一种非常灵活的划分方式。在这篇文章中,更多的具体位置将被称为“句子中间”。人们普遍认为,在学术文章中,过渡词语往往位于句中。句子结尾。句子的结尾是句子中所有必需的成分后面的位置。句子结尾处的过渡词语,大部分都是与会话有关的。在学术文章中,一般很难在句子的末尾使用过渡语。

2.4. 语义分布

许多语言学者对过渡词的语义分类进行了探讨,包括Halliday [3] 、Hasan [3] 、Quirk [2] 、Biber [4] 等。通过多次对比,作者认为,Quirk与Biber等人所作的分类法较为相近,且更符合当前的研究现状。由于已有文献资料,因此,本论文主要使用了Quirk等的分类方法。本文研究的对象如表1所示。

Table 1. The object of this research

表1. 本文的研究对象

3. 研究方法

这部分主要阐述了本文所需的语料和所用数据的处理方法。

3.1. 语料库

本文主要选用两个语料库:LEC (Logistics English Corpus,物流专业英语语料库)和BNC (British National Corpus,英国国家语料库)。

1) LEC。本研究收集了Donald F. Wood编著的International Logistics和Nchandrasekara主编的Fundamentals of Logistics两本书,以国家物流标准化技术委员会和国家物流信息管理标准化委员会提出并统一的《中华人民共和国国家标准:物流专业英语》(GB/T 18354-2006)为参照专业词汇,计算出两本书中专业词汇占比共为21.91%,因此选取者两本书在相关在线专业英语提取网站,提取了共4008条物流专业术语,自建了一个小型的物流专业英语语料库。

2) BNC。从BNC (英国国家语料库)语料库中的书面英语(库容9000万词)提取共916,575个词为参照语料库。

3.2. 数据处理

1) 确定研究对象。如前面所提到的,本论文以Quirk等人的分类法为依据,对112个过渡词进行了修正。这些过渡词正是本论文所要探讨的问题。

2) 处理语料。在LEC中,笔者删除了所有的图表,不重复下载站内链接,然后将Word文档转换为纯文本文档进行检索。BNC是一个有代码的语料,必须使用FOX PRO对代码进行拆分。

3) 搜索关键字。本文使用了两种不同的语料,通过Antconc3.30对112个过渡词进行了搜索,并得出了它们在不同的上下文中出现的情况。

4) 手动操作。目的是将那些不属于过渡词的词语剔除掉,例如那些在句子中充当连接词或附加词的词语,为了确保得到的资料的正确性,作者将这些词语进行了两次人工操作。

4. 研究结果

这部分从四个角度对研究的结果进行了探讨:词汇密度,词汇频率,空间分布以及语义分布。

4.1. 词汇密度

本文从以下两个方面研究过渡词在两个语料库中的词汇密度:一是过渡词在两个语料库中数量的标准值,即每100,000个单词中过渡词出现的数量;二是TTR,即过渡词的类符形符之比。统计结果如表2所示。

Table 2. Statistical result

表2. 统计结果

注:标准值 = 过渡词形符数/语料库形符数*100,000。

表2所示,LEC中形符数和过渡词形符数都比BNC中的多,但是过渡词在LEC中的标准值却比其在BNC语料库中的数值小。这表明,与BNC相比,LEC中的过渡词要少一些。过渡词的TTR结果如表3所示。

Table 3. The TTR results for the transition words

表3. 过渡词的TTR结果

注:TTR = 类符/形符。

从TTR的角度来看,LEC语料中的TTR值为0.006,BNC语料中的TTR值为0.093,因此,LEC语料中的TTR值仍然远远低于BNC。从这一点可以看出,LEC中的过渡词的词汇密度要比BNC小得多。

4.2. 词频

高频词反映了语言的共性,中频词汇的使用情况可以反映出实体内容和语言使用者的水平,低频词可以看到文本的特点。词频统计是语料库研究的基本统计手段 [5] 。在词汇的频度上,我们可以从如下角度进行考察:1) 从两个语料中选取10个最常用的转化词;2) 与BNC相比,LEC中出现了大量的过渡词;3) 与BNC相比,LEC中的过渡词用得太少。本文将两个语料库中的过渡词转换成标准词,以十万个词语为单位,对两个语料库中的过渡词语进行统计。其中,在两个语料库中使用频率最高的10个过渡词如表4所示。

Table 4. Top 10 transition words in LEC and BNC

表4. LEC和BNC中前10个过渡词

注:比例是指本单词在本语料库所有过渡词中所占的比例。

Table 5. Overused transition words in the LEC

表5. 在 LEC中过多使用的过渡词

表4可知:1) 在两个语料库中,前10个过渡词所占的比重均超过一半,并且在LEC中所占比重低于BNC;2) 在所用次数最多的10个过渡词中,LEC中的最大值与最小值之差为5.50% (8.97% − 3.47% = 5.50%),而BNC中的最大值与最小指之差为13.91% (16.63% − 2.72% = 13.91%),比LEC中的差异大得多,说明LEC中对单个词语的依赖程度并不高。3) 从两组数据中还可以发现,“now,so,then”是两组中共有而且使用频率比较高的3个词。可以得知,两种体裁依赖的单词是不一样的。相比于BNC语料库,在LEC中过多使用的过渡词统计结果如表5所示。

表5可以发现,作者所收集到的15个词汇都是在LEC中出现频率很高而在BNC中未出现的词汇。与之相比,在物流英语的篇章中,这15个词的用法被高频使用。这些句式可分为六大语义类,其中以罗列补充和比较性让步最为突出。

此外,笔者还统计了在LEC中过少使用的过渡词,结果如表6所示。

Table 6. The underused transition words in the LEC

表6. 在LEC中过少使用的过渡词

其中3个单词未在LEC中出现,另外6个在LEC中出现的频率均远低于BNC。经过对这9个词的义项的分析,作者发现9个词的义项也都是以罗列的形式出现。从这两个表中我们可以看出,这两个语料对特定过渡词语的运用有很大的差异。

4.3. 位置分布

笔者在本文中将过渡词的位置分为句子开头、句子中间和句子结尾3种。统计结果如表7所示。

Table 7. Statistical results of position distribution

表7. 位置分布统计结果

注:比例是指此位置的过渡词占全部总数的比例。

表7中我们可以看出,与BNC相比,LEC在句中的过渡词地位显著高于BNC,而在句后的地位却低于BNC。正如前面提到的,在较高的学术论文中,过渡词更多地被用在句首的位置。从这一点可以看出,物流英语的语篇在学术上要优于一般的英语。

4.4. 语义分布

笔者将Quirk等人研究的112个过渡词分为7类,并分别对其进行检索统计,结果如表8所示。

Table 8. Semantic distribution of the transition words in the two corpora

表8. 过渡词在两个语料库中的语义分布

注:T/100,000是指过渡词每10万字出现的数量。

表8中的数据对比可以看出:1) 在两种语料的语义分布上有相似的趋势,均侧重于列举附加、结果推断、对比让步和转折4个义项,而且在4个义项中,LEC所含的过渡词数目显著低于BNC;2) 其余3种语义组所占比重较小,但其中LEC中的过渡词的数目略大于BNC。

5. 结语

本文的结论是:与一般的英语相比,物流英语中的过渡词数目较少,且密集程度较低。尽管与一般英语一样,都对前10位的过渡词依赖性很强,但物流英语依赖性很小,而且依赖于不同的词汇。就位置分布而言,物流英语篇章中位于句中的过渡词比一般英语多得多,而位于句尾的过渡词比一般英语少得多。从语义上看,物流英语与一般英语中的过渡词主要分为4个类别:罗列补充、比较让步、结果推断、转折;另外,在4个语义类中,物流英语篇章中的过渡词比一般英语要少,其它3个语义类中,物流英语篇章中的过渡词比一般英语稍多一些。

虽然笔者已经做了周密的规划与准备,但仍有一些不足之处。1) 语料的大小、代表性等因素对研究的信度、有效性有一定的影响,因此,语料的大小、样本大小等因素也会对研究的结果产生一定的影响。2) 由于本论文是在Quirk等的基础上进行的,因此忽视了其它学者的工作。3) 本论文仅考察了篇章间的过渡关系,对其它关系的探讨还需深入探讨。4) 手动过程中难免会出现主观判断失误。本研究表明,过渡词在不同的英语体裁中有不同的使用特点,因此,在物流英语教学中,教师和学生都要注意这些差别,并且要多接触物流英语,这样才能够熟练准确地应用过渡词。

参考文献

[1] 王芳, 连天雪. 基于语料库的商务英语与普通英语的词汇比较研究[J]. 大连理工大学学报(社会科学版), 2013, 34(3): 130-133.
[2] Quirk, R., Greenbaum, S., Leech, G., et al. (1985) A Comprehensive Grammar of the English Language. Longman, London.
[3] Halliday, M.A.K. and Hasan, R. (1976) Cohesion in English. Longman Pub Group, London.
[4] Biber, D., Johansson, S., Leech, G., et al. (2000) Longman Grammar of Spoken and Written English. 2nd Edition, Foreign Language Teaching and Research Press, Beijing.
[5] 粱茂成, 李文中, 许家金. 语料库应用教程[M]. 北京: 外语教学与研究出版社, 2010.