航运公约词汇表的建立——基于Range软件对海事公约文本的分析
The Establishment of Shipping Conventions Word List—Based on Range-Aid Analysis on Maritime Conventions
DOI: 10.12677/ML.2023.113160, PDF, HTML, XML, 下载: 362  浏览: 438 
作者: 何玉梅:上海海事大学外国语学院,上海
关键词: 词汇门槛词汇覆盖率Range海事公约航运专业Lexical Threshold Lexical Coverage Range Maritime Convention Shipping Major
摘要: 我国本科航运专业的词汇门槛尚未量化,语料库数据驱动的论证使设定这一具体语域的词汇门槛成为可能。在论述词汇覆盖率、词频、词汇门槛、海事公约的学习之间逻辑关系的基础上,本研究使用Range软件对四份具有代表性的海事公约语料进行分析,分别为国际防船舶污染物然公约(MARPOL)、国际海上人命安全公约(SOLAS)、海员培训、发证和值班标准国际公约(STCW)、海事劳工公约(The Maritime Labour Convention)。本研究分别运用Range BNC版本以及Range AWL&GSL版本,对四份公约文本语料(共276,250个形符)进行分析,研究得出分别基于BNC (British National Corpus)以及AWL&GSL (Academic Word List & General Service List)的两个航海公约词汇表(Shipping Conventions Word Lists)。本研究建议把这两个词汇表设定为航运专业词汇门槛的参照,为航运专业在教学大纲撰写、教材编写、词表编列,以及学业测试与评估等提供词汇层面的参考依据。
Abstract: The vocabulary threshold for shipping major in colleges of China has not yet been quantified. Corpus-driven methodology makes it possible to set the vocabulary threshold for this specific domain. Based on the logical relationship between vocabulary coverage, word frequency, vocabulary threshold, and learning of maritime conventions, this study uses Range software to analyze four representative maritime convention corpora, namely Marine Agreement Regarding Oil Pollution Of Liability (MARPOL), the International Convention for the Safety of Life at Sea (SOLAS), International Convention on Standards of Training , Certification and Watchkeeping for Seafarers (STCW), and The Maritime Labour Convention (MLC). In this study, the corpus of the four conventions (276,250 morphological characters) was analyzed by using the Range BNC and Range AWL&GSL versions respectively, and the two Shipping Conventions Lists based on BNC (British National Corpus) and AWL&GSL (Academic Word List & General Service List) were established. This study suggests that these two lists should be used as a reference for the vocabulary threshold of shipping majors, and provide a reference for shipping majors in writing syllabus, teaching materials, word lists and academic tests and assessments.
文章引用:何玉梅. 航运公约词汇表的建立——基于Range软件对海事公约文本的分析[J]. 现代语言学, 2023, 11(3): 1177-1196. https://doi.org/10.12677/ML.2023.113160

1. 引言

航运专业作为一个国际性的专业,并且也是上海海事大学海事特色的代表专业,在英语方面对本科生有着较高的要求。航运专业的本科生除需要通过大学英语四级和大学英语六级以外,还需要通过本专业的国际航行船舶船员专业英语考试。航海公约作为航运专业本科生必修的内容之一,为学生通过国际航行船舶船员专业英语考试提供了一定的支撑作用。赵志刚学者在2014年使用语料库的研究方法,自建航海英语报刊语料库,旨在探讨如何在航海英语阅读教学中利用语料库辅助教学,借助语境共现、词频表和关键词表等来进行航海英语教学,以达到快速掌握航海英语词汇,提高阅读速度和增强阅读理解能力,培养学生的跨文化交际意识等教学目标。学习者要习得某个特定ESP领域的词语,必须频繁接触该领域的真实语言使用事件,ESP领域专门词表的编制就必须以该领域的学术语料库为基础 [1] 。本文选取最具有代表性的四份公约作为研究文本,分别为:国际防船舶污染物然公约(MARPOL)、国际海上人命安全公约(SOLAS)、海员培训、发证和值班标准国际公约(STCW)、海事劳工公约(The Maritime Labour Convention),涵盖了海员培养,海员劳动保护和生命安全保护以及海洋环境保护四个方面。

2. 理论基础

Nation认为建立词汇表的需求可以受到以下原因的驱动,其中包含确立词汇学习目标,评估学生的词汇知识储备和词汇学习进步,分析话语的难度,开发和修订阅读材料,设计词汇学习工具,确定学术类课程表的词汇构成,以及满足其他学术需求。 [2] 航运专业英语是专门用途英语的分支之一(English for Specific Purposes),这一具体语域的专业词汇表的建立需要在通用词汇以及学术词汇表的基础上,利用词频和语域来进行筛选。关于词汇筛选的标准方面,Nation曾提出,如果一个人对一个文本的词汇覆盖率仅有80%,他便无法充分理解这个文本;当词汇覆盖率为90%时,只有少数人可以理解该文本;只有98%以上的词汇覆盖率才能保证阅读者能够较好地理解文本。 [3] Laufer后来提出二语学习者需要认识文本中至少95%的词汇,只有在此基础上对文本阅读理解的质量才有基本保证。 [4] Schmitt等也提出,若要保证对一个学术文本的阅读理解正确率达70%,词汇覆盖率应达到98%。 [5] 上述三位全球最有影响力的词汇学家得出的结论基本一致,对文本中词汇的掌握程度和对文本的理解有着密切的联系,具有95%的词汇覆盖率能够提供基本有效的阅读理解,并且能够促进学生的学习;98%词汇覆盖率提供最优化的阅读理解。英语海事公文是一种同时兼有海事科技术语和公文文体的正式文体,英语海事公文中大量使用专业术语和缩略词,英语海事公约具有用词规范、正式的特点,其目的是为简化表达形式,避免繁琐、冗赘 [6] [7] ,因此只有在所掌握的通用英语的基础初上集中学习海事公约词汇才能够达到海事公约内容的理解,以及辅助航运专业本科生学习以通过国际航行船舶船员专业英语考试。

3. 研究步骤与结果

(一) 分析工具

本实验使用的分析工具为Paul Nation开发的Range程序BNC版本以及Range程序AWL & GSL版本。 [8] 该软件可以在https://people.wgtn.ac.nz/paul.nation免费下载。BNC是最具权威性的英语语料库,采用英式英语拼写,其中书面语语料占90%,口语语料占10%。Leech提出,设计像BNC这样的国家语料库的目的是要使它尽可能地代表某一语言在实际使用中的所有变化范围。 [9] BNC版本的Range软件从1亿词的BNC (British National Corpus)语料库中,按照词频高低提取了14,000个词族,并将每1000个词族分为一个层级,第一层级的词族是日常口头和书面用语中最高频的1000词族,第一级层直至第十四层级词频依次递减。AWL&GSL版本软件是AWL和GSL共同组成的。 [10] 从一个由350万词组成的学术语料库中提取出学术词汇表AWL,该语料库由四个子语料库组成,分别为文、商、法和科学,这四个子语料库是学术科目的代表。GSL是West从一个500万字的小说语料库中提取出来的,在书面和口头英语词汇的使用方面具有代表性 [11] 。

(二) 语料

本研究从海事公约中选出四篇具有代表意义的四篇作为本文实验分析的语料,共计276,250个形符。英语单词的形符包括以空格断开的英文单词、字母、缩略等,但不包括标点符号,形符数即总词数。本研究选取海事航运专业必修的四篇航海公约为语料,内容主要涉及防污公约、国际海上生命安全公约、海员培训、发证和值班规则、以及海事劳动公约四个方面。

(三) 数据预处理

在使用Rang对上述语料进行统计分析之前,先对自建的小语料库进行预处理,以排除语料中可能的干扰因素。预处理主要包括以下几点:

1. 将语料库中美式英语词汇转换成英语国家语料库词表中一致的英式英语词汇。

2. 将连字符进行批量替换为空格。

3. 将四个txt格式的公约文本分别命名为indo1、indo2、indo3、indo4。

预处理后的形符总数为。

(四) 数据输入Range BNC版本

将预处理后的文本存入Range BNC所在的文件夹进行分析统计,步骤如下:

1. 运行Range32.exe程序,对程序相关参数进行设置。保持“Number of Baseword File”的预设数目3保持不变,即使用软件内置的16个Baseword Files中的前3个(BNC 3000)进行分析,并在“Batch Files”前打勾。通过“File”——“Open”菜单打开四个预处理过的公约文本。

2. 通过“File”——“Save”菜单,预先把即将生成的Range.txt文档保存。

3. 点击左侧窗口下方的“Process Files”,操作完成。

(五) 数据输入Range AWL&GSL

将预处理后的文本存入Range BNC所在的文件夹进行分析统计,步骤如下:

1. 运行Range32.exe程序,对程序相关参数进行设置。保持“Number of Baseword File”的预设数目3保持不变,即使用软件内置的16个Baseword Files中的前3个进行分析,并在“Batch Files”前打勾。操作设置如图所示。

2. 通过“File”——“Open”菜单打开四个预处理过的公约文本。

3. 通过“File”——“Save”菜单,预先把即将生成的Range.txt文档保存。

4. 点击左侧窗口下方的“Process Files”,操作完成。

(六) 研究结果

Table 1. Lexical coverage of BNC 3000 in maritime convention material

表1. 英国国家语料库3000词对航运公约的词汇覆盖率

航运公约词汇表(BNC3000版本)词汇覆盖率 = 95% − 85.49% − 0.68% (专有名词) = 8.83%。

Table 2. Lexical coverage of AWL&GSL 2580 words in maritime convention material

表2. 学术和通用词汇表2580词对航运公约的词汇覆盖率

航运公约词汇表(AWL&GSL版本)词汇覆盖率 = 95% − 84.41% − 0.68%(专有名词) = 9.1%。

Range分析语料后生成的文件命名为*Range,放置于Range程序的文件夹内。文件中所含的内容为对MARPOL、Solas、STCW、The Maritime Labour Convention的分析结果。BNC3000能够提供的词汇覆盖率为85.49% (见表1所示),AWL&GSL能够提供的词汇覆盖率为84.41% (见表2所示);基于BNC所建立的航海公约词汇表需要至少对本研究所采用的四份航海公约文本达到8.83%的词汇覆盖率,基于AWL&GSL所建立的航海公约词汇表需要至少对本研究所采用的四份航海公约文本达到9.1%的词汇覆盖率。Francis和Kucera对Brown语料库的研究表明,需要一个350万字的语料库才能找到频率为100的词族,这相当于每百万字中需28.5次出现才能被列入词表当中 [12] 。本研究的子语料库为4个,共276,250个形符,因此词族的筛选标准为:1) 该词族必须出现在3个及3个以上子语料库中;2) 出现频次为8次及8次以上。根据以上两条筛选标准,本研究选取分析语料后生成的文件内“Not in the list”列表的词汇,使用上述两个条件进行筛选,分别得到航海公约词表SCWL (BNC版本) 254词,航海公约词表SCWL (AWL&GSL版本) 245词,如附件内附表1所示。

4. 讨论

英语海事公文是一种同时兼有海事科技术语和公文文体的正式文体,英语海事公文中大量使用专业术语和缩略词 [1] ,因此只有在所掌握的通用英语的基础初上集中学习海事公约词汇才能够达到海事公约内容的理解。对数据显示,在航海公约文本中,BNC3000能够提供的词汇覆盖率(85.49%)与AWL&GSL的覆盖率(84.41%)相比较高,因此基于AWL&GSL词表的SCWL相比基于BNC3000词表的SCWL具有更高的词汇覆盖率,且航海公约词表SCWL (AWL&GSL版本)具有相对较精简的词族列表(见附件中附表1所示)。对航运专业本科生而言,在已掌握的通用英语的基础上学习SCWL (Shipping Conventions World List),进一步扩大有航运专业特色的词汇量,节约学习海量词汇表才能对航海公约达到同等词汇覆盖率的时间,提高了学习效率,为通过国际航行船舶船员专业英语考试提供了一定的支撑作用。航海英语教学不仅仅是就其专业知识、语法、词汇进行的教学,它应是一门综合性语言文化教学,航海专业英语语言教学的最终目标就是要培养学习者能够运用英语进行跨文化交际的能力 [6] 。因此在日常的航海英语教学中,可以通过阅读英语报刊来深刻理解对航运词汇表中专业词汇概念的丰富含义,动态了解外国文化发展动态,从而提高航运专业本科生的跨文化交际能力,丰富航运专业本科生对未来的航海实践的了解。同时,航运词汇表可以灵活运用于航运专业本科生教材编撰以及航运专业本科生阶段性学习测试中。

附录

Table A1. Shipping convention word List (BNC 3000)

表1. 航海公约词表(英国国家语料库版本3000词)

参考文献

[1] 赵志刚. 英语海事公文的语言特点及翻译[J]. 上海海事大学学报, 2014, 35(2): 89-94.
[2] Nation, I.S.P. and Webb, S.A. (2011) Researching and Analyzing Vocabulary. Heinle, Cengage Learning, Boston, MA.
[3] Nation, I.S.P. (2006) How Large a Vocabulary Is Needed for Reading and Listening? The Canadian Modern Language Review, 63, 59-82.
https://doi.org/10.3138/cmlr.63.1.59
[4] Laufer, B. and Ravenhorst-Kalovski, G.C. (2010) Lexical Threshold Revisited: Lexical Text Coverage, Learners’ Vocabulary Size and Reading Comprehension. Reading in a Foreign Language, 22, 15-30.
[5] Schmitt, N., Jiang, X. and Grabe, W. (2011) The Percentage of Words Known in a Text and Reading Comprehension. Modern Language Journal, 95, 26-43.
https://doi.org/10.1111/j.1540-4781.2011.01146.x
[6] 赵志刚, 何安平. 报刊语料库在航海英语阅读教学中的应用[J]. 广东海洋大学学报, 2014, 34(5): 80-85.
[7] 赵志刚. 专门用途英语学术词表创建研究——以航海英语为例[J]. 重庆交通大学学报(社会科学版), 2015, 15(6): 140-144.
[8] Heatley, A., Nation, I.S.P. and Coxhead, A. RANGE and FREQUENCY programs. http://www.victoria.ac.nz/lals/staff/paul-nation.aspx
[9] Leech, G. (1992) 100 Million Words of English: The British National Corpus (BNC). Language Research, 28, 1-13.
[10] Coxhead, A. (2000) A New Academic Word List. TESOL Quarterly, 34, 213-238.
https://doi.org/10.2307/3587951
[11] West, M. (1953) A General Service List of English Words. Longman, London.
[12] Francis, W.N. and Kucera, H. (1979) Brown Corpus Manual. Letters to the Editor, 5, 7.