1. 引言
英语是一种国际交流的工具,近年来,教育国际化和学术国际化的趋势日益明显,来自不同学术背景的学生希望通过阅读英文文献进行学术研究活动。 [1] 因此,掌握学术词汇对于他们尤为重要:它可以帮助准确理解文章内容、避免错误理解;同时也可以帮助他们更好地应用学术词汇表达和传递信息。由此学术英语词汇更是受到不少关注成为研究热点。在学术词汇(academic vocabulary)的研究中,学者们还在探讨其使用特征、能力发展以及学术词表的创建等方面的问题,这些研究也为我们了解学术词汇提供了重要信息。然而,对于通用核心词汇、通用学术词汇及专业学术词汇的定义和习得顺序,国内外学界尚无定论 [2]。
在各种学术性文章中学术词汇虽不能传递主要学术信息,但当作者表达学术观点、阐述研究活动、解释研究结果时经常需要使用这些词。学者们发现,学术词汇涵盖了约10%的学术文本和约16%的学校教科书,没有掌握足够的学术词汇对阅读学术文本和撰写学术文章有困难。如果消除这些障碍有助于提高学术水平,人们一致认为教学应该集中于学术词汇 [3]。
AWL (英语学术词汇表),是语言学家通过追踪主流媒体和学术文章所发现的在所有学术文章中出现频率最高的570个英语单词集合。这个表在许多国家的英语教学中都得到了很高的评价,本文主要借用citespace软件分析AWL中词的出现频率、发表趋势、发文国家、以及研究热点。AWL的分析研究具有重要的理论意义和实践意义。主要体现在,在教学理论以及教学实践中可以指导学习者进行独立地学习。对于EAP的研究者和教学者来说进行相关的教科研都是有重要意义的。并且国内相关领域的研究尚不多见,选择这一视角旨在推动国内AWL的编纂和ESP的发展。
2. 研究背景
Coxhead的学术词汇表是一个处理大规模语料的研究,它旨在帮助学生正确理解和使用学术性的单词。通过使用语料库语言学和各种检索软件,从不可胜数的英语词汇中分辨出哪些是学术性的单词,并将其列入学术词汇表中,以便在教学中提高学生对学术词汇的掌握,帮助学生正确理解和使用这些单词。语料库语言学的发展和各种检索软件的出现使大规模语料处理成为可能这也为词表的制定提供了新的途径。近年来这方面比较有影响的研究便是Coxhead的学术词汇表。
2.1. Coxhead的AWL研究背景
为了提高初级英语学习者的词汇学习效果,West在1953年编纂了2000常用词汇表(General Service List,简称GSL)。GSL包含90%小说文本、75%非小说文本和76%学术文本 [4],可以为所有初级学习者使用。然而,随着GSL的使用和验证,其中单词较普通无法满足学术要求而受到一些批评。因此,为了满足学术需要,后来的研究者开始创立出具有较高出现频率、覆盖面较广、可用于学术目的的新一代学术性单词表。
2.2. Coxhead的AWL开发
Coxhead [5] 的Academic Word List (AWL)是一个包含3,513,330词标的语料库,它来自4个学科(人文、商业、法律和理科)的28个专业以及414篇文本(见表1)。AWL收集了学术词汇中出现频率较高、覆盖面较广的单词,可以帮助英语学习者提高词汇学习效果在国际化教育和学术交流中取得成功。Coxhead基于这个语料库,收集出现频率超过100次、在15个专业中出现10次以上的词族,最终完成了一份包含570个词族的“学术词汇表”(Academic Word List简称AWL) [6]。Coxhead选择词族的三个标准是:1) 特定出现(specialized Occurrence):入选词族必须不在West的2000常用词汇表中;2) 范围(range):每个词族里的单词至少在四个学科中出现10次以上、至少在15个专业领域中有所体现;3) 频率(frequency):每个词族里的单词在整个文本库里至少出现100次 [3]。

Table 1. Composition of the academic corpus
表1. 学术语料库的组成
在range软件的帮助下Coxhead的AWL收录了570个词族,按照词族频率的高低分成10个子表。子表1包含了在Coxhead语料库中出现频率最高的词族子表2次之后以此类推。子表1~9各有60个词族子表10有30个词族。作为一个刚出现的新词表有必要深入研究它的效度和适用性,以及它在英语教学中的应用。目前,Mingtzu和Nation [7] 已经从一词多义的角度对AWL进行了效度研究;而其他方面的研究则少之又少。此外,AWL收录了570个词族,并把它们按频率分成10个子表。Coxhead的Academic Word List (AWL)包含了覆盖学术语料库10%单词的词族,其中94%至少出现在20个专业领域中。因此,使用AWL来进行学术英语教学和进行相关研究都是非常重要的一步。
3. 研究设计
3.1. 学术英语词汇研究
本研究将采用定量和定性相结合的方法,通过深入分析学术词表的变化趋势,分析1996~2022年间AWL相关文献。重点梳理研究趋势、研究热点和研究突显。本文借助WOS检索1996~2022年期间的相关研究,在高级检索中以academic word list或者academic word lists为主题词,与AWL为主题词,期刊类别限定为linguistics和language linguistic。语种限定为英语。两者分别搜出303篇和19篇文献,在经过CiteSpace分析时共收集有效论文302篇。
3.2. 学术英语词汇研究理论框架
英语学术词汇表简称:AWL。它是由新西兰惠灵顿维多利亚大学语言学和应用语言研究学院的Averil Coxhead开发的,是一种通过语料库研究得出的,包含了所有英语世界主流媒体和学术文章中出现频率最高的570个英语单词。Averil Coxhead的研究旨在帮助学习者快速提高英语水平,他将最常用的570个单词归纳出来,作为一个参考清单,帮助学习者先从这些单词开始学习,然后再扩展到更多的英语单词,帮助学习者快速提高英语水平,从而更好地理解和使用学术文章。
该列表包含570个单词家族,之所以被选中是因为它们在广泛的学术文本中出现频率很高。该列表不包括在英语中最常见的2000个单词(一般服务列表)中的单词,因此使其特定于学术语境。该词表主要是为了让它可以被教师使用,作为计划的一部分,为学习者准备高等教育水平的学习,或用于学生在学院和大学独自学习最需要学习的单词。词表可以广泛用于学术论文写作、各种国际英语测试如雅思(IELTS)、托福(TOFEL)等。570个单词被分成10组。这些组的顺序是这样的,第一组的单词是最频繁的单词,而在最后一组是最不频繁的单词。
4. 研究与讨论
4.1. 发文量总体趋势与特点
本文根据年度发表情况,运用Excel软件分别以年份和发文量为横、纵坐标绘制出论文发表量分布图(见图1)。随着年代的推移,英语学术文章的发表量也在不断变化。这些数据使得AWL发文量更加明了。在AWL诞生之际,发文量比较稳定,少则9篇,多达15篇,这一阶段学术英语词表相关研究很有起色。然而此后很长一段时间年经历了大萧条,甚至在03年发文量为0,多年发文量为1篇,说明在此期间词表研究不为研究者所吸引,AWL经过一段时间的瓶颈期后最终在2010年开始发文量直线上升,逐渐开始进入成熟发展,且始终保持一定规模的产出,在2021年达到峰值,也表现出AWL逐渐成为学者的研究热点。
4.2. 关键词
CiteSpace软件的关键词聚类功能可以清晰地展现出某研究领域的热点词汇 [8],这有助于我们判断出论文内容的精华,并更好地了解其中的研究焦点和发展趋势 [4]。AWL的另一个用处是,它可以帮助研究者快速搜集学术文章中使用频度最高的570个单词,从而更好地分析出文章的核心内容和研究焦点。

Figure 1. Number of AWL research papers published at home and abroad in 1996~2022
图1. 1996~2022年国内外AWL研究论文发文量
从词频由高到低的排序中可以看出(见表2),国际研究者对AWL的English、language、academic vocabulary的研究论文发表数量排在前三位;表明学者们对词汇研究本身的一个重视。frequency, wordlist, knowledge, list和vocabulary等方面的研究论文发表数量次之。而学生的comprehension、performance相对来说比较薄弱。

Table 2. Key words of AWL research papers from 1996 to 2022
表2. 1996~2022年国内外AWL研究论文关键词
与此同时,我们可以看到研究的焦点已经从单词本身转向记忆单词,比如“learner”,“retrieval”,因此通过CiteSpace数据分析,我们可以清楚地知道单词记忆过程已经引起了人们的注意。
4.3. 主要发文国家分布
由表3可以看出,以AWL为题的文章主要在美国发表的为116篇,占总数的38.2%,美国与英国占据了51.1%,而中国仅占据了7.5%。说明英美国家的外语学界对于词表分析研究非常重视,Coxhead的Academic Word List (AWL)就是一个很好的例子。因此,使用AWL来进行学术英语教学和进行相关研究都是非常重要的一步。这些发现展示出英美国家外语学界对于词表分析有深入的关注和重视,以便能够开展多领域的有效词表分析研究。而同时也说明我国对词表研究并不太重视。

Table 3. Research of AWL published nations in1996~2022
表3. 1996~2022年AWL分析研究发文国家统计
4.4. 国家合作图谱
合作研究一直是科学计量学较关注的问题,绘制作者合作图谱能够更加清晰直观地反映出某一学术研究领域不同国家专家学者的合作关系 [9]。科学合作可以提高学者科研成果的质量和影响力,大型合作群体能够产生更有说服力的成果 [10]。通过绘制作者合作图谱,可以更加清晰地反映出不同国家专家学者之间的合作关系,从而有助于增强学术研究领域的影响力。本部分通过绘制国家共现图谱以揭示国内外词表研究现状。
从图2中可以看出国家之间分布较稀疏,说明合作较很少。说明各国科研从事AWL研究的科研人员跨国合作的较少,大多是孤军奋战。每位作者对应一个节点,连线代表了他们之间的合作关系。总体来看,大多数国家之间存在独立发文的情况,超过半数的国家之间没有节点连线。除了发表文章数量较多的国家之间存在几个较大的聚类合作关系之外,其他聚类都呈小群体分散在四周,这说明国家之间相互联系较少。因此,在近年国内外词表分析研究中,大型科学团队尚未形成,而且各个国家之间的合作也有待加强。只有通过不断扩大合作面、加强协作、促进技术创新,才能使词表分析取得更好的发展。

Figure 2. Co-occurrence map of country cooperation in the field of AWL from 1996 to 2022
图2. 1996~2022年AWL分析研究国家合作统计
4.5. 研究前沿分析
在CiteSpace中,前沿研究主要是指在本阶段起始年份即1996年开始突现的节点文献所反映的研究主题,共11个突发词。我们可以将这11个突发词分为三大类。第一类在1996~1999三年间,以词汇记忆为主题和内容,包括memory,retrieval和activation三个突发词。第二类是包括research article, frequency, academic vocabulary, frequency和list,其贯穿在2014~2017,在此阶段突现集中在词汇本身。最后一类是English,lexical bundle以及knowledge自2018年到现在的2022年仍是研究热点,词汇是英语学者及研究者都是至关重要的,词汇知识对英语学习者又是一个很大的挑战。突变率最高的是English、research article和academic vocabulary,对应年份是2018~2022、2014~2017、2017~2018,表明在此年份中为其的研究热点。通过图3分析可知,English、lexical bundle和knowledge在近几年研究比较火热。

Figure 3. Burstiness of AWL 1996~2022
图3. 1996~2022年AWL突现表
5. 结论
本研究借助文献计量学知识与可视化分析软件,进行了定性与定量相结合的研究方法。对国内外近十几年学术英语词表相关文献进行了检索、统计、分析和归纳,主要从发展趋势、核心作者以及研究热点等进行总结分析。研究发现:1) 1996~2022年,国内外词表研究文献数量持续增加,而且随之而来的是不断壮大的学术队伍。总体上来看,这些发展趋势表明词表相关的学术领域正在取得可观的成果。2) 国家间连接点较少,国家机构之间合作不紧密。在近年国内外词表分析研究尚未形成大规模的科研团队,只有通过多方面的合作,才会得到更好的发展,也说明国家合作有待加强。3) 通过国家发文量的对比可以看出我国对词表的研究不足。4) 学者们对词表研究的关注已从最初的词汇记忆发展到了更多元化,包括词汇本身、词义知识、专业背景知识等。学术词表在不同国家之间有交流合作,对于英语学习者来说,要掌握学术性的英文单词是非常重要的,这也是取得高等教育成功所必备的一部分。而通过数据分析可知词汇在AWL中的充当着至关重要的作用且为广大研究者所注视。研究者今后可以深入探讨学术词汇的教学方法,以及用于加强学术词汇的练习和测验AWL教学效果的方法,相信这样的研究会有助于加深对学术词汇的认识,并且进一步完善AWL这一新的学术词汇表,以促进学术英语教学和开展相关研究。