1. 引言
教材评估研究是专业教育研究体系中的重要方面,推动教材编写、修订和评估等相关理论的创新与改革。近年来,外语教材研究“重经验、轻理论”、“重编写、轻评估”的问题仍然凸显 [1]。20世纪60年代起,国外语言教材评估研究逐渐兴起,早期确立了对照表式的评估标准体系。从八十年代开始,国外教材开发和评估研究中语料库的应用渐成趋势 [2],旨在为教材评估提供具有可操作性、可比性的量化指标,推动构建量化和质性评价结合的评价体系。在应用语料库的教材评估研究中,词汇评估研究成果显著。教材词汇评估对促进学生词汇学习和语言能力发展具有重要意义。现有词汇评估研究主要涉及教材与本族语语料或者不同系列教材之间的横向对比 [3] [4],通常在评估中将一套教材作为一个整体进行评估,缺乏对不同册级教材和教材内部单元之间词汇知识发展的评估。在国内,已开展应用语料库进行外语教材词汇评估的研究 [5] [6],但针对专业教材的相关研究仍较为匮乏。鉴于此,本文自建英语专业教材语料库,对词汇广度知识发展进行量化分析和评估,以期为教材编写和使用提供参考,并深入探索教材词汇评估的语料库路径。
2. 文献综述
词汇学习是语言教学的重要目标之一,外语专业学生词汇学习主要依赖专业教材。在众多的教材词汇评估研究中,诸多研究关注学习者的词汇广度知识(即词汇量)与阅读理解教材的关系,通常涉及词汇覆盖率的测量。词汇覆盖率指读者理解的词或所参照的词表对文本覆盖的百分比。在可获得辅助的情况下,学习者认识文本中95%的词汇,即能达到可接受的理解水平,而认识98%的词汇则能达到充分理解的水平,即进行独立阅读 [7] [8]。通常用作参照的词表包括General Service List、Academic Word List和BNC/COCA frequency lists [9] 等。已有研究试图揭示不同类型教材对使用者词汇量的要求,如中学英语教材 [10] [11] 、大学英语教材 [6] 、专业英语教材 [12] [13] 、EAP教材 [14] 以及ESP教材 [15] [16] [17]。由于二语或外语学习者普遍认为词汇知识缺乏或质量低下是理解和使用语言上遇到的主要困难,上述研究均建议教材编写要考虑学习者的词汇知识水平,提升教材的适用性和可学性,提高教材促进学生语言知识和能力发展的价值。此外,部分研究参照大纲词汇表进行教材词汇评估 [6] [18] [19] [20],旨在从语言知识角度评估教材对实现教学大纲目标的作用和功能。
根据动态系统论,可将外语教材知识视为动态系统,从而为教材知识发展提供理论诠释 [5]。教材词汇知识作为其中的子系统,其发展具有系统性差异,关注教学项目的分组和排序 [21],有助于降低学习的困难程度,提高学习效率和学习目标的明确性,代表着学习发展的路径。同时,根据最近发展区理论,教材知识的渐进性发展能避免教材材料难度过高或过低对学生理解能力产生负面影响。然而,少有研究对教材语言知识发展进行检验 [22]。现有为数不多的研究对教材词汇进行不同年级、册级、单元之间的纵向比较 [11] [18] [19] [23] [24],旨在为教材词汇广度知识发展评估提供实证依据,从而为教材语言知识发展的系统性提供参考。
综上所述,国内外教材词汇评估研究围绕不同类型教材展开,但是国内对英语专业教材的词汇评估关注较少,对通用和大纲词汇表对教材编写指导作用的研究较为匮乏,对教材词汇知识发展进行纵向评估的实证检验不足。鉴于此,本文通过自建英语专业教材语料库,对教材的词汇量要求和大纲词汇等方面的广度知识进行量化分析,验证教材词汇广度知识发展是否遵循渐进性原则,从而探讨教材词汇知识发展的影响因素,并探索语料库在词汇知识发展评估方面的功能和价值。
3. 研究设计
3.1. 研究对象
本文所研究教材为数次列为国家级规划教材的由2012年外研社出版的《现代大学英语》(第二版) (Contemporary College English,以下简称CCE)。该教材在全国高等院校广泛使用并获得认可。该教材共有六册,适用于英语专业一至三年级使用。考虑到本研究的探索性和可行性,仅选取用于大学一、二学年的前四册教材中各单元课文A文本构成《现代大学英语》教材语料库。
3.2. 研究问题
基于CCE教材语料库,对教材中通用词表 [9] 和英语专业大纲词表 [25] 的词汇覆盖率进行分析,评估该教材不同册级、单元之间的词汇量要求和词汇覆盖率是否遵循渐进的原则,从而对教材的词汇广度知识发展进行解读和评估。本研究尝试回答以下问题:1) 各册教材之间单元词汇量要求是否存在差异?单元词汇量要求是否随单元递进而增加?2) 各册教材之间单元大纲词汇数和词汇覆盖率是否存在差异?单元大纲词汇数和词汇覆盖率是否随单元递进而增加?
3.3. 研究方法和步骤
研究涉及以下四个步骤。首先,以四册教材各单元课文A为单位创建文本。每册教材各有16个单元,除去用作复习的2个单元,每册各14个单元课文作为教材语料库的语料,教材语料库共包含105,347个词汇,16,835个不同词形的词汇(即类符)以及11,265个词族。
然后,参照Nation [9] 的25个按照词频高低排序的1000词族词表,测量教材的词汇覆盖率以获知教材的词汇量要求。将该词表加载在AntWordProfiler软件上后,能够获得教材文本在各1000词族水平上的覆盖率,通过计算得出达到教材95%、98%的覆盖率要求所对应的词族水平。该词表除上述25个1000词族表外,还包括四个补充词表,包含专有名词、边缘词、复合词和首字母缩略词 [9]。词族包含一个词的原形、屈折形式和派生词。例如able、abilities、ability、abler、ablest、ably、inability、unable同属于able一个词族。有关母语使用者的研究表明,在阅读或听力时学习者熟悉一个词族中至少一个成员时,可通过最基本的英语构词知识来理解该词族的其他成员。对于外语学习者来说,这显然是较为乐观的预设。然而,以词族为单位统计词汇量符合心理词汇的构成方式,有助于提升词汇研究的标准化和可比性 [20],因此在测量接受性词汇知识的研究中广泛应用。本研究同样选择词族作为测量词汇量要求的单位。
再者,为研究大纲词汇表在教材中的呈现和覆盖率,参照《英语专业四、八级词汇表》 [25] 制作大纲词族表。使用Familizer (https://www.lextutor.ca/familizer/)将四、八级词汇表转换成四、八级词族表(分别为6508个和3323个词族)。将该词表加载在AntWordProfiler软件上,可获得教材所包含的四、八级词族数和词族覆盖率。
最后,对数据进行统计检验。在SPSS 20.0中运用非参数Kruskal-Wallis检验四册教材单元词汇量要求之间的差异;使用ANOVA检验册级间单元大纲词族数和词族覆盖率之间的差异;使用Spearman相关性分析检验词汇量要求、大纲词族数和词族覆盖率是否与单元序号具有相关关系。
依据上述统计结果,结合二语词汇习得、教材评估、语言教学和语料库语言学相关理论和研究,对教材词汇知识发展进行分析和评估。
4. 结果与讨论
4.1. 词汇量要求
根据AntWordProfiler报告的四册教材各单元词汇覆盖率,如果学生不认识词表 [9] 的补充词汇和不包含在该词表中词汇(off-list words)的情况下,阅读绝大多数单元时无法达到98%的词汇覆盖率。因此,本文以下所指词汇覆盖率是指将Nation [9] 补充词表和不在该词表中词汇的覆盖率考虑在内的情况,即假设学生通过某些辅助手段能够认识补充词表和不在词表中的词汇。研究结果显示,无论将四册教材作为一个整体来看,还是分年级来看,达到95%和98%的词汇覆盖率分别均需3000和5000词族。
根据非参数Kruskal-Wallis检验结果(见表1),四册教材之间单元词汇量要求存在显著性差异(p < 0.01)。事后检验发现,从不同册级来看,要达到95%的词汇覆盖率,从第三册起单元词汇量要求比第一册显著提高(p < 0.01);要达到98%的词汇覆盖率,第四册比第一册的单元词汇量要求显著提高(p < 0.01)。但是,同一年级内教材之间和不同年级相邻教材之间的词汇量要求均无显著差异。可见,无论是同一年级,还是跨年级,相邻学期使用的教材对学生的词汇量要求保持稳定;通常,学生进入大学阶段学习至少一年后,教材的词汇量要求才会明显提高。

Table 1. The non-parametric test of differences in vocabulary load per unit among four textbooks
表1. 四册教材之间单元词汇量要求差异的非参数性检验
根据Spearman分析结果(见表2),就每册教材而言,达到单元词汇覆盖率95%和98%水平的词汇量要求与单元顺序的相关系数均未达到显著性水平,但是纵观所有四册教材,达到不同词汇覆盖率水平的单元词汇量要求与单元顺序呈现显著性相关(r = 0.471, p < 0.01; r = 0.432, p < 0.01),表明每册教材内单元词汇量要求未随单元的递进而逐渐升高,但整体上四册教材的单元词汇量要求呈现随单元的递进而升高的趋势。可见,各册教材内单元词汇量要求未体现明确的渐进性;但从所有教材使用的整个阶段来看,教材的单元词汇量要求呈现缓慢的升高趋势。

Table 2. Correlations between unit ordinals and the presentation/coverage of syllabus vocabulary lists
表2. 词表的呈现和覆盖率与单元序号的相关分析
**:p < 0.01;*:p < 0.05。
4.2. 大纲词汇的呈现和覆盖率
在大纲词汇的呈现方面,基于AntWordProfiler报告,四册教材的单元四、八级词族数平均为467、13,并且四册教材之间单元四、八级词族数都存在显著性差异(见表3)。事后检验发现,跨年级、非相邻学期教材之间单元四级词族数显著增多,并且二年级比一年级教材的单元八级词族数显著增多;但是同一年级教材之间的单元大纲词族数均无显著性差异。关于大纲词汇覆盖率,四册教材的单元四、八级词族覆盖率平均为96.5%、0.9%,并且四册教材之间覆盖率均存在显著性差异。事后检验发现,相邻两册教材之间四、八级词族覆盖率均无显著差异;第四册比第一册教材的四级词族覆盖率显著降低,第三、四册比第一册教材的八级词族覆盖率显著升高。可见,同一年级教材中大纲词汇呈现的数目和词汇覆盖率均没有较大变化。纵观四册教材,仅凭掌握四级词汇就可达到理解的最低门槛,而八级词汇无论是数目还是覆盖率都处于边缘地位。

Table 3. Unit coverage and presentation of families of syllabus vocabulary lists in English teaching materials
表3. 英语专业教材大纲词族的单元覆盖率和呈现
***:p < 0.001;**:p < 0.01;*:p < 0.05。
根据Spearman分析结果(见表2),从不同教材来看,仅第二册教材的单元序号与四、八级词族数和四级词族覆盖率的相关性均达到显著性水平,说明第二册教材内单元大纲词汇呈现和覆盖率的渐进性发展最为凸显。第二册中,随着单元的递进,四级词族数呈现逐渐增多的趋势,同时四级词族覆盖率呈现逐渐下降的趋势。也就是说,四级词族所涉及的形符数逐渐减少,即四级词族重复出现的次数减少。可见,随着第二册单元学习的推进,学生可以逐渐接触更多的四级词汇,而且接触四级以外词汇的机会逐渐增多。从四册教材的所有单元来看,单元序号与大纲词族呈现的数目和覆盖率均达到显著相关,说明在所有教材使用的两个学年中,大纲词汇的呈现和覆盖率展现出渐进式发展的趋势。
4.3. 讨论
4.3.1
. 对专业学习者词汇广度知识发展的作用
大体上,达到英语专业精读教材95%和98%的词汇覆盖率,词汇量要求为3000和5000词族。比较而言,CCE第一册教材整体词汇量要求为2000词族,低于高中三年英语教材普遍要求的3000词族 [10] [11]。要达到充分理解英语专业一、二年级教材水平所要求的5000词族,也同样低于高中教材要求的9000词族 [10] 或6000词族 [11]。尽管CCE编者已在第二版前言中指出第一版一年级教材的词汇起点低于高中,第二版已进行调整,但是研究结果表明,调整的效果并不明显。此外,与英语专业学生的词汇量水平相比 [20],一、二年级学生的词汇量水平已达6500至7000词族的水平。一、二年级CCE教材的词汇量要求低于该水平,无法充分满足低年级学生扩展6000、7000词族及以外的中频词和低频词方面的需求。通常来讲,外语学习者每年可习得约400词族或500词族 [20]。在学习完高中英语教材并认识3000词族的基础上,一、二年级CCE教材的词汇量要求一直停留在3000词族以内,难以充分匹配学生词汇广度知识发展的速度。由此可见,在专业四年的学习过程中,有一半时间使用的教材未对学生的词汇量增长提出要求,对英语专业低年级学生词汇知识的发展和词汇学习的激励所发挥的作用有所限制。
从词汇知识发展来看,从二年级开始CCE教材对学生达到95%的词汇覆盖率水平提高了词汇量要求。但是,要达到充分理解教材的水平,直至第四册教材才会显著提高对学生的词汇量要求。而且,相邻册级教材之间的词汇量要求未体现出增长,较显著的增长仅体现在较低册和较高级教材之间。这种词汇知识发展较缓慢的趋势在大学英语教材的词汇复杂度研究 [24] 中也得到证实。可见,尽管CCE每册教材所包含的词族数逐渐增多,但是总体上词汇量要求的升高较为缓慢,词汇知识发展缺乏确定性和规律性 [19],成为英语专业低年级学生词汇量增长较慢 [20] 的原因之一。因此,CCE在为学生提供词汇学习的动力和促进学习者词汇知识系统稳步增长方面难以发挥预想的主导作用。
4.3.2
. 对专业教学大纲的支撑作用
根据《高等学校英语专业英语教学大纲》,英语专业一、二年级学生的词汇量应分别达到4000至5000以及5500至6500词。由于该大纲并非按词族界定词汇量目标,因此其词汇量要求比按词族为单位计数的词汇量要求略高。但大体上仍可推测出,一、二年级CCE教材的词汇量要求低于大纲要求,对学生达到大纲要求的词汇量水平的支撑作用受到限制。类似研究也发现四套非专业英语教材均无法完全涵盖四、六级大纲词汇 [19],英语专业的阅读教材四、八级大纲词汇覆盖率较低 [13]。可见,无论是英语还是非英语专业学生,仅依靠一套教材难以全面接触和掌握大纲要求的词汇知识。
从大纲词汇知识发展来看,在同年级使用的教材内大纲词汇呈现数目和词汇覆盖率无显著变化。但是,不同年级之间教材的大纲词汇呈现数目明显升高,特别是第四册与第一册相比大纲词汇的呈现和覆盖率的提高较为显著。同时,四级词汇对理解教材一直居于主导地位,八级以及大纲外词汇对教材理解的影响不大。可见,一、二年级CCE教材将词汇学习重点视为四级词汇,在此基础上激励学生习得更高级别大纲和超纲词汇。从四册教材所有单元来看,大纲词汇呈现数目和词汇覆盖率呈现平稳增长的趋势,并且增长效果不易被使用者感知 [18]。但不同教材比较来看,第二册对大纲词汇的渐进性安排更为理想。总体上,一、二年级CCE教材对基础级别大纲词汇学习的支撑作用较强,并且绝大部分时间内不同册级教材之间大纲词汇难度水平较平稳,最可能在学生使用第四册时对大纲词汇知识的要求有明显提升。
4.3.3
. 词汇知识发展设计的挑战和启示
研究结果表明,无论是教材词汇量要求,还是大纲词汇的呈现和覆盖率等词汇广度知识发展的规律性和系统性都有待改进。原因在于,一方面,精读教材语料的选材主要关注主题内容的适切性、题材多样性和文化内涵丰富性,词汇知识特征往往不是教材编写者注重的因素,也少有教材编写者掌握语料库评估教材词汇知识的方法。现有教材中词汇广度知识的发展多体现在单元词汇和更高级大纲词汇数目的增加,但增加的程度和方式没有系统性安排。尽管现阶段精读教材数量不断增多,但是选择不同教材对学习者词汇广度知识发展的作用及其差异难以预测。为此,教材编写者应利用语料库工具了解和把握语言材料的词汇广度知识 [11],选择与学生的词汇量水平和词汇知识发展阶段更为匹配的语料,或者对语料进行适当改编而将词汇广度知识控制在目标级别大纲要求的范围内。另一方面,教材知识“系统的各种变体在动态发展中互动关联” [26]。词汇知识属于文本复杂度中的一个指标,与句法、语篇等指标相互作用。词汇知识在文本复杂度测量中所占权重受多种因素影响,例如学习者群体的词汇知识水平、教材使用动机等。这些情况都给教材词汇知识量化指标体系的确立提出挑战,需要二语习得、语料库语言学、计算语言学等相关研究提供支撑。在这种背景下,针对不同类型学生群体词汇学习的多样化需求进行精读教材教辅材料的开发,或开发相关的线上课程资源建设以促进数据驱动学习是可供参考的方案。
5. 结语
本文基于英语专业精读教材语料库,参照通用词汇表和大纲词汇表,对不同册级教材之间的单元词汇量要求和词汇覆盖率进行分析,旨在对教材词汇广度知识发展进行评估。研究结果表明,教材的词汇量要求和大纲词汇的覆盖可能低于学生使用者群体的词汇知识水平和专业大纲要求,并证实了同年级教材之间以及教材内部单元之间词汇广度知识无显著拓展,但从四册教材使用整个过程来看,词汇广度知识呈现渐进性发展趋势,对大纲词族(尤其是四级词族)的学习和习得提供了有效支撑。教材词汇广度知识发展影响学习者词汇知识能力的全面发展和教材对大纲的支撑作用,因此教材词汇知识发展的渐进性设计需要更多的实证研究支撑。基于语料库的教材词汇评估能够在教材量化评估方面发挥优势和积极作用,并为教材编写、使用和评估等教材建设的各个环节提供有益参考和借鉴。本研究的局限性在于评估对象仅限于一套教材,今后将对更多同类教材进行比较分析和评估。
基金项目
本文为“中国外语教育基金”项目“基于语料库的英语专业教材词汇发展评估研究”(项目号ZGWYJYJJ11B017)的课题成果。