1. 引言
词汇学习一直被视为语言学习的重要组成部分 [1]。在中国EFL (English as a foreign language)环境下,教师和学生都清楚地认识到,英语学习,尤其到了中高级阶段,需要习得大量的词汇知识,这成为了众多学习者提升自身语言水平的重大障碍。对于工科院校学生而言,巨大词汇量的挑战更为严峻。许多学者和语言工作者都致力于探索在二语或外语环境下,如何能够高效地习得词汇。其中,较为有影响力的是投入量假设理论 [2] ,其认为在阅读过程中,对词汇知识的加工投入量越大,词汇习得的可能性就越大。该理论也是语言研究者第一次设计出可见的测量方法,即投入量指数,来衡量学习者在阅读过程中对词汇知识的加工程度。
基于投入量假设的理论研究框架,笔者在北京某市属高校对108名石油化工专业的学生进行了一项实证研究,目的是进一步验证投入量假设理论中三因素对词汇附带习得的影响是否相同,以期为EFL词汇教学和学习提供具有实际意义的反馈和有益的借鉴。
2. 研究背景
“附带习得”的概念是针对“有意学习”而提出的,最早出现在20世纪初的心理学研究领域。正如其名,有意词汇习得是指学习者故意地、有意识地专注于词汇学习,努力记忆目标词的拼读、词形变化及其语法、功能和社会用途 [3]。但是,在很多情况下,词汇习得都是偶然发生的。学习者在进行听、读等其他交流活动时,顺便习得了陌生词的意义及用法 [4]。没有学习词汇的目的,却达成了词汇学习的效果。事实上,许多词汇附带习得都发生在学习者进行泛读的过程中 [5]。整个过程是完全无意识的,学习者在阅读时,注意力没有放在词汇上,但作为阅读的“副产品”,词汇习得的效果较为可观。
许多L1研究者认为,直接地讲授词汇并不能帮助人们掌握丰富的词汇量。扩大词汇量的主要方法是通过意义环境来习得词汇 [6]。大量关于EFL和L2的阅读实践及词汇习得研究也表明,当学习者具有强烈动机开始专注于意义学习时,扩大阅读量会形成数目相当可观的词汇量 [7] [8] [9] [10]。这就是说,阅读活动本身可以明显地促成词汇附带习得 [11] [12] [13]。
因此,词汇附带习得研究长期以来一直是EFL和L2研究者研究的焦点。然而,词汇附带习得的效率并不高 [14] [15]。阅读过程中词汇强化任务对词汇附带习得的影响则获得了许多研究者的青睐。
其中,较为有影响力的观点认为,阅读者在阅读过程中对词汇知识加工的水平越高,越有可能通过阅读理解来习得词汇。换言之,词汇是否被习得完全取决于阅读者所投放的注意力 [16]。为了提供“可见的”工具来测量词汇加工水平,Hulstijn和Laufer (2001)提出了著名的投入量假设理论。其通过动机(motivation)与认知(motivation)两个维度,运用需求(need)、搜寻(search)及评估(evaluation)三个因素构建了投入量框架,用具体的指数来描述由阅读任务引发的投入量的强弱。
需求属于动机层面的因素。如果阅读任务需要读者清楚陌生词的含义,那么就产生了需求的投入量,外在需求,强度记为中等,内在需求,强度记为强烈。搜寻属于认知层面。如果阅读任务要求读者通过查字典或询问权威等方法查找陌生词的词义或词形,那么搜寻投入量就形成了。评估也是认知层面的因素。如果阅读任务需要读者在一定语境下评估或比较目标词的形式或意义是否适当时,评估因素就被视为存在。给定语境,强度记为中等,原创语境,强度记为强烈。若因素不存在,指数记为0 (−),因素存在,强度中等,指数记为1 (+),强度强烈,指数记为2 (+ +)。辨别投入量强度指数的详细标准可见表1。投入量假设理论表明,阅读任务所含的投入量指数越高,阅读过程中词汇附带习得的效果就越好。
投入量假设的实验激发了语言研究者和教育者的热情。有的侧重于调查记叙文和议论文、主题熟悉与主题陌生环境下,读者在阅读过程中词汇附带习得的不同;有的侧重于探讨阅读投入量对动词、名词及形容词等产生的不同的影响。尽管关于阅读材料和不同投入量的研究越来越广泛 [17] [18] [19] [20] ,却很少有人关注投入量总量相同,但各因素强弱指数不同的阅读任务对EFL词汇学习及保持的影响。因此,本文将以实证研究的数据为依据,进一步探讨投入量三因素对词汇附带习得的影响。
3. 实证研究
3.1. 研究问题
本项目组以北京市某市属高校大一石油化工专业学生为对象,开展实证研究,旨在探讨投入量指数相同,但各因素强弱水平不同的阅读任务对目标词的学习及保持的影响是否相同,从而为如何通过阅读提高词汇附带习得效率,扩大EFL学习者的词汇量提供有益的借鉴。研究问题如下:在相同投入量的情况下,投入量假设理论中的三因素对学习者阅读活动中词汇的学习与保持是否同等重要?

Table 1. Specific standards to identify the degree of the involvement load
表1. 投入量指数的判定标准
3.2. 研究对象
北京某市属高校108名学生参与了此项实证研究。所有的参与者都是在校大一的石油化工专业的学生,年龄在18到20岁之间,英语能力相似,处于中等水平。根据每学期的分级测试,参与者均为B级,即英语成绩在60与75分之间。
这108名参与者来自两个完整的教学班(56 + 52),分别就读于机械工程系与化学工程系。每个班的学生又被随机分为3个实验组,分别完成同一篇阅读理解与各不相同的一项阅读任务。
3.3. 研究工具
3.3.1. 阅读材料的选取
只有当阅读者充分理解阅读内容时(词汇熟悉率达98%以上),词汇附带习得才有可能发生(Hu & Nation,2000)。本项研究所选取的文章包含96%参与者所熟悉的词汇(这一点由不参与研究的其他同级别学生在前期测试中所证实),就词汇的熟悉率而言,符合词汇附带习得发生的条件。文章的主题是关于北美青少年的消费倾向,对于中国在校大学生较有吸引力。因此,无论是文章的难度(生词率及主题),还是长度(512 words),都能确保参与者的充分理解。
3.3.2. 目标词的选取
20个来自其他B班,不参与本项研究的学生被邀请划出文章中所有感觉陌生的词。在此基础上,选取了10个目标词,包括4个名词、2个形容词和4个动词。随后,又用这10个目标词对另外20个自其他B班,不参与本项研究的学生进行实验性测试,以确保这10个词确实是学生所不熟悉的,具体包括:budget, gigantic, allowances, estimate, purchase, market, manufacturer, latest-style, institution, debt。
3.3.3. 阅读任务
本项研究侧重的是投入量指数相同,但三因素强度各不相同的阅读任务。基于Hulstijn和Laufer的实验框架,具体任务设计如下:
阅读任务1:阅读文章后判断对与错(T or F questions)
参与者阅读文章(目标词词义未加注),并基于对文章的理解,完成关于文章内容的10个陈述的判断。每个陈述包含1个目标词。例如:
In
North America
, young people have gigantic buying power in today’s economy. (True/False)
在此过程中,允许参与者使用词典。由于参与者必须理解文章的整体内容,以及各项陈述的含义,才能完成错与对的判断,因此,阅读任务1引发的投入量指数为“3”,在三个因素需要、搜寻、评估中的分布是(2 + 1 + 0)。
阅读任务2:阅读文章后选择目标词中文词义
参与者阅读文章(目标词词义未加注),并基于对文章的理解,从四个选项中,选出目标词在文中的词义。例如:
In
North America
, young people have gigantic buying power in today’s economy. ( )
a. 巨大的b. 有限的c. 奇特的d. 吸引人的
同样,参与者可以在阅读过程中随意翻看词典。由于参与者被外在因素(题目要求直接选择词义)要求知晓目标词词义,既可以通过查字典,也可以通过上下文推测,然后决定哪一个选项是正确的,因此,阅读任务2引发的投入量指数为“3”,在三个因素需要、搜寻、评估中的分布是(1 + 1 + 1)。
阅读任务3:阅读理解后使用目标词造句
参与者阅读文章(目标词词义已加注中文释义),并基于目标词在文中的意义及使用方法,完成10个目标词的造句任务,句子要求结合自身体验原创。例如:
In
North America
, young people have gigantic buying power in today’s economy.
Your own sentence: ___________________________.
与阅读任务2相似,阅读任务3中的需求因素是中等强度,因为知晓目标词词义并非参与者自身意愿,而是被外在因素所强加。搜寻因素为不存在,因为中文释义已给出。 在完成阅读任务3的过程中,评估因素强烈,是因为参与者在使用目标词原创造句时,其不得不比较、评估新词,把它们与自己熟悉的词联系到一起使用。因此,阅读任务3引发的投入量指数为“3”,在三个因素需要、搜寻、评估中的分布是(1 + 0 + 2)。
3.3.4. 词汇测试与评分标准
三个实验组所有的参与者都将参加阅读任务完成后的即时词汇测试及一周后的延时词汇测试。为保证验证的是词汇附带习得的效果,两次测试都未提前告知,也就是说,参与者在完成阅读任务的时候,注意力并未因为词汇测试的存在而转移至词汇学习本身。
两次词汇测试完全相同,要求参与者写出目标词的中文翻译或英文释义,以评价其对目标词的学习及保持情况。
项目组采用Hulstijn和Laufer实验中的评分标准批阅两次词汇测试。空白或完全错误的翻译及释义得0分;部分正确或贴近正确的翻译及释义得0.5分;完全正确的翻译及释义得1分。
3.3.5. 数据收集
本项实证研究计划覆盖108名学生,极其理想的是,最后,108名参与者全部参与了阅读任务、即时测试及延时测试。
参与者随机分为3组(34 + 36 + 36),完成同一篇选定篇章的阅读理解(第三组的文章带中文注释),然后,每组完成各自的阅读任务。完成过程不限时间,因为本研究关注的是阅读过程中加工词汇的投入量,而不是阅读活动本身的质量与效率。随即词汇即时测试。阅读任务完成后,随即对全部参与者进行即时的词汇测试,以确保测试的信度。同样,一周后的延时测试也针对全部参与者并在同一时间进行。
两次测试的试卷交由同一经验丰富的教师严格按照上述评分标准批改。对于批改所得数据(词汇测试的分数),本研究使用社科统计软件包(SPSS12.0版本)进行整理和分析。
4. 数据分析与讨论
4.1. 即时测试及延时测试成绩的整体描述
表2展示的是对即时测试与延时测试成绩的描述性数据。
如表2所示,各组测试成绩之间的差异较明显。完成阅读任务3的参与者无论是即时测试(M = 6.411764706)还是延时测试(M = 4.941176471),都取得了最高的分数,优于完成其他两个阅读任务的参与者。完成阅读任务1的参与者成绩最低(M = 3.958333333, M = 3.180555556)。这表明,投入量中的三因素(需求、搜寻及评估)对阅读过程中的词汇附带习得的影响是不同的。评估因素越高,词汇习得的可能性就越大。阅读任务1包含最高强度的需求因素,但是,组1的成绩在两次测试中都是最低(M = 3.958333333, M = 3.180555556)。以此可以推断,需求因素对于阅读中词汇的学习与保持不具有决定性。
并且,虽然组2和组3在即时测试中成绩较好,但在一周后的延时测试中,成绩显著下滑。这提示我们,词汇知识的保持并非易事,不时地加强巩固是不可缺少的环节。这种接触频率对词汇习得和保持的影响值得进一步研究和探讨。

Table 2. Descriptive statistics of the immediate and delayed tests
表2. 测试任务与测试时间的描述性统计
另外,值得一提的是,组3在两次测试中的标准差(SD = 1.912758551, SD = 1.857681456)明显小于组1和组2。这也许可以证明,包含最强评估因素的阅读任务3更能够促使学习者最大程度地增加对词汇知识的加工水平。即便是不愿意努力的参与者在完成阅读任务的过程中也不自觉地理解和记住了词义。
4.2. 投入量三因素与词汇附带习得的关系分析
本研究运用3 × 2双因素方差分析的方法,阅读任务为被试间因素,具有3个水平:阅读后判断正误、阅读后选择目标词中文含义及阅读后使用目标词原创造句;测试时间为被试内因素,具体有2个水平:即时测试及延时测试。
通过表3可知,“阅读任务”[F (2,105) = 72.18; sig = 0.000 < 0.01; η2 = 0.340]和“测试时间”[F(2,105) = 44.94; sig = 0.000 < 0.01; η2 = 0.479]的主效应以及“阅读任务与测试时间”的交互效应[F(4,105) = 17.96; sig = 0.000 < 0.01; η2 = 0.235]在统计上都是显著的。也就是说,在阅读任务三个水平及测试时间两个水平的平均值上有显著差异,它们之间的交互效应在统计上也具有显著差异。因此,投入量各因素分布对阅读中词汇学习与保持的影响显著不同。
4.3. 差异定位与分析
基于上述分析,F值显现出极显著差异。因此,本研究采用了双因素方差中的Scheffé事后分析,对现存差异进行定位与分析。
通过表4可以看出,任务1、任务2及任务3在即时测试中存在明显差异,其显著水平分别达到了p = 0.000 < 0.01, p = 0.000 < 0.01 以及p= 0.022 < 0.05。这表明每项阅读任务相比较,对词汇成绩都产生了极其不同的影响。然而,Scheffé事后分析的数据显示,在延时测试中,仅仅任务1和任务3之间(p = 0.024 < 0.05)以及任务2和任务3之间(p = 0.028 < 0.05)存在差异。尽管完成阅读任务2的参与者在延时测试中的平均成绩高于任务1,但是方差分析结果不显示明显差异(p = 0.695 > 0.05)。分析其原因,笔者认为,与阅读任务1(阅读后判断信息对错)相比,阅读任务2(阅读后选择目标词中文词义)中的评估因素在当时确实产生了更好的词汇学习效果,但是,其强度不足以确保学习者对词汇知识的保持。
5. 结论
根据上述对实证数据的定量分析,本项研究得出以下结论。
首先,投入量相等,但三因素强度不等的阅读任务对学习者阅读过程中的词汇附带习得影响相助不同。其中,评估因素与需求及搜寻两个因素相比,更为关键,更具决定性。评估因素越强,越有利于学习者对词汇的习得与保持。需求因素的影响不如搜寻和评估,这也说明,动机因素固然重要,但认知因素更加强势。
其次,通过比较三因素强度不同的阅读任务所引发的投入量对词汇附带习得的影响,也为广大EFL

Table 3. Task effect, time effect and the effect of task × time interaction
表3. 阅读任务与测试时间的主效应及交互效应

Table 4. Scheffé Post Hoc Multiple Range Test for immediate and delayed tests
表4. 多组样本间差异Scheffé Post-Hoc检验
词汇学习和教学提供了启示。在原创的语境下,以产出(造句或写作等)的方式使用目标词,习得词汇的效果最好。词汇教学应侧重关注意义的任务,具备较强的评估因素。
最后,学习者要有意识地利用机会接触新习得的词汇,如结合自身体验创造新的意义语境。EFL教师也要通过使用评估因素强的阅读任务来不断刺激学习者在阅读中的词汇学习与保持,以防止或延缓遗忘。
基金项目
本研究是北京市教育委员会社科计划一般项目——“中国英语学习者对高频非习语程式语的习得范式研究”(项目编号:SM201710017002)的成果,谨致感谢。
参考文献