1. 引言
雅思写作考试是评估非英语母语者学术英语能力的关键组成部分,其评分标准体系严谨,其中“词汇丰富度”(Lexical Resource, LR)是衡量考生语言输出质量的核心维度之一。官方评分标准明确了词汇多样性对于获取高分的重要性。然而,在实际教学与备考中,如何将这一抽象标准转化为可观察、可测量的具体教学实践,仍是师生共同面临的挑战。早期就有相关学者研究过词汇量与写作质量的关系以及词汇丰富度的测量方法。但对文章中的关键部分,即首段的词汇特征如何具体影响LR评分的研究还不足。
本研究以一项雅思教师功底提升项目中的写作文本为样本,旨在深入探究不同分数段雅思写作Task 2在词汇丰富度上的具体差异,运用语料库工具精确测量其词汇变化度,并进一步对不同话题下高分与低分作文在话题词汇替换策略上的特征进行质性对比。通过研究结论为雅思写作教学提供实证依据,强调首段词汇多样性的意义。
2. 研究背景
2.1. 评分标准
雅思考试官网中提到雅思写作Task 2评分标准共分为四项,包含任务回应度、连贯与衔接、词汇丰富度、语法多样性和准确性,各分数段的具体要求不同;其中,关于词汇丰富度(LR)的部分描述,8分段具体表现为“能流畅、灵活地使用丰富的词汇,表达准确的意思”,7分段为“使用足够的词汇,展现一定灵活性及准确性”,6分段为“使用足够词汇”,5分段则为“使用词汇范围有限,但能达到试题的最低要求”[1]。从“丰富”到“足够”到“有限”可以理解为词汇变化程度,即词汇多样性。
2.2. 理论基础
Laufer & Nation认为,词汇丰富度可以从词汇独创性、词汇密度、词汇复杂度和词汇变化度四个维度进行测量[2]。Read提出词汇丰富度的构成要素包含词汇变化度、词汇复杂度、词汇密度和词汇偏误率[3]。两篇均明确了词汇变化度(lexical variation, LV)、词汇密度(lexical density, LD)和词汇复杂度(lexical sophistication, LS)的测量方法,认为不重复出现的词汇、实义词及低频词在文中起着重要的作用。
3. 研究方法
3.1. 写作任务
本次任务基于新东方内部师训项目——雅思功底提升营展开,参营人员为日常雅思授课教师,旨在通过学习营提升自身雅思写作水平,进行雅思备考和提分。任务要求考生,即参营教师,分阶段共完成3篇不同话题的写作Task 2模考,分别为社会生活、环境保护、文化传统三个主题。每篇文章由专业的培训师进行批阅打分,给出写作总分以及任务回应度、连贯与衔接度、词汇丰富度和语法多样性及准确性四项维度的分数。
3.2. 写作样本
研究随机选取了三个不同主题下LR分数在6分、7分、8分水平的文章各3篇,共27篇。文章题目均源自新东方教师团队编纂的写作范文真经[4]。所有文章按照话题和分数从A1、B1、C1到I1,A2到I2,A3到I3的规律进行编号,再分门别类对其进行词汇使用情况的分析,见图1。
Figure 1. 27 articles numbers with different topics and scores
图1. 27份不同话题和分数的文章编号
3.3. 研究工具和方式
根据以上任务和样本,本文采用定量与定性研究相结合的方法,对全部文章首段内容进行词汇变化度、词汇密度及词汇复杂度的分析。
(1) 词汇变化度
词汇变化度通常采用“类符/形符比(type/token ratio),简称形次比(TTR)”来计算。形符类似于我们日常说的“词”,类符作为一个统计量,指语料库文本中任何一个独特的词形。在一个文本中,重复出现的形符只能记作一个类符[5]。TTR越高,词汇丰富度也就越高。
Laufer & Nation提出的计算公式如下[2]:
LV = numbers of types * 100%/numbers of tokens
针对词汇变化度,研究使用WordSmith语料分析软件,将所有文章转化为纯文本(plain text),并根据WordSmith的词频列表检索、文本对比等功能对样本库中的首段TTR、全文TTR进行量化评估;并研究首段及全文词汇丰富性与LR分数的相关性。
(2) 词汇密度
词汇密度通常指文本中实词的占比,实词主要包括名词、实义动词、形容词和派生副词,其计算公式为[3]:
LD = total number of lexcial words/total number of words in the composition
通常认为,在雅思大作文写作题目中,包含话题词(topic words)与任务词(task words)两类关键词,任务词常在教学和备考中被授课教师和考生用来判定文章类型,如出现“agree or disagree”意思的词汇,则为同意与否类题目,出现“advantage and disadvantage”的文章,常被认为是利弊分析类题目。而话题词常为实词,每个题目的话题词一般在3个左右,通常为表明题目核心主题的词汇,主要用来帮助考生理解题目的实际内容,从而更好地进行评分标准中要求的任务回应。因此本次研究将不执着于作文中具体实义词的数量,而将重点放在对词汇丰富度产生实际影响的与作文题目的话题词汇相对应的表达,对考生首段的话题词汇进行质性分析,探究不同话题及不同分数的文章中,话题词汇使用的不同之处。
(3) 词汇复杂度
词汇复杂度,也称稀有度,通常用来衡量学习者文本中相对非常用或高级词汇的占比,计算方式为[3]:
LS = number of sophisticated word families/total number of word families
与词汇密度相同,本文将着重关注并对比低分段与高分段中话题词汇的高级表达。因本次研究对象为参营的授课教师,教师整体英文水平较高,大部分作文并无明显的词汇使用错误,因此词汇偏误率不纳入此次词汇丰富度的影响因子内。
4. 研究过程与讨论
4.1. 不同分数段词汇丰富度
首先,根据分数段分类,通过WordSmith语料软件生成词表,测量不同分数段的首段词汇变化度和全文词汇变化度数据,见表1。
Table 1. Comparison of average TTR between the first paragraph and the entire article among three score ranges
表1. 3个分数段的文章首段和全文平均形次比
LR分数段 |
段落 |
平均TTR |
段落 |
平均TTR |
6分 |
首段 |
81.29% |
全文 |
53.27% |
7分 |
首段 |
82.96% |
全文 |
53.83% |
8分 |
首段 |
87.90% |
全文 |
57.73% |
表中可见,LR为6分的考试平均TTR比例最低,即考生的词汇达到了“足够”但不够丰富,LR为8分的考生平均TTR比例最高,即考生“能流畅、灵活地使用丰富的词汇”。此外,作文首段TTR比例与全文TTR比例均成正比,且与LR分数呈正相关,表明首段与文中其他段落的词汇丰富度均为提高LR分数做出了贡献。其中首段TTR比例更高,与LR分数相关性更强,表明首段内容的作用更不容小觑。同时,结合心理学中的首因效应,最先出现的信息比后续信息印象更深刻、对整体印象形成影响更大的认知偏差[6]。因此文章第一段不仅有概括和回应题目的作用,也有给考官形成第一印象、奠定文章基调的影响。第一段通过丰富的词汇进行论点陈述,会大大提升写作中LR维度的分数,从而提升整体写作分数。
4.2. 不同话题词汇丰富度
除词汇量外,还有许多因素可能影响写作中的词汇丰富度,包括对话题的熟悉度、写作技巧以及交际目的等。这意味着,仅改变话题就可能导致词汇丰富度发生显著变化[2]。因此,研究又根据话题分类,测量不同话题下,分数段的首段词汇变化度和全文词汇变化度数据,包含TTR比例、平均词长、平均句长等,见图2。
Figure 2. Vocabulary analysis and comparison of the first paragraphs on different themes
图2. 不同主题文章首段的词汇分析对比
经过对图中三个不同话题的平均TTR计算,社会生活、环境保护和文化传统的首段平均TTR分别为86.82%、84.60%和80.41%。由此可见考生对社会生活的词汇量掌握程度较高,表明他们对日常生活了解得更多,而对文化传统类的词汇相对不太熟悉。具体根据题目来对两个极值的话题题目及首段话题词进行分析。
(1) TTR最高的社会生活话题的题目见图3:
Figure 3. Sample task on social life
图3. 社会生活类样题
经观察可发现,题目中关键话题词分别为:young people,change,jobs/career。样本文章中6分段考生对关键话题词的同义表达为:youngster,young adult,young staff,switch,pursue;7分段考生对关键话题词的同义表达还有(除6分段外):try,position,choice;8分段考生对关键话题词的同义表达还有(除6、7分段外):workforce,opt to/for,flexible role,shift,job-hopping。
(2) TTR最低的文化传统话题的题目见图4 (该题目为考试真题,多次出现在2017、2018、2019年考试中)。
Figure 4. Real exam task on cultural tradition
图4. 文化传统类真题
分析发现,题目中关键话题词分别为:restoration,old/new buildings/housing,expense/money,governments,road development。6分段考生对关键话题词的同义表达为:remain,maintain,restore,preserve,historical,architecture,cost,spent,expenditure,update,construct,traffic infrastructure。7分段考生对关键话题词的同义表达还有(除6分段外):ancient,cultural heritage,accommodation,rebuild,sustain,age and outgrow,budget,invest,modern development。8分段考生对关键话题词的同义表达还有(除6、7分段外):repair,amenities,monuments,financial,funds,renovation,facilities。
从不同LR分数段的话题词对比可看出,低分段考生仅能识别1~2个关键词并在首段中对其进行简单的近义词替换,其他则均为冠词、介词、代词、情态动词等功能词,这会使文章的词汇密度降低,词汇重复率增加,信息量较小;而高分段的考生能够识别题目中较多关键词,进行更复杂、更灵活的替换。例如,6分段考生会只聚焦于主语和谓语进行替换,而7分和8分段考生能关注到宾语,除“young people”和“change”外,还能将宾语“job”进行较多形式的替换。此外,高分段的考生对词汇的理解力更强,在写作时除近义替换外还能够对其进行上义的抽象概括和下义的解释,如7分和8分段文字将“road”替换为“facilities”以及属于CEFR中C1级别的“amentities”,将“building”解释为“cultural heritage”、“accommodation”和“monuments”;同时,高分段词汇变化形式更多样,除了词词替换外,更擅长运用短语搭配及复合词,如“opt for, job-hopping”。
5. 结论
5.1. 建议
通过以上研究发现,文章首段在整篇文章中起到领衔和画龙点睛的作用,较大程度上影响着雅思写作评分标准中“词汇丰富度”维度的分数,因此教师和考生应该更重视首段的词汇的教学和掌握。笔者通过日常对大量教师进行教学质量监测发现,部分雅思写作教师将过多的重心放在任务回应度的提升上而忽视了学生对词汇的理解和掌握。虽然任务回应度是大部分中国学生的弱项,但教师也不可完全不在课上讲解词汇而将其只作为课下练习和背诵环节。质检发现,还有一部分教师习惯使用中文帮助学生表达观点、拓展思路,致使学生在真正写作时提笔忘词。
经过该篇研究分析,词汇是其他评分维度的基石,帮助学生理解词汇并进行拓展运用是写作教学的基础。教师应学会对词汇部分进行有效的课堂教学设计,引导学生掌握其近义词、上下义词、词性变化和词汇搭配的使用。同时,教师可使用WordSmith、AntConc等语料工具对学生的作文进行检索、生成词表、词频等进行分析,帮助教师更快更准地发现学生在词汇上的弱点所在,通过数据驱动辅助语言教学,也能真正做到“以学习者为中心”的教学。
5.2. 局限性
TTR和词汇丰富度也受文章长度的影响,随着文章篇幅变大,作者对功能词等虚词的使用也就越多,TTR比例必然会降低,此时类符和形符比例的可信度也会降低。此研究主要基于雅思写作文章首段进行分析,篇幅较短,且样本话题种类不够多样,因此基于较大库容的文本研究还有待进一步挖掘和探讨。
致 谢
首先,感谢新东方国际教育长期致力于为提高教师功底以及保障教师教学质量而持续进行的雅思功底提升师训项目以及教学质检,提供了相关专业数据。同时也感谢教学管理部贺洁老师的校对以及张馨之老师对真题分析的指导。