1. 引言
2018年,教育部颁布了《普通高中英语课程标准(2017年版)》,引发了新一轮关于英语教育和教学领域的研究和改革热潮。在多年的教学实践中,广大教师逐渐对新课程标准的含义有了更深层次的理解。新一轮英语新课改的目的、核心理念是否能够有效地实施,或教师有没有按照课标来进行教学,其关键在于以标准为基础。本文将从语言测试的发展出发,探讨语言知识和语言能力之间的相互转化关系,在此基础上,结合国内外英语教学评价的相关标准,探讨我国英语评价标准的研制重点解释评价的标准所在。
2. 语言测试理论对我国英语测试的影响
Brindley (1994)、Bachman & Palmer (1996)等人,在语言测试的演进历程可以追溯至早期的科学测试阶段,这一阶段主要是通过对语言技能进行量化和标准化的尝试。随后,随着技术的进步和教育需求的增长,分析法测试开始崭露头角,它通过考察学生在特定任务中使用语言的能力来评估其语言运用水平[1]。进入20世纪后,综合法测试逐渐成为主流,它将多种测试方法结合起来,以更全面地评价学习者的语言能力。而交际法测试则在此基础上进一步发展,它强调语言实际应用中的交流技巧和互动能力,模拟真实的语言使用情境。这些不同的测试阶段不仅各自丰富了英语测试的内涵,而且相互影响、相互促进,共同推动了英语教学评估体系的不断完善与发展[2]。
(一) 前科学测试阶段
Long & Norris (2000)认为,在前科学测试阶段,由于缺乏系统化的语言测试理论的指导,主要采用历史语言学的分析方法。这种方法在英语教学和考试过程中占据主导地位,因而呈现出浓厚的翻译性和文学性特点[3]。语法翻译作为一种古老且最早传入中国的语言现象,对外语教学及测试产生了深远的影响。尽管这一方式饱受争议,目前在全国的中考、高考试题中都很少见到纯粹的翻译题,但从语言对比的角度来看,它的确有助于了解一门语言的结构特征,因此,语法翻译法的教学和测试方式在课堂教学中,在阶段性成绩测试(achievement tests)中也得到了广泛的运用。
(二) 分析法测试阶段
陈丽(2021)认为,分析法测试阶段的起源可以追溯至二十世纪三十至四十年代的结构主义语言学。该阶段的提出是基于对语言体系的深入分析和研究,其核心目的在于评估学生在语言知识与能力方面的掌握水平。多项选择题模式作为英语教学及考试体系中的一个显著特征,它着重于语言测试方法的规范化和客观性[4]。在这种理念的指导下,即70年代后期,将多项选择题引入英语科目的试卷设计之中,不仅极大地推动了考试形式的创新,而且对提升考试的标准化、公平性及有效性发挥了重要作用。
(三) 综合法测试阶段
在20世纪50年代末期,转换生成语法(generative grammar)的研究开始显现其学术主导地位,并且伴随着这一趋势,综合法测试的方法也逐渐成熟并被广泛采纳。这种方法通过将语法规则与数据分析相结合,为理解语言结构提供了一个更为精确和系统的视角。该方法以评估语言的心理能力为基础,强调在同一议题上对学习者语言知识与技能进行全面考察。例如,完形填空和听写等题目,旨在同时检测词汇、语法、篇章理解及拼读能力。韩宝成(2003)认为,自20世纪80年代起,我国初中阶段的英语考试经历了从定性评估向定量评估的转变,从经验性评价转向结合科学性与规范性的综合评价体系。这一过程不仅促进了考试方式和内容的规范化,而且也推动了其向统一标准的稳定发展[5]。
(四) 交际法测试阶段
在20世纪60年代和70年代期间,随着以功能主义为基础的语言学理论以及交际法的兴起,加之社会语言学的最新进展,语言测试理论遭遇了显著的挑战。这些发展逐渐将交际语言能力的构建确立为了许多第二语言学习及评估的标准。这一转变标志着语言能力研究领域向更加重视实际交际功能的方向发展。与之相比,在交际理论中,语言的交际性(如是否能够理解语言行为,语境的具体情况等)较其本身的正确性更为重要,它更注重测试任务是否符合学生的真实生活需求。尽管使用交际方法设计的试题也将语言能力分为听、说、读、写等几个方面,但是,它最根本的特征就是以任务为中心,着重于话语(discourse)这个层面,要求考生更多地关注上下文和语用特性。就拿英语科目来说,近十年来,它的题型也发生了很大的变化,“考试的侧重点逐步从基本的语言知识向语言应用能力的转变,从词汇、单句层面的题目逐步转向篇章层面的题目,越来越注重所给语言材料和被测任务的真实性,考查内容更加全面”。
3. 从语言知识的考查到对语言能力的评价
这些四个阶段的考试理论与实践的演进,不仅体现了学术界对语言的本质与功能的深入探讨和反思,也映射出对语言教学成效的持续思考与辩论。同时,它们揭示了对外语课程目标的深刻剖析和前瞻思考。改革开放后,国家经济和社会的发展对国民的外语水平提出了更高的需求,这在客观上推动了中学英语教育的快速发展,同时也引发了人们对教育评价方法的重视和反思。
本文通过对多年来英语教学大纲、课程标准及其他课程文件对评估问题的表述与解读作了文字的剖析,以下只举一些具有代表性的课程资料,来证明英语教学评估的演变是一个不断深化的、不断调整的过程。
在1986年,我国颁布了《全日制中学英语教学大纲》,并在其“教学方法”部分中首次引入了“测试方法”这一章节,从而促使英语测试领域的科学本质和研究得到了日益增加的关注。紧随其后,1992年发布的《九年义务教育全日制初级中学英语教学大纲(试用版)》进一步将“考试、考查”纳入独立章节,并分别在“教学目的”与“教学要求”章节中予以阐述。从所描述的内容分析可知,所谓“考试、考查”已不仅限于“测试”,更涵盖了“讲评”,并且强调了其在学习诊断中的功能。进入2000年,《九年义务教育全日制初级中学英语教学大纲(试用修订版)》和《全日制普通高级中学英语教学大纲(试验修订版)》将“考试、考查”转变为“教学评价”,在此基础上特别强调结合“形成性评价”与“终结性评价”的原则。这种由单纯的“考查”向“评价”学生综合语言能力的转变,标志着外语教学与教学理念上的一次重大突破[6]。尤其是在2001年及2003年推出的《全日制义务教育普通高级中学英语课程标准(实验稿)》以及《普通高级中学英语课程标准(实验)》等文件,更加注重以多元化和多样化的方式来培养学生的综合语言应用能力。
但是,通过大量的教学例子及试题分析,发现课程目标和评估意见并未充分反映。这主要是因为,在文本分析的视角下,课程标准中缺少较为“具体、具体的语言行为目标”,在设计阶段性学业测验题目时,不可避免地会受出题者的主观经历以及语言知识结构的制约,“通常并不是以大纲[课程标准]中对各种语言能力的说明为基础”。在我国的教育体系中,考试对于教育目标的影响是显著的:若不能体现课程标准的多样化与多元化评价理念,则无法在教学思想上取得实质性的进步。正如先前所述,“具体、详细的语言行为目标”构成了评估学生整体语言应用能力的关键标准。因此,这些目标使得对学生整体语言运用能力的评价得以落实,本文进一步将之概括为“能力目标”。
4. 对能力目标的理解与应用
(一) 能力目标的概念
李琳(2021)在探讨能力目标概念的界定时,首先必须明晰知识、能力与运用能力之间的内在联系。经过多年对英语教学的研究和实践,我们逐渐形成了一个共识:所谓的“知识”并非直接等同于“能力”[7]。此外,学生们所表现出的运用知识的能力存在显著差异,这一点也是我们需要关注的重要议题。这是因为尽管语音、语法、词汇和句型等知识都是在教室里进行的,但是学生的能力需要通过(一般是在教师的指导下进行的)实践活动才能实现,从而独立地掌握,并在适当的交流活动中得到体现。也只有学生所展示的能力能够被衡量与分析。因此,当前问题的核心并不是关于如何对语言知识进行分析和分类,而是由于大多数教师对于各年级所设定的知识目标都已具备充分的了解。关键问题出现在对学生应当展现的应用能力进行深入分析与分类上。在缺乏具体的评估目标的情形下,标准化教育过程难以被实现;唯有建立在标准化基础上,科学评估方可得以实施。这一点意味着教育工作者可能无法精确把握学生的语言技能水平以及他们在教学进程中所处的具体成长阶段,导致他们丧失了制定恰当教学策略的基础。因此,所谓的能力目标便涉及对学生应展现出的能力进行预先设定、深入分析以及分类处理,旨在让教师清楚地理解“学生能够达到何种水平”,让学生明晰“自己能做什么”,并且使得出题者明白“考生可以做什么”。以下是几个具体的能力目标的例子:
1) 语言表达能力(Communicative Competence)。这项能力目标关注学生在真实情境中使用语言进行有效沟通的能力。例如,学生需要能够在不同社交或专业情境下,得体地表达自己的意见、情感或要求。比如,在一场讨论中,学生不仅需要使用正确的语法和词汇,还要能够根据对话的内容和语境灵活调整语气、用词和表达方式,以确保信息的清晰传达和礼貌表达。
2) 语言理解能力(Comprehension Competence)。这一目标涉及学生能够准确理解口语和书面语材料的能力。例如,学生能够听懂复杂的演讲或阅读学术文章,并抓住其中的主要信息、细节和隐含意义。举个例子,学生能够听取关于环境问题的新闻报道,并总结出其中的关键观点和论据,或在阅读一篇科学文章时,能够区分出作者的观点与支持这些观点的证据。
3) 语言批判性思维能力(Critical Thinking Competence)。语言批判性思维能力要求学生不仅能理解语言信息,还要能够对所接收的信息进行分析、评估和批判性反思。例如,在阅读一篇议论文时,学生不仅要理解作者的论点,还要能够判断论据的合理性,识别论证中的逻辑漏洞,甚至形成自己的见解并通过论述进行回应。
(二) 能力目标的特点
刘庆思(2008)自20世纪80年代以来,我们在国际二语(双语)教学与评估方面投入了大量的时间进行深入的研究与实践。《ILR语言水平等级量表》《美国外语教学理事会语言水平指导》《欧洲语言教学与评估共同参考框架》,美国《迎接21世纪外语学习标准》《加拿大语言测试等级标准2000》,这些都是二语学习的标准[8]。在二语教学规范与评估标准中,能力目标的释义与表述方式各有不同,比如indicators, descriptors, progress indicators, performance descriptors等,其翻译方式也各不相同,有“指标”“描述符”,“进步指标”,“能力指标”等等,但它们的含义却是一样的:都是对学生的语言能力进行特定的描述。文章将各项指标进行分析,得出了以下几个明显的特征。
1) 经常运用“能……”等表述,凸显了在沟通中语言的实用性。例如:在讨论一些普遍问题时,能够进行简单而清晰的讨论,确保每个人都能理解。
2) 所使用的词汇多为肯定和肯定,如“能……”,而非“不能……”。这其实也对学生的心理产生了正面的影响。评估的起点应放在对学生的理解上,并使学生明白自己学到了什么,而不是什么没学会。以《美国外语教学理事会语言水平指导》来说,这本书对低段初级学生的阅读能力作了如下说明:有时能够识别个别单词或短语,同时有足够的情景支持。虽然这段描述可能暗示学生的阅读技能还不够成熟,但这种正面的评价实际上有助于他们对自己的学习成果有一个明确的理解。
3) 通过综合运用听、说、读和写四项语言能力,我们能够更加有机地提升语言技能。这是世界上所有语言评估的共识。语言能力是一种语言能力的表达方式,它必须通过听说读写等方式得到体现,才能被科学地衡量与分析。
4) 倾向于与已决定的主题领域或情景领域组合在一起。美国《迎接21世纪外语学习标准》将语言交流分为三个不同的情景领域,即生活领域、学校领域和工作领域,并将其进一步细分为不同的领域。这和我们国家的《英语大纲》大致相同,只是划分得比较细致,共分为24个主题领域,而每一个主题领域又包含多个次主题。
5) 努力对一种语言能力所应具备的行为特征进行综合概括描述,并在此基础上保留对其进行动态、开放的描述,使之符合评估对象的特点。美国的《迎接21世纪外语学习标准》清楚地规定,它的标准应该与各州及其地方的框架和准则相结合,以便为每个校区和学校的学生制定最佳的教学方法,并提出了合理的要求,因此,美国大多数州都根据自己的实际情况,制定了自己的外语教学规范。《欧洲语言教学与评估共同参考框架》还清楚地表明,它的架构必须是全面的、透明的和一致的,而且是开放的、有活力的和不拘泥于教条的;运用时不能机械地套用,要根据实际情况进行分析。
通过深入分析这些特点,我们能够洞察到交际语言测试理论在其中扮演的关键角色。这不仅为我们构建一个基于科学和有效性的英语教学评估体系提供了宝贵的参考,而且还启发了我们在教学实践中不断追求更高标准。《英语课程标准》将听力、口语、阅读和写作四大能力划分为基本类别,并采用“能……”等句型划分,这一点与前面所列举的各项标准类似。王丽(2022)在把课程标准转化为评价准则之后,对等级的技术要求就有了更多的细化,即要将其提炼成符合特定主题领域的、能够反映语言交流特点的正面、积极、动态开放的能力目标[9]。课程标准实际上为这种转化提供了丰富的素材,例如,在《标准》的附录中,包含了主题条目表、功能意念条目表、词汇表等,尽管受到结构主义和功能主义理论的交互影响,但是它仍然为最后的主题领域的选择以及对语言评估的科学度量提供了一个较为方便的空间。接着,在明确了能力目标后,我们必须进一步探究如何识别这些目标。换言之,关键在于确定何种标准或指标能够用来评估学生是否达到了所设定的语言能力要求。
(三) 能力目标的检测
基于“任务表现”(Task performance)的研究,在过去十多年中,国内外在第二语言(外语)领域的研究和实践中是最可能得出结论的。张华(2020)任务型测试(task-based assessment,简称“以任务为基础的语言测试”),从某种意义上讲,是对交际测试理论的一种补充。尽管学术界和教育界对“任务”尤其是任务设计的认识还存在诸多分歧,但它已逐渐成为一种发展的潮流,这一点是毋庸置疑的。在探讨基于任务的语言评估方法时,学术界存在两种对立的观点:一种是以“任务为中心”的视角(the task-centric perspective),另一种则是以“能力为中心”的视角[10]。前者主张,如Long & Norris (2000)所阐述的,任务型测试的目的在于评价应试者完成任务的表现,并据此预测应试者未来完成现实世界中任务的能力。任务型语言评估(Task-based Language Assessment)任务型语言评估是一种以实际任务为导向的测试方法,旨在通过设置真实生活中的语言情境,检测学生运用语言进行交流和解决问题的能力。例如,教师可以要求学生在模拟情境中进行一场面试,内容包括提出问题、回应以及表达自己的观点。在此过程中,评估的重点不仅是学生的词汇和语法掌握情况,还包括其语言流利度、逻辑性、适应不同交际环境的能力等。通过此类评估,能够有效检测学生在复杂情境下的综合语言运用能力,反映其应对真实语言任务的水平。
相反,后者的代表人物包括Brindley (1994)、Bachman & Palmer (1996)以及Skehan (1998),他们认为任务型测试旨在推测应试者的潜在语言能力。韩宝成对此提出批评,认为这种观点虽然直接而清晰,却显得过于极端;相比之下,后者由于拥有一个高度概括的语言能力模型及大量前期的研究,因而显得更为可接受一些。此外,在对任务完成表现的解释方面,本研究也支持“以能力为中心”的概念框架。在评价体系中,其核心目标在于检测学生是否达到了预定的能力标准,并以此为基础对学生的整体语言应用能力进行全面评估。综合性语言技能评估(Integrated Skills Assessment)综合性语言技能评估将听、说、读、写等语言技能有机结合,评估学生在处理综合语言任务中的能力。例如,教师可以设计一个阅读和写作结合的任务,要求学生先阅读一篇关于环境保护的文章,然后撰写一篇分析性报告,阐述文章中的关键观点,并结合自己的见解和背景知识进行深入探讨。在此评估过程中,学生不仅要展示对阅读材料的理解能力,还需要展示如何在写作中有效组织语言,传达信息,并进行批判性思维和分析。这种评估方法能够全面检测学生的语言理解与表达的整合能力。
5. 结语
文章列举了许多语言学习和评价准则的理论依据及实践,从中可以看出各个国家为改进英语教学所作的努力。《普通高中英语课程标准(2017年版)》提到,相对于以前的教学大纲,目前的英语课程标准在能力方面的确有了较大的提升,所以,研究和改进评价标准,是新课程实验发展的当务之急,也是真正达到课程标准所规定的课程目标的关键。然而,评价标准的建立是一个长期而复杂的过程,绝非单纯的对教材内容进行研究和发展[11]。通过对这一问题的研究,笔者期望能够在今后的研究工作中,寻找一些新的突破点,以利于对能力目标和评估之间的相互联系,并在不断的探索、实践和反思中对其进行改进。