1. 引言
近年来,数学课堂教学日益受到重视,已然成为国际教育界的研究热点与核心议题。数学这门学科的特殊性使其具有独特的魅力和挑战性,但同时也为构建数学课堂教学质量的评估框架带来了难度。因此,现有的专门针对数学专业的评估框架相对较少,本文对数学教学质量评价工具MQI的发展背景、理论基础以及MQI框架和维度进行了概述,MQI评价工具的使用和深入探究对我国数学教师课堂教学数学质量的提高具有重要意义。
2. MQI发展背景
数学教学质量评价工具(Mathematical Quality of Instruction,简称MQI)是由美国希尔(Hill)教授及其团队开发。MQI的研究和开发始于2003年,在基于大量文献和多年课堂实践研究后作为实用工具于2010年正式向社会开放。在MQI的研发中,研发者们试图超越课堂教学的形式,而只关注教学的数学质量。例如,某些课堂评价工具可能因教学中的小组合作、创造力培养或动手能力等教学形式而将相应教学排名很高。但是,对大多数数学课堂观察者来说,都会对教学中的数学的教学效果表示强烈关注,MQI就是在这一背景下旨在捕捉课堂教学中的数学内容而开发。
MQI评价工具的原始目标主要有两个,一是探寻数学教师知识和课堂教学之间的联系;二是希望能够找到捕捉教学中的数学质量的工具,以区别于教学策略。
2.1. 教师数学知识与教学数学质量关系的研究
要回答“什么是良好的数学教学?”这一问题,一种方法就是确定能够促进学生数学学习的教学是什么。对这个问题感兴趣的学者至少走了两条不同的道路。
研究人员首先探讨了,总体上看教学的哪些方面对学生的学习有贡献 [1] [2] [3] ,这导致了“通用教学因素列表”的逐渐形成。例如,使学生的学习时间最大化,将教学内容以结构化和连贯的方式呈现给学生,就学习过程和结果提问,为学生提供及时和描述性的反馈。
另一个进路则是从教师所教的学科的视角来审视教学的有效性。教师的数学知识在数学教学中起着重要的作用这种说法,最初源于研究学生、教师和学校资源对学生学习的贡献的所谓“教育生产函数文献”(Educational Production Function Literature)。早在《教育机会平等研究》开始 [4] ,不少学者都相继确认了教师知识对学生成就的独特贡献 [4] [5] [6] [7] ,同时,研究教师知识的学者也发现了教师知识对教师教学有所影响 [8] [9] [10] [11] [12] 。
20世纪70年代开始,教师教育工作者和其他学者一直在研究教师数学知识的性质和对教学以及学生成就的影响。在这项工作的早期研究中,Begle将教师的教育背景(如教师所学的课程、获得的学位或教师资格证的认证状态等)作为数学知识的参照变量,来研究教师的数学知识和学生成绩之间的关系。但是研究结果表明,教师的教育背景与学生成绩之间关系不大。虽然如此,学者们对建立教师知识与学生成绩之间的联系仍有兴趣。
受舒尔曼(Shulman, 1986年)教学知识(PCK)的启发,其它研究人员试图理解特定数学内容的教学特征,这些特征使得数学教学不同于其它学科的教学 [13] [14] [15] ,并开始思考教师对所教的内容知识的理解如何促进学生学习的问题 [16] [17] ,这种教学内容知识的新概念代表了教师知识概念的转变。教师理解如何掌握知识变得比他们掌握了多少知识更重要。在这一框架下,数学教育研究者越来越关注教师教学的数学知识。这导致了专门针对数学教学的分析框架的发展,该框架侧重于数学知识如何教的问题,例如教师在教学过程中建立精准的数学语言和严谨的表达形式之间的连接,以帮助学生更好掌握抽象的数学思想。
另外,通过访谈、测试和直接观察,学者们开始发现教师的基本数学知识存在的问题,并探索其特征 [18] [19] [20] [21] [22] 。
不过这种传统中的许多研究都是定性的,并以职前教师为主题。大部分学者专注于阐明教师数学知识的建构,而不是定量地检查教师数学知识与教学质量之间关系的强度。事实上,许多研究使用逻辑声明而不是直接观察来证明这种知识
对教学至关重要,包括Ball (1990),Ma (1999),Post等人(1991),以及Simon (1993) [17] [18] [20] [21] 。
综合来看,更强的教师知识会更有利于课堂教学和学生成就。尽管当时有这些研究结果,并且有大量基于这些研究结果的政策举措,但仍缺乏关于教师知识如何影响课堂教学和学生成绩的详细解释。
Hill教授团队正是弥补了这一教师知识对教学以及学生成就如何影响的认识缝隙。在Hill教授的团队看来,前人的研究缺乏教师数学知识如何影响教学的细节研究。于是试图定量研究教师的数学知识与教学之间的关系,并定性描述其影响因素。2008年,为了考察教学的数学质量,Hill教授团队从前人关于教师知识研究的文献的研究中获取了MQI的三个要素:(数学)错误、(数学)表达、数学解释,在此基础上添加了一个要素,即数学内容的丰富性,构成了MQI的四个维度 [23] 。
MQI是特定于数学的,是衡量数学教师在教学中数学质量的框架。它反映了学术研究者们试图衡量在以内容为中心的教学中数学质量的尝试。MQI的开发人员强调了直接检查教学的数学质量的重要性(LMT 2011)。MQI已经被用来描述教学,以更好地理解教师知识与教学实践之间的关系,并探索教学特征与学生成绩之间的关系。
2.2. 为衡量教学开发的课堂观察工具的研究
美国教育者在教室内进行教学观察以对教学各方面的频率和价值做出判断的历史悠久。课堂观察工具的目的是支持知识渊博的评估者注意到教学的相同方面,即影响学生学习数学的教学方面。Rosenshine和Furst (1986)指出,它们可以轻松找到用于测量课堂过程和现象的120种观察系统 [24] 。这些文献都将教学特点如清晰、灵活、热情以及学生思维的使用(直接或间接)与学生的成绩联系在一起。但是,这些观察工具大多集中在通用行为,而不是特定内容的行为上。
为了弥补以上研究的不足,20世纪80年代中期的研究人员将注意力转向了两个不同的领域: 教学中使用的数学知识和基于建构主义学习观的教学技巧的使用。每个研究领域都开发了相应的工具来捕捉课堂实践。
在舒尔曼及其同事提出教学需要独特的学科相关知识 [16] 之后,课堂观察很快成为探索这一思想的主要方法。研究人员通常收集数十或数百小时的课堂观察或录像带。然而,发表的研究通常只关注一小部分观察数据,通常只有几分钟的录像。分析几乎完全是定性的,研究人员使用专门针对当前数学主题和问题量身定制的方法和编码系统。这一传统研究的一个经典例子是Leinhardt和Smith (1985)对数学教学专业知识的研究 [10] 。为了探索教师行为与学科知识之间的关系,作者对八位小学教师的数学教学进行了深入研究,从他们的数学课中收集了三个月的观察现场笔记、10个小时的录像课、访谈数据以及教师在卡片分类任务中的表现。他们根据“三年的课堂讨论,并考虑他们的陈述和解释以及错误”,使用教学观察将教师的数学知识分为高、中或低。不幸的是,有关如何确定这些分类的详细信息并未在已发表的作品中进行说明。然后,作者根据访谈任务的表现检查了教师的知识,并深入考查了三位教师关于简化分数的课程。这种详细的课程分析后来成为探索教学中数学知识的支柱。
Borko等人(1992)提供了另一种观察方法来调查教师的数学知识 [8] 。在长达一个小时的复习课中,作者仅专注于几分钟的时间,其中一个学生要求老师解释分数除法的算法。该课程的录音带伴随着观察员的现场笔记,并评估该老师为标准算法提供概念解释的能力。作者指出,在实践中,这位老师对分数除法的数学知识很差。例如,在她应该使用分数的除法模型时却使用了表示乘法关系的模型,当学生要求老师解释分数除法的运算法则,即为什么可以将分数的除法运算转换为乘法运算时,老师试图用画图的方法来进行解释,但她失败了,因为这位老师使用的模型代表乘法而不是除法,而后老师回避了问题并将侧重点转向了分数除法的运算程序上。然后,作者使用访谈中的数据、在开放性的数学问题上的表现以及该老师的职前教育经历的记录来解释了她的课堂表现。
最后,Rowland及其同事的一项研究,旨在了解职前教师的数学知识在课堂实践中是如何展现的 [25] [26] 。研究人员从头开始,反复观看录像课程,培养对课堂任务的感知,在这些任务中教师的数学知识得以展现。回应学生的想法,选择表达形式和示例并建立联系,然后形成了框架的基础。作者将其命名为知识四重奏:基础知识(例如,主题知识,大量的写),转化型知识(例如,向学习者提供主题知识);联系(例如,过程和概念之间的联系)和偶然事件(例如,回应学生的想法)。该框架可用于自我评估和更正式的外部评估。
为了研究教师的数学知识,许多学者将目光投向了这些教师课堂中发生的数学活动的性质。这些学者的课堂观察为构成MQI的元素奠定了基础。并且,对于这些文献的回顾(包含在Hill等人2008中)有助于MQI概念的描述。然而,由于课堂观察这一研究领域许多工作本质上是探索性的和小规模的,因此其观察工具既不可广泛获得也不可复制。也没有任何设计来量化教师工作的数学质量。随着政策制定者对教师教育和专业发展计划的问责制越来越严格,观察工具已成为捕捉教师教学变化和增长的必要手段。许多最近开发的工具都将数学质量作为更广泛的课堂数学教学视野中的一个要素。
在有关学习者如何构建知识的新思想的刺激下,20世纪90年代的研究人员开发了观察工具,旨在捕获增强学生学习的教学实践,例如小组工作或特定的提问技术。在许多情况下,研究人员的目标和工具仅仅集中在特定的课堂活动上。在其他国家,教学目标和教学工具是通用的。
撇开仅专注于数学教学中与内容无关的教学方面的课堂观察工具,许多工具将对课堂工作的数学性质的描述与对教师教学技能和知识的估计相结合。其中最广为人知和使用的是“改革后的教学观察报告”(RTOP, Reformed Teaching Observation Protocol) [27] 与“课堂观察和分析报告”(Horizon,Inside the Classroom Observation and Analytic Protocol) [28] ,这两种课堂观察工具都要求:
1) 对准确呈现内容的程度进行评级;
2) 呈现给学生的内容在数学上是否有趣且有价值;
3) 关于教学中使用的数学元素,例如,表示、解释和抽象。
以上两种课堂观察工具都可以测量课堂教学中的数学元素。但是,两者都将课堂教学中对数学内容的评分嵌入到更大的范围内,以衡量课堂教学与美国课程标准的一致程度。这些课堂观察工具的设计是根据其教学材料来测量上述教学的数学特征以及将数学传达给学生的方式。这些工具的示例代码包括:
1) 探索并重视与其他内容学科和/或现实世界现象的联系(RTOP);
2) 学生积极参与发人深省的活动,通常涉及程序的批判性评估(RTOP);
3) 教学策略与调查性数学/科学(Horizon, Inside the Classroom Observation and Analytic Protocol);
4) 课程的气氛鼓励学生产生想法,问题,猜想和/或命题(Horizon, Inside the Classroom Observation and Analytic Protocol)。
在这些工具中,没有单独的对课堂中数学质量的衡量标准;相反,它们包括数学材料如何呈现给学生的更广泛的估计中。RTOP和Horizon课堂观察工具还设计用于对科学和数学两种课程的评级,这限制了他们测量特定数学实践的特殊性。
通过以上对文献及观察工具的回顾,可以看到并没有针对课堂教学中数学质量的正式观察措施。“教学的数学质量”仅指学生在教学过程中有用的数学内容的性质。而不是对教学策略或者教学风格的关注。以上没有提到的其他课堂观察工具侧重于教学的指导方面,如与学生的对话模式或提问策略,并且仅将学生可用的数学作为更一般的教学方法的一部分 [29] [30] [31] 。
然而,Hill教授等人认为,教学中数学质量已成为考察教师课堂工作的越来越重要的镜头,因为它是学生学习的关键因素。无论教师的教学方式是怎样的,当其数学解释混乱或数学思想扭曲时,学生的学习都会受到影响。尽管美国目前的改革努力倾向于将高质量的数学与特定的教学实践混为一谈,但Hill教授的团队认为这是两个互相独立的结构,它们对学生成绩的影响可能是截然不同的。一堂数学课,让学生积极参与小组合作,使用动手材料,但数学内容很少,可能对提高学生的数学理解没有多大作用。相反,一节更具有教学性的数学课,教师在教室的前面与学生交谈,学生一个接一个地回答问题,教师能够准确描述数学思想,并且学生具有参与复杂和具有挑战性的数学思想的大量机会,这可能会促进学生的理解 [32] 。
如果教育工作者能够描述和衡量教学中的数学质量,他们将更好地改善教学。这并不意味着课堂气氛、师生互动或教学方式不重要,这些都是帮助学生学习的教学特征,应该加以研究。然而教学中数学质量领域的研究缺乏一定的关注度,Hill教授等人对教学中数学质量的研究与开发是对这一空白的填补。
3. MQI的理论基础与研究方法
3.1. 理论基础
MQI这一评价工具最初是为“学习数学教学”项目而设计,同时还开发了概念化和验证教学的数学知识(MKT)的工具 [33] 。研究最初设想探寻优秀数学教师需具备的素养,后来演化为建构MQI评估系统。MKT指的是教学工作中特别需要的数学知识。根据当时MKT研究的观点,MQI旨在关注课程的数学特定组成部分,并且不衡量特定的教学方法。换句话说,作者声称,无论教学方法如何,都可以关注教学情节的数学质量。这种方向反映在MQI工具所关注的点上,它关注的是教学中特定的数学内容,而不是教学中采用什么教学方式进行教学。
支持MQI设计研发的第二个关键结构是教学三角形 [34] ,其中教学被概念化为教师、学生和内容之间的互动。鉴于这种更全面的教学观点,该工具根据教师的言行、学生的言行和课程的内容来衡量数学质量。
3.2. 研究方法
研究方法有采样和数据收集、课程录像、纸笔测试、课后访谈。Hill教授团队的研究方法是不同寻常的,体现了MQI研究的双重重点:发展关于课题教学的关键数学特征的理论,并发展(和验证)记录这些特征存在或不存在的工具。MQI研究的目的是测量学生在学习过程中可用的数学内容的性质。
教学的数学质量(MQI)是对课堂教学过程中存在的数学的严谨性和丰富性的多维评估。MQI研究采用制作课堂教学录像,供后续描述和编码,而不是开发一种观察工具应用于现场教学。事实上,由于课堂教学的许多数学实质性要素是连续快速发生的,因此在课堂中是难以及时进行可靠地分解和分析。同样,在不知道这些活动结果的情况下,也很难通过事前教学设计来判断课堂活动的数学性质。
MQI必须应用于录像带的教学情节而不是现场课堂观察。事实证明,研究人员需要观察每盘磁带至少两次,某些地方,在编码之前要多次观察,从而收集视频记录的意义得到了证实。
为了建立一个来描述教学课程数学质量的框架,Hill教授的团队从三个方面着手:教学经验和研究教学的师资培训、录像带本身以及现有的研究数学知识教学的文献。最初的编码方案是通过综合有关数学课堂教学的文献和分析250多份来自2年级至6年级教室的课程记录而制定和完善的。编码的目的是为了捕捉损害课程的数学完整性的因素(例如,存在错误或不精确的语言),以及支持学生学习的教学方面(例如,使用多种表现形式,并重点解释为什么会有效果)。同时将代码开发作为一个迭代过程,首先对数学质量变量进行广泛的区分,再对照录像进行精细的观察,同时从相关文献中引入观察点,然后回到广泛的区分,重新开始循环。在完成编码之后,对工具的性能进行分析,从而能够重新审视测量以及它们是如何组织的。这再次导致对大类的修订。这项研究是扎根理论的一个变体 [35] ,它使用了原始材料,认识到MQI研究的历史和观察教学的镜头,但也使用了现有数学课堂文献中的关键见解。Hill教授团队花了将近两年的时间看录像带,回顾文献,磨练定义。在发展更广泛的框架时,Hill教授的团队尝试了记录教学的数学特征的方法。例如,一开始是在比较长的时间内(10或15分钟)进行编码;但是,在10或15分钟的时间跨度内,发生的大量数学事件并不能得到充分地描述,因此希尔教授的团队决定以5分钟为间隔进行编码。此外,在最初关于特定数学特征是“存在”还是“不存在”的讨论中,团队发现这两个状态并不能完全反映所看到的。例如,有时一个指示的要素是“不存在的”但这样做是恰当的;在其它情况下,教学质量会因要素的遗漏(不存在)而受损,所以Hill教授的团队增加了一种方式来讨论特定数学事件或遗漏的“适当性”或“不适当性”。例如,当一个数学元素被准确而完整地制定出来(完整性是必要的,如数学解释),它就被标记为既存在又适当。当一个数学元素由于错误、未完成或其他障碍而严重失真时,它被标记为存在但不适当。从而导致编码系统具有对应于以下表格中的四个选项,见表1所示。
在整个代码开发过程中,以及在实际编码过程中,Hill教授及其团队有意对教师在纸笔测试中的得分“视而不见”。虽然MQI研究借鉴了这些教师的一小部分经验教训来制定MQI的框架和设计MQI测验工具,但是不希望这些教师在纸笔测试中的表现影响团队的编码方案或对教师工作的评估。
MQI测评于2014年2月进行了修订,根据验证研究的反馈完善了代码,并更明确地与《州共同数学核心标准》(CCSSM)中的数学过程标准保持一致。
4. MQI的框架与维度解析
MQI的目标是测量学生在学习过程中可用的数学内容的质量。目前,MQI框架围绕教学的五个方面来组织:课堂活动与数学的联系、数学的丰富性、应对学生及其数学问题、错误和不精确以及与共同核心标准一致的学生实践(见表2)。研究人员可以决定使用部分或全部的MQI维度。

Table 2. MQI framework dimensions
表2. MQI的框架维度
“数学的丰富性”方面的6个分量反映了教师和学生在多大程度上1) 明确地将数学思想或程序的表述联系起来;2) 提供数学知识着重于为什么而不是如何的语法解释;3) 关注数字关系的意义和操作;4) 讨论多种程序或解决方法;5) 在研究实例或例子的基础上进行数学概括;以及6) 流畅地使用数学语言。
“应对学生及其数学问题”这一维度反映了教师是否能够理解和回应学生提出的数学观点,并适当地纠正学生的错误。
“错误和不精确”的维度更严格地关注教师对正确、清晰和精确的数学语言和符号的使用。
最后一个维度,即“与共同核心相一致的学生实践”,包含了以前版本中的 “学生参与意义形成和推理”的内容,以及其他子量表,以表示学生在背景任务中的工作程度和关于数学的交流。作为一个整体,这个维度的子量表衡量了学生参与意义建构的情况,具体表现为学生解释的质量;证据学生质疑、猜想和归纳数学思想的能力以及任务执行过程中的认知需求。
录像课被分成5~7.5分钟的等距时间段,每段都按照5个维度进行编码。第一个维度“课堂活动与数学是否相关”,根据是否有至少50%的课堂时间(总时长至少是1小时)被编码为“是”或“否”。在7.5分钟的片段中,有3.75分钟与数学有关,而不是管理或其他活动。对于剩下的四个维度,评分者对每个视频片段进行记录,并在观看完整个视频后用这些记录对一些子量表和维度进行评分。子量表和整体维度的评分有不存在、低、中、高四个层次。
MQI开发团队为了让更多人掌握其测评工具,开展了基于视频的在线培训。培训模块包括对代码和评分标准的详细描述,以及展示不同评分点的视频和实践测试。通过这些模块的工作后,个人可以通过达到与主编码的既定百分比的一致而成为MQI认证编码员。一旦个人完成培训并获得认证,就可以获得整个MQI协议。
为了得到可靠的数学质量指标,开发者建议至少由两名编码者对3节课进行独立评分。正如Hill,Charalambous和Kraft (2012)所描述的,当三个观察点(每位教师)由两个认证人打分时,整体维度的内部一致性可靠性大大增加。与仅有一名认证编码员相比,认证编码员的内部一致性可靠度有所提高。当四个观察点由两个认证编码员打分时,内部一致性可靠性继续增加,但只是略有增加 [36] 。例如,数学的丰富性从0.77增加到0.80,误差和不精确性从0.71增加到0.75。
通过对五个维度的得分进行平均,可以得到一个课程综合得分,一个教师的得分由四节课的综合得分汇总而成。在教师层面上,选择报告课程的综合得分、每个维度的总分,还是单个分量表的得分,取决于研究问题的目的。一般来说,五个维度中的每个维度的总分都会被报告。然而,在报告中,我们可以看到一个维度内的每一个子量表都可以用来直接向教师提供形成性反馈,或者汇总起来作为专业发展的参考。在多次观察过程中,来自多名教师的分数也会被汇总,以便在地区提供反馈水平。这样的数据可以显示不同教师或学校的趋势,用于项目评估(例如,衡量专业发展或课程变化的影响)。
MQI是美国“数学测量项目”中使用的五个课堂评估量表之一。有效教学(MET)项目初步研究结果表明,该工具确实测量了不同于非学科观察工具(即课堂评估评分系统CLASS或教学框架FFT)中评估的教学质量 [36] 。本项目中的具体研究也揭示了MQI与教学的强弱相关的方面。对MQI进行规模化使用,在地区或学校层面上的教学研究,或对学生成绩影响最大的数学教学内容,可以提供一个关于当前数学的愿景。对于5个维度的得分比较表明,作为MET项目的一部分,大多数数学课都是围绕主题的,而且相对来说没有错误。然而,这些课程不一定有丰富的教学内容,而且学生很少有机会参与感性认知活动。
MQI适用于评价学生在各种教学方法中学习数学的机会,而不考虑是否有改革导向的教学实践的期望。MQI的开发者指定其用于K-9年级,这可能是因为其对数学内容的关注和对评分者的要求。MQI的理想背景包括专业发展计划或课程实施、初中或小学的数学教师职前教育计划,或对数学教学的大规模评估,重点是教学过程中的数学质量。适合于MQI的问题包括:“教师的数学知识与数学教学的数学质量之间的关系是什么?”或“教学的数学质量与学生的数学成绩有什么关系?”
5. 结语
教学评价在我国广泛存在,从基础教育到高等教育,从职前到职后;更由于评价的目的、评价单位,甚至评价者的差异,评价量表种类繁多;评价指标、赋分多寡大凡也各不相同。而令人称奇的是,使用者往往在需要时总是有量表可用,也令人好奇这些被分发到手的量表来自于哪里,出自谁手,是如何研制出来的?事实上,我国有关教学评价的文献众多,但大凡理论研究深度不够,更多囿于一般教学理论,少有区分不同评价量表的理论基础与视角是什么,在研究方法上主要依赖于思辨,在指标设定及权重上往往随意轻率,在使用上都是即时的课堂观察,很少有适合于事后的评价,在测量数据的采集上凭感觉,相对而言不严谨,因而严肃的评价也就浮于表面。所以对于具体学科教学评价而言,虽然可以使用的量表很多,但往往没有凸显学科特征,评价的结果的精准性欠佳,难以给教师教学的改进提供针对性建议。
另外,MQI在我国已有所介绍,但都聚焦于对这一课堂教学评价工具的框架的介绍,为更好地使我国相关研究者和使用者了解借鉴这一评价量表,本文对有关教学评价的整体背景,以及MQI研究的理论基础、方法、维度、过程进行了细化说明,给出了从理论到评价量表的整个逻辑链条。同时,为强调MQI的学科属性和其侧重点,在MQI的翻译上,这里将其翻译为“数学教学中数学质量评价工具”,而不是翻译为“数学教学质量评估系统”,或者“数学教学评价工具(系统)”。
最后,从经验我们知道,教师对学生学习有重要影响,对大部分学生来说甚至有决定性的影响,但同时我们也清楚,教师与学生成绩之间在未有条件保障的情况下并没有必然关系,比如存在教师知识丰富、教学能力强然而学生成绩差。所以,在教学评价研究的推进中,需要更多地关注教师的知识类型是如何对教学产生影响,以及如何对学生成绩产生影响的。