1. 引言
传统的教育测评中,人们往往认为学生的分数越高,学生对测试内容的掌握越好,分数相同的学生具有等同的能力水平。然而,教育实践表明,即使获得相同分数的学生,其内在的认知结构和知识掌握状况可能存在显著差异。《普通高中数学课程标准(2017年版2020年修订)》指出“只关注学生学习结果是不够的,更重要的是我们要了解学生如何学习,所以要建立多目标、多方式、过程性的评价体系”[1]。2020年习总书记在《深化新时代教育评价改革总体方案中》提出“要扭转不科学的教育评价导向,坚决克服唯分数、唯升学的顽瘴痼疾,提高教育治理能力和水平”。认知诊断理论[2]作为新兴的智能测评理论,融合了认知心理学、现代测量学、计算机科学等学科知识,能够精准分析学生的知识掌握状态和认知特点。相比传统分数评价,认知诊断评估通过诊断学生的认知结构和思维过程,为个性化教学提供科学依据,已成为教育评价改革的重要技术手段。
目前在教育测量评估中较为常用的认知诊断模型是DINA (Deterministic Input, Noisy And Gate)模型和G-DINA (Generalized DINA)模型。DINA模型仅包含“失误参数”和“猜测参数”,具有参数少、解释性强的优势,受到很多学者的关注,被应用于多种学科的教学评价中,见[3]-[6]。但DINA模型常用于处理属性间相互独立的情形,对认知属性间交互作用较为复杂时常采用G-DINA模型。G-DINA模型拥有更灵活的框架,允许属性间的协同效应,可以处理更加一般化的属性机制,在加设约束条件的情况可转化为DINA模型[7]。秦海江与其合作者将G-DINA模型应用于探索高中平面向量的认知诊断中,见文[7]。王强等则是将G-DINA模型应用于高中数学学习的个性化追踪研究中[8]。
在高中数学课程中,指数函数是高中数学的基础内容,是丰富学生数形结合的解题方法,锻炼学生计算能力,培养逻辑思维和推理能力的关键部分,更是高考的一大重点。关于指数函数的研究多聚焦于教学方法,高考试题的分析等方面。随着认知诊断理论的发展,也有学者将认知诊断理论应用于指数函数的教学评价中,如文献[4]。它主要应用的是DINA模型,针对广州某高中学生进行诊断测评,同时也给出了一些教学补救建议。但数学知识点的各属性间关系都不是相互独立的。对指数函数的认知属性的划分也存在着不同的方式,并且每种属性之间也会相互影响。为更清晰地了解学生的潜在认知结构,本文则是以河南省商丘市某高中高一学生的指数函数测评为例,采用G-DINA模型应用于教育评价,借助认知诊断数据分析平台(flexCDMs)进行认知诊断分析,结合分析结果给出补救策略。希望将这种认知诊断评价方法应用于平时的数学教学中,不断改进教学策略,提高教育教学水平。
2. 研究设计
2.1. 确定认知属性与层级关系
划分认知属性是进行认知诊断的关键环节之一,本研究采用多源证据进行交叉验证。针对高一指数函数教学内容,首先参考高中数学课程标准与教材初步构建属性列表,进而通过学生访谈和教师研讨进行两方面的实证分析。通过对学生进行认知访谈,调研学生对学习指数函数内容时的认知过程,了解学生在解决指数函数问题时的内在心理过程,掌握常见的错误模式。在此基础上,与多位一线数学教师开展深度研讨,从教学经验层面验证所构建的属性的必要性与合理性。最后,为进一步提升其权威性,聘请学科专家评审,根据专家在学科内容和认知逻辑方面的建议进行优化,最终确定认知属性包括指数运算,指数函数的概念,图像和性质,及两个类型的应用,详见表1。
根据认知属性的划分,列出相应的可达矩阵,如果认知属性间存在直接关系、自身关系和间接关系中的任意一种,则在可达矩阵中用“1”表示,否则用“0”表示[2],见表2。
Table 1. Attributes classification of exponential function
表1. 指数函数的属性划分
序号 |
属性 |
具体含义 |
A1 |
指数的运算 |
能够比较熟练运用指数运算的法则 |
A2 |
指数函数的概念 |
理解指数函数的定义和形式 |
A3 |
指数函数的图像与性质 |
掌握指数函数的图像的特征和单调性等 |
A4 |
指数函数方程及不等式 |
根据指数运算法则和指数函数性质,能够较为熟练求解含指数函数的方程及不等式 |
A5 |
指数函数模型的应用 |
能够相对熟练应用指数函数模型解决实际问题 |
Table 2. Reachability matrix for cognitive attributes of exponential functions
表2. 指数函数的认知属性可达矩阵
|
A1 |
A2 |
A3 |
A4 |
A5 |
A1 |
1 |
1 |
1 |
1 |
1 |
A2 |
0 |
1 |
1 |
1 |
1 |
A3 |
0 |
0 |
1 |
0 |
1 |
A4 |
0 |
0 |
0 |
1 |
0 |
A5 |
0 |
0 |
0 |
0 |
1 |
基于以上5种认知属性的划分,学生对指数函数的所有属性掌握的可能模式共
种。通常,我们认为学生掌握了指数的图像和性质,则应该已经掌握了指数的运算,即掌握属性A3一般都掌握了A1和A2。类似分析可知,理想测试掌握模式共8种,见表3。
Table 3. Students’ ideal mastery profiles
表3. 学生的理想测量掌握模式
|
A1 |
A2 |
A3 |
A4 |
A5 |
1 |
1 |
0 |
0 |
0 |
0 |
2 |
1 |
1 |
0 |
0 |
0 |
3 |
1 |
1 |
1 |
0 |
0 |
4 |
1 |
1 |
0 |
1 |
0 |
5 |
1 |
1 |
1 |
1 |
0 |
6 |
1 |
1 |
1 |
0 |
1 |
7 |
1 |
1 |
0 |
0 |
1 |
8 |
1 |
1 |
1 |
1 |
1 |
2.2. 编制认知诊断测验
指数函数的测试题选自2025数学A版“5年高考3年模拟”指数函数部分练习题,经3名一线教师和2名学科专家研讨,编制诊断评估测试题为10个选择题,共50分。为确保认知诊断的有效性,每个题目包含至少1个认知属性,并且总测试题所呈现每种认知属性不少于3次。在完成测试题的初步编制后,组织学科专家和教育测量专家进行独立评审,对每道题目所考查的认知属性进行独立评定,以构建初始的Q矩阵。经计算,评定者间的一致性信度(Percentage Agreement)达到90%,表明专家意见一致。最终确定测试题目与认知属性对应关系,即为测试题Q矩阵,见表4。
Table 4. Q-matrix of the test items
表4. 测试题的Q矩阵
|
A1 |
A2 |
A3 |
A4 |
A5 |
T1 |
1 |
0 |
0 |
0 |
0 |
T2 |
1 |
1 |
0 |
0 |
0 |
T3 |
1 |
1 |
1 |
0 |
0 |
T4 |
1 |
1 |
0 |
1 |
0 |
T5 |
1 |
1 |
0 |
0 |
1 |
T6 |
1 |
0 |
0 |
1 |
0 |
T7 |
1 |
1 |
1 |
1 |
0 |
T8 |
1 |
1 |
1 |
0 |
1 |
T9 |
1 |
1 |
1 |
1 |
0 |
T10 |
1 |
1 |
1 |
1 |
1 |
通过分层抽样方法,选取商丘某高中一年级2个重点班,2个普通班共225名学生作为测试评估对象。从前期入学时中考的数学成绩及单元测试中发现,这些学生中,占年级前30%的约70人,后30%的约40人,中间水平的约110人。这说明选取的评估对象具有代表性。在学生完成指数函数章节内容学习后,以周测的形式,要求学生30分钟内完成测试。此次测试,共发放试卷225份,收回有效试卷225份。试卷评定后,利用EXCEL统计学生各小题得分与总分,同时将测试结果利用二元记分法对作答数据进行编码,答对记为1,答错记为0,以题目为行,学生为列得到作答数据矩阵。
2.3. 认知诊断评估方法
在本次教学测评中,由于指数运算、图像分析及应用问题涉及多个属性的交互,G-DINA模型更符合实际认知过程,故针对本次测试评估采用该模型。其数学表达式[7]为
其中
表示被试
答对题目
,否则为0;
表示被试
的认知属性掌握向量,
表示被试
掌握第k个属性,值为0表示未掌握。
指的是第
题目考查的属性数量;
为题目
的截距项参数;
为题目
中属性k的主效应;
表示题目
中属性
与属性
的交互作用,模型参数估计采用边际似然的最大期望化算法[9]。
3. 认知诊断评估结果
为验证测验题与测试质量,利用测试结果首先进行难度、区分度、信度、HCI等分析。测试题的难度分析使用公式为
,(
表示测试者在某题目的平均分,
为该题目的满分)得到测试题难度在0.2到0.8之间,见表4,说明试题难度合适。将测试数据矩阵和指数函数的Q矩阵上传认知诊断分析平台(flexCDMs)进行数据分析,得出各测试题的区分度(表5)和层级一致性指标HCI值为0.6695,说明拟合良好。
Table 5. Test difficulty and discrimination
表5. 测验难度与区分度
|
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
整体 |
难度 |
0.96 |
0.84 |
0.74 |
0.48 |
0.74 |
0.56 |
0.49 |
0.53 |
0.34 |
0.51 |
0.62 |
区分度 |
0.31 |
0.43 |
0.49 |
0.73 |
0.60 |
0.65 |
0.67 |
0.59 |
0.45 |
0.62 |
0.55 |
在认知诊断数据分析平台(flexCDMs),选择二级评分CDMs,上传测试数据矩阵和Q矩阵,采用G-DINA模型估计得到的学生属性掌握概率和模式反应概率。下面分别从群体和个体两方面展示认知诊断评估结果。
3.1. 群体的诊断报告
基于G-DINA模型,对两个不同班型的学生的作答情况进行认知诊断分析,可以得到每位被试对各个认知属性的掌握概率,从平台导出数据利用EXCEL计算可得群体的认知属性掌握概率,如下表6。
根据认知属性的分析结果,整体上大部分同学在刚学完指数函数的教学内容时,对各属性的掌握情况良好,重点班与普通班在各属性的掌握上存在较为明显的差异,尤其是关于属性A4和A5。重点班在A1和A3上的表现较好,掌握的概率超过了0.7,表示大部分同学都能较好的掌握指数的运算及指数函数的图像和性质。但在属性A5上表现较弱,仅为0.3673,说明重点班学生对指数函数模型的深入应用能力有待提升。普通班整体在属性A4和A5上表现显著不足,均低于0.5。两个类型班级的共同薄弱点是A5,表明学生在将指数函数知识迁移到实际问题时存在较大困难。
此外,基于G-DINA模型的模式反应概率认知诊断分析结果显示93.5%的学生划分到8种认知状态中(见表7),这也反映了采用该模型进行诊断分析的合理性。
Table 6. Attribute mastery
表6. 属性掌握情况
属性 |
重点班 |
普通班 |
平均 |
A1 |
0.8213 |
0.6837 |
0.7525 |
A2 |
0.6373 |
0.5366 |
0.5870 |
A3 |
0.7421 |
0.6242 |
0.6832 |
A4 |
0.5565 |
0.3756 |
0.4661 |
A5 |
0.3673 |
0.3262 |
0.3468 |
Table 7. Predominant cognitive states among students
表7. 大部分学生的认知状态
|
认知状态 |
百分比 |
1 |
10000 |
5.31% |
2 |
11000 |
3.82% |
3 |
11100 |
12.81% |
4 |
11010 |
8.36% |
5 |
11110 |
25.35% |
6 |
11101 |
21.62% |
7 |
11001 |
2.38% |
8 |
11111 |
12.82% |
总计 |
|
93.5% |
3.2. 个体的诊断反馈
学生的个体评价能够清晰地反馈出个体差异,这对学生个性化教学有很大的参考价值。通过认知诊断分析可以得到每一位学生详细认知属性掌握情况,表8展示的是部分学生的卷面总数、认知状态、以及属性掌握概率。
Table 8. The diagnostic feedback of some students
表8. 部分学生的诊断反馈
学生编号 |
总分 |
认知状态 |
A1 |
A2 |
A3 |
A4 |
A5 |
ID4 |
45 |
11110 |
1 |
1 |
0.9986 |
0.9653 |
0.4535 |
ID5 |
45 |
11101 |
1 |
0.9976 |
0.9765 |
0.0876 |
0.8986 |
ID6 |
40 |
11110 |
0.8737 |
0.8737 |
0.9992 |
0.9576 |
0.3815 |
ID135 |
25 |
01010 |
0.1972 |
1 |
0.9568 |
0.4972 |
0.2925 |
… |
… |
|
… |
… |
… |
… |
… |
从上表可以看出,学生ID4和ID5的总分是一样的,但两个人的认知状态是不一样的。学生ID4虽然对属性A1、A2、A3、A4掌握都很好,但对属性A5的掌握概率相对较低,仅为0.4535,说明该生对指数函数模型的应用能力有待加强。而ID5在属性4的掌握情况较差外,其它属性掌握都很好,说明该生指数函数部分的知识掌握较好,但与其方程,不等式融合应用能力较差,整体的计算能力有待提升。学生ID4和ID6的认知状态一致,仅在属性A5掌握有差异,在总分上也表现出了差异。而学生ID135的诊断反馈,该生仅对A2与A3有较好的掌握,说明学生能基本掌握指数函数的基本知识,但运算能力,综合应用能力较差,需要加强巩固练习。
4. 补救策略
通过对学生的认知诊断分析,更清晰地了解到学生的整体优势和不足,及个体的认知状态,提出以下教学补救策略。
4.1. 采用分层教学
针对普通班,应该多强化基础训练,如通过练习题反复讲解指数运算和图像性质,提升学生A1~A3基础属性的掌握;重点班则深化A4~A5的应用能力,设计实际情境问题如人口增长、复利计算等引导学生分析。采用“问题链”形式,从简单方程逐步过渡到复杂模型,辅以小组合作探究,提升解决实际问题的信心。
4.2. 深化思维导图
为解决学生个体知识能力的提升,教师可引导学生深化思维导图的运用,将零散的知识系统化形成完整的知识网络。然后让学生定期回顾自己制作的思维导图,并且在学习指数函数的综合应用后,将相关的解题方法和二级结论、自己刷题总结的解题技巧添加到思维导图中,使思维导图成为一个不断生长和丰富的知识体系,进一步巩固对指数函数知识的整体把握,提高知识的综合应用能力。
4.3. 加强错题管理
教师可指导学生建立错题本,对计算错误进行分类整理,并用不同颜色标记错误类型如概念性错误、步骤疏漏、笔下误等,以便针对性强化训练。同时,教师需强调解题过程的规范性,要求学生分步书写计算步骤并养成即时检验的习惯,减少因粗心导致的失误。此外,定期组织错题复盘活动,通过同类变式题的专项训练,帮助学生巩固薄弱点,逐步提升计算准确性和综合应用能力,以提升属性A4和A5的掌握能力。
5. 小结
基于认知诊断G-DINA模型编制了一份高中指数函数的诊断测验,诊断分析表明该测验具有良好的区分度且难度适中,构建的属性层级关系和测试Q矩阵合理,可用于对高一学生关于指数知识的各属性的掌握情况进行探究与诊断分析。诊断分析结果可以分别提供详细的针对群体与个体的反馈,可以用于针对学生的认知结构进行相应的补救教学或教学指导。为同类学校提供了一套可行的数学教学评价的参考方案,为优化教学方法,更好地进行教学改革提供科学支持。
基金项目
河南省教育科学规划2025年度一般课题项目:课程思政视域下中学数学教学现状与对策研究(2025YB0188);商丘师范学院高等教育教学改革研究与实践项目,《概率论》课程思政教学改革的实践与探索(2024XJGLX0065)。