摘要: 目的:验证高频小测验对预防医学专业《营养与食品卫生学》课程平时成绩、期末成绩及总评成绩的影响,为医学课程考核改革提供实证依据。方法:选取某医学类大学预防医学专业2019级(传统教学组)和2020级(小测验干预组)学生为研究对象,在保持教学内容与课时不变的前提下,2020级通过在线考试系统增设高频小测验(占平时成绩60%)。收集两组学生平时成绩、期末成绩及总评成绩,采用SPSS 26.0进行独立样本T检验等分析。结果:干预组平时成绩和期末成绩均显著高于传统组(P < 0.001),效应量分别为1.14和1.11,达到大效应水平;总评成绩虽干预组高于传统组,但差异未达统计学显著水平(P = 0.106),效应量较小(d = 0.28)。结论:在《营养与食品卫生学》课程中实施高频小测验,可显著提升学生平时成绩与期末笔试成绩,体现形成性评价在知识巩固与应试能力培养中的积极作用,但总评成绩差异不显著,后续研究需优化考核权重设计,扩大样本量,探索小测验频率、难度及成绩反馈机制的影响,推动医学教育向“过程–结果双驱动”转型。
Abstract: Objective: Verify the impact of high-frequency quizzes on the regular grades, final grades, and overall evaluation scores of the course “Nutrition and Food Hygiene” in the field of preventive medicine, and provide empirical evidence for the reform of medical course assessment. Method: Students majoring in preventive medicine from a certain medical university in 2019 (traditional teaching group) and 2020 (small test intervention group) were selected as the research subjects. On the premise of maintaining the same teaching content and class hours, high-frequency small tests (accounting for 60% of their usual grades) were added through an online examination system in 2020. Collect the daily grades, final grades, and overall evaluation scores of two groups of students, and conduct independent sample t-test and other analysis using SPSS 26.0. Result: The intervention group had significantly higher daily and final grades than the traditional group (P < 0.001), with effect sizes of 1.14 and 1.11, respectively, reaching a large effect level; Although the overall evaluation score of the intervention group was higher than that of the traditional group, the difference did not reach a statistically significant level (P = 0.106), and the effect size was relatively small (d = 0.28). Conclusion: Implementing high-frequency quizzes in the course of “Nutrition and Food Hygiene” can significantly improve students’ daily grades and final written test scores, reflecting the positive role of formative evaluation in knowledge consolidation and test taking ability cultivation. However, the difference in overall evaluation scores is not significant. Subsequent research needs to optimize the design of assessment weights, expand the sample size, explore the influence of quiz frequency, difficulty, and score feedback mechanism, and promote the transformation of medical education towards “process-result dual drive”.
1. 引言
在当今时代,高等教育的变革正以前所未有的速度和深度展开。随着数字技术的迅猛发展,其已成为国际竞争、社会进步、经济发展的新动能,深刻影响着教育领域和技术产业格局[1]。高等教育的数字化转型与信息化建设成为必然趋势,这不仅是实现教育现代化的重要推动力量,也是提升人才培养质量、加快实现人才强国战略的关键举措[2]。我国十分重视教育信息化建设,高等教育信息化作为其中的重要组成部分,是教育信息化出经验、出典型、出成果的重要领域[3]。近年来,一系列高等教育信息化政策《教育信息化2.0行动计划》和《中国教育现代化2035》明确提出,需构建智能化教育环境[4],提倡以在线学习等形式精准推送定制化教育服务,构建全民参与、内外结合的优质数字资源共享机制与公共服务体系[5]。这有助于打破传统考试评价的时空限制[6],使学生能够更加便捷地获取学习资源,有力地推动了高等教育的变革与发展,也为考试评价体系的革新创造了良好的条件。
在此背景下,高校广泛引入在线考试系统,如“考试星”等平台支持10万人同时在线考试,并整合人脸识别[7]、AI阅卷等技术,覆盖从题库管理到成绩分析的全链条需求[8]。传统考试模式存在出卷耗时长、阅卷效率低、防作弊能力弱等问题[9],而在线考试系统通过无纸化流程、智能组卷、实时监控与数据分析等功能,实现了考试效率与公平性的双重提升[10]。随着教育数字化转型加速,在线考试系统在高等教育中的应用呈现技术赋能与评价范式革新的双重趋势。从技术层面,AI驱动的智能测评工具不断突破传统考核局限:基于自然语言处理的主观题自动评分系统在医学案例分析题中的评分一致性已达89% [11],结合眼动追踪的认知诊断功能可精准定位学生知识薄弱点[12]。在应用模式上,系统从单一的终结性考试工具转变为形成性评价核心载体,支持“教–学–测”一体化设计。实证研究显示,高频小测验通过“间隔效应”和“提取练习效应”显著提升知识保持率,每周2次的小测验可使期末考试成绩提高12%~15% [13]。然而,现有研究在医学专业课程中的应用仍存在瓶颈:一是缺乏对“理论–实践”双维度考核的适配性探索,二是过程性评价与终结性评价的权重联动机制尚不明确,三是对成绩影响的异质性效应(如不同考核形式的交互作用)尚未充分揭示。
《营养与食品卫生学》作为预防医学核心课程,其知识体系兼具理论抽象性与实践应用性,传统“重期末、轻过程”的考核模式易导致学生知识碎片化掌握与实践能力脱节。2020级教学改革中,研究团队在保持教学内容与课时不变的前提下,通过在线考试系统在理论课与实验课中增设高频小测验(每2课时1次,覆盖概念辨析、案例分析、操作流程模拟等题型),构建“即时反馈–持续改进”的形成性评价闭环。本研究旨在通过对比两届学生的成绩数据,验证高频小测验对平时成绩、期末成绩及总评成绩的影响,为医学课程考核改革提供实证依据。
2. 研究方法
2.1. 研究对象
选取某医学类大学预防医学专业2019级(传统教学组)和2020级(小测验干预组)学生为研究对象。两届学生均由同一教师团队授课,教学大纲、教材及期末试卷难度一致,差异在于2020级增设高频小测验(占平时成绩60%)。剔除休学、转专业学生后,最终纳入有效样本159人(2019级52人,2020级107人)。
2.2. 干预设计与考核体系
传统教学组采用“平时作业 + 课堂表现”的传统考核模式(平时成绩占30%,期末笔试占70%);干预组在理论课与实验课中嵌入12次在线小测验(每次10~15分钟),平时成绩由小测验(60%)、作业(20%)、课堂表现(20%)组成。小测验通过Blackboard平台实施,具备自动判分、错题解析及进度追踪功能,错误题目实时推送至个人学习空间。
2.3. 数据收集与分析
收集两届学生的平时成绩、期末成绩(满分100分)及总评成绩(平时成绩 × 30% + 期末成绩 × 70%)。采用SPSS 26.0进行独立样本T检验,通过Levene检验评估方差齐性,根据结果选择等方差或异方差模型,效应量计算采用Cohen’s d (合并标准差法)。
3. 结果
3.1. 组间成绩对比
如表1所示,干预组的平时成绩和期末成绩均显著高于传统组(P < 0.001),平均差值分别为6.53分(90.92 ± 5.61 vs. 84.39 ± 6.24)和7.83分(88.39 ± 7.41 vs. 80.56 ± 6.87),效应量分别为1.14 (大效应)和1.11 (大效应)。总评成绩虽呈现干预组高于传统组的趋势(86.39 ± 5.89 vs. 84.81 ± 5.53),但差异未达统计学显著水平(P = 0.11)。
Table 1. Comparison of course grades between two classes of students (±SD)
表1. 两届学生课程成绩比较(±SD)
指标 |
2019级(n = 52) |
2020级(n = 107) |
T值 |
P值 |
Cohen’sd |
平时成绩 |
84.39 ± 6.24 |
90.92 ± 5.61 |
6.396 |
<0.001 |
1.14 |
期末成绩 |
80.56 ± 6.87 |
88.39 ± 7.41 |
6.398 |
<0.001 |
1.11 |
总评成绩 |
84.81 ± 5.53 |
86.39 ± 5.89 |
1.624 |
0.106 |
0.28 |
3.2. 方差齐性与效应分析
Levene检验显示,平时成绩(F = 0.038, P = 0.845)和期末成绩(F = 0.120, P = 0.729)方差齐性,总评成绩方差齐性(F = 0.429, P = 0.514)。效应量分析表明,高频小测验对平时成绩和期末成绩的提升效果均达到强效应水平,而总评成绩的效应量较小(d = 0.28),可能与平时成绩在总评中权重较低(30%)有关。
本研究数据经独立样本T检验验证,干预组在平时成绩(T (157) = 6.396, P < 0.001)和期末成绩(T (157) = 6.398, P < 0.001)上均显著优于传统组,总评成绩差异接近临界显著(P = 0.106),结果符合研究设计逻辑,支持高频小测验对医学课程成绩的提升效应。
4. 讨论
4.1. 高频小测验对过程性与终结性考核的差异化影响
4.1.1. 小测验对成绩的差异化影响
本研究发现,干预组平时成绩与期末成绩均呈现显著提升,印证了形成性评价的双重价值:一方面,高频小测验通过“即时反馈–定向复习”机制强化知识掌握——每次测验的错题解析直接指向薄弱环节,形成“诊断–改进”闭环,使平时成绩提升6.53分(d = 1.14);另一方面,常态化测验环境降低了期末考核焦虑,干预组学生在期末笔试中表现出更稳定的知识提取能力,期末成绩提高7.83分(d = 1.11),与认知负荷理论中“练习效应降低工作记忆消耗”的假设一致[14]。也可能与增设小测验后评分标准更为严格有关;而期末成绩的显著提升则表明,小测验通过强化知识巩固,间接提高了学生的综合应用能力。这一结果支持形成性评价在长期学习效果中的积极作用。
4.1.2. 总评成绩未达显著差异的潜在原因
尽管平时与期末成绩提升显著,总评成绩差异却未达统计学意义(p = 0.11),可能源于两方面因素:其一,平时成绩在总评中占比仅30%,期末成绩占比70%,权重分配弱化了过程性考核的整体影响;其二,传统组学生可能通过期末突击弥补平时不足,而干预组学生的知识掌握更均衡,导致总评差异被稀释。这提示在考核改革中,需合理调整形成性与终结性评价的权重,避免“高权重期末考”对过程性干预效果的掩盖。
4.1.3. 教学启示
小测验作为过程性评价工具,需结合合理的评分机制,避免因评分严格化导致学生积极性受挫。同时,应优化总评成绩的计算方式,除了调整平时成绩和期末成绩的权重外,还应积极探索采用更全面的评价指标体系,纳入课堂参与度、小组合作表现、实践操作技能等多元化指标,构建一个更科学、更全面的评价体系,从而更精准、更全面地反映教学改革的实际成效,充分发挥形成性评价在教学过程中的积极作用,以更全面反映教学改革的成效。
4.2. 医学专业形成性评价的优化路径
4.2.1. 实践启示
在线考试系统的实践启示强调与学科特点的深度融合及动态适应性。例如,针对医学课程,实验课可增加操作流程排序题,理论课强化案例分析题,案例教学法已被证明在提高学生病例分析能力、临床思维能力和综合分析能力方面具有显著效果[15],实现“考–学–用”一体化,贴合实际应用场景。同时,大数据分析功能可精准定位学生高频错误点,推送个性化复习资源包,提升学习效率[16];通过客观赋权法构建动态代数模型,结合学生平时成绩的得分,利用矩阵理论对权重进行一致性检验,最终得出最优权重。这种动态调整的方式能够更好地反映学生的真实学习情况,避免固定权重可能带来的局限性,增强考核的灵活性与公平性[17]。这些措施通过技术手段将考核与教学过程紧密关联,形成闭环反馈机制。
4.2.2. 功能创新
在线考试系统的功能创新已从基础组卷拓展至智能生态构建[18]。题库与组卷智能化支持填空、手写、视频等多样化题型,并通过章节、难度、知识点等多维度标签实现分层组卷和随机抽题,确保试卷的科学性与多样性[19]。数据分析功能深度拓展,可生成学生能力模型、知识点错误率报告及班级/个人成绩趋势分析,为教学改进提供数据支撑。
4.2.3. 教学效果
在线考试系统的应用显著优化了教学流程与学习成效。效率方面,减轻了老师的工作负担,提高了出卷、阅卷效率和阅卷的准确度[20]。学生层面,实时反馈机制帮助快速定位知识薄弱点[21]。此外,系统通过错题集与知识点关联分析推荐针对性练习,促进自主学习,形成“考–学–练”闭环[22]。
4.2.4. 现存问题与技术挑战
尽管在线考试系统发展迅速,仍面临多重挑战。技术适配性方面,部分系统兼容性差,难以支持手写公式、实操题等复杂题型,且大规模考试时易出现网络拥塞。数据分析层面,多数系统仅提供基础统计(如分数段分布),缺乏对知识点关联性、学习行为模式的深度挖掘。公平性与伦理争议亦待解决:远程监考依赖设备与环境,可能加剧资源不平等;AI评分对主观题的判定仍存争议,需结合人工复核以确保公正性。这些问题亟需技术优化与评价理念的同步革新。
4.3. 研究局限与未来方向
本研究存在局限性,后续需有针对性地改进。在样本选取上,目前仅纳入了某医学类大学预防医学专业的学生,样本来源单一,样本量较小(传统组n = 52)。不同院校在教学理念、教学水平、学生素质等方面存在差异,对《营养与食品卫生学》课程的重视程度、教学重点和学生基础也不尽相同。这使得研究结果可能仅适用于特定环境,难以推广至更广泛的学生群体,普适性不足。在小测验相关因素研究方面虽验证了高频小测验对学生成绩有一定影响,但对于小测验频率、难度和反馈机制的研究还不够深入。本研究中仅设定了一种小测验实施模式(每2课时1次),未能充分探讨不同频率的小测验对学生学习成绩的影响差异。小测验难度方面,也未进行多样化设置与对比分析,难以明确何种难度水平更有助于学生知识掌握和成绩提升。在反馈机制上,现有小测验虽具备自动判分、错题解析及进度追踪功能,但不同反馈方式(如即时反馈、延迟反馈,详细解析反馈、简略提示反馈等)对学生学习效果的影响尚未得到研究。此外,在研究过程中,对其他影响因素的控制和分析有所欠缺。学生背景信息(如学习习惯、学习动机、家庭学习环境等)、教学方法(如讲授法、讨论法、案例教学法等的使用差异)以及教学资源(如教材版本、实验设备条件等)均可能对学生成绩产生影响。本研究未充分收集这些信息并加以控制,可能导致研究结果受到其他因素干扰。
在后续研究中扩大样本规模并延长追踪周期,可进一步探索:① 不同频率、难度和反馈机制的小测验,通过多组对照实验,收集和比较不同实验组学生的成绩数据,深入探究这些因素对学习成绩的影响,为教学实践提供更具针对性的指导;② 全面收集学生背景信息,尽量控制教学方法、教学资源等方面的差异,通过统计分析方法排除这些因素的干扰,使研究结果更具可靠性和科学性;③ 结合学习投入度、认知策略等中介变量,揭示高频测验的作用机制;④ 开发基于项目反应理论的智能组卷系统,实现测验难度与教学目标的精准匹配。
5. 结论与展望
本研究证实,在《营养与食品卫生学》课程中实施高频小测验,可显著提升学生的平时成绩与期末笔试成绩,体现了形成性评价在知识巩固与应试能力培养中的积极作用。尽管总评成绩差异未达显著,但其过程性改进价值仍为医学课程考核改革提供了重要参考。研究中还需关注形成性评价对平时成绩的潜在负面影响,可能与现行评价体系对过程性指标权重分配不足有关,后续研究可进一步优化考核权重设计,结合智能化工具深化形成性评价的应用场景,推动医学教育从“结果导向”向“过程–结果双驱动”转型。未来研究可进一步探索小测验的频率、难度与成绩反馈机制的影响,并扩大样本量以增强结果的普适性。此外,还可以将多元化评价指标(如课堂参与度、小组合作)纳入总评体系,以更精准地评估教学改革效果。
基金项目
2023年广西中医药大学教育教学改革与研究重点项目(2023B054)。
NOTES
*第一作者。
#通讯作者。