1. 引言
耳鼻喉头颈外科学是一门解剖结构复杂的学科,该学科组织器官多,且解剖结构多为细小和深在的腔洞,学生常面临知识消化困难,难以理解记忆等问题,教学难度大[1] [2]。随着医学教学模式不断发展,对学生的空间理解想象和临床思维能力的要求不断提高,传统的以授课为基础(Lecture-based learning, LBL)和以问题为基础(Problem-based learning, PBL)的教学方法虽然能够提高知识传递效率,锻炼学生自主发现、思考和解决问题的能力[2]-[8],但仅依靠文字描述及简单的图片展示,学生对于三维立体的局部解剖及疾病的发生发展变化往往无法深刻了解,无法有效锻炼学生的自我探索能力和临床思维。作为一门新兴信息技术,人工智能(Artificial intelligence, AI)是一门跨多学科的前沿智能科学,它的应用推动了医学精准化和智能化,为传统医学的发展输注新的活力[9]-[11]。而虚拟现实(Virtual reality, VR)技术是一项引领科技前沿的实用技术[12]-[14],它能模拟真实临床场景,训练并提高操作者的感知、操纵和空间构建能力,同AI技术结合有利于应对教学中遇到的解剖结构复杂的难题,提高学生的学习和理解能力。本研究将AI联合VR技术与LBL和PBL教学法相结合,并与传统LBL联合PBL教学法进行比较,旨在探讨AI联合VR技术在耳鼻咽喉头颈外科学教学中的构建与实践的应用效果。
2. 资料与方法
2.1. 一般资料
本研究从西南医科大学2022级临床医学专业2个平行班级中随机抽取40名学生作为研究对象。采用随机数表法将学生个体随机分配至实验组或对照组,每组各20人,经教务协调,两组学生分别集中授课。其中实验组男生13人,女生7人,年龄(19~22岁);对照组男生11人,女生9人,年龄(18~22岁)。同法随机选择2023级临床医学专业本科2个班级的学生作为本项目教学方法推广应用的对象,同样将学生按照随机数表法分为实验组(20人)和对照组(20人),其中实验组男生10人,女生10人,年龄(18~20岁);对照组男生11人,女生9人,年龄(19~20岁)。两组学生在性别、年龄(见表1)及前期课程成绩方面比较差异无统计学意义(P > 0.05),具有可比性。
纳入标准:① 为西南医科大学2022级或2023级临床医学专业全日制本科在校学生;② 正式选修本门课程(耳鼻咽喉头颈外科学),并同意参与本次教学研究;③ 承诺全程参与至少5次及以上(≥83%)的教学活动,以保证干预效果可评估。排除标准:① 教学期间缺课 ≥ 2次,无法完成完整教学干预;② 在本课程开始前已系统学习过VR解剖软件或接受过同类AI + VR教学培训;③ 存在严重晕动症、立体视觉障碍、癫痫史等可能影响VR使用的医学禁忌;④ 未完成期末考核或教学评价问卷。
2.2. 研究方法
实验组采用AI联合VR技术与LBL和PBL教学法相结合,对照组采用传统LBL联合PBL教学方法,由同一名高级职称教师对学生进行授课,一致的授课进度以及相同的教学内容,授课时间为每组学生每周1次教学,每次3个学时,共6次。
2.2.1. 实验组具体研究方法
设计基于AI和VR的教学课程内容,构建相应的平台系统,让学生提前进入平台系统进行学习。教师授课时除传统LBL和PBL模式讲授外,还通过AI器械和建立VR解剖系统,实现多种平台和终端包括台式机、智能手机、立体头盔、数据手套和VR眼镜的连接。
LBL阶段:教师在智慧教室授课,同步调用VR解剖平台进行三维动态演示。学生佩戴VR设备同步沉浸式观察。此阶段仍以教师主导,但可视化深度与空间感知显著提升,时长约1.5学时。
PBL阶段:学生进入预设的VR临床场景,在虚拟患者头颅模型中定位病变区域、规划入路、识别关键解剖标志,系统自动记录操作路径与错误。内置AI引擎基于学生操作行为,实时生成个性化反馈报告。学生基于VR体验与AI报告,围绕PBL案例展开讨论,分析解剖变异对疾病的影响,提出诊疗建议。教师根据系统后台数据进行针对性点评。此阶段强调“做中学(Learning by Doing)”,时长约1.5学时。
2.2.2. 对照组具体研究方法
授课教师采用传统LBL和PBL模式讲授,通过PPT授课结合多媒体动画、声音、图像、教具、实例等的传统教学方法进行授课并提出相关问题,学生进行讨论,教师进行答疑和教学反思,总结经验教训。
LBL阶段:教师在多媒体教室进行系统理论讲授,内容涵盖本周教学主题的解剖结构、功能关系、临床意义等。采用PPT、板书、实体标本或图谱辅助讲解,强调知识体系的完整性与逻辑性,时长约1.5学时。
PBL阶段:学生以5~6人/组分组讨论,围绕教师预设的临床案例展开探究。学生需在教师引导下,自主查阅资料、分析解剖结构关联、提出假设并汇报结论。教师全程巡回指导,适时点拨,促进高阶思维发展,时长约1.5学时。
2.3. 成本与可及性
AI + VR教学系统的初始投入为8套设备(含VR头盔、主机及软件授权),每套设备可支持6名学生轮转/课时。
教师经4小时集中培训即可独立指导学生操作,培训内容包括系统启动、任务分配与常见故障处理。在8周教学周期中,仅发生1次软件卡顿,由技术人员远程解决,未影响教学进度。
2.4. 教学评价
两组学生均采用以下评价方法:
2.4.1. 随堂测试
结合当堂的教学内容针对性地设计随堂测试题目,以对学生的掌握程度进行考核,通过AI软件统计结果分析,从而有针对性地对薄弱环节进行加强并补充相应的教学内容。
2.4.2. 单元测试
从历年试题库中随机抽取单元测试题目,实验组与对照组的学生采用相同的试题,以评估对理论知识的掌握程度,通过AI软件统计结果。
2.4.3. 问卷调查
采用无记名方式进行问卷调查,以了解两组学生对于教学方式、教学效果的满意度,以及对学习能力及知识掌握程度的自我评估,以期从学生的角度了解两种教学方式的优势与不足。线上问卷调查后,通过AI软件对上述结果进行统计。
2.4.4. 理论知识考核
针对临床涉及的解剖、病理生理、诊断及治疗设计题目,均为客观题。通过AI软件对两组学生的理论成绩进行统计。
2.4.5. 临床基本技能操作考核
考核外耳道异物取出术的操作技能,并由高年资主治医师担任评估老师。评估表内容包括基本信息、评分项目、开放式问题三方面。评估采用百分制评分,并根据评分结果分为4个等级,<60分为未达预期标准;60~79分为接近预期标准;80~89分(良好)为达到预期标准;≥90分(优秀)为超出预期标准。
2.5. 推广应用
根据2022级临床医学专业本科生的教学效果评价结果,进一步改进两种教学方法,并将上述教学方法推广应用于2023级临床医学专业本科生随机选取的2个班级学生的教学中,同法进行教学效果评价。
2.6. 过程数据与安全性监测
实验组学生的学习行为数据由AI + VR平台自动记录,包括操作错误类型及其发生率。对照组的过程数据由两名研究者通过标准化观察表盲法记录。错误分类依据国家《临床基本技能操作指南》预设为四类:1) 无菌操作违规;2) 关键步骤遗漏;3) 操作手法不当;4) 应急处理缺失。本研究未评估长期保持效果与迁移能力,后续将纳入延迟测验与新情境任务。
此外,虽未观察到晕动症等严重不良反应,但仍需大样本监测VR相关不适。
2.7. 统计学分析
本研究以理论知识考核成绩为主要结局指标,随堂测试、单元测试、教学效果满意度和临床基本技能操作考核为次要结局,所有分析计划在数据收集前确定。使用SPSS软件进行数据处理,计量资料符合正态分布用(
)表示,不符合者用中位数和四分位距表示,两组间比较采用独立样本t检验或Mann-Whitney U检验;计数资料以率表示,采用卡方或秩和检验对问卷调查结果进行分析,以P < 0.05为差异有统计学意义。
鉴于每个结局指标均在2022级、2023级及2022级 + 2023级合并样本中进行三次组间比较,为控制多重比较引起的第一类错误率,对每个结局指标内部的三次比较采用Bonferroni校正,校正后显著性水平设定为α = 0.0167。连续变量的效应量采用Cohen’s d表示,非参数检验的效应量采用r值表示,同时报告组间均值差或中位数差的95%置信区间(95% CI)。以校正后P < 0.0167为差异具有统计学意义。
3. 结果
3.1. 两组学生的一般资料比较
分别比较2022级、2023级、2022级 + 2023级实验组和对照组学生的人数、性别、年龄构成情况,结果显示两组间差异均无统计学意义(P > 0.05),见表1。
Table 1. Comparison of baseline characteristics between experimental and control groups among students of grade 2022, 2023, and combined 2022 + 2023
表1. 2022级、2023级、2022 + 2023级实验组和对照组学生的一般资料比较
|
实验组 |
对照组 |
t/z/χ2值 |
P值 |
2022级 |
人数 |
20 |
20 |
— |
— |
性别 |
男:13 (65%) |
男:11 (55%) |
χ2 = 0.417 |
0.519 |
女:7 (35%) |
女:9 (45%) |
年龄 |
20 (20, 21) |
20 (20, 21) |
z = −0.189 |
0.850 |
2023级 |
人数 |
20 |
20 |
— |
— |
性别 |
男:10 (50%) |
男:11 (55%) |
χ2 = 0.100 |
0.752 |
女:10 (50%) |
女:9 (45%) |
年龄 |
19 (19, 20) |
19 (19, 20) |
z = −0.111 |
0.912 |
2022级 + 2023级 |
人数 |
40 |
40 |
— |
— |
性别 |
男:23 (57.5%) |
男:22 (55%) |
χ2 = 0.051 |
0.822 |
女:17 (42.5%) |
女:18 (45%) |
年龄 |
20 (19, 20) |
20 (19, 20) |
z = −0.041 |
0.967 |
3.2. 随堂测试
对2022级、2023级、2022级 + 2023级实验组和对照组的随堂测试结果进行比较,发现2022级实验组成绩(18.55 ± 1.10)明显高于对照组(17.35 ± 1.27),均值差为1.20分(95% CI: 0.44~1.96, P = 0.003, d = 1.01);2023级实验组成绩(17.15 ± 1.53)同样高于对照组(14.10 ± 1.45),均值差为3.05分(95% CI: 2.10~4.00, P < 0.001, d = 2.05);对2022级 + 2023级综合分析,结果显示实验组成绩(17.85 ± 1.49)高于对照组(15.73 ± 1.12),均值差为2.12分(95% CI: 1.31~2.94, P < 0.001, d = 1.60)。经Bonferroni校正后差异仍具有统计学意义(P < 0.0167)。
3.3. 单元测试
对2022级、2023级、2022级 + 2023级实验组和对照组的单元测试结果进行分析,得到这三组实验组成绩分别为16.90 ± 2.29、16.40 ± 1.98、16.65 ± 2.13,而对照组的成绩分别为15.00 ± 2.29、14.50 ± 2.14、14.75 ± 2.20,实验组的测试结果明显优于对照组。对实验组和对照组的分数进一步比较分析,发现2022级均值差为1.90分(95% CI: 0.43~3.37, P = 0.013, d = 0.83);2023级均值差为1.90分(95% CI: 0.08~2.92, P = 0.039, d = 0.92);2022级 + 2023级均值差为1.90分(95% CI: 0.01~2.49, P = 0.04, d = 0.88),经Bonferroni校正后部分数据差异仍具有统计学意义(P < 0.0167)。
3.4. 教学效果满意度
本研究采用自编问卷调查学生对AI + VR联合教学的满意度,共包含10个条目,每项“满意”计1分,“不满意”计0分,总分范围为0~10分。对2022级、2023级、2022级 + 2023级实验组和对照组的满意度总分进行分析,实验组的得分分别为9.75 ± 0.44、9.8 ± 0.41、9.78 ± 0.42,与对照组6.45 ± 1.43、6.25 ± 1.12、6.35 ± 1.27相比,显著升高(P < 0.05)。对实验组和对照组的得分进一步比较分析,发现2022级均值差为3.30分(95% CI: 2.61~3.99, P < 0.001, d = 3.12);2023级均值差为3.55分(95% CI: 3.00~4.10, P < 0.001, d = 4.21);2022级 + 2023级均值差为3.43分(95% CI: 3.00~3.85, P < 0.001, d = 3.63),经Bonferroni校正后差异仍具有统计学意义(P < 0.0167)。
此外,各条目满意度亦普遍高于对照组(见表2),提示该教学模式在多个方面均获学生认可。数据显示,此次实验性教学方法不但有益于教师的教学,还能提高学生的学习能力,增强学生的课堂参与感和提高课堂满意度。
Table 2. Comparison of satisfaction with teaching effectiveness between experimental and control groups among students of grade 2022, 2023, and combined 2022 + 2023 [Satisfied n (%)]
表2. 2022级、2023级、2022 + 2023级实验组和对照组学生的教学效果满意度比较[满意人数(率)]
|
2022级 |
2023级 |
2022级 + 2023级 |
|
实验组 |
对照组 |
χ2值 |
P值 |
实验组 |
对照组 |
χ2值 |
P值 |
实验组 |
对照组 |
χ2值 |
P值 |
教学方式 |
19 (95%) |
13 (65%) |
3.906 |
0.048 |
20 (100%) |
13 (65%) |
6.234 |
0.013 |
39 (97.5%) |
26 (65%) |
13.867 |
0.000 |
课堂氛围 |
19 (95%) |
13 (65%) |
3.906 |
0.048 |
19 (95%) |
13 (65%) |
3.906 |
0.048 |
38 (95%) |
26 (65%) |
11.250 |
0.001 |
教学创新性 |
20 (100%) |
11 (55%) |
9.176 |
0.002 |
20 (100%) |
14 (70%) |
4.902 |
0.027 |
40 (100%) |
25 (62.5%) |
16.082 |
0.000 |
学习效率提升 |
20 (100%) |
12 (60%) |
7.656 |
0.006 |
19 (95%) |
11 (55%) |
8.533 |
0.003 |
39 (97.5%) |
23 (57.5%) |
16.129 |
0.000 |
自学能力提升 |
19 (95%) |
13 (65%) |
3.906 |
0.048 |
19 (95%) |
12 (60%) |
5.161 |
0.023 |
38 (95%) |
25 (62.5%) |
12.624 |
0.000 |
学习兴趣激发 |
20 (100%) |
14 (70%) |
4.902 |
0.027 |
20 (100%) |
12 (60%) |
7.656 |
0.006 |
40 (100%) |
26 (65%) |
16.970 |
0.000 |
理论知识理解 |
20 (100%) |
14 (70%) |
4.902 |
0.027 |
19 (95%) |
13 (65%) |
3.906 |
0.048 |
39 (97.5%) |
27 (67.5%) |
12.468 |
0.000 |
临床思维培养 |
20 (100%) |
13 (65%) |
6.234 |
0.013 |
20 (100%) |
12 (60%) |
7.656 |
0.006 |
40 (100%) |
25 (62.5%) |
16.082 |
0.000 |
分析能力提高 |
19 (95%) |
13 (65%) |
3.906 |
0.048 |
20 (100%) |
14 (70%) |
4.902 |
0.027 |
39 (97.5%) |
27 (67.5%) |
12.468 |
0.000 |
协作能力提高 |
19 (95%) |
13 (65%) |
3.906 |
0.048 |
20 (100%) |
11 (55%) |
9.176 |
0.002 |
39 (97.5%) |
24 (60%) |
16.807 |
0.000 |
3.5. 理论知识考核
2022级、2023级、2022级 + 2023级实验组学生理论知识考核成绩分别为93.65 ± 2.37、92.05 ± 2.58、92.85 ± 2.58,而对照组学生理论知识考核成绩分别为87.95 ± 2.98、86.70 ± 5.74、87.33 ± 4.56。对实验组和对照组的理论知识考核结果进行比较,发现2022级均值差为5.70分(95% CI: 3.97~7.43, P < 0.001, d = 2.12);2023级均值差为5.35分(95% CI: 2.46~8.24, P =0.001, d = 1.20);2022级 + 2023级均值差为5.52分(95% CI: 3.87~7.17, P < 0.001, d = 1.49)。实验组成绩明显高于对照组,经Bonferroni校正后差异仍具有统计学意义(P < 0.0167),表明AI联合VR教学方式的创新能够提高学生对理论知识的学习能力,加深学生对理论知识的掌握程度。
3.6. 临床基本技能操作考核
对实验组和对照组的临床基本技能操作考核结果进行秩和检验,发现实验组良好及以上的学生占比率明显高于对照组,且Bonferroni校正后差异有统计学意义(P < 0.0167),见表3。
Table 3. Comparison of basic clinical skill performance scores between experimental and control groups across grade 2022, 2023, and 2022 + 2023 cohorts [n (%)]
表3. 2022级、2023级、2022级 + 2023级实验组与对照组学生的临床基本技能操作考核比较[n (%)]
|
|
未达预期标准 |
接近预期标准 |
良好 |
优秀 |
Z值 |
P值 |
r值(95% CI) |
2022级 |
实验组 |
1 (5%) |
2 (10%) |
8 (40%) |
9 (45%) |
−2.646 |
0.008 |
0.42 (0.12, 0.65) |
对照组 |
3 (15%) |
6 (30%) |
9 (45%) |
2 (10%) |
2023级 |
实验组 |
1 (5%) |
3 (15%) |
10 (50%) |
6 (30%) |
−2.577 |
0.010 |
0.41 (0.11, 0.64) |
对照组 |
3 (15%) |
8 (40%) |
8 (40%) |
1 (5%) |
2022级 + 2023级 |
实验组 |
2 (5%) |
5 (12.5%) |
18 (45%) |
15 (37.5%) |
−3.686 |
0.000 |
0.41 (0.23, 0.58) |
对照组 |
6 (15%) |
14 (35%) |
17 (42.5) |
3 (7.5%) |
3.7. 临床技能操作错误谱系分析
为评估教学干预对临床技能操作效果的影响,我们对两组学生在临床技能考核中的错误类型进行了系统编码。如表4示,实验组在多项高风险错误上的发生率显著低于对照组(P < 0.05)。
Table 4. Comparison of error type distributions between the two groups [n (%)]
表4. 两组学生操作错误类型分布比较[n (%)]
|
2022级 |
2023级 |
2022级 + 2023级 |
|
实验组 |
对照组 |
χ2值 |
P值 |
实验组 |
对照组 |
χ2值 |
P值 |
实验组 |
对照组 |
χ2值 |
P值 |
无菌操作违规 |
4 (20%) |
8 (40%) |
1.905 |
0.168 |
3 (15%) |
8 (40%) |
3.135 |
0.077 |
7 (17.5%) |
16 (40%) |
4.943 |
0.026 |
关键步骤遗漏 |
2 (10%) |
8 (40%) |
4.800 |
0.028 |
1 (5%) |
10 (50%) |
10.157 |
0.001 |
3 (7.5%) |
18 (45%) |
14.528 |
0.000 |
操作手法不当 |
4 (20%) |
9 (45%) |
2.849 |
0.091 |
3 (15%) |
10 (50%) |
5.584 |
0.018 |
7 (17.5%) |
19 (47.5%) |
8/205 |
0.004 |
应急处理缺失 |
1 (5%) |
8 (40%) |
— |
0.020 |
2 (10%) |
11 (55%) |
9.231 |
0.002 |
3 (7.5%) |
19 (47.5%) |
16.050 |
0.000 |
注:因“应急处理缺失”行2022级组存在期望频数 < 5,采用Fisher精确检验;其余采用χ2检验。
4. 讨论
耳鼻咽喉头颈外科学是一门解剖难度较大的学科,因其解剖结构的复杂性和部位的隐蔽性,使得教学和学习过程显得抽象且乏味[15] [16]。虽然教师采用LBL和PBL教学方法授课时会有与理论知识相对应的图片和视频提供,但仍然有二维的限制,学生无法深度理解体验与参与课堂。而AI联合VR技术可实现三维重构,将它们融进课堂,既有利于老师对解剖结构讲解,又能将具体部位人体结构直观立体地展现给学生,使学生建立立体概念,有利于学生知识体系的构建,加深学生对解剖结构记忆,激发学生对耳鼻咽喉头颈外科学的学习兴趣[17]-[21]。本研究的2022级、改良后推广应用的2023级以及两个年级学生联合的实验组(AI + VR技术联合传统LBL和PBL)教学方法与对照组(LBL和PBL)教学方法相比,可明显激发学生的学习兴趣,提高学生的学习效率、分析和协作能力等;问卷调查情况显示实验组学生的知识掌握情况、教学满意度均高于对照组。在包含随堂测试、单元测试、理论知识考核的3次理论测验中,2022级、2023级,2022级 + 2023级AI联合VR教学组的学生理论成绩均好于对照的传统教学组,同时实验组在临床技能考核中的多项高风险错误发生率低于对照组。表明AI + VR技术联合传统LBL和PBL教学方法有利于学生对理论知识的理解与掌握,大大地激发学生的学习潜能,明显提高学生的教学满意度。
此外,AI与VR相结合,利用AI大数据和虚拟仿真系统可以为学生提供海量的临床病例以及针对不同情况的决策训练,帮助学生培养临床思维,提高学生的体验感,可为学生提供涵盖各种疑难病例的可重复、可记录的训练平台,有助于提升医学生的临床技能和手术操作能力[22]-[25]。本研究在外耳道异物取出术的临床技能操作考试中,实验组的表现远好于对照组,表明AI联合VR技术有利于提高学生的实践动手能力,锻炼了学生的临床思维。
综上,AI联合VR技术在耳鼻咽喉头颈外科学教学中的构建与实践有利于耳鼻喉头颈外科学的课堂教学,能够加强学生对基础知识的掌握和临床思维的锻炼,发挥学生主观能动性,培养学生发现、分析和独立解决问题的能力,以及提高学生的实践动手能力。因此,AI联合VR技术联合LBL和PBL的教学模式值得在今后耳鼻咽喉头颈外科学的教学中进一步推广应用。
致 谢
感谢所有参与本研究的学生和教师。
基金项目
西南医科大学教育教学改革研究项目(JG2023yb111),西南医科大学研究生教育教学改革项目(YJG202239)。
NOTES
*第一作者。
#通讯作者。