ChatGPT联合ASSURE评估在临床医学本科教学中的探索与实践
Exploration and Practice of ChatGPT Combined with ASSURE Evaluation in Clinical Medicine Undergraduate Teaching
DOI: 10.12677/ns.2025.1412324, PDF, HTML, XML,    科研立项经费支持
作者: 李子广, 胡志敏:蚌埠医科大学第二附属医院呼吸与危重症医学科,安徽 蚌埠;唐佳鑫, 周佳慧:蚌埠医科大学研究生院,安徽 蚌埠;王 宁:蚌埠医科大学第一附属医院外科楼手术室,安徽 蚌埠
关键词: ChatGPTASSURE评估临床医学本科教学临床思维ChatGPT ASSURE Evaluation Clinical Medicine Undergraduate Teaching Clinical Thinking
摘要: 目的:探索ChatGPT联合ASSURE评估模式在临床医学本科教学中的应用效果,为培养具有主动学习能力、临床思维能力和创新能力的医学人才提供实践依据。方法:选取2024年在我院进行临床培训的60名临床医学本科生作为研究对象,随机分为教改实验组(n = 30)和传统教学组(n = 30)。传统教学组采用基于PPT的LBL教学模式,教改实验组采用ChatGPT联合ASSURE评估的“师–生-ChatGPT”三主体教学模式,以呼吸衰竭为教学病种开展教学。比较两组学生的理论考核成绩、体格检查技能、胸部CT判读能力、入院记录书写质量、人文沟通能力及教学满意度,并分析教改模式的优缺点。结果:教改实验组学生的理论考核成绩、体格检查技能评分、胸部CT判读评分、入院记录书写质量评分、人文沟通能力评分及教学满意度均显著高于传统教学组,差异均有统计学意义(P < 0.05)。结论:ChatGPT联合ASSURE评估模式能有效提升临床医学本科生的理论知识水平、临床实践技能和综合素养,激发学生主动学习热情,是一种值得推广的临床医学本科教学创新模式。
Abstract: Objective: To explore the application effect of the ChatGPT combined with ASSURE evaluation model in undergraduate clinical medicine teaching, and to provide practical evidence for cultivating medical talents with autonomous learning ability, clinical thinking ability, and innovation ability. Methods: Sixty clinical medicine undergraduates undergoing clinical training in our hospital in 2024 were selected as the study subjects and randomly divided into a teaching reform experimental group (n = 30) and a traditional teaching group (n = 30). The traditional teaching group adopted a PPT-based LBL teaching model, while the teaching reform experimental group used a three-subject “teacher-student-ChatGPT” teaching model integrating ChatGPT combined with ASSURE evaluation, focusing on respiratory failure as the teaching disease. Theoretical exam scores, physical examination skills, chest CT interpretation ability, inpatient record writing quality, humanistic communication ability, and teaching satisfaction were compared between the two groups, and the advantages and disadvantages of the teaching reform model were analyzed. Results: The teaching reform experimental group scored significantly higher than the traditional teaching group in theoretical exam scores, physical examination skill scores, chest CT interpretation scores, inpatient record writing quality scores, humanistic communication ability scores and teaching satisfaction, with all differences being statistically significant (P < 0.05). Conclusion: The ChatGPT combined with ASSURE evaluation model can effectively improve the theoretical knowledge, clinical practice skills, and overall quality of clinical medicine undergraduates, stimulate students’ enthusiasm for autonomous learning, and is an innovative clinical medicine undergraduate teaching model worth promoting.
文章引用:李子广, 唐佳鑫, 周佳慧, 王宁, 胡志敏. ChatGPT联合ASSURE评估在临床医学本科教学中的探索与实践[J]. 护理学, 2025, 14(12): 2456-2462. https://doi.org/10.12677/ns.2025.1412324

1. 引言

研究背景

在大思政教育全面推进的时代背景下,高等医学本科教育的核心目标不仅是传授专业知识与技能,更在于培养学生的临床思维能力、主动学习能力和职业素养,为其未来职业生涯奠定坚实基础[1]。当前临床医学本科教学中,尽管“以学习者为中心”的教育理念已得到广泛认同,但在实际教学中仍存在教师主导性过强、学生主体责任缺失的问题,导致学生的临床思维能力和问题解决能力培养效果未能达到预期[2]。随着人工智能技术的迅猛发展,以ChatGPT为代表的生成式人工智能工具凭借其强大的对话生成能力、知识整合能力和个性化服务能力,为医学教育改革提供了新的契机[3]

ChatGPT作为OpenAI公司开发的神经网络模型,能够通过交互式对话为学习者提供即时的知识解答、病例分析思路和学习资源推荐,其生成性特征使临床教学从“教师–学生”双主体模式向“教师–学生-ChatGPT”三主体模式转变[4]。这种转变不仅可以丰富教学手段,还能为学生提供个性化的学习支持,帮助其突破传统教学的时空限制[5]。与此同时,Russel提出的ASSURE教学设计模式将教学过程系统化、步骤化,通过分析学习者特征、确定教学目标、选择教学方法、运用教学资源、实施教学活动和评估教学效果六个环节,有效提升教学的针对性和实效性[6]。近年来,ASSURE模式在医学教育领域的应用显示,其结合多元化评价方式能够显著激发学生的学习动机,提高教学质量[7]

本研究将生成式人工智能技术与成熟的教学设计模式相结合,旨在解决当前临床教学中存在的突出问题,提升学生解决临床问题的综合能力和团队协作能力,为国家“健康中国2030”战略储备优秀的创新型医学人才[8]构建“ChatGPT + ASSURE”的临床医学教学新框架,丰富了医学教育技术学的研究内容,为人工智能在高等医学教育中的应用提供了理论参考。同时,本研究关注教学评价的变革,强调对学生创造性问题解决能力的评估,完善了临床医学本科教学评价体系的理论基础[9],成果可推广至其他医学教研室,惠及更多医学生,推动医学教育质量的整体提升[10]

2. 研究对象与方法

2.1. 研究对象

选取2024年在本院第二附属医院进行临床培训的60名临床医学本科学生作为研究对象。纳入标准:① 完成临床医学本科阶段基础课程学习,进入临床见习阶段;② 自愿参与本研究,并签署知情同意书;③ 无严重躯体疾病或精神心理障碍,能够正常参与教学活动。排除标准:① 因请假、休学等原因无法完成全程教学及考核者;② 既往有呼吸内科相关临床实践经历者。采用随机数字表法将研究对象分为教改实验组和传统教学组,每组各30名。其中教改实验组男16名,女14名,年龄(22.3 ± 1.2)岁;传统教学组男15名,女15名,年龄(22.5 ± 1.1)岁。两组学生的性别、年龄等一般资料比较,差异无统计学意义(P > 0.05),具有可比性。

2.2. 研究内容

以呼吸衰竭为指定教学病种,分别采用不同教学模式对两组学生进行为期4周的临床教学培训。通过比较两组学生的理论考核成绩、体格检查技能、胸部CT判读能力、入院记录书写质量、人文沟通能力及对带教老师的教学满意度,系统评估ChatGPT联合ASSURE评估教学模式的干预效果,并分析该模式在临床教学中的优势与不足。同时,将大思政教育贯穿教学全过程,强化学生的职业道德素养和网络安全意识。

2.3. 研究方法

2.3.1. 文献研究法

系统查阅中国知网、万方数据知识服务平台、PubMed、Web of Science等数据库中关于人工智能在医学教育中的应用、ASSURE教学设计模式、临床医学教学改革等相关文献,检索时间为2022年1月至2024年12月。检索关键词包括“ChatGPT”、“人工智能”、“医学教育”、“ASSURE model”、“clinical teaching”、“problem-based learning”等。对检索到的文献进行筛选、整理和分析,总结当前临床医学本科教学中存在的问题、ChatGPT的应用现状及ASSURE模式的实践效果,为本次研究的方案设计提供理论依据。

2.3.2. 教学方案设计

两组学生均以呼吸衰竭为教学核心内容,教学时长均为4周,每周理论教学2课时,临床实践4课时,由同一组具备丰富临床教学经验的教师(副主任医师及以上职称,教龄 ≥ 5年)进行带教。传统教学组采用基于PPT的LBL教学模式,按照临床医学本科教学大纲要求开展教学活动。具体内容包括:① 理论教学:通过PPT讲解呼吸衰竭的病因、发病机制、临床表现、诊断标准、鉴别诊断及治疗原则;② 临床实践:教师带领学生进行床旁查房,讲解典型病例的诊疗过程,指导学生进行体格检查和辅助检查分析,学生在教师指导下完成病例讨论和诊疗计划制定。教改实验组采用ChatGPT联合ASSURE评估的教学模式,结合PBL和LBL教学方法,按照ASSURE模式的六个环节分步实施教学,具体流程如下:

1) 分析学习者特征(Analyze Learners):入组前通过问卷调查和面谈了解学生的基础理论水平、临床实践经历、学习兴趣及对人工智能工具的掌握程度,建立学生个人学习档案。同时,开展思政教育专题讲座,强调医学职业的责任感和使命感,强化学生的网络安全意识,引导其正确、规范使用ChatGPT等人工智能工具,避免学术不端行为。

2) 确定教学目标(State Standards and Objectives):根据教学大纲要求,结合学生的实际情况,制定具体、可测量的教学目标。知识目标:掌握呼吸衰竭的核心理论知识,包括病因、发病机制、诊断及治疗要点;能力目标:具备独立进行呼吸衰竭患者的体格检查、胸部CT判读、入院记录书写及制定初步诊疗计划的能力,培养批判性思维和问题解决能力;素养目标:树立以患者为中心的服务理念,具备良好的人文沟通能力和职业道德。

3) 选择教学方法和媒体(Select Methods, Media, and Materials):采用“师–生-ChatGPT”三主体教学模式,结合PBL和LBL教学方法。教学媒体包括ChatGPT (4.0版本)、PACS病例库、临床典型病例视频、虚拟仿真教学软件等。ChatGPT主要用于提供病例背景资料、生成病例报告模板、解答学生的即时疑问、提供多视角的病例分析思路等。

4) 运用教学媒体(Utilize Media and Materials):根据教学进度,分阶段运用教学媒体开展教学活动。① 预习阶段:教师通过ChatGPT向学生推送呼吸衰竭的相关学习资源和导向性问题(如“慢性阻塞性肺疾病所致呼吸衰竭的发病机制与其他病因有何不同?”),学生借助ChatGPT进行自主学习,生成预习笔记,提出疑问;② 理论教学阶段:教师结合PPT和典型病例进行重点讲解,针对学生预习中提出的共性问题组织课堂讨论,ChatGPT辅助提供补充案例和数据支持;③ 临床实践阶段:学生分组进行床旁查房,采集患者病史并进行体格检查后,利用ChatGPT生成初步的病例报告模板,结合PACS病例库中的影像资料进行分析,小组内讨论制定诊疗计划。教师全程指导,对学生的分析过程进行点评和纠错。

5) 实施教学活动(Require Learner Participation):组织学生开展多样化的互动教学活动,包括病例讨论会、角色扮演、模拟诊疗等。在病例讨论中,引导学生运用批判性思维质疑ChatGPT提出的假设和结论,结合临床实际证据进行分析;角色扮演活动中,学生分别扮演医生、患者及家属,模拟医患沟通场景,ChatGPT对沟通过程进行评价并提出改进建议。

6) 评估教学效果(Evaluate and Revise):采用形成性评价与终结性评价相结合的方式,结合ASSURE模式的评估指标对学生的学习效果进行全面评估。形成性评价包括预习笔记质量、课堂参与度、小组讨论表现等;终结性评价包括理论考核、技能操作考核、病例分析报告等。根据评估结果及时调整教学策略和方法,优化教学方案。

2.3.3. 考核评价方法

教学结束后,对两组学生进行统一考核,考核内容及评分标准如下:① 理论考核:采用闭卷考试形式,试题涵盖呼吸衰竭的基础理论、诊断标准、治疗原则等内容,满分100分;② 体格检查技能:选取呼吸衰竭相关的核心体格检查项目(如肺部听诊、生命体征监测等),由3名资深医师组成考核小组进行现场评分,取平均值,满分100分;③ 胸部CT判读:提供10份呼吸衰竭患者的胸部CT影像资料,要求学生在规定时间内完成判读并写出报告,考核小组根据判读准确性和报告完整性评分,满分100分;④ 入院记录书写质量:以同一临床典型病例为素材,要求学生独立完成入院记录书写,从内容完整性、逻辑清晰度、医学术语规范性等方面评分,满分100分;⑤ 人文沟通能力:采用情景模拟方式,设置医患沟通场景,考核小组根据学生的沟通态度、表达能力、换位思考能力等评分,满分100分;⑥ 教学满意度:采用问卷调查形式,从教学内容、教学方法、教学效果等方面设置10个问题,采用Likert 5级评分法,总分 ≥ 40分为满意,计算满意度。

2.3.4. 统计学方法

采用SPSS 26.0统计学软件进行数据处理。计量资料以( x ¯ ±s )表示,组间比较采用独立样本t检验;计数资料以率(%)表示,组间比较采用χ2检验。以P < 0.05为差异具有统计学意义。

3. 结果

3.1. 两组学生考核成绩比较

教改实验组学生的理论考核成绩、体格检查技能评分、胸部CT判读评分、入院记录书写质量评分及人文沟通能力评分均显著高于传统教学组,差异均有统计学意义(P < 0.05)。具体结果见表1

Table 1. Comparison of examination results between two groups of students ( x ¯ ±s , score)

1. 两组学生考核成绩比较( x ¯ ±s ,分)

组别

例数

理论考核成绩

体格检查技能评分

胸部CT判读评分

入院记录书写质量评分

人文沟通能力评分

教改 实验组

30

89.23 ± 4.12

90.15 ± 3.87

88.67 ± 4.53

87.34 ± 4.26

91.28 ± 3.54

传统 教学组

30

78.56 ± 5.34

76.32 ± 4.65

75.89 ± 5.11

74.21 ± 5.48

77.65 ± 4.92

t值

-

9.523

12.845

10.672

10.134

12.056

P值

-

<0.001

<0.001

<0.001

<0.001

<0.001

3.2. 两组学生教学满意度比较

教改实验组学生对教学的满意度为96.67% (29/30),显著高于传统教学组的73.33% (22/30),差异有统计学意义(χ2 = 6.405, P = 0.011)。具体结果见表2

Table 2. Comparison of teaching satisfaction between two groups of students [n (%)]

2. 两组学生教学满意度比较[例(%)]

组别

例数

满意

不满意

满意度(%)

教改实验组

30

29 (96.67)

1 (3.33)

96.67

传统教学组

30

22 (73.33)

8 (26.67)

73.33

χ2

-

-

-

6.405

P值

-

-

-

0.011

3.3. ChatGPT联合ASSURE评估模式的优缺点分析

通过教学实践和学生反馈,总结ChatGPT联合ASSURE评估模式的优势主要包括:① 激发学习主动性:ChatGPT的交互式学习方式和个性化资源推送能够有效吸引学生的学习兴趣,促使其从被动接受知识转变为主动探索知识;② 提升临床思维能力:引导学生运用批判性思维质疑ChatGPT的结论,结合临床证据进行分析,培养了学生多角度思考问题的能力;③ 提高教学效率:ChatGPT能够快速解答学生的疑问,减轻教师的重复教学负担,使教师能够将更多精力投入到案例分析和技能指导中;④ 完善评价体系:ASSURE模式的系统化评估能够全面反映学生的学习过程和学习效果,为教学改进提供精准依据。该模式存在的不足主要有:① 技术依赖性较强:部分学生过度依赖ChatGPT的答案,缺乏独立思考的意识,需加强引导和监督;② 教学资源要求高:需要稳定的网络环境和优质的教学资源库支持,对学校的教学硬件设施有一定要求;③ 教师能力挑战大:要求教师具备运用人工智能工具的能力和系统化的教学设计能力,需加强教师培训。

4. 讨论

本研究结果显示,引入ChatGPT的教改实验组学生在各项考核指标上均显著优于传统教学组,表明ChatGPT在临床医学本科教学中具有重要的应用价值。这与国内外相关研究结论一致[11] [12]。ChatGPT作为一种新型的教学辅助工具,其优势主要体现在以下几个方面:首先,个性化学习支持。ChatGPT能够根据学生的学习进度和知识薄弱点,推送针对性的学习资源和问题,满足不同学生的学习需求,实现“因材施教”[13]。其次,即时性知识服务。在临床实践过程中,学生可能会遇到各种突发的知识疑问,ChatGPT能够快速提供解答和参考信息,帮助学生及时解决问题,提升学习效率[14]。再次,多视角思维引导。ChatGPT能够从不同角度提供病例分析思路,引导学生突破单一思维模式,培养批判性思维和创新能力[15]。但同时也应注意,ChatGPT在医学教学中的应用存在一定的风险,如生成内容可能存在错误、容易导致学生学术不端等[16]。本研究通过入组前的思政教育和网络安全培训,有效降低了学术不端风险,确保了ChatGPT的规范使用,这一经验值得借鉴。

ASSURE模式作为一种系统化的教学设计框架,为ChatGPT在医学教学中的应用提供了科学的指导,其优化作用主要体现在以下几个方面:首先,明确教学目标。ASSURE模式要求在教学开始前充分分析学习者特征,制定具体、可测量的教学目标,使教学活动更具针对性[17]。本研究根据学生的实际情况制定了知识、能力、素养三位一体的教学目标,确保了教学方向的正确性。其次,规范教学流程。ASSURE模式的六个环节环环相扣,形成了完整的教学闭环,使教学活动有序开展,避免了教学的随意性[18]。再次,完善教学评价。ASSURE模式强调形成性评价与终结性评价相结合,能够全面反映学生的学习过程和学习效果,为教学改进提供可靠依据[19]。本研究采用的多元化考核方式,不仅评估了学生的知识和技能水平,还关注了其人文素养和职业精神,符合现代医学教育的培养目标。

本研究构建的“ChatGPT + ASSURE”教学模式,将生成式人工智能技术与系统化教学设计相结合,有效提升了临床医学本科教学的质量和效果,具有较高的推广价值。首先,该模式具有较强的可操作性。其教学流程清晰,考核标准明确,教师经过简单培训即可掌握相关的教学方法和技术工具。其次,该模式具有较好的适应性。虽然本研究以呼吸衰竭为教学病种,但该模式的核心框架可应用于其他临床学科的教学,具有广泛的适用性[20]。再次,该模式符合医学教育改革的发展方向。在人工智能技术快速发展的背景下,医学教育需要不断创新教学模式,培养适应未来医疗行业发展需求的人才。“ChatGPT + ASSURE”模式正是顺应这一趋势的有益探索,能够为医学教育改革提供实践参考。ChatGPT流畅、自信的表述风格,会给学生一种虚假的确定性感,让他们不假思索地接受其输出。这与医学教育中强调的“循证”和“不确定性管理”核心原则背道而驰。因此,教学模式必须内置“可信度评估”环节,强制要求学生交叉验证ChatGPT提供的信息,并将其作为一种必须养成的核心职业素养。

ChatGPT联合ASSURE评估模式能够有效提升临床医学本科生的理论知识水平、临床实践技能、人文素养和教学满意度,激发学生的主动学习热情,培养其批判性思维和问题解决能力。教学模式中必须明确划定ChatGPT的边界,强调其在“知识”和“思维”辅助上的作用,而将“共情”、“沟通”、“伦理决策”等领域的教学牢牢置于师生互动和临床实践之中。在推广应用过程中,需加强教师培训和学生引导,规范人工智能工具的使用,不断完善教学资源和评估机制,以充分发挥该模式的优势,为医学教育事业的发展贡献力量。

基金项目

安徽省教育厅教学质量工程项目(2023jyxm1214)。

参考文献

[1] 李哲安, 赵奕翔, 孙斐. 数字化时代外科学研究生教学的探索与思考[J]. 全科医学临床与教育, 2025, 23(9): 824-828.
[2] 黄汉卿, 蔡雷琴. 人工智能在临床医学本科实习教学中的应用探索[J]. 岭南急诊医学杂志, 2025, 30(2): 239-241.
[3] Aster, A., Laupichler, M.C., Rockwell-Kollmann, T., Masala, G., Bala, E. and Raupach, T. (2024) ChatGPT and Other Large Language Models in Medical Education—Scoping Literature Review. Medical Science Educator, 35, 555-567. [Google Scholar] [CrossRef] [PubMed]
[4] 司圣波, 颜羽赫, 王英, 等. 医学生对生成式人工智能的认知、态度及意愿调查[J]. 中国医药导报, 2025, 22(22): 86-91.
[5] Skryd, A. and Lawrence, K. (2024) ChatGPT as a Tool for Medical Education and Clinical Decision-Making on the Wards: Case Study. JMIR Formative Research, 8, e51346. [Google Scholar] [CrossRef] [PubMed]
[6] D’Arrietta, L., Vangaveti, V., Crowe, M. and Malau-Aduli, B. (2025) The RISES Model: A New Approach to Promoting Health Professionals’ Motivation to Engage in Research. Journal of Multidisciplinary Healthcare, 18, 13-28. [Google Scholar] [CrossRef] [PubMed]
[7] 王晓强, 沈暘, 柯霞, 等. 基于ASSURE模型的慕课 + 微信教学法在耳鼻咽喉科学实践教学中的应用[J]. 中国高等医学教育, 2025(7): 92-94.
[8] 国家卫生健康委员会. “健康中国2030”规划纲要解读[M]. 北京: 人民卫生出版社, 2022.
[9] 雷波, 左蕊. 基于大数据与人工智能驱动的医学研究生创新教育模式研究与实践[J]. 创新教育研究, 2024, 12(7): 448-453.
[10] Quattrini, V., Roesch, A. and Kretz, D. (2023) Innovative Teaching Strategies in DNP Education Using ChatGPT. Nurse Educator, 49, E162-E163. [Google Scholar] [CrossRef] [PubMed]
[11] Kalam, K.A., Masoud, F.D., Muntaser, A., Ranga, R., Geng, X. and Goyal, M. (2025) ChatGPT as a Learning Tool for Medical Students: Results from a Randomized Controlled Trial. Cureus, 17, e85767. [Google Scholar] [CrossRef] [PubMed]
[12] Lim, B., Seth, I. and Rozen, W.M. (2023) The Role of Artificial Intelligence Tools on Advancing Scientific Research. Aesthetic Plastic Surgery, 48, 3036-3038. [Google Scholar] [CrossRef] [PubMed]
[13] Saluja, S. and Tigga, S.R. (2024) Capabilities and Limitations of ChatGPT in Anatomy Education: An Interaction with ChatGPT. Cureus, 16, e69000. [Google Scholar] [CrossRef] [PubMed]
[14] Liu, J., Wang, C. and Liu, S. (2023) Utility of ChatGPT in Clinical Practice. Journal of Medical Internet Research, 25, e48568. [Google Scholar] [CrossRef] [PubMed]
[15] Stretton, B., Kovoor, J., Arnold, M. and Bacchi, S. (2023) ChatGPT-Based Learning: Generative Artificial Intelligence in Medical Education. Medical Science Educator, 34, 215-217. [Google Scholar] [CrossRef] [PubMed]
[16] Tangsrivimol, J.A., Darzidehkalani, E., Virk, H.U.H., Wang, Z., Egger, J., Wang, M., et al. (2025) Benefits, Limits, and Risks of ChatGPT in Medicine. Frontiers in Artificial Intelligence, 8, Article 1518049. [Google Scholar] [CrossRef] [PubMed]
[17] 李跃萍, 宋辉, 王新月, 等. ASSURE模式在提升手术室新护士手术配合准备度中的应用[J]. 天津护理, 2024, 32(3): 330-334.
[18] Liu, X., Li, Q., Yan, X., Wang, L., Qiu, J., Yao, X., et al. (2025) A Specialized and Enhanced Deep Generation Model for Active Molecular Design Targeting Kinases Guided by Affinity Prediction Models and Reinforcement Learning. Journal of Chemical Information and Modeling, 65, 3294-3308. [Google Scholar] [CrossRef] [PubMed]
[19] Rana, A.M., Wiggin, H., DeGaetano, H., Wallace-Ross, J. and Jacobs, R.J. (2022) Formative Evaluation of Using Action Learning in a Master of Medical Education Assessment and Measurement Course. Cureus, 14, e26523. [Google Scholar] [CrossRef] [PubMed]
[20] Bicknell, B.T., Butler, D., Whalen, S., Ricks, J., Dixon, C.J., Clark, A.B., et al. (2024) ChatGPT-4 Omni Performance in USMLE Disciplines and Clinical Skills: Comparative Analysis. JMIR Medical Education, 10, e63430. [Google Scholar] [CrossRef] [PubMed]