1. 引言
医学教育正经历着从传统的经验传授型模式向数据驱动的智能赋能模式所发生的系统性转变[1]。由于人工智能技术的快速发展,AI智能体凭借着它那强大的环境感知、自主决策以及执行任务的能力,为解决医学教育中知识总量指数级增长与教学资源有限、标准化培养与个性化需求之间的核心矛盾提供了创新路径。早在2019年,欧洲医生常务委员会就已经强调了将人工智能系统纳入医学教育课程体系的必要性[1]。就目前的情况来看,基于大语言模型的AI智能体已经在医学教育的多个场景里展现出巨大潜力,从基础医学知识的传授,到临床技能的培养,再到继续医学教育,已经形成了一个相当完整的应用链条[1] [2]。本综述旨在系统梳理AI智能体在国内医学教育领域的研究进展,分析其功能分类、应用场景、技术实现路径及未来发展趋势,为推动医学教育数字化转型提供理论参考和实践指导。
2. 资料与方法
2.1. 文献检索策略
检索自建库至2026年2月发表于中国知网(CNKI)、万方数据库、维普数据库,各数据库检索式根据具体语法规则进行调整,采用布尔逻辑运算符(AND/OR)进行组合检索。中文检索词包括“人工智能”“AI”“智能体”“AI智能体”“大语言模型”“医学教育”“护理教育”“临床教学”“基础医学教育”“护理教学”“护理学”。本研究采用规范的系统文献综述方法,对国内相关文献进行全方位的检索。
2.2. 文献的纳入和排除标准
1) 纳入标准:① 研究对象为医学生、护理生、在职医务人员等;② 研究主题聚焦于AI智能体、大语言模型或相关人工智能技术在医学教育、护理教育、临床教学中的应用;③ 研究类型包括原创性研究、综述、案例报告、教学改革实践;④ 文献发表语言为中文。
2) 排除标准:① 仅提及人工智能但未涉及教育应用的文献;② 单纯技术开发而未应用于教学实践的文献;③ 非学术性文献如新闻报道、会议摘要、专利等;④ 重复发表或无法获取全文的文献。
2.3. 文献筛选、数据提取与分析
将检索到所有文献题录导入到NoteExpress软件中去除重复文献,由2名经过循证课程培训研究者,按照纳入和排除标准,2人独立阅读题目、摘要进行初步筛选,再阅读全文进行复筛;若两人存在意见分歧,双方先讨论,无法统一时则与第3位研究者讨论决定,确定是否纳入该文献。
2.4. 文献检索结果
初步检索数据库获得354篇文献,去除重复文献85篇后得到269篇文献,根据纳入和排除标准,通过阅读题目和摘要后剔除不符合标准文献180篇,阅读全文后剔除研究对象不符、研究类型不符、研究内容不符和无法获取全文文献60篇,最终纳入29篇文献筛选流程图见图1。
Figure 1. Flow chart of document screening
图1. 文献筛选流程图
3. 人工智能在医学教育领域的发展
3.1. 国际发展脉络与前沿趋势
国际医学教育与人工智能的融合受到政策与技术双重驱动。美国于2009年通过《经济与临床健康信息技术法案》,强制推广电子健康记录(EHR)系统,构筑医学大模型数据底座,奠定其医学AI的领先发展[3]。2023年,世界医学教育联合会(WFME)更新了《世界医学教育联合会医学教育质量全球改进标准》(WFME Global Standards for Quality Improvement of Medical Education),强调医学教育学习需要得到虚拟现实、人工智能等新兴信息技术的支持[4]。2016年谷歌研发的视网膜图像识别深度学习算法在糖尿病视网膜病变诊断中达到接近眼科专家的水平,成为AI辅助诊断的标志性成果[3] [5]。2020年GPT-3发布后,以大语言模型为代表的新技术迅速渗透医学教育各环节[3] [6] [7]。谷歌推出的Med-PaLM系列模型在医学问题解答中展现专家级能力并于2023年通过美国医疗执照考试,佛罗里达大学开发的GatorTron模型则专注于电子健康记录的教学应用[3] [4]。当前国际研究热点集中于机器学习、精准医疗、预测分析、数字疗法及联合学习等领域,哈佛大学、斯坦福大学、梅奥诊所等机构持续引领这一方向,《NPJ Digital Medicine》《Medical Teacher》等高影响力期刊已成为成果发布的重要平台[8]。
3.2. 国内研究现状
置身于国际浪潮之中,国内医学教育领域的AI应用起步虽稍晚,但发展势头迅猛。政策层面,2018年教育部发布《高等学校人工智能创新行动计划》,2024年国家卫生健康委联合多部门印发卫生健康行业人工智能应用场景参考指引,为医学教育智能化转型提供政策保障[3] [4]。研究力量方面,北京大学、清华大学、复旦大学等依托交叉学科优势成为重要推动者。北京大学发布的MedSeekAI 2.0作为全国首款面向医学教育全场景的学科大模型,率先实现校内本地化部署,标志着我国医学教育智能化迈入安全可信新阶段[3]。清华大学智能产业研究院开发的Agent Hospital系统通过多智能体模拟真实医疗环境,为临床训练提供创新平台[3]。
3.3. 中外对比与差距分析
将国内研究置于国际背景下审视,仍可发现若干差距。针对技术原创性,国际顶尖机构在底层模型研发中占据主导,国内研究较多集中在应用层面对现有模型进行微调优化,自主可控的医学AI基础模型仍相对匮乏[3]。在数据基础方面,美国依托政策强制构建了大规模标准化医疗数据库,而我国医疗数据“孤岛”现象依然明显,标准不统一、共享机制不完善制约高质量训练数据获取[3] [5]。评价体系上,国际上已形成成熟的医学AI教育效果评估框架,随机对照试验等高标准设计被广泛采用,国内研究则较多停留在可行性验证层面,缺乏多中心、前瞻性教育干预研究支撑[3] [4] [9]。在应用均衡性方面,当前国内AI应用仍主要集中在临床医学领域,公共卫生与预防医学、护理学等方向的应用相对有限,整体发展尚不均衡[7]。认识这些差距有助于更清晰地把脉未来着力点,在保持政策支持力度与应用场景丰富度优势的同时,加强基础研究与数字基础设施建设,完善循证评价体系,推动医学教育智能化迈向更高水平。
4. AI智能体的功能分类
4.1. 教学辅助型
教学辅助型的AI智能体是以教师角色为基本出发点,为学生提供个性化学习支持和智能指导,这类智能体往往具备较强的知识整合能力及多轮对话特征,还能够根据学生的需求快速整合知识框架,因此能很好地帮助学生掌握比较复杂的医学概念[10]。在系统解剖学实验课中,智谱清言AI智能体贯穿BOPPPS教学的多个环节,从课前导入、课中参与式学习到课后评价都予以充分介入,有效解决了传统“填鸭式”教学中师生互动不足的问题[10]。有研究数据表明,使用AI智能体辅助教学之后,高达94.89%的学生认为该工具对课程内容的理解有切实帮助[1]。此外,在药学导论课程中,AI智能体通过课前准备(个性化推荐)、课中实施(引导教学)、课后反馈(数据收集与点评)三阶段模式实现精准教学,尤其在课前阶段,智能体能从知识库中快速、准确地提取内容生成预习材料,让学生们能够带着问题进入到课堂[11]。在PBL项目式教学中,AI智能体通过多智能体(诊断、规划、咨询等角色)的分工合作,实现教学过程自动化,并能根据学生的实时表现动态调整学习计划,有效缓解了传统项目式教学中教师需求量大、个性化指导不足的问题[12]。除此之外,教学辅助型智能体实际上还承担着学习伙伴的角色,通过与学生的深度交互来培养其自主学习能力及批判性思维,为学生构建特定领域的认知框架提供元认知层面的支持[1]。
4.2. 评估反馈型
评估反馈型AI智能体实现了从单一终结性评价向多元化过程性评价的自然转变。这类智能体通过对学生学习数据做实时采集和分析,再据此给出精准、即时的反馈,从而帮助学生及时地对学习策略做出调整。在病理学PBL案例教学中,基于学习通平台的AI辅助系统能够对学生的回答进行详细的分析,并提供针对知识点掌握情况及逻辑结构完整性的明确反馈[13]。研究对比显示,观察组学生的作业内容通常能够达到12~18页,远超对照组的2~4页,AI反馈在提升学习深度方面起到显著作用[13]。在口腔颌面外科学教学中,语音交互式的AI智能体通过对学生提问记录和答题表现的分析,动态调整推送内容,实现个性化评价[14]。更为重要的是,评估反馈型智能体不仅关注最终结果,它还会特别重视对学习过程的轨迹追踪,从而为教师提供全面详细的学习数据分析[13],基于数据驱动的评估模式将医学教育中的评价从主观经验的判断,转向了客观的量化分析,评价的公正性和有效性也得到了切实提高。
4.3. 资源整合型
资源整合型的AI智能体通过构建多维度的知识网络,打破学科壁垒,从而实现对医学教育资源的系统性集成。这类智能体可以把教材、文献、临床案例及虚拟仿真操作等异构资源整合为一体,形成一套结构化的知识体系[15] [16]。神经病学课题组在教学中充分利用AI智能体建立了一个包含教材、试题、临床案例以及思政案例的多元化知识库,并且还导入了神经影像学、脑电图图谱和肌电图学图谱等多学科内容,从而为学生构建了全方位的知识支持体系[17]。而在中医药教育中,多模态智能体系统又把中医古籍、临床医案、诊疗视频还有脉象图谱等进行融合,构建了独具中医特色的智能化教育体系[18]。资源整合型智能体的核心优势,主要体现在其强大的知识检索能力和关联能力上,这些能力能够帮助学生快速建立跨学科的知识联系,有利于培养系统思维[15]。例如,基于检索增强生成技术的智能问答系统,不仅能够提供准确的答案,还能根据上下文进行多轮对话,模仿真人面对面沟通效果[19] [20],这种资源整合模式有效解决了医学教育中知识碎片化和学科割裂的问题,为培养复合型医学人才奠定了基础。
5. 医学教育的细分领域
5.1. 基础医学教育
基础医学教育是医学体系的根基,在系统解剖学教学中,传统教学模式常面临理论知识内容抽象、实验教学兴趣不足等挑战[10],智谱清言AI智能体通过参与式学习设计令学生课前借助智能体尝试执医考试题目,体现了“两性一度”中的高阶性、创新性和挑战度[10]。面向基础医学拔尖人才培养,AI智能体借助搭建“医学 + X”交叉学科课程,完成从知识传授型向探索研究型教育的转变[1]。在面向基础医学拔尖人才的科研素养训练中,智能体依托“无菌术”章节构建“课前智能导学–课中引导教学–课后数据循证”三段式教学模式,有效提升了学生对基础医学知识的理解深度[1]。药理学教学同样在人工智能应用中获得助益,基于智能体辅助的混合式教学模式,学生在资源构建、教学设计、教学活动开展及教学评价等环节的表现均得到改善[15]。
5.2. 临床技能培训
临床技能培训作为医学教育核心环节,在口腔颌面外科学教学中,语音交互式AI智能体通过构建虚拟临床情境、模拟患者反馈,提升课堂参与度与教学适配性[14]。神经病学教学中AI智能体与“Doctor You”等辅助问诊、诊断平台结合,由此在模拟场景中引导学生进行针对性学习,不仅加深其对理论知识的理解并且提高临床思维能力[17]。虚拟仿真技术的应用进一步拓展临床培训边界,即借助Immunesim、Labster等平台,学生可开展免疫学与分子生物学实验模拟训练[17],这类训练有助于深化对疾病机制的理解,为精准临床决策奠定基础。AI智能体在临床培训中既关注技能掌握又注重人文关怀和职业精神培养,临床见习和实习环节通过标准化病人模拟诊疗、教学查房等方式,为培养高素质医学人才提供全面支撑。
5.3. 护理与康复领域
健康教育领域基于大语言模型的多智能体系统通过知识普及智能体、健康计划智能体、沟通协调智能体等模块协同工作,实现患者教育全流程智能管理[21]。老年尿路结石患者健康教育中,智能问答系统应用后,观察组在知识及时性、知识可得性、知识易理解性、知识全面性、内容趣味性及感知有效性等方面的评分均显著高于对照组[19]。抗菌药物合理使用教育中,基于大语言模型的咨询教育处方智能体可智能解析处方信息,自动生成个性化健康教育内容,增强患者对抗菌药物的理解[22]。卒中患者出院用药教育同样引入生成式AI大语言模型构建的智能体系统,能够根据患者病历信息快速生成个性化的用药指导和生活方式建议,经临床药师评估,生成内容准确可靠[23]。肝胆外科术后护理中,基于Coze平台的管道宣教智能体通过构建结构化知识库与对话流程,为患者提供24小时在线个性化管道护理指导,显著提高了患者的自我护理能力,并有效降低了管道相关并发症的发生风险[20]。
护理教育中智能体的应用同样取得了积极进展。研究者基于Coze平台构建了循证护理知识问答智能体,通过整合《循证护理学》教材并采用RAG技术,能够为护理学生提供专业、准确的即时问答支持[24]。多智能体仿真技术通过构建虚拟场景模拟养老照护、慢病管理等复杂情境,令学生在安全可控的环境中提升临床决策能力与资源协调能力[25]。
AI智能体的应用还拓展至康复治疗与特殊教育领域并且与护理实践形成互补。一项针对孤独症儿童会话能力的干预研究,创新地将对话式AI与特殊同伴介入法结合,AI智能体以开朗健谈的同伴身份出现,为孤独症儿童创设低压力的会话练习环境,而经过适当培训的特殊同伴则在旁提供辅助和情感支持,为未来培养能够运用AI技术进行特殊教育和康复治疗的医学人才提供了新思路[26]。
6. 技术实现与工具
6.1. 自然语言处理应用
自然语言处理(Natural Language Processing, NLP)技术是AI智能体实现人机交互的基础,基于大语言模型的智能体具备强大的语言理解和生成能力,可处理医学专业术语中所蕴含的复杂语义关系,实现精准知识传递[27] [28]。解剖学教学中所用的智谱清言AI智能体利用自然语言处理技术,将晦涩解剖学知识转化为易于理解的表述,帮助学生克服学习障碍[10]。临床问诊模拟中语音交互式AI智能体将语音识别与语义理解技术相结合,能够实时解析学生语音输入并提供即时反馈,使其更贴近真实临床场景[14]。作为NLP领域的重要突破,RAG技术通过引入私有化知识库检索机制,显著增强了智能体的语义理解与知识整合能力,从而有效解决了通用大模型在处理专业医学问题时可能出现的“幻觉”问题[24] [27]。在护理健康教育场景中所采用的NLP技术驱动的智能问答系统借助语义理解及上下文建模技术,不仅能够准确解析常规健康宣教问题,还能在复杂多轮对话中持续追踪患者意图,实现个性化、互动式的健康教育服务[20] [28]。
6.2. 机器学习模型
机器学习模型是AI智能体实现智能决策和提供个性化服务的技术核心[29],医学教育领域中各类机器学习算法的应用涵盖学习行为分析、知识图谱构建及个性化推荐等场景[15] [30],而深度学习模型特别是大语言模型(Large Language Model,简称LLM)的出现,为智能体提供了强大的知识表示和推理能力[31]。口腔颌面外科学教学中所设计的基于机器学习的语音AI智能体能够根据学生的学习表现动态调整教学内容及难度,实现了真正意义上的自适应教学[14]。多智能体系统通过与机器学习模型的深度耦合,可构建更宏观的健康管理服务体系。例如,有研究基于机器学习算法驱动多智能体协同,设计了一套可信自主健康管理服务系统,该系统完整模拟公民从检前咨询到检后健康管理的全过程,最终为用户提供贯穿全生命周期的个性化健康管理服务[32]。卫生政策教学领域中,嵌入机器学习算法的多智能体仿真模型被用于模拟分级诊疗系统运行,研究者通过设置不同干预策略(如调整报销比例、增加基层医疗资源),利用机器学习模型预测这些策略对患者就医选择及医疗资源利用效率的影响[33],为卫生政策教学评估提供直观量化工具[34]。知识空间理论为智能体个性化推荐提供理论支撑,基于该理论的机器学习算法通过分析学生知识掌握状态构建个性化学习路径[30]。病理学PBL教学中机器学习模型能够对学生学习过程进行精细分析,识别知识薄弱点并提供针对性改进建议[13]。联邦学习等分布式机器学习技术的应用在保护数据隐私的同时可以实现多机构间模型协同训练,为构建更大规模医学教育智能体奠定基础[29]。
6.3. 多模态交互技术
多模态交互技术通过整合文本、语音、图像、视频等多种信息载体,为医学教育提供更丰富的感知与表达方式。解剖学教学中智能体将文字描述与三维解剖模型、手术视频等多种内容有机融合,帮助学生构建多维度知识表征[10]。口腔颌面外科学教学中语音交互式AI智能体与虚拟现实技术结合,实现了视觉、听觉与触觉的多模态交互,极大提升了临床技能培训的沉浸感及真实感[14]。中医药教育中多模态交互技术的应用更加成熟,智能体系统将文字、图像、视频及传感器数据等加以融合,通过多通道感知与表达支撑“教学–实训–评价”全流程的沉浸式学习体验[16] [18]。扩展现实技术的应用进一步拓展多模态交互边界,借助创建虚拟临床环境为学生提供安全且可控的实践平台[30]。
7. 讨论
本综述系统分析了AI智能体在医学教育领域的研究进展,同时也发现了若干关键问题与挑战。
在技术应用层面,尽管AI智能体展现出巨大潜力,但其可靠性仍有一定的局限性,当前大语言模型在提供参考文献方面存在缺陷,有时将错误信息当作事实陈述,这严重限制其作为学习工具的可用性[1]。在伦理安全层面,患者隐私保护和数据安全是必须优先考虑的问题。多方协作中的数据共享与权限管理缺乏规范,可能导致敏感信息泄露风险加剧。此外训练数据中的偏差可能对少数族裔或边缘化群体造成不公平待遇,由此加剧医疗资源分配不平等。有学者从伦理智能体角度指出智能体的设计应超越简单工具定位,需要自上而下地嵌入伦理规则或自下而上地从社会环境中学习道德规范,进而形成人机协同的道德决策模式[2] [35]。评价体系层面目前缺乏完善的医疗智能体评价标准,大部分研究仍基于静态数据集测试而非动态仿真与实际临床场景的多维度评估,这种局限性使我们难以全面了解智能体在复杂医疗实践中的真实效能。学生对AI智能体的接受程度存在差异,过度依赖AI辅助可能削弱学习主观能动性,若在临床实践中过度依赖AI诊断建议则可能导致临床思维“空心化”[1]。
从应用深度来看,当前AI智能体在医学教育中的应用仍处于探索阶段,多数案例聚焦辅助性功能而尚未成为教育体系核心组成部分。教师角色转变同样不容忽视——AI智能体的有效整合需要教师具备较强教学设计能力与技术理解力,这要求建立完善的教师培训与支持机制[14]。不同学科应用深度存在显著差异,基础医学教育应用相对成熟而继续医学教育应用仍面临诸多挑战。面对AI技术的快速发展,护理等医学专业人才的培养也迎来了新的变革,有研究指出需通过优化课程体系、搭建校内外实践平台等方式培养既精通护理专业又能驾驭智能医疗设备的“技术融合型”人才[36]。
尽管存在上述问题但AI智能体在医学教育中的价值不可否认,它不仅提升了教学效率和质量,更推动了教育模式的创新和变革。未来研究应聚焦构建人机协同教育框架,在发挥AI智能体优势的同时保持人类教师主导地位,同时需加强跨学科合作以整合教育学、计算机科学、医学等多学科力量,共同解决技术及伦理挑战。
8. 结论
AI智能体作为医学教育数字化转型的核心驱动力,正深刻改变传统教育模式和生态。本综述基于系统的文献分析,从AI智能体的功能分类、医学教育的细分领域、技术实现与工具三个方面总结了AI智能体的核心特征,并进一步阐述了其应用前景,尽管在技术瓶颈、伦理争议和缺乏评估标准等方面仍存在许多障碍,但此类工具在促进教育资源普及、激发创新思维萌芽及支持终身学习体系等方面已展现出不可忽视的潜力。
展望未来,AI智能体或将催生出“无边界医学院”与“动态课程宇宙”。届时,实体课堂可能被由AI驱动的全息数字孪生患者与虚拟临床环境取代,学习者可以随时“浸入”任何时空的医疗场景进行决策演练。人机关系将从“使用与被使用”演进为“协同进化”,智能体不再是被动工具,而是扮演“认知伙伴”或“苏格拉底式诘问者”的角色,主动挑战学生的思维定式,甚至在伦理困境中与学生进行价值辩论。这种深度耦合可能模糊“教”与“学”的界限,使教育演变为一场师生与AI共同探索未知领域的持续对话,最终实现技术对人性化照护能力的反哺与超越。因此医学教育工作者需要积极适应时代变化,提高数字素养和AI胜任力,并共同构建新的医学教育生态,培养出新时代兼具专业能力和人文情怀的医学人才。
基金项目
2025年国家大学生创新创业训练计划项目“伦理沙盒”——基于精神科伦理冲突事件学习微场景的类人智能体的开发与应用(项目编号:202513287014)。
NOTES
*通讯作者。