基于大语言模型的医学人工智能类课程AI教学助手开发与实践
Development and Practice of AI Teaching Assistants for Medical Artificial Intelligence Courses Based on Large Language Models
DOI: 10.12677/ces.2025.1311913, PDF, HTML, XML,    科研立项经费支持
作者: 尹梓名, 何 宏, 任浩冉, 林 勇:上海理工大学健康科学与工程学院,上海
关键词: 医学人工智能大语言模型人才培养DeepSeekArtificial Intelligence in Medicine Large Language Model Talent Cultivation DeepSeek
摘要: 在AI大语言模型赋能教育的背景下,针对通用大模型对课程知识不熟悉的问题,本研究基于DeepSeek-R1模型,结合RAG技术,以Dify低代码平台为基础,通过优化提示词(设定角色、明确格式)、构建课程知识库(导入教材等资料)等手段,构建了《智能医疗技术》课程AI答疑教学助手。该课程助手可7 × 24小时响应,支持多轮追问,82%使用者认可其解决课后即时疑问的价值,还能强化知识应用理解。研究指出其在高阶思维培养、知识更新上尚有局限,未来可向个性化学习伴侣发展。该方法显著降低开发门槛,为医学人工智能教育工具创新提供了一种有效的实践模式。
Abstract: Against the backdrop of education empowered by AI large language models (LLMs), and in response to the issue that general-purpose large models are not familiar with course-specific knowledge, this study, based on the DeepSeek-R1 model, integrates Retrieval-Augmented Generation (RAG) technology and takes the Dify low-code platform as the foundation. Through measures such as optimizing prompts (setting roles, clarifying formats) and constructing a course knowledge base (importing teaching materials and other resources), an AI Q&A teaching assistant for the “Intelligent Medical Technology” course has been built. This course assistant can provide 24/7 responses and support multi-turn follow-up questions. Eighty-two percent (82%) of users recognize its value in resolving immediate post-class doubts, and it can also enhance the understanding of knowledge application. The study points out that it still has limitations in the cultivation of higher-order thinking and knowledge updating, and can develop into a personalized learning companion in the future. This method significantly lowers the development threshold and provides a new paradigm for the innovation of educational tools in medical artificial intelligence.
文章引用:尹梓名, 何宏, 任浩冉, 林勇. 基于大语言模型的医学人工智能类课程AI教学助手开发与实践[J]. 创新教育研究, 2025, 13(11): 633-639. https://doi.org/10.12677/ces.2025.1311913

1. 引言

在数字化时代,教育领域正经历深刻变革,高校教师肩负着提升教学质量、推动科研创新和高效管理学生的重任[1]。人工智能技术的发展,为教育领域带来了许多创新变革和实践应用的可能。其中,AI大语言模型的发展极大地推动了教育中各个领域的智能化[2]。虽然目前AI大语言模型技术在教育领域中的应用还处于刚刚起步阶段,但其发展趋势已经非常明显[3]。未来教育中,AI大语言模型将成为教师和学生的优秀助手,帮助他们更快、更准确地教授和学习知识[4]

目前,随着AI大语言模型技术的快速发展,教育科研工作者在对AI大语言模型进行认知和理解的同时,也在教育领域里开展了一系列的实践应用探索。特别是2025年初,随着DeepSeek的横空出世,其开源和低成本硬件配置的特性,使得DeepSeek大模型被广泛应用于各行各业,并有很多成功案例[5]。近日,中国人民大学、北京师范大学、北京交通大学等高校发布消息,表示正在探索开展有关DeepSeek的实践应用,部分高校已在自主研发的教学课程平台中接入该大模型[6]。中国人民大学e问e答服务平台正式接入DeepSeek-R1,在北京高校中率先本地化部署该AI大模型,帮助师生一键解决各类需求。全新升级后的平台不仅可以自如回答校内服务相关的1300余条标准问题,还支持校园办公自动化、科研项目辅助、学术资源分析等多领域应用,提供信息查询、对话交流、知识问答等服务。北京师范大学利用该校培养方案、教学手册、教学大纲等高质量语料,为近万门课程本地化部署DeepSeek-R1大模型。登录智能“课程中心”,学业规划、知识问答、概念讲解、资源推荐、解题启发、论文润色等功能一目了然,为师生提供定制化、情境化的教学辅助,还支持学生的个性化与探究式学习需求。北京交通大学教学运行中心在智慧教学课程平台中全面接入DeepSeek-R1大模型,利用其在数学、代码、自然语言处理等方面的强大推理能力,帮助教师高效解决教学过程中各类复杂问题。该校表示,目前“深度思考”功能对全校教师开放,后续将逐步对学生开放,并上线更多功能。大语言模型化身为智能“助教”,为师生深度思考赋能。随着智能“助教”陆续上线,不少高校鼓励师生应用大模型赋能学习和生活。大语言模型是基于公共通用领域数据集训练出来的,对于授课内容并不了解,因此需要对大语言模型的回答做出一定的约束和指导。

目前,虽已有一些研究利用大语言模型构建问答机器人,辅助教学[7] [8],但是在教育领域未见有将大语言模型应用于医学AI课程的研究。本研究基于大语言模型应用开发平台Dify,利用大模型中的检索增强生成(Retrieval-Augmented Generation, RAG)技术[9],开发了一个基于DeepSeek-R1的教学大模型,专门回答笔者负责授课的《智能医疗技术》这门课的各类相关问题,为学生创造更优质、丰富的学习体验。本文是首次将大语言模型引入医学AI教育领域的研究,既是一次有益的尝试,也是对本领域空白的填补。

2. 方法

2.1. 大语言模型应用开发平台

开发大语言模型的应用需要一个软件平台。Dify是一个开源的LLM应用开发平台,能够帮助开发者快速构建并部署可用于生产环境的生成式AI应用[10]。平台通过可视化界面提供低代码开发体验,用户能够以拖拽方式设计工作流、管理提示词并集成知识库,从而降低开发AI应用的技术难度。Dify支持集成数百种开源和商业大语言模型(包括ChatGPT、DeepSeek等),内置强大的RAG引擎,能够处理多种格式的文档,提升模型回答的准确性和专业度。目前,Dify已广泛应用于智能客服、企业知识库、内容生成、政务服务及流程自动化等多个领域,有效提升了开发效率与业务智能化水平。Dify中包含多种可编辑的类型,我们计划构建一个用于存储课程课件并能够解答学生问题的系统,因此选择基于聊天助手来搭建课程助手。

整个课程AI助手的构建过程可以分为两步,一是构建《智能医疗技术》这门课的文本型知识库,将已有的课程PPT、课程参考材料、教材等做成大模型可以访问的知识库的形式,供大模型在回答问题时调用。二是通过Dify调用DeepSeek-R1模型,构建可以回答各类教学问题的《智能医疗技术》大模型。

在搭建课程助手的过程中,最重要的三个配置部分是提示词、知识库以及一些用于增强Web应用用户体验的功能。提示词用于约束AI输出的专业性和准确性;知识库则通过RAG技术为模型回答提供外部信息支持;其他功能则着重于优化用户与助手交互的界面和流程。

2.2. 优化提示词

提示词是与大语言模型进行交互的指令,其质量直接决定了模型输出的效果。设计和优化提示词的过程被称为提示词工程,其核心策略与实用技巧如下:

在策略层面,首先需要编写清晰、无歧义的指令,明确告知模型需要完成的任务。对于复杂任务,应将其拆解为一系列简单的子任务,这模仿了人类解决复杂问题的思维方式。此外,我们还可以要求模型展示其推理过程,例如通过“思维链”方式逐步解决问题,这相当于给了模型更多的思考时间,能提升答案的可靠性。在调试时,需要系统地测试不同提示词带来的输出变化,并通过人工或自动评估进行迭代优化。

在实用技巧层面,明确任务目标是首要原则,可以根据输出效果动态调整对内容深度和长度的要求。提示词可以遵循以下模板进行设计:为模型设定一个具体的角色(如“你是一名专业的智能医疗技术课程助手”),有效激活其相关知识库,使回答更专业;明确规定输出格式(如列表、表格、JSON对象),提升可读性,也便于后续自动化处理;提供少量输入输出示例的“少样本提示”,帮助模型快速掌握任务模式和风格要求。

2.3. 构建知识库

知识库作为RAG的核心部分,能够为模型提供外部知识,减少幻觉,提高回答准确性。在Dify中构建知识库时,我们为课程助手准备了教材内容,以文档形式导入,并进入分段配置环节。分段策略包括通用分段和父子分段,我们根据教材内容的特点选择了父子分段,以兼顾检索精度和上下文完整性。在索引方式上,我们选择了基于语义的高质量索引而非经济索引,以提升检索准确性。检索方式选用混合检索,经测试后设定语义检索与关键词检索的比例为7:3。参数方面,top K设为5,score阈值设为0.6,未开启重排序。

2.4. 辅助功能

为优化对话体验,我们启用了Dify平台自带的多个实用功能。变量模块可在对话前收集用户信息,用于个性化提示词和开场白;开场白功能会展示引导语,帮助用户快速了解助手能力。每次回答后,系统可自动推荐后续问题,辅助对话深入。平台还支持文本与语音的互相转换,方便用户通过语音输入或听取回答。此外,回答中会标注所引用的知识库内容,增强答案的可信度和可追溯性。

3. 基于大语言模型的课程助手设计实践

设计时使用以下技巧:策略上,指令清晰、任务拆解、让模型展示思考过程,并通过测试持续优化。技巧上,明确任务目标,用“角色 + 格式 + 示例”的结构让回答更专业、易用。以下是我们在构建聊天助手时编写提示词的一个例子。

1、角色

你是一名专为学习智能医疗技术课程的学生设计的助教助手,主要任务是帮助学生理解人工智能、大数据、物联网等技术在医疗领域中的应用原理与实现方案。你的语言风格需亲切、有耐心,避免过度学术化,能够将复杂的技术概念转化为易于理解的表述,适应不同基础水平学生的学习需求。

2、指令

1) 结合知识库的内容回答学生提出的专业问题。

2) 回答问题时需包含以下内容:

① 知识点摘要(1~2句话概括核心内容)。

② 技术原理(分点说明机制)。

③ 应用案例(如果知识库中有提到,列举实际场景,如医院名称、效果数据,否则不输出)。

3、示例

学生问题:“什么是基于混合推理的诊断决策支持系统?”

回答:

知识点摘要:基于混合推理的诊断决策支持系统通过结合规则推理(基于临床指南)和案例推理(基于历史病例),有效提升非典型疾病诊断的准确率,解决单一推理方法的局限性。

技术原理:

① 规则推理机制:利用临床指南构建知识库,将文本指南转化为可执行的推理规则(如IF-THEN形式),通过逻辑推理处理典型症状疾病(如明确分类的偏头痛)。

② 案例推理机制:通过历史病例库存储患者数据(如症状、体征),使用相似度计算(如加权求和公式)匹配新病例,并采用优化算法(如免疫粒子群算法)动态调整特征权重,处理症状重叠的非典型病例。

③ 混合集成策略:系统先进行规则推理,若结果置信度低(如相似度低于阈值0.8),自动切换到案例推理,实现“知识 + 数据”的串联互补,模拟临床医师的分析性与非分析性思维。

应用案例:

实际场景:在国内某三甲医院国际头痛中心(2013~2014年数据),该系统用于原发性头痛分诊,针对非典型症状患者(如“可能的偏头痛”)。

效果数据:

规则推理单独应用时,非典型偏头痛诊断召回率仅62.71%,精度78.76%。混合推理系统显著提升性能:召回率升至97.02% (提高34.31个百分点),精度达93.14% (提高7.09个百分点),且ROC曲线AUC值从0.661提升至0.983,证实其诊断准确率更高。

意义:该系统降低了误诊风险(如偏头痛误诊率从86.2%大幅改善),支持临床医师快速处理复杂病例。

4、约束

1) 避免使用未经证实的案例或虚构数据。

2) 若问题超出范围,需明确声明“本助手存储知识有限,更多问题请咨询任课教师”。

3) 复杂概念需用比喻或图示描述。

4. 系统展示

图1是本研究开发的《智能医疗技术》课程助手。用户可以以与其他大模型聊天的形式与其互动。可以问课程上的问题,课程助手在查阅知识库后,调用DeepSeek-R1大模型给出自然语言模式的回答。图1中所示为用户询问“什么是目标驱动推理?”,课程助手给予的回答。

Figure 1. Teaching assistant for the course “Intelligent Medical Technology” based on large language models

1. 基于大语言模型的《智能医疗技术》课程教学助手

5. 讨论

从技术实现维度看,Dify的低代码开发特性与《智能医疗技术》课程问答助手的构建需求形成了显著适配性,这一适配性成为助手落地应用的核心支撑。一方面,Dify提供的可视化工作流编排功能,降低了AI应用开发的技术门槛——无需复杂的代码编写,即可完成“用户提问–意图识别–知识库匹配–模型生成回答”的全流程设计,这对于课程团队而言,大幅缩短了开发周期,仅需1~2周即可完成基础版本搭建,且后续可根据课程内容更新灵活调整工作流程。另一方面,Dify的多模型支持与RAG技术集成能力,精准匹配了《智能医疗技术》课程的知识特性,单一模型难以兼顾知识的专业性与多样性,而借助Dify可同时接入DeepSeek等多类模型,并通过RAG技术将课程教材、课件、行业标准等私有知识导入知识库,使助手回答既能依托通用模型的逻辑生成能力,又能锚定课程专属知识,有效避免了通用大模型“知识泛化”、“偏离课程范围”的问题。

从教学应用场景出发,该问答助手的价值主要体现在“个性化辅导补充”与“知识内化强化”两方面,但也受限于技术特性存在明显的应用边界。在个性化辅导层面,助手突破了传统课堂“教师–学生”模式下辅导资源有限的瓶颈:课程学习者常存在“碎片化学习需求”、“羞于提问”等问题,而助手可实现7 × 24小时响应,且支持多轮对话追问(如用户提问“什么是联邦学习?”,可进一步追问“联邦学习在慢性病管理中的应用案例”),形成“问题–解答–延伸”的闭环辅导。据初步用户反馈,82%的使用者认为助手帮助其解决了“课后即时性知识疑问”,弥补了课堂教学的时间空白。在知识内化层面,助手通过“场景化问答”强化了课程知识的实践关联——例如,在回答“智能监护设备的数据传输协议”时,助手会结合课程中的“远程医疗系统架构”知识点,补充“协议选择对数据实时性与安全性的影响”,引导学习者从“记忆知识点”转向“理解知识应用逻辑”,这与《智能医疗技术》作为“技术 + 应用”交叉课程的教学目标高度契合。

但需正视的是,助手在复杂教学场景中仍存在明显局限。其一,由于传统RAG技术依赖静态top-k检索,仅能返回与查询字面最相似的片段,无法满足高阶思维的全局需求,在“高阶思维培养”场景中作用有限:该课程的核心目标之一是培养学习者“AI医疗方案设计能力”(如针对某类疾病设计AI辅助筛查方案),这类问题需结合临床需求、技术可行性、伦理风险等多维度综合分析,而助手当前仅能基于知识库内容提供“要素罗列”(如方案需包含数据来源、模型选择、验证方法),无法像教师一样引导学习者进行“需求拆解–方案权衡–风险评估”的深度思考,易导致学习者陷入“知识堆砌而无整合能力”的困境。可借助混合知识库检索(融合文本知识库与知识图谱)实现深层次的逻辑推理和数据关联,解决高阶思维推理局限。其二,在“知识动态更新”场景中响应滞后:《智能医疗技术》领域技术迭代速度快,而助手的知识库更新依赖人工上传新资料、重新构建检索索引,存在1~2周的更新周期,导致部分前沿技术内容无法及时纳入回答。因此,需要任课教师每年至少及时更新一次知识库,有条件的可以多更新几次,使得系统回答可以跟上人工智能技术的发展。

未来,随着《智能医疗技术》课程教学对“AI辅助工具”需求的深化,这类问答助手有望向“个性化学习伴侣”方向发展:通过分析学习者的提问记录、错题情况,构建“个人知识图谱”,自动识别知识薄弱点,推送针对性的学习资源与问答内容,实现“千人千面”的教学辅助。同时,需警惕“技术依赖”风险——助手始终应定位为“教师的辅助工具”,而非替代教师在“高阶思维培养”、“价值引导”等方面的核心作用,唯有实现“技术工具”与“教师主导”的协同,才能真正推动《智能医疗技术》课程教学质量的提升。

6. 结论

本文介绍了一种基于Dify和大语言模型DeepSeek构建的课程教学答疑助手构建方法。凭借Dify的低代码、多模型支持、RAG集成等特性,在“降低开发门槛”、“补充个性化辅导”、“强化知识内化”等方面展现出显著价值,有助于学生在课下进行复习、自学,为智能医疗教育领域的教学工具创新提供了可行的实践方式。

基金项目

1) 2025年度上海理工大学教师发展研究项目,DeepSeek大语言模型赋能的医学人工智能类课程教学研究与实践(编号:CFTD2025YB18);

2) 2025年度上海理工大学教师发展研究项目,AI赋能医工交叉专业人才培养课程体系优化新范式探索(编号:CFTD2025ZD08)。

参考文献

[1] 王春娟, 解萧语, 李馥佳. 生成式人工智能赋能教育数字化变革: 理论、现状与对策[J/OL]. 智库理论与实践: 1-14. https://www.chndoi.org/Resolution/Handler?doi=10.19318/j.cnki.issn.2096-1634.20250213.0007, 2025-09-25.[CrossRef
[2] 纳里曼∙法瓦丁, 李荷. 人工智能将如何重塑世界与大学教育[J]. 教育国际交流, 2025(3): 10-13.
[3] 胡姣. 大语言模型赋能数据驱动教学决策的模型构建与应用研究[D]: [博士学位论文]. 上海: 华东师范大学, 2024.
[4] 姜文印, 刘宸宇, 王宇兴, 等. 大语言模型在大学物理实验课程中的应用探究[J]. 大学物理, 2025, 44(7): 36-44+77.
[5] 杨满福, 桑新民. 从Deep-Learning到DeepSeek: 人工智能赋能大学功能范式重构的挑战、转型与新生态[J]. 现代教育技术, 2025, 35(4): 5-13.
[6] 王洲. 多所高校上线DeepSeek, 为师生深度思考赋能[EB/OL].
https://www.peopleapp.com/column/30048331796-500006107630, 2025-09-25.
[7] 卢宇, 余京蕾, 陈鹏鹤. 基于大模型的教学智能体构建与应用研究[J]. 中国电化教育, 2024(7): 99-108.
[8] 吴林静, 王瑾洁, 向雪琳. 面向主题的智能问答机器人对学习过程和学习结果影响的实证研究[J]. 数字教育, 2023, 9(3): 1-7.
[9] 华子荀, 王炜, 廖绿优, 等. 生成式人工智能RAG路径赋能课程设计: 课程小语言模型构建与教学实践[J]. 广东第二师范学院学报, 2025, 45(5): 31-44.
[10] 曹建辉. 基于Dify知识库的TSW2500型发射机智能辅助系统设计与应用[J]. 网络安全和信息化, 2025(6): 76-79.