1. 引言
在数字化时代,教育领域正经历深刻变革,高校教师肩负着提升教学质量、推动科研创新和高效管理学生的重任[1]。人工智能技术的发展,为教育领域带来了许多创新变革和实践应用的可能。其中,AI大语言模型的发展极大地推动了教育中各个领域的智能化[2]。虽然目前AI大语言模型技术在教育领域中的应用还处于刚刚起步阶段,但其发展趋势已经非常明显[3]。未来教育中,AI大语言模型将成为教师和学生的优秀助手,帮助他们更快、更准确地教授和学习知识[4]。
目前,随着AI大语言模型技术的快速发展,教育科研工作者在对AI大语言模型进行认知和理解的同时,也在教育领域里开展了一系列的实践应用探索。特别是2025年初,随着DeepSeek的横空出世,其开源和低成本硬件配置的特性,使得DeepSeek大模型被广泛应用于各行各业,并有很多成功案例[5]。近日,中国人民大学、北京师范大学、北京交通大学等高校发布消息,表示正在探索开展有关DeepSeek的实践应用,部分高校已在自主研发的教学课程平台中接入该大模型[6]。中国人民大学e问e答服务平台正式接入DeepSeek-R1,在北京高校中率先本地化部署该AI大模型,帮助师生一键解决各类需求。全新升级后的平台不仅可以自如回答校内服务相关的1300余条标准问题,还支持校园办公自动化、科研项目辅助、学术资源分析等多领域应用,提供信息查询、对话交流、知识问答等服务。北京师范大学利用该校培养方案、教学手册、教学大纲等高质量语料,为近万门课程本地化部署DeepSeek-R1大模型。登录智能“课程中心”,学业规划、知识问答、概念讲解、资源推荐、解题启发、论文润色等功能一目了然,为师生提供定制化、情境化的教学辅助,还支持学生的个性化与探究式学习需求。北京交通大学教学运行中心在智慧教学课程平台中全面接入DeepSeek-R1大模型,利用其在数学、代码、自然语言处理等方面的强大推理能力,帮助教师高效解决教学过程中各类复杂问题。该校表示,目前“深度思考”功能对全校教师开放,后续将逐步对学生开放,并上线更多功能。大语言模型化身为智能“助教”,为师生深度思考赋能。随着智能“助教”陆续上线,不少高校鼓励师生应用大模型赋能学习和生活。大语言模型是基于公共通用领域数据集训练出来的,对于授课内容并不了解,因此需要对大语言模型的回答做出一定的约束和指导。
目前,虽已有一些研究利用大语言模型构建问答机器人,辅助教学[7] [8],但是在教育领域未见有将大语言模型应用于医学AI课程的研究。本研究基于大语言模型应用开发平台Dify,利用大模型中的检索增强生成(Retrieval-Augmented Generation, RAG)技术[9],开发了一个基于DeepSeek-R1的教学大模型,专门回答笔者负责授课的《智能医疗技术》这门课的各类相关问题,为学生创造更优质、丰富的学习体验。本文是首次将大语言模型引入医学AI教育领域的研究,既是一次有益的尝试,也是对本领域空白的填补。
2. 方法
2.1. 大语言模型应用开发平台
开发大语言模型的应用需要一个软件平台。Dify是一个开源的LLM应用开发平台,能够帮助开发者快速构建并部署可用于生产环境的生成式AI应用[10]。平台通过可视化界面提供低代码开发体验,用户能够以拖拽方式设计工作流、管理提示词并集成知识库,从而降低开发AI应用的技术难度。Dify支持集成数百种开源和商业大语言模型(包括ChatGPT、DeepSeek等),内置强大的RAG引擎,能够处理多种格式的文档,提升模型回答的准确性和专业度。目前,Dify已广泛应用于智能客服、企业知识库、内容生成、政务服务及流程自动化等多个领域,有效提升了开发效率与业务智能化水平。Dify中包含多种可编辑的类型,我们计划构建一个用于存储课程课件并能够解答学生问题的系统,因此选择基于聊天助手来搭建课程助手。
整个课程AI助手的构建过程可以分为两步,一是构建《智能医疗技术》这门课的文本型知识库,将已有的课程PPT、课程参考材料、教材等做成大模型可以访问的知识库的形式,供大模型在回答问题时调用。二是通过Dify调用DeepSeek-R1模型,构建可以回答各类教学问题的《智能医疗技术》大模型。
在搭建课程助手的过程中,最重要的三个配置部分是提示词、知识库以及一些用于增强Web应用用户体验的功能。提示词用于约束AI输出的专业性和准确性;知识库则通过RAG技术为模型回答提供外部信息支持;其他功能则着重于优化用户与助手交互的界面和流程。
2.2. 优化提示词
提示词是与大语言模型进行交互的指令,其质量直接决定了模型输出的效果。设计和优化提示词的过程被称为提示词工程,其核心策略与实用技巧如下:
在策略层面,首先需要编写清晰、无歧义的指令,明确告知模型需要完成的任务。对于复杂任务,应将其拆解为一系列简单的子任务,这模仿了人类解决复杂问题的思维方式。此外,我们还可以要求模型展示其推理过程,例如通过“思维链”方式逐步解决问题,这相当于给了模型更多的思考时间,能提升答案的可靠性。在调试时,需要系统地测试不同提示词带来的输出变化,并通过人工或自动评估进行迭代优化。
在实用技巧层面,明确任务目标是首要原则,可以根据输出效果动态调整对内容深度和长度的要求。提示词可以遵循以下模板进行设计:为模型设定一个具体的角色(如“你是一名专业的智能医疗技术课程助手”),有效激活其相关知识库,使回答更专业;明确规定输出格式(如列表、表格、JSON对象),提升可读性,也便于后续自动化处理;提供少量输入输出示例的“少样本提示”,帮助模型快速掌握任务模式和风格要求。
2.3. 构建知识库
知识库作为RAG的核心部分,能够为模型提供外部知识,减少幻觉,提高回答准确性。在Dify中构建知识库时,我们为课程助手准备了教材内容,以文档形式导入,并进入分段配置环节。分段策略包括通用分段和父子分段,我们根据教材内容的特点选择了父子分段,以兼顾检索精度和上下文完整性。在索引方式上,我们选择了基于语义的高质量索引而非经济索引,以提升检索准确性。检索方式选用混合检索,经测试后设定语义检索与关键词检索的比例为7:3。参数方面,top K设为5,score阈值设为0.6,未开启重排序。
2.4. 辅助功能
为优化对话体验,我们启用了Dify平台自带的多个实用功能。变量模块可在对话前收集用户信息,用于个性化提示词和开场白;开场白功能会展示引导语,帮助用户快速了解助手能力。每次回答后,系统可自动推荐后续问题,辅助对话深入。平台还支持文本与语音的互相转换,方便用户通过语音输入或听取回答。此外,回答中会标注所引用的知识库内容,增强答案的可信度和可追溯性。
3. 基于大语言模型的课程助手设计实践
设计时使用以下技巧:策略上,指令清晰、任务拆解、让模型展示思考过程,并通过测试持续优化。技巧上,明确任务目标,用“角色 + 格式 + 示例”的结构让回答更专业、易用。以下是我们在构建聊天助手时编写提示词的一个例子。
1、角色
你是一名专为学习智能医疗技术课程的学生设计的助教助手,主要任务是帮助学生理解人工智能、大数据、物联网等技术在医疗领域中的应用原理与实现方案。你的语言风格需亲切、有耐心,避免过度学术化,能够将复杂的技术概念转化为易于理解的表述,适应不同基础水平学生的学习需求。
2、指令
1) 结合知识库的内容回答学生提出的专业问题。
2) 回答问题时需包含以下内容:
① 知识点摘要(1~2句话概括核心内容)。
② 技术原理(分点说明机制)。
③ 应用案例(如果知识库中有提到,列举实际场景,如医院名称、效果数据,否则不输出)。
3、示例
学生问题:“什么是基于混合推理的诊断决策支持系统?”
回答:
知识点摘要:基于混合推理的诊断决策支持系统通过结合规则推理(基于临床指南)和案例推理(基于历史病例),有效提升非典型疾病诊断的准确率,解决单一推理方法的局限性。
技术原理:
① 规则推理机制:利用临床指南构建知识库,将文本指南转化为可执行的推理规则(如IF-THEN形式),通过逻辑推理处理典型症状疾病(如明确分类的偏头痛)。
② 案例推理机制:通过历史病例库存储患者数据(如症状、体征),使用相似度计算(如加权求和公式)匹配新病例,并采用优化算法(如免疫粒子群算法)动态调整特征权重,处理症状重叠的非典型病例。
③ 混合集成策略:系统先进行规则推理,若结果置信度低(如相似度低于阈值0.8),自动切换到案例推理,实现“知识 + 数据”的串联互补,模拟临床医师的分析性与非分析性思维。
应用案例:
实际场景:在国内某三甲医院国际头痛中心(2013~2014年数据),该系统用于原发性头痛分诊,针对非典型症状患者(如“可能的偏头痛”)。
效果数据:
规则推理单独应用时,非典型偏头痛诊断召回率仅62.71%,精度78.76%。混合推理系统显著提升性能:召回率升至97.02% (提高34.31个百分点),精度达93.14% (提高7.09个百分点),且ROC曲线AUC值从0.661提升至0.983,证实其诊断准确率更高。
意义:该系统降低了误诊风险(如偏头痛误诊率从86.2%大幅改善),支持临床医师快速处理复杂病例。
4、约束
1) 避免使用未经证实的案例或虚构数据。
2) 若问题超出范围,需明确声明“本助手存储知识有限,更多问题请咨询任课教师”。
3) 复杂概念需用比喻或图示描述。
4. 系统展示
图1是本研究开发的《智能医疗技术》课程助手。用户可以以与其他大模型聊天的形式与其互动。可以问课程上的问题,课程助手在查阅知识库后,调用DeepSeek-R1大模型给出自然语言模式的回答。图1中所示为用户询问“什么是目标驱动推理?”,课程助手给予的回答。
Figure 1. Teaching assistant for the course “Intelligent Medical Technology” based on large language models
图1. 基于大语言模型的《智能医疗技术》课程教学助手
5. 讨论
从技术实现维度看,Dify的低代码开发特性与《智能医疗技术》课程问答助手的构建需求形成了显著适配性,这一适配性成为助手落地应用的核心支撑。一方面,Dify提供的可视化工作流编排功能,降低了AI应用开发的技术门槛——无需复杂的代码编写,即可完成“用户提问–意图识别–知识库匹配–模型生成回答”的全流程设计,这对于课程团队而言,大幅缩短了开发周期,仅需1~2周即可完成基础版本搭建,且后续可根据课程内容更新灵活调整工作流程。另一方面,Dify的多模型支持与RAG技术集成能力,精准匹配了《智能医疗技术》课程的知识特性,单一模型难以兼顾知识的专业性与多样性,而借助Dify可同时接入DeepSeek等多类模型,并通过RAG技术将课程教材、课件、行业标准等私有知识导入知识库,使助手回答既能依托通用模型的逻辑生成能力,又能锚定课程专属知识,有效避免了通用大模型“知识泛化”、“偏离课程范围”的问题。
从教学应用场景出发,该问答助手的价值主要体现在“个性化辅导补充”与“知识内化强化”两方面,但也受限于技术特性存在明显的应用边界。在个性化辅导层面,助手突破了传统课堂“教师–学生”模式下辅导资源有限的瓶颈:课程学习者常存在“碎片化学习需求”、“羞于提问”等问题,而助手可实现7 × 24小时响应,且支持多轮对话追问(如用户提问“什么是联邦学习?”,可进一步追问“联邦学习在慢性病管理中的应用案例”),形成“问题–解答–延伸”的闭环辅导。据初步用户反馈,82%的使用者认为助手帮助其解决了“课后即时性知识疑问”,弥补了课堂教学的时间空白。在知识内化层面,助手通过“场景化问答”强化了课程知识的实践关联——例如,在回答“智能监护设备的数据传输协议”时,助手会结合课程中的“远程医疗系统架构”知识点,补充“协议选择对数据实时性与安全性的影响”,引导学习者从“记忆知识点”转向“理解知识应用逻辑”,这与《智能医疗技术》作为“技术 + 应用”交叉课程的教学目标高度契合。
但需正视的是,助手在复杂教学场景中仍存在明显局限。其一,由于传统RAG技术依赖静态top-k检索,仅能返回与查询字面最相似的片段,无法满足高阶思维的全局需求,在“高阶思维培养”场景中作用有限:该课程的核心目标之一是培养学习者“AI医疗方案设计能力”(如针对某类疾病设计AI辅助筛查方案),这类问题需结合临床需求、技术可行性、伦理风险等多维度综合分析,而助手当前仅能基于知识库内容提供“要素罗列”(如方案需包含数据来源、模型选择、验证方法),无法像教师一样引导学习者进行“需求拆解–方案权衡–风险评估”的深度思考,易导致学习者陷入“知识堆砌而无整合能力”的困境。可借助混合知识库检索(融合文本知识库与知识图谱)实现深层次的逻辑推理和数据关联,解决高阶思维推理局限。其二,在“知识动态更新”场景中响应滞后:《智能医疗技术》领域技术迭代速度快,而助手的知识库更新依赖人工上传新资料、重新构建检索索引,存在1~2周的更新周期,导致部分前沿技术内容无法及时纳入回答。因此,需要任课教师每年至少及时更新一次知识库,有条件的可以多更新几次,使得系统回答可以跟上人工智能技术的发展。
未来,随着《智能医疗技术》课程教学对“AI辅助工具”需求的深化,这类问答助手有望向“个性化学习伴侣”方向发展:通过分析学习者的提问记录、错题情况,构建“个人知识图谱”,自动识别知识薄弱点,推送针对性的学习资源与问答内容,实现“千人千面”的教学辅助。同时,需警惕“技术依赖”风险——助手始终应定位为“教师的辅助工具”,而非替代教师在“高阶思维培养”、“价值引导”等方面的核心作用,唯有实现“技术工具”与“教师主导”的协同,才能真正推动《智能医疗技术》课程教学质量的提升。
6. 结论
本文介绍了一种基于Dify和大语言模型DeepSeek构建的课程教学答疑助手构建方法。凭借Dify的低代码、多模型支持、RAG集成等特性,在“降低开发门槛”、“补充个性化辅导”、“强化知识内化”等方面展现出显著价值,有助于学生在课下进行复习、自学,为智能医疗教育领域的教学工具创新提供了可行的实践方式。
基金项目
1) 2025年度上海理工大学教师发展研究项目,DeepSeek大语言模型赋能的医学人工智能类课程教学研究与实践(编号:CFTD2025YB18);
2) 2025年度上海理工大学教师发展研究项目,AI赋能医工交叉专业人才培养课程体系优化新范式探索(编号:CFTD2025ZD08)。