1. 引言
人工智能技术在过去的几十年里已经广泛渗透进工业、军事、医疗、教育、管理等诸多领域,并深刻地影响着社会的发展。大语言模型是人工智能技术的重要分支,简称大模型。它基于大量通用数据和专业领域知识数据构建的人工智能预训练模型实现对人类自然语言的表征、模拟和理解,可以应用于文本生成、数据标注、文本分类、知识问答、代码生成及机器翻译等领域,承担着人类自然语言和人工智能其他技术应用之间的桥梁作用[1]。该领域的相关研究开始于20世纪40年代,并随着人工智能技术的整体发展而起落。2022年11月,美国OpenAI公司发布了ChatGPT,标志着大语言模型进入了大规模实际应用阶段。此后,一系列类似产品如Claude、Gemini、LLaMA、I-JEPA、PaLM2、文心一言、讯飞星火、盘古等如雨后春笋般纷纷涌现。2024年12月,中国自主开发的DeepSeek-V3以极低的模型训练成本和比肩ChatGPT的性能荣登世界大模型排行榜的榜首,更是将该领域的技术发展推向了全新的高度[2]。人工智能对人类技能的巨大超越正在对全世界造成震撼。
大型语言模型的发展促进了社会的变革,为教育领域带来了巨大的机遇和挑战。当前的大模型经过海量数据的训练已经建立起丰富的知识库并具有强大的信息处理能力,能够根据学习者的个体情况规划最优学习路径,辅助教学人员构建富有互动性和吸引力的学习环境。因此,大模型用于教育场景可以极大地提高学习效率和教学质量,为教育领域带来重大变革[3]。国际和国内针对大学生的调查研究表明,逾半数的受访学生已经在使用或正考虑采用相关技术来完成作业和辅助科研工作[4] [5]。教育界在肯定大模型提高了学习效率和教学质量的同时,普遍对由此可能带来的学生对大模型的过度依赖性、对学术诚信和原创性的挑战等问题表示担忧。如何调整教学模式、教师角色的转变和能力提升问题、如何验证和确保大模型的知识输出的准确性、评价体系的重构问题、学术诚信和原创性的调整问题等,已经成为高等教育所要面临的普遍问题。在此基础上,中医药学科由于历史传承和不同于现代科学的研究方法等情况,还进一步面临着传统知识理解和研究方法革新等特殊问题。探讨大模型对中医药高等教育的冲击与应对策略,已经成为当前亟待研究的课题。
2. 大语言模型在国内外高等教育中的应用和研究状况
2.1. 国外相关情况
由于大模型技术在国外尤其是欧美各国的先发优势,国外对于大模型在高等教育领域的应用研究起步早、发掘深、探索广,引领着世界的潮流。Nature期刊发表文章指出,大语言模型正在重塑教育事业,包括学生的学习方式、教师的教学方法以及教育平台的设计等[3]。哈佛大学的一项研究表明,87.5%的哈佛大学学生已在日常学习中使用大语言模型如ChatGPT等,表明大模型正逐渐成为大学生学术生活的核心组成部分[6]。一项在英国进行的涵盖2555名本科生与研究生的调查结果显示,逾半数的受访学生已经在使用或正考虑采用相关技术来完成作业[4]。
在大模型对现代高等教育形成广泛而巨大的冲击的形势下,广大学者探讨了不同专业领域借助大模型助力大学教育的经验和教训。Bewersdorff等[7]分析了大模型在科学类课程教学中的作用,指出大模型可以方便地输出文本、语音、视频类的资料,提供了学习过程中个性化的互动过程,并能有效评估学生的学习效果和给出反馈,从而将科学类课程的教学引入新时代。但是,大模型在教学中的应用也带来了数据隐私保护和伦理学等方面的问题。综合考虑,大模型对于传统教学模式应该发挥补充而不是替代作用。Bernabei等[8]研究了大语言模型如ChatGPT等用于工程类大学课程教学的作用。研究发现,学生借助大模型能够生成高质量的研究论文,而现有的大模型识别系统并不能可靠地识别大模型生成的论文,所以需要对大模型在高等教育环境中采取有所限制性的使用,并密切关注领域内的发展以对使用政策及时重新评估,以取得大模型应用中利弊的平衡。此外,该研究发现,学生在开始使用大模型时普遍迷信其可靠性,经过使用经验的积累后逐渐发现大模型有时会输出不正确的信息,由此意识到教师在学习中的必要性和遵守大模型使用规范的重要性。Lee等[9]介绍了其研究组开发和测试一个用于艺术鉴赏教学的专用大模型LLaVa-docent的情况。该模型基于GPT-4,采用多模态信息审查技术克服了传统教学中可鉴赏资源少的问题。经测试发现,该模型显著提升了使用者的学习积极性,增强了艺术鉴赏教育的普及性。Ling等[10]介绍了该研究组开发和测试一个基于大语言模型的用于辅助教学的自动问答题库系统的过程。该系统在一门本科生的课程(计算机编程语言)和两门研究生课程(大数据与NoSQL数据库;企业计算与ERP系统)进行测试并经过用户评价,表明其能够高效可靠地支持学生的课程学习。
2.2. 国内相关情况
因应人工智能技术的发展和对世界的改变,教育部高度重视大语言模型的发展,于2024年3月启动实施了人工智能大模型应用示范行动,以推动我国创造教育领域的专有大模型[11]。2024年4月,教育部又公布了首批18个“人工智能 + 高等教育”应用场景典型案例,作为相关工作探索实践的参考和借鉴[12]。在这一系列政策的指引下以及大语言模型技术快速发展的刺激下,国内关于大模型在高等教育领域的应用研究一直如火如荼地开展着。关于大语言模型在学生中的应用情况,我国一项针对研究生的实证研究揭示,过半数的调查对象在学习和科研中使用ChatGPT,“双一流”建设高校研究生使用ChatGPT的频率高于普通高校研究生[5]。关于大语言模型辅助教学的研究,我国也一直紧随国际发展的潮流。陈垚等[13]提出了一种融合开源计算软件OpenSees和大模型技术的教学改革方案,用于土木工程专业的核心基础课程“结构力学”的教学。该教学方案显著提升了课程的教学效果,激发了学生的学习兴趣,有效克服了传统教学中存在理论与实践脱节、教学方法单一等问题,为工程专业的教学改革提供了新的实践路径。吕臻等[14]从医学研究生教学的角度探讨了以ChatGPT为代表的大语言模型在论文撰写中的应用价值与存在的挑战。该研究围绕文献检索、辅助数据统计分析、优化论文结构和上下文逻辑、辅助检查语法和语言润色、提供个性化信息资料和指导等方面展开分析,从信息筛选、独立思考和创新能力培养、人文素养培训、恪守学术伦理、变化隐私和信息安全等方面对医学论文的撰写提供了建议,以帮助研究生更高效地利用大语言模型同时规避其潜在的风险。徐文博等[15]选用“护理学(师)基础知识”真题和“基础护理学(本科)”课程考试题,对比了三种大语言模型(ChatGPT、文心一言、讯飞星火)在护理课程考核中的应用表现,并比较其与学生的考试成绩差异。研究发现,在护理学基础知识的掌握程度上三种大语言模型能力相当,答案准确率均超过90%,但在护理知识的应用能力方面,其准确率均较低且存在差异。此外,大语言模型在内容生成速度、使用便捷性和使用限制性等方面均表现良好。该研究表明,大语言模型在解答基础知识题目方面具有优势,但在需要知识应用或独立思考的问题上存在局限性。此外,在大模型辅助计算机专业[16]-[20]、新闻专业[21]、会计专业[22]等不同学科的教学、学生实验技能的培养[16] [23]以及高校辅导员工作[24]等方面,国内学者也积极开展了大量研究。
2.3. 中医药领域研究
总结上述国内外关于大模型在高等教育领域的应用研究,可以发现大模型的应用研究目前已经覆盖了高等教育的很多学科和领域。具体地,对于中医药这一具有悠久历史同时蕴含丰富的哲学和艺术特色的学科方向,目前已经出现了一些中医药领域的大模型[25],但是关于大模型在中医药高等教育领域的具体应用和效果评估研究目前还非常匮乏。公开文献中可以检索到的只有孙利平等[26]对于大语言模型赋能中医药研究生科研能力的策略研究。该研究介绍了中医药研究生在科研能力方面的现状,并提出运用大语言模型可以帮助学生优化知识检索、辅助实验设计、增强数据分析能力以及提升论文撰写质量。
如同在其他领域一样,大模型为中医药院校高等教育带来了前所未有的机遇与挑战。通过深入研究大模型对中医药高等教育的冲击及其应对策略,不仅可以提升中医药教育的质量和效率,还能为其他传统学科的教育改革提供参考。
3. 对中医药领域相关研究规划的思考
大语言模型技术在过去的几年里发展非常迅猛,在全社会还没有对它的横空出世和快速蔓延做好准备的情况下,它就已经冲击到人们生活和工作的方方面面。作为全社会知识密集的高等学校,也面临同样的处境。一方面,大语言模型正在重塑教育事业,包括学生的学习方式、教师的教学方法以及教育平台的设计等[3]。另一方面,逾半数的高校学生已经在使用或正考虑采用大模型技术来完成作业[4] [5]。教育界在肯定大模型对提高学习效率和教学质量的同时,普遍对由此可能带来的学生对大模型的过度依赖性、对学术诚信和原创性的挑战等问题表示担忧。一些大学因此选择了保守的立场,禁止或限制大模型类工具的使用,而另一些大学例如哈佛大学却秉持更加开放的态度[6]。实际上,禁止或限制大模型类工具的做法在实际执行中很难落实,因为到目前为止还没有能够有效检测作业中大模型使用情况的工具[4]。
在大模型已经广泛影响社会生活各方面的大趋势下,采取消极抵触的态度是无济于事的。堵不如疏,对学生使用大模型进行积极有效的引导,才是解决问题的正确途径。为此,教育界需要研究与此相关的一系列问题,包括如何调整教学模式、教师角色的转变和能力提升问题、如何验证和确保大模型的知识输出的准确性、评价体系的重构问题、学术诚信和原创性的调整问题等。这些问题是不同专业高等教育所要面临的共同问题。在此基础上,中医药高等教育还有着特殊性:其一、中医药不仅仅是一门科学,更是科学、传统哲学和艺术的有机结合,体现在对其中所涉及的阴阳、五行、气血等微妙精深的概念的理解,以及遣方用药需要针对不同患者的个体情况灵活把握,其运用之妙存乎一心;其二、中医药历经数千年的发展,造成中医药文献不但浩如烟海,而且不同时期以及不同作者的著作中常存在词汇和论述的含义方面的较大差异,并进一步形成了中医药的标准化问题。比如,“气”作为中医的核心概念,可指代“元气”(生命本源)、“营气”(营养输布)等不同实体,其内涵远超现代医学的生理学范畴,涵盖生命能量、物质基础、功能状态等多重维度[27]。这种哲学抽象性导致其难以被形式化语言精准捕获,现有自然语言处理模型在语义解析时易陷入“一词多义”的困境。全面描述“气”的概念则需要构建中医哲学本体论知识库,引入描述时序逻辑与因果推理的动态关系网络以刻画“气”与“血”、“津液”等的交互关系,从多模态知识融合的角度将“气”的抽象概念转化为可计算的符号(如“阴阳平衡”量化为[0, 1]区间值),并关联临床图像(如舌象图谱)与脉象波形数据,构建跨模态知识图谱[28]。另外,现有的大模型因为前期训练所用数据集的差异、使用场景的不同等因素,在用于中医药领域时表现出不同程度的局限性。比如,我们曾选取《徐灵胎医书全集》[29]中的一则典型病案:“男患,冬天时就诊,性格暴躁,腹部有一结块,年余,上颚蚀损,左关脉洪数,按则偏弦紧,余脉沉细弱”,将该病案输入DeepSeek (V3.2)、通义千问(Qwen-3Max)、豆包(网页版)、Kimi (V1.5)这四个当前主流大模型中进行分析。各模型均认为该病案的核心病机为肝火夹瘀,结而成积,日久耗伤气血阴阳,致成上盛下虚、寒热错杂、本虚标实之证,但在分析的全面性和治疗建议方面存在差异。其中,大模型1辩证较为全面、准确,强调了疾病严重程度,指出应补充舌象、腹部结块的大小、软硬、活动度等信息以进一步辅助诊断,并指出应结合西医诊断方式,先排除恶性病变可能,在用药上给出了清晰的建议,并指出应禁用大苦大寒之品如龙胆泻肝汤等,在预防调护上指出绝对忌怒。但是,大模型1基本上只侧重于辨证论治,没有从辨病的角度指出属于什么病(癥瘕积聚)。大模型2先从辨病的角度指出该病案属“癥积”范畴,然后条理性地进行了辨证分析,但分析的深度不及大模型1,而且未能指出患者的严峻情况。大模型2用药上同大模型1差不多。大模型3在治疗方面建议采用先治标后治本,予以龙胆泻肝汤等,但此时患者身体已不耐攻伐,用龙胆泻肝汤病情反而可能加剧病情,所以大模型3在此问题上出现错误。大模型4辨证不够深入,没有指出病情的严重程度,用药推荐方面也不如其他大模型。中医药所涉及的这些特殊问题对大模型这样基于通用数据和现代专业领域知识数据的技术形成了新的挑战。研究大模型对中医药高等教育的冲击与应对策略,需要在关注大模型改变各现代专业学科教育并借鉴相关研究成果的同时,探讨中医药学科对大模型技术的特殊要求及其对中医药高等教育的影响。
3.1. 对研究内容的思考
研究大模型对中医药高等教育的冲击和应对策略,可以从以下几个方面展开:
1) 大语言模型在中医药研究生教育中的应用现状分析:调查中医药高等教育中大语言模型的应用情况,包括使用频率、应用场景及效果评估。在此基础上,总结大语言模型在知识传播、个性化学习等方面的优势,同时识别其可能引发的问题,如知识权威性不足、学术诚信风险等。
2) 中医药高等教育的核心需求与大模型技术匹配性研究:深入研究中医药高等教育的特点,包括理论学习、临床实践、科研能力培养等核心需求。分析大语言模型的功能特性与中医药教育需求之间的匹配程度,明确技术应用的重点领域。
3) 大语言模型对中医药高等教育的冲击与挑战:探讨大语言模型如何改变传统教学模式,分析其对师生互动、课程设计等方面的深远影响。研究学生在使用大语言技术工具过程中可能出现的学术不端行为及其成因。评估大语言模型输出内容的准确性和权威性,特别是在中医药专业知识领域的适用性。
4) 基于大语言模型的教学模式优化:传统的课堂教学模式难以满足个性化学习需求,而大语言模型可以提供定制化学习路径和即时反馈。结合传统教学方法与大语言技术,设计适合中医药高等教育的混合教学模式。利用大语言模型为学生提供个性化的学习建议和资源推荐,提升学习效率。探索如何通过AI模拟真实场景,帮助学生提高中医药临床实践和科研创新能力。当前的评价体系可能无法全面反映学生的综合能力。借助于大模型,探索多维度评价指标和AI辅助评价方法,用以更科学地评估学生的学习成果,促进公平性和公正性。
5) 学术诚信保障机制建设:随着AI工具的普及,学术诚信问题日益突出。调研检测大语言模型生成内容的技术工具,用于辅助教师识别学生作业或论文中的大语言技术痕迹。研究针对大语言技术使用的学术规范和管理政策,引导学生正确使用大语言技术工具。
6) 教师能力提升与角色转变:在大语言模型广泛应用的时代,教师的角色不再是传统意义下单纯的知识传授者,而是转变为人工智能赋能下的学习引导者和评估者。高等教育需要探索教学策略的调整以适应新的教育环境。
上述的研究均与大模型在其他现代学科专业的应用研究存在很大程度的共性问题,因此可以彼此对照,相互借鉴。第2、3、4、6个方面的研究中涉及中医药学科特色的内容则需要结合中医药传统技术的特点进行开拓性研究。
3.2. 对实施方法的思考
上述研究的具体实施方法可以采用以下:
1) 文献检索:持续查阅中国知网、Pubmed、Web of Science等文献数据库,研读研究者对于大模型在高等教育领域的应用研究和现状分析,为本项目的研究提供理论支撑并跟踪领域内的最新研究动态。
2) 问卷调查:设计调查问卷并获取所需的伦理批准,对中医药大学的学生和老师进行问卷调查,了解师生对于大模型在中医药教学科研中的使用情况并进行统计分析。
3) 典型范例访谈:走访对使用大模型持不同态度(反对、无所谓、拥护)的师生,听取这些典型范例中师生对于大模型的认识程度、使用情况、使用的感受、遇到的问题、对大模型与中医药结合的点评、以及对未来的期望等详细情况。
4) 理论学习:阅读关于大模型的专业书籍,理解大模型的工作机理和技术实现详情。
5) 小组讨论:研究组开展学术讨论,共同分析调查研究的结果,相互交流理论学习的认识和心得,探讨大模型在中医药高等教育中的潜力、技术实现、存在的问题和应对措施等。
6) 试点实验:选取部分对大模型应用于中医药大学教育有兴趣但是还没有深入尝试的师生,对他们进行大模型使用的适当培训,跟踪和记录他们使用前后的工作学习情况及变化,听取他们的感受和意见,以评价大模型对他们的正面和负面的影响。
4. 总结
中医药作为我国的国粹,历经数千年的发展,拥有深厚的文化基础和群众基础。党中央和国务院长期以来高度重视中医药的发展并从政策上、资源上给予多方扶持。近年来因应人工智能技术的迅速发展,国家对于人工智能技术和产业的发展给予高度重视,多次印发文件以推进人工智能在我国的开发和应用。近年来生成式人工智能和大语言模型的迅猛发展和快速推广已经有力地影响到社会生活的方方面面,深刻地冲击到包括中医药学科在内的不同专业高等教育。在此形势下,本文简略地总结了大语言模型在国内外高等教育领域的应用和研究状况,并针对大语言模型应用于中医药高等教育中需要着重关注的研究内容和实施方法提出了设想。开展这些研究,可以有力地推动中医药教育现代化,促进教学模式创新,提升学术诚信水平,助力教师角色转变,优化评价体系,为中医药高等教育揭开新的篇章。
基金项目
本研究由陕西中医药大学研究生质量提升工程研究生教育教学改革创新项目(JGCX202511)资助。
NOTES
*通讯作者。