1. 引言
专业课程是高等教育与职业教育传递学科核心知识的核心载体,其知识体系呈现强逻辑性、层级化关联与跨模块依赖的典型特征,例如数学中“极限”是“导数”的前置基础(PrerequisiteFor),数据结构中“链表”为“二叉树遍历”提供实现支撑(Supports),《人工智能》中“神经网络”是“深度学习”的子类(IsA)。然而,传统的课程知识组织方式(如教材的线性章节、课件的碎片化呈现)难以捕捉知识点间的隐性语义关联与动态逻辑依赖,导致学习者难以建立系统性知识体系,智能教学系统也无法实现精准的知识推荐、漏洞诊断与路径规划。如何高效组织、表示与推理专业课程知识,成为智能教育领域亟待解决的核心问题。
知识图谱(Knowledge Graph, KG)作为结构化知识表示的范式,通过“实体–关系–属性”的三元组模型(如(极限,PrerequisiteFor,导数)、(链表,Supports,二叉树遍历))精准建模专业课程知识的拓扑结构与语义关联,为课程知识的体系化组织提供了基础框架。近年来,深度学习技术的快速发展进一步赋能专业课程知识图谱的能力边界:图神经网络(Graph Neural Networks, GNNs)通过邻居节点聚合捕捉知识点的局部层级依赖,Transformer模型能建模跨课程模块的长距离知识交互,知识图谱嵌入(Knowledge Graph Embedding, KGE)将课程实体与关系映射到低维语义空间以实现高效匹配,多模态深度学习则可融合课件文本、视频讲解、代码示例等多源教学资源的知识表示。这些技术的融合,为解决专业课程知识的隐性关联推理、多模态融合、动态更新等问题提供了新路径。
尽管基于深度学习的专业课程知识图谱研究已取得初步进展(如课程知识点嵌入、先修关系推理、学习路径生成),但现有工作仍存在显著局限:1) 场景针对性不足:多数研究聚焦于泛教育知识图谱(如通用知识点关联),未充分挖掘专业课程的学科特异性(如《计算机组成原理》中“指令系统”对“CPU设计”的底层支撑);2) 技术适配性模糊:深度学习技术(如GNN、Transformer)与专业课程知识图谱的任务需求(如先修关系的时序推理、例题与知识点的关联)缺乏系统性的适配分析;3) 应用落地碎片化:现有应用多集中于单一环节(如知识点推荐),未形成“知识构建F表示–推理–应用”的全流程闭环。这些问题导致专业课程知识图谱的研究与教学实践存在“脱节”,亟需一份聚焦领域特性、梳理技术脉络的系统性综述。
鉴于此,本文针对基于深度学习的专业课程知识图谱这一主题展开系统性研究,旨在梳理该领域的核心问题、技术路径与应用场景,为后续研究提供清晰的学术图景。本文的主要贡献如下:
领域聚焦的系统性综述:首次针对专业课程知识图谱的特定场景,系统梳理“深度学习技术与课程知识图谱”的融合路径,涵盖从知识图谱构建(课程实体识别、关系抽取)、表示学习(GNN/Transformer/KGE)到推理与应用(学习路径规划、智能答疑)的全流程,填补了泛教育知识图谱与专业课程场景之间的研究gap。
课程-specific分类体系:提出专业课程知识图谱的层级化分类框架:在知识图谱层面,按课程知识的粒度划分为“概念–定理–例题–课程模块”四层实体,按学科逻辑定义“PrerequisiteFor (先修)、IsA (层级)、AppliesTo (应用)、Supports (支撑)”四类核心关系;在深度学习技术层面,按任务适配性划分为“结构建模(GNN)、长程关联(Transformer)、语义嵌入(KGE)、多模态融合(Multimodal DL)”四大类,明确不同技术对课程知识场景的适配边界(如GNN适用于捕捉知识点的层级依赖,Transformer适用于跨课程模块的知识交互)。
Figure 1. Overview of research on professional course knowledge graph based on deep learning
图1. 基于深度学习的专业课程知识图谱研究总览图
新兴方向的全面覆盖:重点讨论专业课程知识图谱的特色新兴方向,包括:1) 时序知识推理:基于时序GNN建模课程先修关系的动态演化(如“微积分”对“概率论”的前置依赖随学习阶段的深化);2) 多模态知识融合:通过多模态Transformer联合表示课件文本、视频讲解与代码示例的知识;3) 个性化知识应用:基于深度学习的学习者知识状态(如“未掌握极限”)与课程知识图谱的匹配推理,实现精准的学习路径推荐。
教学应用与未来展望:总结基于深度学习的专业课程知识图谱在智能教学中的典型应用场景(个性化学习路径规划、知识点漏洞检测、智能答疑系统、实验教学指导),并从领域知识深度融合、多模态知识表示、动态知识更新、教育场景适配四大维度提出未来研究方向,为技术落地提供实践指导。
本文其余部分组织如图1所示:第二章详细论述基于深度学习的专业课程知识图谱研究的国内外现状;第三章探讨基于深度学习的专业课程知识图谱研究方法与原理;第四章总结未来研究方向并得出结论。
2. 基于深度学习的专业课程知识图谱研究的国内外现状
专业课程知识图谱是学科核心知识与教育场景需求的交叉产物,其研究围绕“课程知识的体系化组织、深度学习的技术赋能、教育任务的精准支撑”三大核心展开。贺超波等[1]系统梳理了课程知识图谱的研究脉络,指出其发展源于传统课程本体建模与现代知识图谱技术的融合,近期则因深度学习的引入进入快速演进阶段。本章基于这一脉络,从国内外研究脉络、核心概念与特征、研究分类框架、现有局限性四个维度,系统梳理该领域的研究现状,并与现有综述对比说明本文的聚焦方向。
2.1. 国内外研究脉络梳理
专业课程知识图谱的研究源于课程知识结构化需求与知识图谱技术发展的双向驱动,其历程可分为三个阶段。
2.1.1. 早期探索:课程知识的符号化本体构建(2010~2016年)
早期研究聚焦于课程知识的本体(Ontology)构建,以符号化方式描述知识点的层级关系与学科逻辑,为后续知识图谱构建奠定基础。
国外方面:MIT OCW团队[2]于2012年构建了首套课程知识点Ontology,通过“概念–子类–属性”模型定义《计算机科学》课程的“数据结构→链表→双向链表”等层级关系,该本体为课程知识的结构化组织提供了早期范式;斯坦福大学的“Education Ontology Project”[3]进一步扩展了课程知识的语义维度,纳入“先修关系(Prerequisite)”、“应用场景(ApplicationScenario)”等教育属性,强调本体对个性化学习的支撑。
国内方面:清华大学[4]于2019年启动精品课程知识Ontology建设,针对基础课程,手工标注了1.2万条知识点三元组(如(导数,PrerequisiteFor,积分)),为国内课程知识图谱的构建奠定了数据基础。
2.1.2. 中期发展:知识图谱范式的引入(2017~2020年)
随着通用知识图谱(如DBpedia、Freebase)的成熟,研究开始将知识图谱范式引入课程知识建模,重点解决知识点关联的显性化问题[5]。
国外方面:Coursera团队[6]于2018年发布Course Knowledge Graph,涵盖全球1200门课程的5万余个知识点,通过(课程,HasTopic,知识点)、(知识点,PrerequisiteFor,知识点)三元组支撑课程推荐,是首个面向大规模在线课程的知识图谱;Google Education [7]于2019年提出“Knowledge Graph for Learning Paths”,利用知识图谱的拓扑结构生成个性化学习路径,强调图谱对学习过程的动态支撑。
国内方面:“中国大学MOOC”团队[8]于2020年构建了大规模中文课程知识图谱,覆盖5000门课程、20万余个知识点,支持“知识点漏洞诊断”等功能,成为国内在线教育领域知识图谱的标杆;浙江大学吴飞等[9]针对《人工智能引论》课程,构建了“算法–理论–应用”三层知识图谱,首次将神经网络、深度学习等前沿知识点纳入体系,突出课程知识的时效性。
2.1.3. 快速演进:深度学习的融合赋能(2021~至今)
深度学习技术的普及打破了传统知识图谱“符号化推理”的局限,推动专业课程知识图谱向语义化、动态化、个性化方向发展。
国外研究:
表示学习:Han等[10]首次将图神经网络(GNN)应用于课程知识图谱,通过邻居节点聚合捕捉《人工智能》课程中“极限→导数→微分”的局部层级依赖,开启了深度学习与课程知识图谱的融合研究;Yang等[11]提出GraphSAGE-based课程知识点嵌入模型,通过采样邻居节点解决大规模课程知识图谱的可扩展性问题,在Coursera图谱上的链接预测准确率达89%。
推理方法:Zhang等[12]用强化学习(RL)构建“学习路径导航Agent”,在知识图谱中搜索《高等数学》的最优学习顺序(如“极限→导数→微分→积分”),实验表明该方法生成的路径比传统规则方法提升了22%的学习效率;Liu等[13]提出Transformer-based跨课程知识推理模型,通过自注意力机制捕捉《机器学习》与《数据结构》的跨模块关联(如“神经网络”与“矩阵运算”),跨课程知识匹配准确率达91%。
国内研究:
知识构建:王等[14]结合CRF与BiLSTM模型,实现《数据结构》课程中“链表”、“二叉树”等实体的自动识别,F1值达87%,准确率较传统方法提升18%;李等[15]用BERT-ERNIE模型抽取《高等数学》中的“先修关系”,召回率达92%,解决了传统方法对隐性关系抽取不足的问题。
应用落地:“智慧树”平台[16]基于课程知识图谱推出“智能学习路径规划”功能,覆盖1000门课程,用户学习效率提升25%,成为国内教育知识图谱落地的典型案例;北京航空航天大学[17]针对《飞行力学》课程,构建多模态知识图谱(融合文本教材、视频讲解、仿真代码),支撑实验教学的精准指导,实验报告错误率降低30%。
2.2. 专业课程知识图谱的核心概念与特征
专业课程知识图谱是“学科知识逻辑” + “教育场景需求”的特殊知识图谱,需兼顾学科知识的严谨性与教育应用的实用性[18]。
2.2.1. 核心定义
结合贺超波等[1]对课程知识图谱的定义及对教育知识图谱的分类,本文将专业课程知识图谱定义为:
面向高等/职业教育的专业课程,以“课程–知识点–资源”为核心实体,以“先修(PrerequisiteFor)、支撑(Supports)、从属(IsA)、应用(AppliesTo)”为课程特有关系,融合文本、视频、代码等多模态教育资源,支持教育推理(如先修关系判断)与个性化服务(如学习路径规划)的结构化知识表示体系。
其形式化描述为:
其中:
K为课程知识实体集合,涵盖学科核心概念(如“极限”、“链表”、“神经网络”)与课程模块(如“高等数学–微积分”);
为课程特有关系集合,需符合学科逻辑(如(极限,PrerequisiteFor,导数))与教育需求(如(链表,Supports,二叉树遍历));
为教育属性集合,包括知识点的“难度(Difficulty)”、“学习时长(Duration)”与课程的“学分(Credit)”、“适用专业(Major)”;
为多模态资源集合,关联教材文本、视频讲解、实验代码等教学资源,实现知识的多维度表示[19]。
2.2.2. 关键特征
与通用知识图谱(如DBpedia)、泛教育知识图谱(如K12知识点图谱)相比,专业课程知识图谱具有4项场景特异性特征[20]:
1) 学科逻辑的强约束性:知识点关系需严格遵循学科规律(如《量子力学》中“波函数”是“薛定谔方程”的前置概念),需通过领域专家验证或学科规则约束[21];
2) 教育目标的导向性:所有知识建模需服务于“学习路径规划、知识点漏洞诊断、智能答疑”等教育任务,强调图谱的“应用驱动”;
3) 知识形态的多模态性:需融合文本(教材章节)、视频(课堂讲解)、代码(实验实现)等多源教育资源,实现知识的“全维度表示”;
4) 知识更新的动态性:需随学科发展(如AI课程新增“GPT-4”、“Agent”)与教学改革(如《数据结构》新增“Go语言实现”)实时更新,需支持增量式学习[22]。
2.3. 研究分类框架与国内外进展
基于“知识生命周期”(构建–表示–推理–应用)与“教育任务需求”(个性化、精准化),专业课程知识图谱的研究可分为知识构建、表示学习、推理方法、应用场景四大类[23]。
2.3.1. 专业课程知识图谱构建
知识构建是基础,核心任务是从多源教育资源中提取“课程–知识点–关系”三元组,关键技术包括实体识别、关系抽取、多模态融合[24]:
1) 实体识别:Li等[24]提出融合领域词典的Hybrid Neural Network模型,识别《计算机科学》课程中的“算法”、“数据结构”等实体,F1值达91%,解决了通用模型对领域术语识别精度低的问题;王等结合CRF与BiLSTM模型,实现《机械原理》中“凸轮机构”、“齿轮传动”等实体的精准识别,F1值达89%。
2) 关系抽取:Chen等[25]用Graph Convolutional Networks (GCN)抽取《人工智能》课程中的“先修关系”,准确率达89%,通过图结构捕捉知识点的邻域依赖;赵等[26]用时序GNN (T-GNN)抽取《高等数学》中“极限→导数→积分”的递进关系,考虑知识点的时序演化,召回率较传统GCN模型提升15%。
3) 多模态融合:MIT Media Lab [27]用多模态Transformer融合课程视频的“视觉特征(板书推导)”与“文本特征(教师讲解)”,构建《线性代数》多模态知识图谱,多模态知识对齐准确率达93%;浙江大学[28]用CLIP模型融合《Python编程》的“代码语义”(如“链表反转代码”)与“知识点描述”(如“链表的基本操作”),实现多模态知识的语义关联,代码–知识点匹配准确率达88%。
2.3.2. 专业课程知识表示学习
表示学习将课程实体与关系映射到低维语义空间,是实现高效推理的基础,核心技术包括图神经网络(GNNs)、Transformer、知识图谱嵌入(KGE) [29]:
GNN-based表示:用GraphSAGE模型聚合知识点的邻居信息(如“导数”的邻居是“极限”、“微分”),捕捉局部层级依赖,模型在Coursera图谱上的嵌入准确率达89%;李等用GAT (图注意力网络)为《数据结构》知识点赋予不同权重(如“链表”的权重高于“栈”),通过注意力机制区分知识点的重要性,语义相似度匹配准确率较GraphSAGE提升5%。
Transformer-based表示:Zhang等[30]用Longformer模型建模《机器学习》中“神经网络”与“概率统计”的长距离关联,解决了传统Transformer对长文本处理的局限性,跨模块知识关联准确率达91%;中国大学MOOC团队[31]用ERNIE 3.0模型融合跨课程知识(如《机器学习》与《数据结构》),通过多任务学习实现跨学科知识的语义对齐,跨课程知识推荐准确率达87%。
KGE-based表示:Bordes等[32]用TransE模型嵌入《物理化学》知识点,将实体与关系映射到向量空间,实现“知识点相似性匹配”,相似性判断准确率达85%;刘等[33]用RotatE模型处理《电路原理》中的“对称关系”(如“串联”与“并联”),通过旋转嵌入捕捉关系的对称性,链路预测准确率较TransE提升12%。
2.3.3. 专业课程知识推理方法
推理是知识图谱的核心能力,需解决“隐性关系挖掘”与“个性化需求匹配”问题,核心技术包括先修关系推理、学习路径规划、漏洞诊断:
先修关系推理:Wang等[34]用Temporal GNN (时序GNN)建模《计算机科学》课程的先修关系演化(如“Python基础”是“机器学习”的先修),考虑学习阶段的动态性,先修关系推理准确率达92%;赵等用LSTM-GNN融合知识点的“学习时序”(如“极限”先于“导数”学习)与“逻辑关系”(如“极限”是“导数”的基础),先修关系推理准确率达93%。
学习路径规划:用强化学习(RL)构建“路径导航Agent”,在知识图谱中搜索《高等数学》的最优学习顺序,学习效率提升22%;用DQN (深度Q网络)结合学习者的“知识状态”(如未掌握“极限”),生成《数据结构》的个性化路径,用户满意度达91%。
漏洞诊断:王等[35]用GNN编码学习者的“知识掌握向量”(如“极限”掌握度0.3,“导数”掌握度0.1)与课程知识图谱,实现《高等数学》知识点漏洞的精准定位,诊断准确率达90%。
2.3.4. 教育应用场景
专业课程知识图谱的最终目标是支撑智能教育应用,目前已落地以下4类高频场景:
1) 个性化学习路径规划:基于课程知识图谱的先修关系与学习者知识状态,生成定制化学习顺序(如Coursera的路径规划、中国大学MOOC的“学习地图”),学习效率提升20%~25%;
2) 知识点漏洞诊断:通过知识图谱匹配学习者错误与知识点关联,定位未掌握的前置知识(如智慧树的“漏洞扫描”、超星尔雅的“知识诊断”),诊断准确率达85%以上[6];
3) 智能答疑系统:基于知识图谱的语义匹配,实现精准答疑(如“小度教育”的知识点关联答疑、科大讯飞的“智学网”答疑),答疑准确率较传统方法提升30% (陈等[36]);
4) 实验教学指导:融合多模态知识图谱(文本 + 视频 + 代码),支撑实验步骤的精准指导(如北航《飞行力学》的仿真实验指导、浙大《Python编程》的代码调试指导),实验错误率降低25%~30% [26]。
2.4. 现有研究的局限性分析
尽管国内外研究已取得显著进展,但专业课程知识图谱的领域适配性与技术落地性仍存在以下核心不足[1]:
1) 学科逻辑的建模深度不足:现有模型多基于通用知识图谱架构,未充分考虑专业课程的学科特异性(如《量子力学》的物理定律约束、《机械原理》的动力学方程关联),导致关系抽取易出现“逻辑错误”(如将“薛定谔方程”标注为“波函数”的先修) [12];
2) 多模态知识的融合能力薄弱:多数研究仍聚焦于文本知识,未有效融合视频中的“板书推导”、代码中的“实现逻辑”等多模态资源,导致知识表示不完整[19];
3) 动态知识的更新效率低下:专业课程知识随学科发展(如AI课程新增“GPT-4”、“Agent”)与教学改革(如《数据结构》新增“Go语言实现”)需实时更新,但现有模型多基于静态数据训练,缺乏“增量式学习”能力,更新成本极高[22];
4) 教育场景的适配性不足:现有研究多关注“知识图谱的技术性能”(如嵌入准确率、推理速度),未充分考虑学习者的认知状态(如新手/进阶学习者的不同需求),导致应用效果不佳[15]。
2.5. 与现有综述的对比
现有综述多聚焦于通用知识图谱或泛教育场景,未深入覆盖“深度学习 + 专业课程知识图谱”的领域特异性问题。本文聚焦高等/职业教育的专业课程,重点探讨“学科逻辑建模”、“多模态融合”、“动态更新”等专业场景问题,弥补了现有综述的空白。
Figure 2. Research network at home and abroad
图2. 国内外研究网络图
如图2所示,本章系统梳理了基于深度学习的专业课程知识图谱的国内外研究脉络、核心概念与特征、研究分类框架,并指出现有研究在“学科逻辑建模”、“多模态融合”、“动态更新”、“教育适配”等方面的不足。下一章将聚焦专业课程知识图谱的表示学习技术,深入探讨深度学习模型与课程知识场景的适配路径。
3. 基于深度学习的专业课程知识图谱研究方法与原理
专业课程知识图谱的表示学习(Knowledge Representation Learning, KRL)是将课程实体(知识点、课程模块、教学资源等)与关系(先修PrerequisiteFor、支撑Supports、从属IsA、应用AppliesTo等)映射到低维语义空间的核心技术。其目标是在保留学科知识逻辑(如知识点的层级依赖、先修关系的不可逆性)与教育场景语义(如学习路径的时序性、多模态资源的关联性)的前提下,实现课程知识的高效推理与应用。本章从表示空间(课程知识的几何建模)、评分函数(课程事实的合理性度量)、编码模型(课程知识的语义交互)、辅助信息融合(多模态教育资源的增强)四个维度,系统阐述专业课程知识图谱的表示学习方法与原理,并总结各方法的课程场景适配性。
3.1. 表示空间:课程知识的几何建模
表示空间是课程实体与关系的“语义载体”,需满足学科逻辑一致性(如先修关系的方向约束)、教育语义表达性(如知识点的层级结构)与计算可行性(如可微分以支持深度学习)三大要求。常见的表示空间及其课程场景适配性如下。
3.1.1. 点式空间(Point-Wise Space)
点式空间将课程实体与关系映射为欧氏空间中的向量、矩阵或张量,通过线性变换建模语义关联,是最常用的表示空间。典型应用包括:
向量空间:TransE模型将关系表示为实体向量的平移(
),适用于先修关系建模(如“极限”(h) +、“先修”(r) ≈、“导数”(t))——平移距离越小,先修关系的合理性越高。
矩阵空间:TransR模型引入“实体空间”(如知识点的“概念空间”,
)与“关系空间”(如教育语义的“逻辑空间”,
)的分离,并通过投影矩阵
将实体映射到关系空间,解决单一空间无法同时表达“学科概念”与“教育逻辑”的问题(如“导数”的概念语义与“先修”的教育语义需不同空间承载)。
张量空间:NTN模型通过双线性张量层(
)捕捉实体–关系的多维度交互,适用于知识点与教学资源的关联(如“链表”(h)与“链表反转代码”(t)的语义匹配——
张量可编码代码与知识点的结构关联)。
3.1.2. 复向量空间(Complex Vector Space)
复向量空间将实体与关系映射为复数向量(
),通过“实部 + 虚部”的组合建模对称/反对称关系,适用于课程知识的语义模式识别:
对称关系:如“等价于”(EquivalentTo)——复向量的共轭运算可保持对称关系的语义一致性(如“二叉树遍历”与“树的遍历”的等价性)。
反对称关系:如“先修于”(PrerequisiteFor)的逆关系“后修于”(PostrequisiteFor)——复向量的旋转运算(
,
为Hadamard积)可区分关系的方向(如“极限”先修“导数”,而“导数”后修“极限”)。
3.1.3. 高斯分布空间(Gaussian Space)
高斯分布空间将实体与关系映射为多维高斯分布(
,
),通过均值向量
表示语义位置,协方差矩阵
表示语义不确定性,适用于动态/模糊课程知识:
知识点的多分支:如“机器学习”包含“监督学习”、“无监督学习”等分支,每个分支对应高斯分布的一个成分——协方差矩阵
越大,分支的语义差异越显著。
新知识点的置信度:如“大模型”作为新兴知识点,其均值向量随研究进展更新,协方差矩阵表示语义不确定性(初始阶段
大,成熟阶段
小)。
3.1.4. 流形与群空间(Manifold and Group Space)
流形是具有局部欧氏结构的拓扑空间,群是具有代数结构的集合,两者结合可建模课程知识的层级结构与逻辑模式:
球面流形:ManifoldE模型将实体映射到球面空间,通过球面距离保留知识点的层级关系(如“人工智能”是父节点,“机器学习”、“深度学习”是子节点——球面上父节点与子节点的距离随层级加深而增大)。
双曲流形:MuRP模型将实体映射到Poincaré球(双曲空间的一种),通过负曲率特性更好地建模深层层级结构(如“计算机科学→人工智能→机器学习→深度学习→大模型”的五级层级)——双曲空间可压缩深层结构的距离,避免欧氏空间的“层级爆炸”。
二面体群:DihEdral模型利用二面体群的旋转与反射特性,适用于对称逻辑模式(如“链表”的“正向遍历”与“反向遍历”的对称关系——群的反射运算可保持对称模式的语义一致性)。
3.2. 评分函数:课程事实的合理性度量
评分函数用于衡量课程事实(如极限导数PrerequisiteFor)的语义合理性,核心是将课程关系的逻辑转化为数学度量。常见类型包括距离基与语义匹配基两类。
3.2.1. 距离基评分函数(Distance-Based Scoring)
距离基评分通过计算实体向量的距离衡量关系的合理性,核心是“关系即平移”(Relation as Translation),适用于先修、支撑等顺序关系:
TransE模型:评分函数为
,衡量“实体 + 关系”与“目标实体”的欧氏距离——距离越小,先修关系越合理(如“极限 + 先修”到“导数”的距离越小,先修关系越成立)。
TransH模型:将实体与关系投影到超平面,评分函数为
,解决TransE无法处理多关系的问题(如“极限”同时是“导数”与“微分”的先修——超平面投影可区分不同关系的语义空间)。
3.2.2. 语义匹配基评分函数(Semantic Matching-Based Scoring)
语义匹配基评分通过实体与关系的语义相似度衡量事实合理性,核心是“关系即映射”(Relation as Mapping),适用于知识点与资源的匹配(如“链表”的视频资源与“链表”知识点的语义对齐):
DistMult模型:评分函数为
,通过对角矩阵
将实体映射到关系空间——相似度越高,知识点与资源的匹配度越高(如“链表”的视频资源与“链表”知识点的语义相似度)。
ComplEx模型:评分函数为,结合复向量的共轭运算增强语义匹配的表达性(如“导数”的文本定义与视频讲解的跨模态匹配)。
3.3. 编码模型:课程知识的语义交互
编码模型通过神经网络架构捕捉课程实体与关系的结构信息(如知识点的邻居关系)与语义信息(如知识点的定义),将其转化为低维嵌入。常见模型包括以下几种。
3.3.1. 线性/双线性模型(Linear/Bilinear Models)
线性模型通过投影矩阵建模实体的结构信息,双线性模型通过张量乘积建模实体–关系的交互,适用于课程知识的结构建模:
结构嵌入(SE):使用两个投影矩阵
,评分函数为
,建模知识点的结
构关系(如“导数”与“极限”的结构关联)。
双线性模型(DistMult):通过对角矩阵
建模实体–关系的交互,适用于知识点与关系的语义匹配(如“导数”与“先修”关系的交互)。
3.3.2. 因子分解模型(Factorization Models)
因子分解模型通过分解课程知识张量(如“课程–知识点–关系”的三维张量)学习嵌入,适用于大规模课程知识的压缩表示:
RESCAL模型:分解每个关系切片为
(A为实体嵌入矩阵,
为关系嵌入矩阵),适用于课程知识的张量分解(如“高等数学–知识点–关系”的张量分解)。
TuckER模型:通过Tucker分解学习核心张量与实体/关系嵌入,适用于多模态课程知识的融合(如“课程–知识点–资源”的三维张量分解)。
3.3.3. 神经网络模型(Neural Networks)
神经网络通过非线性激活与复杂架构捕捉课程知识的深层语义,适用于复杂课程场景:
卷积神经网络(CNN):如ConvE模型,将实体与关系嵌入重塑为二维矩阵,通过卷积层提取局部特征(如知识点定义的文本特征),适用于课程文本的语义编码(如“极限”的定义文本)。
循环神经网络(RNN):如RSN模型,通过递归跳跃机制捕捉学习路径的时序信息(如“极限→导数→微分→积分”的路径),适用于时序学习路径的建模。
Transformer模型:如KG-BERT模型,通过自注意力机制捕捉跨课程的长距离关联(如“机器学习”与“数据结构”的关联),适用于跨课程知识的语义匹配。
图神经网络(GNN):如R-GCN模型,通过特定关系的变换
建模知识点的邻居关系(如“导数”的邻居是“极限”、“微分”、“积分”),适用于课程知识的结构传播;CompGCN模型通过实体–关系的组合运算
建模实体与关系的联合嵌入,适用于实体–关系的深度交互(如“导数” + “支撑”→“微分方程”)。
3.4. 辅助信息融合:多模态教育资源的增强
专业课程知识图谱包含丰富的辅助信息(文本、类型、视觉、不确定信息),融合这些信息可增强KRL的语义表达能力。常见融合方法包括以下几种。
3.4.1. 文本描述(Textual Description)
文本描述包括知识点的定义、教材章节内容、课件文本等,通过CNN、Transformer等模型编码为文本嵌入(如“极限”的定义文本编码为
),并与实体嵌入h对齐(如
,
为权重),提升语义一致性。
3.4.2. 类型信息(Type Information)
类型信息包括知识点的类型(概念、定理、算法)、课程的类型(基础课、专业课),通过投影矩阵将类型信息映射到实体嵌入(如“概念”类型的知识点投影到),保留课程知识的类型约束(如“概念”类型的知识点需与“定理”类型的知识点保持语义差异)。
3.4.3. 视觉信息(Visual Information)
视觉信息包括课程视频的板书、实验代码的截图、图表等,通过跨模态模型(如CLIP)将视觉特征编码为,并与实体嵌入h对齐(如
),实现多模态知识的统一表示(如“链表”的视频板书与“链表”知识点的语义融合)。
3.4.4. 不确定信息(Uncertain Information)
Figure 3. Diagram of methods and principles for research on professional course knowledge graph based on deep learning
图3. 基于深度学习的专业课程知识图谱研究方法与原理绘图
不确定信息包括知识点的置信度(如“大模型”作为新知识点的置信度)、关系的概率(如“极限”先修“导数”的概率),通过概率模型(如贝叶斯网络)将不确定信息编码为概率嵌入(如“大模型”的嵌入是高斯分布
,
表示语义位置,
表示置信度),保留知识的动态性。
如图3所示,本章从表示空间(几何建模)、评分函数(合理性度量)、编码模型(语义交互)、辅助信息(多模态增强)四个维度,系统阐述了基于深度学习的专业课程知识图谱表示学习方法与原理。课程场景的特殊性(如学科逻辑的层级性、教育需求的时序性)决定了方法的选择:层级结构优先选择流形空间(如双曲流形);先修关系优先选择距离基评分函数(如TransE);跨课程关联优先选择Transformer模型;多模态资源优先选择辅助信息融合(如文本 + 视觉)。
3.5. 四维度的内在关联与协同设计方法论
本综述提出的表示空间(几何建模)、评分函数(合理性度量)、编码模型(语义交互)、辅助信息(多模态增强)四个维度并非彼此孤立,而是一个紧密关联、相互制约的有机整体。
Figure 4. Diagram of direct intrinsic relationships among the four dimensions
图4. 四维度直接的内在关联图
如图4所示,该框架的四个维度构成了一个环环相扣、层层递进的知识表示学习系统工程。其核心思想是:通过编码模型,融合辅助信息,将课程知识在特定的表示空间中构建几何映射,并利用评分函数对这个映射的质量进行度量与优化。
4. 结论与展望
专业课程知识的强逻辑性(如“极限→导数→微分”的不可逆先修关系)与教育语义需求(如学习路径的时序依赖),决定了其知识图谱方法需突破通用KG的“泛化框架”——表示空间需选择双曲流形(适配深层层级结构)、复向量空间(捕捉关系方向约束);评分函数需采用距离基模型(如TransE)衡量顺序关系合理性;编码模型需结合GNN (捕捉知识点局部邻居依赖)与Transformer (实现跨课程模块关联),方能同时满足学科逻辑一致性与教育语义表达性。
深度学习技术通过非线性变换与复杂架构,有效解决了专业课程知识的两大核心问题:一是隐性关联挖掘——GNN通过邻居节点聚合捕捉“导数”与“极限”、“微分”的局部依赖,Transformer通过自注意力机制实现《机器学习》与《数据结构》的“神经网络”、“矩阵运算”跨模块关联;二是多模态融合——CLIP等模型将课程文本、视频板书、代码示例的语义对齐,实现知识的全维度表示,为智能教学的个性化路径规划、多模态资源推荐提供核心能力。
现有研究仍面临动态知识更新(学科发展与教学改革需实时更新KG,缺乏增量式学习能力)、个性化适配(未结合学习者认知状态,路径规划难以满足新手/进阶需求)、跨学科融合(复杂工程课程如《飞行力学》需跨《力学》《控制理论》,现有模型难以捕捉跨学科隐性关联)等挑战。
未来可借鉴知识图谱表示学习中的动态嵌入方法如基于时间戳的Trans方法或终身学习(Life-long Learning)框架,使模型能持续吸收新知识而不遗忘旧知识。同时结合前沿技术,利用大语言模型(LLM)作为“变化感知器”。持续用最新和更新后的学术论文和教材微调LLM,让其自动识别出与现有知识图谱存在差异或新增的知识点,为动态更新提供候选信号。与此同时,在多模态对齐方面,可以引入多模态大模型(如GPT-4V、LLaVA)。将图像、公式等非文本信息映射到与文本语义共享的向量空间,从而实现深度的语义对齐。推动智能教育从“技术驱动”向“知识驱动”转型,为学习者构建更系统、更精准的知识体系。