1. 引言
知识图谱(Knowledge Graph),是一种利用可视化技术呈现的知识资源及其载体的网络化表示,旨在通过挖掘、分析、构建、绘制和展示知识及其相互间复杂关系,以直观地揭示知识发展的动态过程与结构关联。从本质上说,知识图谱属于一种在自然界构建起实体关系的知识数据库,它能够刻画出万物之间的复杂联系。在当下,知识图谱技术在教育范畴内已经获得了极为广泛的运用,并由此催生出一系列相关概念,比如教育知识图谱、学科知识图谱以及课程知识图谱等。笔者在文献[1]中所提出的专业知识图谱也是知识图谱的一个衍生概念。专业知识图谱是以高等学校专业设置或者专业划分为前提,是专业所涵盖的知识体系中各种知识概念、属性和关系构成的语义网络。可以作为高等院校本科专业的专业课程体系确立依据和专业设置、专业划分的依据,推动本科专业建设的科学发展。
在教育领域,知识图谱的应用研究重点探索了教育知识图谱、学科知识图谱和课程知识图谱的构建与应用,以及这些图谱如何为教育教学提供有效的支撑机制。李惠乾等[2]对教育知识图谱研究的最新发展进行了详尽的分析与总结,涵盖了该领域中的核心关键技术、实际应用场景、实施成效、现存问题及未来挑战等多个维度。提出应在完善理论与建立标准、优化技术与精准建模、强化应用与提升效果等方面进行深入研究。郭彩丽等[3]以信号与信息处理类课程体系为例,构建以课程专业知识、科学研究论文和企业用人需求为三要素的知识图谱,挖掘课程专业知识学习与科研和就业中专业知识应用的关系。丁国富等[4]研究了知识图谱对产教融合课程体系改进的支撑作用,通过知识图谱采集产业界对高等工程教育的能力需求信息,与课程知识点进行匹配映射,建立并实施一种能够促进教育与产业双向技能匹配与持续优化的评估机制,并在西南交通大学机械制造及其自动化专业课程体系中进行了实践应用。杨文霞等[5]构建了武汉理工大学“线性代数”课程知识图谱并进行了教学实践,表明课程知识图谱对师生的教学活动均有提升作用。此外,还有学者将知识图谱与大语言模型技术相结合进行科创城资源建设,如王佐旭[6]将自然语言处理技术、深度学习技术、预训练语言模型等技术相结合进行工科课程知识的本体构建、知识抽取和知识图谱构建,并应用于制造信息学原理与应用课程中。Huy Ngo等[7]提出了一种融合知识图谱嵌入、序列挖掘和协同过滤的个性化学习路径推荐方法,通过构建特定于MOOC的知识图谱,结合学习者的行为序列,为学习者提供个性化的学习资源推荐。Gui Chen等[8]提出了一种基于多智能体协作的框架,用于从文本中构建知识图谱,通过动态交互的知识图谱专家、知识抽取专家、数据处理专家和领域专家等智能体,提升了知识图谱构建的效率。Shaoxiong Ji等[9]对知识图谱的获取机制及其在教育领域的应用进行了详尽的综合评估。该研究全面探讨了知识图谱的嵌入空间设计、评分函数的构建、编码模型的运用以及如何整合辅助信息以提升知识图谱的有效性。这一系列分析为教育学界提供了一套坚实的理论框架,旨在指导知识图谱技术在教学和学习支持中的实践应用。Subhi Issa等[10]对知识图谱的完整性进行了系统文献回顾,识别出七种完整性类型,并分析了相关工具和方法,有助于教育领域知识图谱的质量评估与改进。这些研究都为专业知识图谱的构建提供了方法指导。2022年,长安大学运输工程学院胡大伟教授带领团队成功获批教育部国家级交通运输专业虚拟教研室,为长安大学交通运输专业知识图谱构建提供了应用环境。
本研究在专业知识图谱概念的基础上,以长安大学交通运输本科专业为对象,研究专业所覆盖、包含的知识点及其相互之间的关系,通过全面梳理和系统整合专业知识点,实现知识的有机组织和深度挖掘,构建交通运输专业知识图谱,助力交通运输相关专业建设,推动落实教育部“以人工智能赋能专业内涵建设”的目标尽早实现。
2. 基于德尔菲法的交通运输专业知识体系构建
本文研究运用到了德尔菲法(Delphi Method),该方法又被称为专家小组法。采用该方法是为了识别交通运输专业的知识体系。该方法作为一种广泛应用的定性分析手段,其操作方式是通过匿名问卷调查的形式,收集专家意见,并历经多轮迭代,最终得出方案。另外,该方法具备匿名性、反馈性与统计性等显著特征,这些特征使得德尔菲法能够很好地被用于该项研究中。由于专家们的教育背景以及具体研究领域存在差异,他们对于交通运输本科专业知识体系的认知也不尽相同,而德尔菲法凭借多轮收集意见并促使意见逐渐收敛的优势,能够有效地汇总不同专家的见解,进而构建出较为完善的交通运输专业知识体系,为交通运输专业知识图谱的搭建提供结构化的数据支撑。
德尔菲法的实施步骤如图1所示。采用德尔菲法进行调查,首先要明确问题,然后选择能够给出意见的专家,制定出第一份调查表,发放给各位专家并得到专家的反馈,接着对结果进行整理,判断结果是否集中,如果不集中的话需要制定第二份调查问卷,这一过程循环往复,直至专家群体的意见展现出高度一致性,最终得出结论。该过程一般需要循环3~4轮。
Figure 1. Implementation steps of Delphi method
图1. 德尔菲法的实施步骤
(1) 提出问题
交通运输专业不同于其他专业,它具有鲜明的特点,它既注重系统理论,又强调实践应用,同时还是一个多学科交叉融合的专业,广泛涉及多个学科领域。依据《工程教育认证标准(2024版)》的规定,对于交通运输专业学生的毕业要求,应全面涵盖工程知识、现代工具运用、工程与可持续发展等诸多方面。具体而言,学生应具备将数学、自然科学、计算知识、工程基础以及专业知识综合运用,以及解决复杂问题的能力;在处理复杂工程挑战时,展现出卓越的能力,包括自主创新技术开发、精准技术资源选取、高效应用现代工程工具及信息技术手段。同时,在解决此类问题的过程中,他们能深入剖析并精确评估工程活动对健康、安全性、环境质量、法律法规遵循、经济效益以及社会长期可持续性等多维度影响,确保决策与行动不仅满足当前需求,亦兼顾未来代际福祉。
根据交通运输专业的培养目标定位,初步筛选了交通运输专业知识中各交叉领域及对应的知识,见表1。
Table 1. Professional knowledge system of transportation
表1. 交通运输专业知识体系
序号 |
所属领域 |
知识模块名称 |
包含的具体知识 |
1 |
基础科学 |
数学 |
微积分,数列与极限,微分方程与极数,解析几何与线性代数,运筹学,概率论,数理统计 |
2 |
物理 |
力学,热学,光学,相对论,电磁学,量子物理基础,波动学 |
3 |
化学 |
有机化学,无机化学,分析化学,物理化学 |
4 |
人文社会科学 |
哲学 |
逻辑学,认识论,伦理学 |
5 |
政治 |
政治理论,军事,法律 |
6 |
历史 |
中国历史,世界历史 |
7 |
教育 |
心理学,体育 |
8 |
经济学 |
微观经济学,宏观经济学 |
9 |
交通运输和人文社会科学的交叉领域 |
交通运输法规 |
—— |
10 |
交通与环境 |
节能减排,交通对城市环境的影响 |
11 |
交通运输和管理学的交叉领域 |
运输管理 |
客运管理,货运管理 |
12 |
运输安全 |
驾驶员与乘客安全,行人安全 |
13 |
交通运输应急
管理 |
不同运输方式下的应急管理 |
14 |
物流 |
物流系统,物流管理,物流学前沿 |
15 |
管理学 |
设施站场 |
运输枢纽,客运站 |
16 |
交通运输和工程技术的交叉领域 |
载运工具 |
汽车,火车,飞机,轮船,管道 |
17 |
公共交通系统 |
公交规划与运营,公共交通系统构成,公交系统建模方法 |
18 |
智能运输系统 |
系统构成,主要技术 |
19 |
工程技术 |
计算机 |
计算机应用知识,程序语言 |
20 |
测绘技术 |
工程制图 |
(2) 选择专家
由于德尔菲法具有统计性特征,因此选择的专家必须有一定的要求。要求应该对该领域有着独到的理解和体会,并且具有实际的工程经验和丰富的理论知识。另外需要避免各位专家对该专业的知识体系的理解的相关程度,比如说研究交通运输的领域中,有不同的方向,有些学者研究的是轨道方向,而有的学者则是研究公路方向,这都会对结果产生一定的影响。由于本研究以长安大学交通运输本科专业为对象,因此,基于权威性、代表性和平衡性的原则,从长安大学运输工程学院、公路学院、经管学院、汽车学院、信息学院等二级学院中选择出了12位专家老师。
本次专家遴选标准如下:① 参与此次研究的专家,应具有从事交通运输研究和教育不少于5年的工作经历,具有副高级以上职称,在学术研究与一线教学工作中均取得了卓越成果。在核心期刊上发表过至少两篇具有影响力的学术论文,并提出诸多创新性理论,还具有丰富的教学和实践经验,培育出众多优秀的交通运输专业人才。② 在年龄结构上,应涵盖青年学者、中年骨干和老年资深专家,兼顾经验与创新,促进知识的传承。③ 他们能积极参与到本次调研,自愿对该研究提供自己的经验和建议。由于专家们的教育背景以及具体研究领域存在一定的差异性,这就导致他们对于交通运输本科专业知识体系的认知不尽相同。而德尔菲法凭借多轮收集意见并促使意见逐渐收敛的特性,能够有效地汇总不同专家的见解,进而构建出较为完善的交通运输专业知识体系,为交通运输专业知识图谱的搭建提供结构化的数据支撑。
(3) 设计调查表并开展第一轮专家咨询
通过查阅交通运输领域中的相关调查资料并结合步骤(1),设计出第一轮的调查问卷(表2)。为避免专家对某些概念产生误解,表中具体阐述了德尔菲法的相关概念、调查目的并解释了相关概念。然后要求各位专家根据自己所学和相关经验给出自己的相关判断和意见。第一轮问卷调查的目的是要通过专家给出的修改意见,对交通的具体领域、相关模块以及相关知识进行改进,形成更完善的交通运输专业知识图谱。第一轮问卷的表格设置有五大领域和二十个知识模块,如表1所示,针对每项内容设置五种意见,分别是:完全同意、同意、部分同意、反对、完全反对,评级标准见表3。表格中设有“备注”栏,供专家提出自己的想法和建议。
Table 2. Components and main contents of the inquiry paper of expert letter
表2. 专家函询问卷组成部分与主要内容
问卷组成部分 |
主要内容 |
科学性说明 |
a) 构建长安大学交通运输本科专业知识体系的目的及意义 b) 德尔菲法相关概念 |
问卷主体 |
a) 根据专家对知识体系中各项指标的态度建立五级评分选项,邀请专家分别打分 b) 每级指标评分后设立“备注”栏 |
专家信息表 |
参与函询专家的研究领域、工作年限、职称 指标评价判断依据 |
Table 3. Expert rating criteria
表3. 专家评级标准
评级选项/得分 |
评级标准 |
完全同意(5分) |
该知识是交通运输专业本科教育的核心知识之一,对学生掌握交通运输专业的基本理论、方法和技能至关重要。 |
同意(4分) |
该知识是交通运输本科教育的重要组成部分,对学生掌握专业核心知识和技能有一定帮助,与其他知识有一定关联。 |
部分同意(3分) |
该知识具有一定重要性,但仅在某些培养方向或目标可能是核心的部分。 |
反对(2分) |
该知识在交通运输专业本科教育中不是核心内容,或者该知识在交通运输行业实践中的应用较少。或者该知识虽然不属于交通运输专业培养的直接方向,但它们在培养高素质、在人才发展的全面性方面,其展现出显著的价值和重要性。 |
完全反对(1分) |
该知识在交通运输行业实践中几乎没有应用。 |
(4) 发放、回收调查表并进行统计分析
在首轮研究进程中,我们向12位专家发放了调查表。等待专家们完成对相关知识的评价后,成功收回全部12份调查反馈结果。经统计分析,我们发现原有的分类方式存在多处需要修正的地方,同时也详细汇总了专家们针对交通运输知识体系提出的相关建议,以及选取特定知识的理由。为进一步深入探究,我们对每一位专家的意见进行汇总整理,并通过电话问询或者邮件沟通等形式,诚挚地向专家征询其对相关问题的意见。在回收这些意见后,我们对该轮所有专家的意见再次进行全面梳理与整合,为后续研究的推进奠定坚实基础。
根据第一轮专家意见,对交通运输专业知识体系进行修改。添加了“交通运输、基础科学以及管理的交叉领域”,并在其下添加“危险品运输”,包括“民航危险品运输”、“铁路危险品运输”、“公路危险品运输”、“海运危险品运输”;添加了“交通运输和人文社会科学的交叉领域”下的“交通心理学”,包括“机动车驾驶人心理”、“自行车交通心理”、“行人交通心理”;添加了“交通运输应急管理”模块下的“政策法规”;将“管理”领域下的“设施站场”更改到“交通运输和工程技术的交叉领域”下。
(5) 第二轮调查和统计分析
在第一轮调查的基础上,根据调查反馈修改问卷调查表,再次对专家发放问卷,然后回收问卷并对专家的意见进行统计分析,得出以下普遍修改意见:添加了“管理”领域下的“文献检索”,包括“数据库”和“检索方法”;删除了“工程技术”领域下的“测绘技术”;删除了“人文社会科学”领域下的“经济学”;增加了“人文社会科学”领域下的“文学”;将“交通运输和人文社会科学的交叉领域”下的“交通与环境”更换到“交通运输、基础科学以及管理的交叉领域”下。修改后的知识图谱框架共有五大领域和22个知识模块。
(6) 第三轮调查和统计分析
根据修改后的结果设计出第三轮的专家咨询表,再次发放给各位专家学者。首先对第二轮的修改结果进行说明,并备注相关理由;其次要求专家对于修改结果提出新的意见或建议。最终收到12份专家的反馈结果,通过对第三次问询得到的结果汇总整理,发现专家对于交通运输专业知识体系的修改结果基本趋向一致,没有专家反对该交通运输专业知识体系,因此进行两轮专家问询即可得出此次交通运输知识体系结果。
总体而言,在“交通运输和工程技术的交叉领域”中,“载运工具”、“公共交通系统”以及“智能运输系统”的各知识被认为是交通运输专业最核心的知识组成部分,同时“数学”作为基础性学科,是解决交通运输专业问题所需的必备技能,这两个领域下各知识的得分区间在[4, 5];根据交通运输领域研究问题的不同,“交通运输和人文社会科学的交叉领域”以及“交通运输和管理学的交叉领域”模块下各知识具有一定的重要性,其得分区间为[3, 5];计算机技术的使用能更高效地解决交通运输专业相关问题,其得分区间为[3, 4]。除此之外,“人文社会科学”领域下各知识的得分区间为[1, 2]。根据每轮函询结果,对交通运输专业知识作出的删改、添加造成了每轮得分总体的波动。通过加总每轮各知识得分,得到专家每轮打分情况,如表4。这也表明了五大领域和二十二个知识模块的知识体系更能够代表交通运输专业的知识体系,如图2所示。
Table 4. Expert rating (Unit: Minute)
表4. 专家评分情况(单位:分)
专家 轮次 |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
一 |
190 |
185 |
190 |
189 |
194 |
185 |
186 |
192 |
188 |
183 |
188 |
195 |
二 |
202 |
197 |
203 |
196 |
204 |
195 |
197 |
202 |
197 |
195 |
201 |
200 |
三 |
206 |
205 |
205 |
204 |
207 |
204 |
205 |
206 |
204 |
204 |
205 |
205 |
Figure 2. Transportation professional knowledge system
图2. 交通运输专业知识体系
3. 专业知识图谱构建方法
根据汉语词典,“专业”有多个含义,结合本文的研究对象和研究范围,此处“专业”是指高等学校的一个系里或中等专业学校里的学业门类。专业知识图谱以高等学校专业设置或者专业划分为前提,是专业所涵盖的知识体系中各种知识概念、属性和关系构成的语义网络。
(实体(Entity)–关系(Relationship)–实体(Entity))构成的三元组是知识图谱的基本表达方式。其原始数据形式涵盖了结构化数据、半结构化数据以及非结构化数据三种类型。数据存储通常涉及两种主要策略:其一,采用资源描述框架(RDF)实现存储,这在Jena等系统中有具体应用;其二,借助图数据库技术进行存储,Neo4j是其中广受青睐的解决方案之一。
知识图谱的形成策略主要包括自底向上的集成方式、自顶向下的设计途径以及融合这两种方法的综合策略。如图3所示,自底向上的构建方法呈现了一种从基础元素逐步向上整合的流程图示。首先,通过数据挖掘技术从原始数据源中识别并抽取关键实体、其属性以及实体间的相互关系,这一过程填充了知识图谱的数据基础层。其次,通过对抽取的知识元素进行系统分类和整合,构建层次化的概念体系,实现了从具体到抽象的知识聚合,形成了知识图谱的概念层。最后,基于上述概念及其关系,构建出能够反映数据内在联系和规律的模式层,从而实现对复杂数据结构的深度理解和有效利用。自上而下的构建策略首先启动于构建本体与数据架构的顶层设计,从最高级的概念出发,逐步细化为具体的概念层次树,确保知识图谱的结构逻辑严密。其流程主要包括两部分:一是本体学习阶段,此阶段聚焦于自顶向下地构建概念框架,从泛化的顶层概念开始,逐级深入,定义并扩展概念及其间的关联关系,形成一个有序、层次分明的知识体系;二是实体学习阶段,此阶段涉及利用知识抽取技术获取的实体信息,将其精确对应并整合至预先设计的本体架构之中,实现从抽象概念到具体实例的有效链接。
自底向上的构建方法其数据源可以包含结构化知识、半结构化知识和非结构化知识,而自顶向下的构建方法需要利用一些现有的结构化知识库作为其基础知识库。自底向上法更新快、针对大规模数据集构建知识图谱时,尽管其能够有效整合多样化的信息资源,但同时也面临着知识噪声显著、整体准确性欠佳等挑战。自上而下的构建策略在展现概念间的层级关系、提升数据结构化水平方面展现出优势,然而这一方法显著依赖于人工干预,且在模式层面上的迭代更新能力有限,故其适用范围主要局限于小型知识图谱的构建任务。融合了优势的集成方法在知识抽取的框架之上,逐层构建模式,通过归纳性地整合新颖的知识与数据,不断迭代优化模式层。这一过程基于对更新后的模式层进行实体填充,以实现知识图谱的持续完善与深化。集成方法当前代表了知识图谱构建领域的主流实践,融合了多种技术以生成全面且精确的知识表示。
Figure 3. The bottom-up construction process of professional knowledge map
图3. 自底向上的专业知识图谱构建流程
本文在构建专业知识图谱时,采取了综合性的策略,既自顶向下地确保了知识体系的规范化以契合行业标准,又自底向上地捕捉了最新的动态和内在规律。自顶向下的方法在交通领域包括定义核心本体,例如交通运输的分类(管理学、基础科学等)、基础科学的类型(物理、化学、数学)等。这些本体需要符合行业标准,如交通管理系统标准。而自底向上的方法则是从各种数据源中提取信息,比如交通类报告、学生上课反馈情况、社交媒体中的交通事件报告、政府公开的交通统计数据等。这些内容可能结构不一,格式多样,需要抽取实体和关系,并融合到已有的本体结构中。结合这两种方法的关键在于如何利用自顶向下的本体框架来指导和约束自底向上的数据抽取,同时利用自底向上的数据来丰富和扩展本体结构。例如,在定义交通运输类型时,本体可能预先定义了“管理”和“工程技术”的类型,但通过对交通类报告数据分析,可能发现新的子类型,如“基础科学”,这就需要动态更新本体。总结来说,交通运输专业的知识图谱构建需要在本体设计上充分考虑行业标准和动态数据的特性,通过自顶向下提供结构和语义约束,自底向上注入实时和多样化的内容,同时处理好时空数据和多源冲突,确保知识图谱的准确性和实用性。
4. 交通运输专业知识图谱
Neo4j是一个高性能的NOSQL图形数据库,它将结构化数据存储在网络上而不是表中。它以图的形式存储数据,具有高性能、可扩展、易于使用等特点。Neo4j采用Cygnet图引擎,能够高效地处理大规模图数据。该数据模型尤为适宜用于刻画复杂的结构性数据,包括但不限于社交网络拓扑、个性化推荐算法的构建以及知识图谱的组织,展现出其在处理多维、互联数据集时的灵活性与效能。在Neo4j中,知识图谱的构建主要涉及到节点的创建、关系的建立以及属性的设置。节点和关系是图数据模型的核心,属性用于存储节点的额外信息,标签用于对节点进行分类。
在图3的基础上,采用Neo4j创建了长安大学交通运输专业知识图谱,如图4和图5所示。其中,图4展示了三层节点,图5展示了四层节点。
Figure 4. Map of transportation professional knowledge of Chang’an University—layer 3 node
图4. 长安大学交通运输专业知识图谱——3层节点
由图4可以看出,知识图谱能够很好的对长安大学交通运输专业的知识结构及构成进行展示,红色圆框一级节点,代表该图谱的核心——交通运输专业,绿色圆框为二级节点,代表交通运输专业所包含的知识的主要来源学科,包括基础科学、人文社会科学、管理学、工程技术这四大学科领域。蓝色圆框为三级节点,代表具体的知识模块,即某一学科,例如基础科学中的数学、物理、化学等学科。图5中的粉色圆框为4级节点,代表了学科中某一部分的具体知识,如物理学中的力学、热学、光学、电磁学等。圆框之间的连线则表示次一级节点对上级节点的隶属关系。在三级节点中,存在一个节点同时属于两个及多个上级节点的情况,该情况表明该节点所代表知识模块隶属于交通运输、基础学科、人文社会科学、管理学、工程技术这五大领域的交叉领域。如客运管理及货运管理隶属于交通运输、基础科学、管理学这三大领域的交叉领域。
Figure 5. Map of transportation professional knowledge of Chang’an University—layer 4 node
图5. 长安大学交通运输专业知识图谱——4层节点
专业知识图谱的搭建,首先能够通过知识图谱的可视化这一特性,对当前学科专业课程结构进行分析,识别出现有课程体系中存在的知识断层及冗余内容,为课程模块优化提供数据支撑。同时可以基于知识图谱易于更新的特性完成对前沿知识的追踪,适当纳入当下本领域新兴知识节点,对于行业需求也可以做到快速响应,灵敏捕捉行业人才需求的变化。以此来对课程结构进行调整及优化。其次,该知识图谱当前已用于长安大学虚拟教研室平台,不仅可以为其他高校交通运输专业知识图谱建设提供参考,还能为其他学科的知识图谱的构建提供思路和框架。
5. 结论
本研究聚焦于长安大学的交通运输专业,主要目的为构建该专业的知识图谱。在搭建知识体系的过程中,本研究团队采用了德尔菲法,历经三轮专家咨询。充分考量交通运输专业的多学科交叉特点,最终确立了涵盖基础科学、人文社会科学等在内的五大领域,以及细分出的二十二个知识模块的完整体系。在知识图谱的构建过程中,我们综合运用了自底向上与自顶向下的集成策略,旨在全面覆盖并精确捕捉知识实体及其间的关系,最终借助图形数据库Neo4j成功地实现了知识图谱的构建。此图谱精确地揭示了各知识单元间的交织联系网络。目前,这一知识图谱已应用于交通运输专业虚拟教研室平台,在教学资源管理以及课程体系优化等方面发挥了积极作用。在未来,本研究团队计划持续对交通运输专业知识图谱的内容进行完善,进一步挖掘其在专业建设中的潜力,使其发挥更大的效能。同时,该知识图谱也有望为其他专业的建设提供具有参考价值的范例与思路。
基金项目
2023年度长安大学高等教育教学改革研究项目:工科专业知识图谱构建方法研究——以交通运输专业为例(BY202331);长安大学国际教育学院教改项目:行业特色型高校留学生培养模式及评价体系研究(300108221099);2023年度长安大学高等教育教学改革研究项目:面向中外合作办学的全过程协同教学质量管理及保障体系研究(ZY202369);长安大学实验教学改革研究项目:新工科背景下汽车类专业实践教学模式探索与实践(20231804)。