1. 引言
随着我国综合国力的全面提升,国防科技水平不断取得重大进展。尤其是进入新时代以来,在强军目标的引领下,我国军事科技发展迅猛,军队迎来了武器装备更新换代的热潮[1]-[3]。与此同时,由于科技水平的快速迭代,未来武器装备更新换代周期必将大幅度缩短。广大基层官兵面对大批量新列装的高科技武器装备将成为未来新常态[4]。如何快速实现“成建制、成系统形成战斗力和保障力”,最大限度确保各类型武器装备完好状态保持,确保在任何情况下能够快速有效地排除已现的装备故障成为关键。由此,如何快速形成装备故障判排能力成为摆在广大维修保障人员以及装备操作使用人员面前的紧要问题[5]。传统的以各类装备故障手册为支撑,依靠广大维修保障人员手动查阅故障手册并结合自身维修经验排除装备故障的模式,已然难以满足当前高效履行高科技武器装备维修保障使命任务的要求[6]。
知识图谱是一种较为新颖的知识表示形式,被称为智能语义服务的重要基础。作为一种新型信息系统基础设施,知识图谱可以将非结构化、无显示关联的粗糙数据逐步提炼为结构化、高度关联的高质量数据,提升数据质量,提升数据之间的关联度[7] [8]。知识图谱技术已经在语义搜索、智能问答、数据分析、自然语言理解、视觉理解、物联网设备互连等方面发挥出越来越大的价值,并在医疗、金融、电商、公安等领域落地应用中取得了很好的效果[9]。运用现代知识管理技术手段,构建装备故障知识图谱,可为推进装备故障知识移动科技信息服务提供数据基础,为基层一线部队提供更加精准、更加便捷、更加融合的可视化知识服务,从而为基层一线部队官兵在装备维修保障方面提供更加强有力的智力支持。
目前将知识图谱技术应用到军事装备故障知识管理领域尚处于起步阶段,现有研究主要利用开源数据进行装备领域知识图谱构建及应用的研究,如:吴闯等(2022)利用多源故障知识进行了航空发动机润滑系统故障知识图谱构建及应用研究,实现润滑系统故障知识智能问答和故障归因分析[10];车金立等(2019)基于武器百科上的开源装备数据,构建了军事装备知识图谱,并利用该图谱实现了知识问答,从而辅助相关使用人员快速准确地获取所需知识[11];谢雨希等(2022)对雷达装备故障原因文本特点进行了总结,采用模式层和数据层相结合的图谱构建方法,构建了雷达装备故障原因知识图谱,实现了对相关实体抽取及关系抽取模型效果的检验[12];许驹雄等(2022)针对多源故障数据进行了发动机故障领域图谱构建方法与应用的研究,实现了故障知识抽取、可视化检索以及辅助决策等功能[13];赵永亮等(2022)运用多层次知识图谱模型等技术进行了故障检测及诊断建模,实现了通过武器装备的状态变化对装备故障类型的判断[14]。以上研究在军事装备故障领域知识图谱构建方法及应用方面进行了非常有益的探索,但总体来看,研究存在理论性较高,对广大基层官兵进行借鉴应用要求较高,基层官兵普遍缺乏图谱相关的理论基础和技术,难以将相关研究成果转化为实际应用,以至于落地应用存在较大的困难。同时,装备故障知识对于数据的系统性、准确性要求很高,利用开源数据构建的故障图谱在装备维修保障实践应用中的指导性及可靠性难以保证。因此,本文基于现有的某型装备故障手册,进行了基于某型装备故障手册的知识图谱构建方法及应用的研究,可为基于大量存在的各类型装备故障手册等真实数据构建装备故障知识图谱及落地应用提供参考。
2. 某型装备故障手册知识分析
装备故障手册是装备技术资料体系中非常重要的一种。某型装备故障手册,是用来归纳总结某一种型号装备在使用过程中出现的故障现象、故障原因、故障判断与排除方法、预防措施及注意事项等知识的重要技术文件,通常会随装备列装一并配发部队使用,主要用于为部队装备修理工作提供参考以及指导装备维修训练等用途。装备故障手册涵盖的装备故障相关知识,是部队装备维修保障领域非常重要的知识组成部分。对于基层一线部队来说,尤其是新装备换装初期的部队快速形成“两成两力”具有极其重要的作用。同时,装备故障手册知识也可为基层一线部队官兵完成装备维修保障任务提供极大的帮助,因此受到广大官兵的普遍青睐。
从知识管理的角度出发,文章首先对某型装备故障手册知识进行分析。首先是知识的承载形式分析。由于保密要求等原因,装备故障手册始终以传统的纸质资料的形式承载,电子资料通常无法到达基层官兵手中。其次是知识的主要格式分析。故障手册以文本知识和图片知识为主,少量附录知识为表格格式。其中文本知识主要是对故障项目、故障的现象、故障发生的原因、判断与排除故障的方法及具体步骤、预防故障应采取的措施以及故障排除过程中的注意事项等的文字描述;图片知识主要是以流程图的形式对故障判断排除的流程的展示,包含图名和图两项知识内容;表格知识涵盖了常用检查、调整数据表、全车润滑部位及润滑表等有关故障排除的技术参数等知识以及随装工具、备品、附件文件等有关故障排除所需的工具器材及文件信息。同时,所有故障描述均围绕故障产生的相关部件进行,因此,故障手册虽然没有将故障部件进行单列和描述,但其作为贯穿故障手册始终的一项重要要素,应当作为一项重要的知识分类。图1所示为某型装备故障手册知识体系。
Figure 1. Knowledge system of fault manual for a certain type of equipment
图1. 某型装备故障手册知识体系
3. 某型装备故障知识图谱构建
从本质上来看,知识图谱可以看作是一张由不同知识点相互连接形成的语义网络[15]。任何一种网络都由节点和边构成的,因此,知识图谱是由节点和边构成的。节点表示实体或概念,边表示实体之间的关系或属性。Google于2012年推出知识图谱的概念的同时对知识图谱构建的原则进行了相应的阐述,即通过概念、实体和关系形成的结构化语义关系网络,以节点关系图的形式来进行存储[16]。知识图谱根据其知识涵盖范围的不同,被区分为通用知识图谱和垂直领域知识图谱两种不同类型。两种知识图谱涉及知识的范围不同,深度不一,且在图谱构建方法上也存在各自特点。显然,某型装备故障知识图谱构建属于典型的垂直领域图谱构建。
(一) 某型装备故障知识图谱构建流程
关于知识图谱构建的流程,可以归纳为3个核心步骤,即本体构建、知识抽取、知识存储与可视化。图2所示为某型装备故障知识图谱构建流程。
Figure 2. Construction process of fault knowledge graph for a certain type of equipment
图2. 某型装备故障知识图谱构建流程
(二) 某型装备知识图谱本体设计
本体设计即为模式层设计,也称为Schema设计或知识建模。本体设计是对概念、概念之间的关系以及概念属性的定义。由于垂直行业领域知识图谱涵盖知识具有知识深度要求高和专业性强的特点,所以领域知识图谱本体构建多由行业领域专家以人工构建的方式完成领域本体的构建。领域本体的构建通常包括六个阶段,分别为确定领域及任务、知识体系复用、明确概念要素、确定分类体系、定义属性及关系、定义约束[17]。对照每个阶段的任务可知,前三个阶段为本体构建相关准备工作,确定分类体系、定义属性及关系是本体构建的中心环节,最后一个阶段定义约束是根据实际数据情况进行约束条件的确定。确定分类体系即将概念组成层级结构的分类体系,主要方法有自顶向下、自底向上2种。根据本体设计的相关经验,垂直行业领域知识图谱的本体构建通常采用自顶向下的方法进行,而通用领域图谱本体构建通常采用自底向上的构建方法[18]。图3所示为2种本体构建方法。
Figure 3. Ontology construction methods of top-down and bottom-up
图3. 自顶向下和自底向上的本体构建方法
由于装备故障领域知识属于典型的垂直领域图谱构建,所以文章选择自顶向下的方法作为某型装备故障知识图谱构建的主要方法,并结合领域专家意见,首先定义相关概念,而后对概念之间的关系进行定义,最后明确概念相关属性,进而形成某型装备故障知识本体,图4所示为模型即为构建的装备故障知识本体。
Figure 4. Fault knowledge ontology for a certain type of equipment
图4. 某型装备故障知识本体
1) 核心概念及描述(基于RDF/OWL标准规范定义)
通过对故障手册知识的梳理,并与相关领域专家交流,最终确定了“故障”(owl:Class)、“方法”(owl:Class)、“资源”(owl:Class)三个核心概念,各概念通过rdfs:subClassOf明确层级关系,具体定义如表1所示。
Table 1. Core concepts in the domain and their descriptions
表1. 领域核心概念及概念的描述
概念 |
OWL规范定义 |
“故障” 概念 |
owl: Class rdf: ID = “Fault” rdfs: label = “故障” rdfs: comment = “某型装备及所属系统、零部件部件等产品不能正常执行规定功能的状态” |
“方法” 概念 |
owl: Class rdf: ID = “Method” rdfs: label = “方法” rdfs: comment = “针对故障所采取的排除、预防以及应急处置的方法步骤” |
“资源” 概念 |
owl: Class rdf: ID = “Resource” rdfs: label = “资源” rdfs: comment = “针对装备故障情况可利用的随装携带及配套的技术资源及工具、备品、附件等实体资源” owl: disjointWith rdf:resource = “#TechnicalResource” owl: disjointWith rdf:resource = “#PhysicalResource” ###子概念定义 owl: Class rdf: ID = “TechnicalResource” rdfs: label = “技术资源” rdfs: subClassOf rdf:resource = “#Resource” owl: Class rdf:ID = “PhysicalResource” rdfs: label = “实体资源” rdfs: subClassOf rdf: resource = “#Resource” |
2) 关系及关系示例(基于RDF/OWL属性规范定义)
围绕核心概念,通过owl: ObjectProperty定义概念间关系,具体如表2所示。
Table 2. Relationship definition and examples
表2. 关系确定及示例
相关概念 |
关系类型(OWL规范) |
关系描述 |
示例 |
故障与方法 |
owl: ObjectProperty
rdf: ID = “hasCorrespondingMethod” rdfs:domain
rdf: resource = “#Fault” rdfs:range
rdf: resource = “#Method” rdfs:label = “对应方法” |
故障与排除、预防、应急处置方法之间的关联关系 |
加温器加温时冷却液温度上升缓慢的故障预防方法是定期检查、保养加温器风道,清理脏物。 |
故障与资源 |
owl: ObjectProperty
rdf: ID = “requiresResource” rdfs: domain
rdf: resource = “#Fault” rdfs: range
rdf: resource = “#Resource” rdfs: label = “需求资源” |
故障排除过程中对各类资源的依赖关系 |
液压有关漏油故障排除需要的资源为某型号卡箍。 |
方法与资源 |
owl: ObjectProperty
rdf: ID = “needsResource” rdfs: domain
rdf: resource = “#Method” rdfs: range
rdf: resource = “#Resource” rdfs:label = “需要资源” |
故障处理方法执行过程中对资源的需求关系 |
更换油管需要的工具为扳手。 |
3) 属性及属性值类型确定
在以上定义了概念及概念之间关系的基础上,本节主要对主要实体的属性进行确定。结合装备维修保障工作实际,维修保障人员针对故障概念所关心的属性主要包括故障部位、故障项目、故障现象、故障原因,属性数据格式均为文本型数据;针对方法概念所关心的属性主要包括故障判断与排除方法、故障判断与排除流程图、预防措施以及应急处置,除故障判断与排除流程图属性值数据为图格式外均为文本型数据;资源概念包含技术资源和实体资源两个子概念,技术资源概念包含底盘常用检查、调整数据,全车润滑部位及润滑表,全车用燃料、油料、特种液表等概念;实体资源概念包括随车工具、随车备品、随车附件等实体。具体实体及属性项目如表3所示。
Table 3. Attributes of resource entities and attribute items
表3. 资源实体属性及属性项目表
实体 |
属性项目 |
底盘常用检查、调整数据 |
名称、单位、标准、允许 |
全车润滑部位及润滑 |
润滑部位、使用油料、保养时机、润滑标准 |
全车用燃料、油料、特种液体 |
名称、使用季节、备战 |
全车管子外表面积颜色 |
管子名称、外表颜色 |
车辆随装工具 |
名称、规格型号(或代号)、数量、单位 |
车辆随装附件 |
名称、规格型号(或代号)、数量、单位 |
车辆随装备品 |
名称、规格型号(或代号)、数量、单位 |
单装随装技术文件 |
名称、数量、单位、位置 |
(三) 某型装备故障手册知识抽取
在以上本体构建的基础上,从型号装备故障手册中逐项抽取实体及属性数据,将其分别以EXCEL表格形式进行存储。以便后续数据导入图谱可视化软件进行图谱生成及数据存储。表4对“故障”、“方法”、“资源”实体及属性知识抽取结果的统计。
Table 4. Statistics of knowledge extraction results from fault manual for a certain type of equipment
表4. 某型装备故障手册知识抽取结果统计
概念 |
知识项目 |
数量 |
故障 |
故障部位 |
7 |
故障项目 |
127 |
故障现象 |
127 |
故障原因 |
127 |
方法 |
故障判断与排除流程图 |
113 |
故障判断与排除方法 |
127 |
预防措施 |
110 |
应急处置 |
12 |
资源 |
底盘常用检查、调整数据表 |
23 |
全车润滑部位及润滑表 |
38 |
全车用燃料、油料、特种液体表 |
18 |
全车管子外表面颜色标识 |
8 |
车辆随装工具 |
78 |
车辆随装附件 |
27 |
车辆随装备品 |
129 |
单装随装技术文件 |
27 |
(四) 数据存储与可视化
数据存储与可视化是指将结构化的知识存储到数据库当中,并以可视化的图谱形式进行呈现。需借助数据存储工具以及可视化软件实现。当前可用的知识图谱存储及可视化软件具有较多的选择性,常见的数据存储工具有Neo4j、Microsoft Azure Cosmos DB、OrientDB等,常见的可视化软件有Neo4j、D3、Echarts、Neovis.js、GraphXR等。不同的存储及可视化工具具有不同的优势和特点。其中由上海图客科技有限公司推出的数据可视化软件“GraphXR”,是一个基于浏览器的可视化工具,相比于其他可视化工具来说具有,界面更加友好,且操作简单、可视化效果为更加直观的3D模式等显著特点,能够支持多种数据格式导入,如CSV、Gexf、Json、Kml、Mtgl、GraphML等,同时支持连接多种数据库,如Neo4j,MySQL/MSSQL,Gremlin类数据库,数据可迁移性好。
1) 数据导入
(1) 将知识抽取产生的Excel文件转换为软件支持的CSV文件。
(2) 通过项目–数据–导入CSV文件的方式或直接拖拽的方式导入CSV文件数据。
2) 图谱生成
数据导入之后,每个CSV文件被作为一个类并生成实体节点,每一行数据生成一个具体的节点。同步将本体导入GraphXR,按照关系及属性确定的结果,将本体与每个类型实体进行映射,即可生成基于某型装备故障手册知识的故障知识图谱。
3) 数据存储
在图谱可视化的基础上,通过GraphXR软件自带的数据保存模块,可将图谱数据保存为“.GXRF”文件、“.CSV”文件、“Json”文件等多种文件格式。也可通过配置neo4j示例的方式将数据直接存储到neo4j数据库中。
4) 图谱知识检索与推理示例
图谱知识检索是基于图谱数据的知识查询操作,常用方法有基于关键词的检索和基于语义的检索等,基于图谱知识的检索是图谱知识在问答、推荐、辅助决策等应用的基础。GraphXR作为一款高效的图谱可视化软件,提供了基于Cypher语言和自然语言两种图谱知识查询功能。
为体现图谱的推理能力,设计以下复杂查询案例及对应的Cypher语句:
案例1:查询“发动机”相关故障及其对应的排除方法和所需工具
Cypher语句:
MATCH (f:Fault)-[r:hasCorrespondingMethod]->(m:Method),
(f)-[s:requiresResource]->(p:PhysicalResource {resourceType: “工具”})
WHERE f.faultPart CONTAINS “发动机”
RETURN f.faultItem, m.troubleshootingMethod, p.resourceName LIMIT 10
案例2:查询需要“扳手”作为工具的所有故障及预防措施
Cypher语句:
MATCH (m:Method)-[r:needsResource]->(p:PhysicalResource {resourceName: “扳手”}),
(f:Fault)-[s:hasCorrespondingMethod]->(m)
RETURN f.faultPhenomenon, m.preventiveMeasure LIMIT 10
自然语言查询对于普通图谱用户来说更为友好,能够实现对图谱数据的检索和匹配,并将结果以列表的形式返回,通过对返回的结果进行点击选择的操作方式,实现图谱界面自动跳转,选择的实体节点会出现在界面中心位置,并高亮显示。
4. 某型装备故障知识应用场景分析
(一) 故障诊断中的应用
故障诊断是装备故障知识图谱的主要应用场景,通过构建的某型装备故障知识图谱,可以利用知识图谱中的丰富准确的信息为故障诊断提供有力支持。在故障诊断场景下,通过对故障知识图谱的分析和挖掘,能够快速定位故障原因,进而为维修人员提供有针对性的维修指导,提高维修效率和质量。同时,在实际应用中也可依据装备性能方面表现出来的弱化等现象,结合故障知识图谱中的故障特征和原因等进行故障预测,从而减少故障发生的风险,提高装备的可靠性和稳定性。
(二) 维修过程中的应用
维修过程中的应用是故障知识图谱的重要应用场景,通过故障现象、故障部位等信息,检索故障知识图谱,可以得到详细的故障原因和维修方法,以及随车可利用维修资源的情况,为维修人员提供有针对性且专业具体的维修指导,进而提高维修效率和质量。同时,通过对故障知识图谱的分析和挖掘,可以发现装备的共性故障和规律,为优化维修策略和预防性维护提供数据支持。
(三) 教学培训中的应用
教学培训过程中的应用是故障知识图谱的普遍应用场景。故障知识图谱能够将繁杂的故障知识以可视化的直观的形式呈现在组训和受训者面前,即有利于组训者条理清楚且内容全面的进行组训授课,同时也能使受训者更加快速精准地掌握所学所训内容,起到举一反三、融会贯通的良好效果。同时,依托图谱进行教学组训,对于组训过程中存在的问题能够进行及时的基于图谱的检索,从而节省教学组训时间。
(四) 数据分析中的应用
故障知识图谱中的大量故障数据能够为数据分析和挖掘提供数据支撑,通过深入的分析和挖掘,有助于发现故障发生的规律和原因,为针对性做好装备维修保障方案决策提供可靠遵循,进而有效防止装备故障的发生,提高装备维修保障质量效益。
综上所述,装备故障知识图谱的应用场景非常广泛,可以为基层部队的故障诊断、维修过程、教学培训、数据分析等方面提供有力的支持,提高基层部队装备维修保障的效率,极大促进战斗力的提升。
5. 结论与展望
(一) 研究结论
本文以某型装备故障手册为数据来源,首先对故障手册涵盖的知识进行了分析、在此基础上进行了故障知识图谱的构建,在构建过程中首先介绍了知识图谱构建流程,而后按照本体设计、知识抽取、知识存储的流程,构建形成了某型装备故障知识图谱。最后结合构建完成的图谱进行了应用场景的分析总结,文章做出的主要贡献有三个方面:
1) 根据某型装备故障手册知识体系,并结合领域专家意见进行提炼总结,构建了某型装备故障手册知识语义网,为装备领域知识图谱构建创造了可供复用的体系,为开展大规模军事装备故障知识图谱构建提供了借鉴。
2) 结合GraphXR图谱软件数据导入要求,利用Excel表格进行了数据收集和存储,降低了图谱构建过程中知识抽取和组织的难度,探索了有助于部队广大官兵等非专业图谱人员参与领域知识图谱构建的方法及路径,对领域图谱的构建及调动更多的人员参与到图谱构建工作中来具有一定借鉴意义。
3) 结合图谱知识内容和基层官兵维修保障工作过程中的实际知识需求,进行了故障知识图谱应用场景分析,总结凝练了装备故障知识图谱四种主要应用场景,为同类型知识图谱构建过程中确定应用目标场景提供了必要的参考。
(二) 未来展望
1) 深化半自动化知识抽取:后续将进一步优化基于规则和模板的抽取方法,扩大标注数据规模,微调BERT等预训练语言模型,实现实体、关系和属性的自动化抽取,提升图谱构建效率和技术成熟度。
2) 完善知识图谱评估体系:建立常态化评估机制,将动态评估指标(如图谱更新及时性、用户反馈整改率)纳入评估体系,持续优化图谱质量。
3) 拓展知识来源与融合机制:计划整合历史维修工单、专家知识库、装备运行数据等多源异构数据,设计基于本体对齐和冲突消解的知识融合方法;同时建立知识更新工作流程,支持一线用户反馈、勘误和补充,经领域专家审核后入库,实现知识图谱的动态演进。
4) 强化图谱推理与应用拓展:进一步丰富Cypher查询模板库,开发智能问答接口,实现自然语言到查询语句的自动转换;探索基于知识图谱的故障预测模型,提升装备维修保障的前瞻性和主动性。