1. 引言
随着自然灾害和社会紧急事件的频繁发生,应急救援任务变得越来越复杂和紧迫。如何快速准确地选择和部署救援资源对于提升救援效率和成功率至关重要。选择合适的救援方案不仅能提高救援成功率,更能有效减少受灾群众的伤亡情况。本文针对应急救援中快速变化的灾害环境,提出了一种基于知识图谱嵌入的救援决策推荐方法,旨在提高救援决策服务的科学性和实时性,并为救援人员缩小最合适的救援方案选择范围。
2. 算法基本原理
在现代应急救援领域,智能化决策推荐系统已成为提升救援效率和响应速度的关键技术。特别是在灾害发生时,迅速准确地选择合适的救援方案对于任务的成功至关重要。本章节将介绍现有推荐方法的相关研究,分析现有算法的不足和已有的解决方案。
2.1. 基于协同过滤的推荐算法
协同过滤是应用最为广泛的推荐算法,该算法核心思想是基于用户的历史行为和用户间的相似度来预测用户可能喜欢的物品。协同过滤可以分为两种类型:基于用户的协同过滤和基于物品的协同过滤。基于用户的协同过滤算法是通过对用户行为进行分析和对用户间的相关性计算来实现物品的推荐;而基于物品的协同过滤算法则是对物品的属性进行分析和对物品间的相关性计算来实现物品的推荐。协同过滤算法的工作流程如图1所示。
现实场景中协同过滤算法存在数据稀疏性和冷启动两大问题,极大的限制了该算法的应用范围和性能。对此学者们提出了不同的解决办法:吴鹏远[1]等人提出了一种基于特征网络对比学习的图协同过滤模型(FCL),通过计算特征向量之间的余弦相似度和概率归一化策略建立节点特征相似度矩阵以捕捉节点间的高阶连接性;李睿智[2]提出一种基于用户相关性的加权Slope One协同过滤算法。该算法考虑到不同用户评论数等因素对推荐准确度的影响,加入用户活跃度与公正度对传统加权Slope One算法进行改进,并且根据共同评分项目对Pearson相关系数进行改进,减少干扰数据对推荐的影响,提高了推荐精度。
Figure 1. Collaborative filtering process diagram
图1. 协同过滤流程图
2.2. 知识图谱技术
知识图谱是一种由节点(Entities)和边(Relations)构成的图结构,用于表示现实世界中的实体及其相互关系。每个节点代表一个实体,可以是人、地点、组织、概念等。每条边代表实体间的关系,如“属于”、“位于”、“创立者是”等。知识图谱不仅存储静态的知识点,还能表示知识间的动态联系。
知识图谱在推荐领域的应用主要通过引入知识图谱作为辅助信息来解决推荐系统中的数据稀疏性和冷启动问题,同时增强推荐的可解释性。具体应用方式可以分为三种主要类型:依次学习、联合学习、以及交替学习。
1) 依次学习:首先独立地使用知识图谱学习实体和关系的向量表示,然后将这些向量作为推荐系统的输入特征。这种方法的优势在于两个模块相互独立,可以预先训练知识图谱特征学习模块,减少推荐系统更新时的时间开销。但缺点是无法实现端到端的训练,知识图谱学习到的向量可能不完全适合特定的推荐任务。
2) 联合学习:将知识图谱特征学习和推荐算法的目标函数结合,通过端到端的方式进行优化。例如,Collaborative Knowledge base Embedding (CKE)就是基于这种思想,通过TransR、去噪自编码器和卷积–反卷积自编码器等技术学习结构化知识、文本知识和图像知识,并将这些知识融合到推荐系统中。
3) 交替学习:采用多任务学习的框架,将推荐系统和知识图谱特征学习视为两个相关但分离的任务。通过设计交叉特征共享单元,让两个任务的信息可以互补,提高推荐系统的泛化能力,同时避免过拟合问题。
胡泽宇[3]等人提出了一种名为KGLSR (基于知识图谱的长短期序列推荐算法)的新型推荐系统,该算法不仅提高了推荐的准确性,还通过知识图谱增强了推荐的可解释性,为推荐系统领域提供了新的研究方向和思路。符家成[4]等人提出了一种结合前置三元组集的知识图谱推荐模型,它基于异构传播策略生成用户和物品的初始表示,并在知识传播的过程中结合当前跳三元组集、初始种子和上一跳三元组集之间的关系以控制每跳三元组集的表示,从而生成用户和物品的最终表示,进而根据最终表示预测用户和物品交互的概率。解决现有推荐算法在利用知识图谱时忽略当前跳三元组集、初始种子和上一跳三元组集之间联系的问题。并在AUC、F1和Recall三个测试指标下优于目前主流的基于知识图谱的推荐模型。柳哮峰[5]等人提出了一种基于知识图谱的多任务推荐方法(MRGC),旨在解决传统推荐算法中的冷启动和数据稀疏性问题。MRGC算法通过联合训练推荐任务和图谱补全任务,充分利用用户交互中的协同信息以及知识图谱中的丰富语义信息。
2.3. 知识图谱表示学习方法
知识图谱嵌入模型(Knowledge Graph Embedding, KGE)是知识表示学习的一个重要方向,它旨在将知识图谱中的实体和关系映射到低维的连续向量空间中,同时保留实体和关系之间的语义信息和结构关系。利用知识图谱表示学习方法可以增强项目语义或建模细粒度,有助于提升推荐准确性,它通过学习实体和关系之间的相似性、分析路径信息和综合多种方法的优势来提供更准确的推荐结果。
王体昌[6]提出HR-RL-KG方法,使用TransD嵌入方法对知识图谱进行低维表示,构建马尔可夫决策过程模型,通过强化学习进行路径探索,并设计了探索性奖励函数(ERF)和动作空间剪枝策略,实验结果表明,该方法在亚马逊电子商务数据集上优于传统推荐算法和其他基于知识图谱的推荐方法。熊余[7]等人提出了一个基于知识图谱的可解释学习路径推荐模型(ELPRKG),旨在解决在线学习中信息过载和学习迷航问题,同时提高推荐结果的准确性和可解释性。首先利用邻域标定的图注意力网络(NCGAT)捕捉知识图谱中的语义信息,并生成候选学习路径集。然后,根据不同学习场景下学习者与候选学习路径之间的契合度和匹配度,实现个性化且可解释的学习路径推荐。
2.4. 军事行动武器推荐系统
应急救援决策推荐系统是应急响应决策支持系统中的一个新兴领域,专注于在特定的灾害环境下为救援人员提供快速、精确的救援方案建议。这类系统至关重要,因为在快节奏的救援环境中,能够迅速部署合适的救援资源往往意味着生与死、成功与失败的差别。尽管已有研究在应急推荐系统方面取得了一定的进展,但仍存在以下不足:例如缺乏对应急信息保密性的充分考虑、缺少对复杂灾害环境的深入分析和模拟、推荐结果的可解释性不强,难以为救援指挥官提供充分的决策支持等。
面对此等问题,文献[8]总结了面向一体化综合减灾的知识图谱构建流程和关键技术,并以九寨沟地震为例展示了面向九寨沟地震减灾的知识图谱构建过程、构建结果,并介绍了知识图谱在应用减灾信息主动推送方面的应用。文献[9]研究实现了一种基于Ontology的应急救援决策支持信息系统,以应急救援为系统决策目标,基于系统应急救援决策支持理论体系,充分利用本体理论知识,展开基于知识本体应用的决策过程研究,为智能决策支持系统应用于重特大事故应急救援工作进行了新的应用尝试。高洪波[10]针对煤矿应急救援辅助决策系统中应急预案应用不足、应用效率低及系统生成的救援方案可执行性欠佳等问题,提出了一种基于应急预案的煤矿应急救援辅助决策系统设计方法。充分利用了应急预案的规范化内容,形成了与现场信息紧密结合、资源优化的救援方案,进一步提高了救援决策的准确性、科学性和智能化水平。
3. 基于TransR知识图谱嵌入的应急救援决策推荐系统
协同过滤算法虽然应用广泛,但是仍然存在着数据稀疏、冷启动以及时效性等常见问题。在应急救援决策支持领域,数据稀疏尤为严重。一方面,应急资源种类繁多和灾害情景复杂多样直接导致灾害情景–应急资源交互矩阵维数过大。另一方面,每项灾害情景适配的应急资源有限,使用过的应急资源更加有限,所以导致使用记录中的应急资源种类相对于总应急资源种类的比例非常小。因此,面对如此稀疏的灾害情景–应急资源交互矩阵,单纯的协同过滤算法很难从中挖掘出相似的灾害情景和应急资源。
本文提出的基于TransR知识图谱嵌入的推荐算法是一种结合知识图谱、知识图谱嵌入和协同过滤的推荐方法。该方法通过利用知识图谱中的实体、属性和关系等信息来提高推荐的准确性和可解释性;然后将知识图谱中的路径经由知识图谱嵌入TransR模型转换为其低维向量表示,通过路径的相似度作为应急资源推荐的依据,巧妙地解决了协同过滤算法在应急资源领域的数据稀疏和冷启动问题;最后根据基于用户的协同过滤算法思想将用户–用户关系映射为当前灾害情景信息–历史应急案例,物品信息映射为应急资源信息,计算当前灾害情景信息向量和历史案例的向量相似度,返回Top-N推荐,完成应急资源推荐服务。
3.1. 应急资源知识图谱构建
应急资源知识图谱的构建主要由抽取并准备相关信息与绘制知识图谱两大部分组成。
第一部分是进行应急资源信息的抽取与处理。资源信息是应急资源知识图谱构建的基础。开源的资源信息主要以文本的形式存在于互联网的各类资源中。为了将文本中的信息转化为可服务于应急资源知识图谱构建的结构化知识,需要按照数据梳理、对比识别、形成RDF三元组的步骤对网络数据进行处理。
第二部分是进行应急资源知识图谱的绘制,基于抽取与处理后的结构化知识,以可视化的方式对应急资源知识图谱进行绘制与呈现,展示各应急资源实体及其关系。本方法使用Neo4J平台绘制知识图谱。
在应急资源知识图谱中,可以包含各种应急资源的类别、特性、适用场景等信息,以及它们之间的关系,如资源之间的互补性、替代性等。这种知识图谱可以帮助应急决策者更好地理解不同资源之间的关系,以及如何在特定灾害情景下有效地组合和利用这些资源。通过知识图谱,可以提高应急资源分配的效率和效果,为应急救援行动提供科学、合理的决策支持。
3.2. TransR模型介绍
表示学习将实体和关系进行分布式表示,通过这些富含语义信息的分布式向量,我们可以探索实体关系之间的复杂语义关联。例如,通过计算实体向量之间的距离,我们可以快速得到实体间的语义相似度。本文就将利用应急资源知识图谱表示学习后的案例实体向量去计算案例间的语义相似度以应用于后续推荐算法中。其中以基于Trans系列[11]的表示学习方法最为普遍。
Trans系列方法是对知识图谱中的实体、关系进行表征的方法。这类方法目的是将实体和关系映射到连续的向量空间中,获得低维稠密表示,实现数据降维操作。主要模型包括TransE,TransH,TransR。
图2为TransE模型和TransH模型的原理图对比。可以看出两者的基本思想都是将关系视为从头实体到尾实体的“翻译”。区别在于TransH为每个关系定义了一个超平面,允许同一实体在不同关系中具有不同的语义表示,从而更好地处理了一对多、多对一和多对多的关系,解决了TransE在处理复杂关系时的局限性。
然而TransE和TransH模型都假设实体和关系是同一语义空间中的向量,因此相似的实体在同一实体空间中的向量表示会非常接近。为了解决这一问题,学者们提出了TransR模型[12],如图3所示。TransR模型构建实体和关系表征,构建了投影矩阵Mr,将实体空间和关系空间相分离。训练表征向量的方法为:首先通过将实体映射到关系空间中,其次在两个投影实体之间构建翻译关系。在链接预测、三元组分类和关系抽取三个实验中的结果表明。TransR模型的翻译效果相比TransE和TransH模型,得到了一定的提升。
Figure 2. Schematic diagram of TransE and TransH
图2. TransE、TransH原理图
Figure 3. TransR schematic diagram
图3. TransR原理图
TransR的基本思想:对于每个三元组
,TransR为每个关系r设置了一个投影矩阵
。通过映射矩阵Mr,可以定义每个实体在对应关系空间的投影向量:
头实体向量hr与关系向量r之和与尾实体向量tr越接近越好(
),这里使用L1或L2范数来衡量“接近”。得分函数定义为:
损失函数是使用了负抽样的max-margin函数。
y是正样本的得分,
是负样本的得分。然后使损失函数值最小化,当两个分数之间的差距大于margin (通常设置为1)即可,由于我们使用距离来表示得分,所以我们在公式中加上一个减号,知识表示的损失函数为:
其中,
表示取x与y之间的最大值,S和
分别表示正例和负例三元组集合,λ为设置的边界。该公式通过计算正例三元组
的得分值和负例三元组
的得分值之间的差值,来判断一个三元组的合法性。正例三元组指的是已存在于知识图谱中的三元组,而负例三元组则是通过随机采样获得的不存在于知识图谱中的三元组。
本文使用TransR作为翻译模型,将实体和关系分别嵌入到不同的空间中,这种方法允许不同关系关注实体的不同属性,从而提高了模型的语义表达能力。
3.3. 应急救援决策推荐方法
本文引入知识图谱和知识图谱嵌入TransR模型,提出基于知识图谱和知识图谱嵌入TransR的协同过滤算法,该方法利用知识图谱嵌入TransR模型将应急救援决策支持领域的应急资源实体和关系节点映射到连续的向量空间中,获得低维稠密表示,训练得到各节点的表征向量。实现数据降维操作;融入了知识图谱结构化数据额外信息。有效解决了数据稀疏和冷启动问题。
应急救援任务的应急资源使用记录反映出从应急任务角度对资源的归类。基于用户的协同过滤算法思想为:根据用户之间的相似性来预测用户对物品的偏好。将该思想映射到应急救援领域可以演化为根据当前灾害情景信息和历史应急案例态势信息的相似性来为当前灾害情景推荐适合的应急资源。
将灾害的态势信息载入知识图谱,并生成路径信息
,其中RDFi为路径中态势信息构成的三元组。我们采用余弦相似度来计算应急资源基于使用记录的相似度:
其中Wi为当前灾害态势信息组成的知识图谱路径经TransR模型转移后的向量表示,Wj为历史灾害态势信息组成的知识图谱路径经TransR模型转移后的向量表示。
该式的计算值越大,表明当前灾害态势信息和历史灾害态势信息的相似度越高。即可为当前灾害情景推荐历史案例中使用过应急资源和方案。当值为1时,表明这两个灾害情景所包含的态势信息可能一样;当值为0时,表明这两个灾害情景的态势信息完全不相同。
4. 实验
4.1. 数据集
本文使用的数据集来自全球灾害数据库,该数据库整理收录了来自全球范围内的自然灾害信息,如地震、洪水、台风等,以及与之相关的应急响应的资源分配情况,并进行了结构化处理。
4.2. 算法实现步骤
1) 将数据集中各节点信息写入知识图谱生成历史作战案例知识图谱路径。
2) 导出知识图谱三元组。
3) 三元组数据经Trans模型转换成向量表示。
4) 将三元组向量组合成路径的向量表示。
5) 根据当前灾害现场态势信息路径向量表示与历史灾害态势信息路径向量做余弦相似度计算,获得TopN列表。
6) 根据TopN列表完成当前战场的应急资源和方案推荐。
4.3. 对比算法与评估
首先对比本文模型和Trans系列模型在常使用的FB15K和WN18数据集上的准确率和召回率,表1和表2分别为本文模型和Trans系列模型在两个数据集中的测试结果对比。
Table 1. Test results of the model in FB15k
表1. 模型在FB15k中测试结果
Model |
MeanRank (Raw) |
MeanRank (Filter) |
Hit@10 (Raw) |
Hit@10 (Filter) |
TransE |
243 |
125 |
34.9 |
47.1 |
TransH |
212 |
87 |
45.7 |
64.4 |
TransR |
198 |
77 |
48.2 |
68.7 |
Table 2. Test results of the model in WN18
表2. 模型在WN18中测试结果
Model |
MeanRank (Raw) |
MeanRank (Filter) |
Hit@10 (Raw) |
Hit@10 (Filter) |
TransE |
263 |
251 |
75.4 |
89.2 |
TransH |
318 |
303 |
75.4 |
86.7 |
TransR |
238 |
225 |
79.7 |
92.0 |
从表1和表2中可以看出,与Trans系列模型相比,本文提出的模型性能明显优于TransE和TransH模型。
然后对比传统推荐模型CKE、NCF、BPRMF和本文提出的基于知识图谱嵌入TransR模型的推荐算法在Top-k场景下召回率和准确率性能,该对比试验采用全球灾害数据库。对比结果如表3、表4所示:
Table 3. Recommended Precision results of the model in Top-k
表3. 模型在Top-k中推荐Precision结果
模型 K值 |
CKE |
NCF |
BPRMF |
TransR |
2 |
0.231 |
0.240 |
0.217 |
0.275 |
10 |
0.171 |
0.180 |
0.160 |
0.190 |
20 |
0.142 |
0.143 |
0.135 |
0.150 |
50 |
0.104 |
0.009 |
0.009 |
0.105 |
Table 4. Recommended Recall results of the model in Top-k
表4. 模型在Top-k中推荐Recall结果
模型 K值 |
CKE |
NCF |
BPRMF |
TransR |
2 |
0.04 |
0.05 |
0.03 |
0.05 |
10 |
0.13 |
0.14 |
0.12 |
0.15 |
20 |
0.22 |
0.23 |
0.18 |
0.24 |
50 |
0.36 |
0.38 |
0.33 |
0.39 |
从表3、表4可以看出,基于知识图谱嵌入TransR模型的应急救援决策推荐算法在全球灾害数据集上取得了不错的成绩,召回率和准确率都优于传统的推荐算法,因为其结合了知识图谱嵌入学习和深度学习,解决了数据稀疏性,提取了用户–项目之间的高阶关系特征。
5. 结论
本文针对应急救援领域存在的数据稀疏性和信息安全性问题,提出了一种基于知识图谱嵌入TransR模型的应急救援决策推荐系统,旨在提高应急资源选择的科学性和实时性。系统通过整合灾害事件、应急资源和历史救援案例等多源数据,利用知识图谱技术构建了应急资源知识图谱,并通过TransR模型学习实体和关系的向量表示。结合基于案例的协同过滤算法,系统能够根据当前灾害情景信息与历史救援案例的向量余弦相似度为救援人员提供智能化的应急资源推荐服务。实验结果表明,该系统能够显著提高应急资源选择的准确性和响应速度,同时考虑了应急信息的保密性和安全性,降低了对个人行为数据的依赖,减少了信息泄露和主观判断的风险。
推荐系统在应急救援领域的应用是一个相对较新的研究方向,它主要关注如何利用先进的信息技术来提高应急指挥的效率和救援决策的质量。本文提出的算法思想旨在解决推荐系统在应急救援领域的数据稀疏性问题和冷启动问题,采用历史救援案例对灾害情景信息进行建模和相似度计算。但在实时性和灾害后续态势推理方向仍存在不足,这也是推荐系统在应急救援领域的未来主要研究方向。未来的研究可以进一步探索如何更准确地预测和推理灾害发展态势,从而为救援决策提供更加全面和深入的支持