基于机器学习的分拨中心安全评估与风险预警研究
Research on Safety Assessment and Risk Warning of Distribution Centers Based on Machine Learning
摘要: 分拨中心的分拣作业是快递企业成本最高的环节,分拨中心的安全运营和管理也是影响服务质量的关键因素。本文探讨了分类中心的安全控制问题。仿真结果表明,在分类性能指标方面,LSTM-CNN-Attention模型的Recall、Accuracy和F1分数均优于LSTM和CNN模型。此外,与LSTM和CNN模型的分类性能指标相比,LSTM-CNN-Attention模型的Recall、Accuracy和F1分数都有显著提高,证明LSTM-CNN-Attention模型可用于配送中心的数据分类处理。该模型在处理快递分拣环节数据时表现更佳,证实了LSTM-CNN-Attention模型的优越性。
Abstract: The sorting operation of the distribution center is the most costly part of the courier enterprise, and the safe operation and management of the distribution center is also a key factor affecting the quality of service. This paper discusses the security control problem of the sorting center. The simulation results show that the Recall, Accuracy and F1 scores of the LSTM-CNN-Attention model outperform those of the LSTM and CNN models in terms of classification performance metrics. In addition, the Recall, Accuracy and F1 scores of the LSTM-CNN-Attention model are significantly improved compared with the classification performance metrics of the LSTM and CNN models, proving that the LSTM-CNN-Attention model can be used for data classification processing in distribution centers. The model performs better when processing data from courier sorting sessions, confirming the superiority of the LSTM-CNN-Attention model.
文章引用:张博研, 李文, 梁方, 刘厚娟, 孙军艳. 基于机器学习的分拨中心安全评估与风险预警研究[J]. 人工智能与机器人研究, 2024, 13(4): 872-882. https://doi.org/10.12677/airr.2024.134089

1. 引言

快递业近年来在多个方面取得了显著成就,成为社会发展的重要力量。国家在快递业安全方面给予了高度关注,并制定了相应政策。然而,由于快递业基层工作复杂,政策的有效执行面临挑战,因此深入研究快递业的安全体系至关重要。分拣作为派送流程中的关键环节,其安全评估与预警对快递业的安全运营至关重要。分拣作业涉及多个因素,如搬运成本、人力资源消耗、管理复杂度以及自动化程度等,这些都增加了分拣作业在仓储作业中的成本比例。为了保障快递业的安全运营,本文深入研究分拣流程,对其进行安全评估与安全预警的研究。通过对分拣流程的全面分析,我们提出了针对性的策略和建议,旨在提高快递业的安全水平,确保快递服务的质量和效率。综上所述,快递业的安全体系研究和改进对快递业的持续健康发展具有重要意义。通过对分拣流程的安全评估与预警研究,我们可以为快递行业的安全运营提供新的策略和思路。

国内外针对物流企业安全评估与安全预警都进行了相关研究。在安全评估方面,主要分为以下两种情况。第一种是仅对物流某一重要流程进行安全评估,如奇格奇[1]对快递运输这一流程的风险评价提供可量化的客观指标依据。李喜媛[2]以陕西省道路危险货物运输企业为研究对象,设计并实现了面向道路危险货物运输企业安全评估的应用系统。第二种是对物流整体重要流程任务进行安全评估,Antoni Arif Priadi [3]基于滚装渡船这一海上运输工具,结合层次分析法以及模糊逻辑系统对整体运输供应链进行安全评价并阐述其缓冲开发模型。王荧荧[4]等针对农产品冷链物流进行研究,对冷链物流作业全过程中摘取重要因素构建评估模型。

国内外对安全预警的研究各有侧重。国外的研究主要集中在智能技术在多个领域的应用和实施,而国内的研究大多集中在企业生产过程中的安全预警。其中物流领域的研究则主要集中于供应链关键环节的安全预警。如张奇[5]等对支持向量机算法进行深入探讨,建立了港口企业SVM数字建模安全预警模型,分析其应用于港口企业安全生产中的工作原理。综上所述,国内外对安全评估的研究主要集中于物流整体重要流程,对某一重要流程的研究也大部分集中于运输这一环节。在物流方面,对安全预警的研究主要集中于整体供应链,针对某一重要流程为对象的研究相对较少,导致研究细致程度不足。本文对快递中心分拣这一具体流程设计其安全评估体系,并通过LSTM-CNN-Attention机器学习模型对数据进行训练、测试,并与其它算法比较得出该算法合理性,从而实现对风险的及时发现和预警。

2. 指标体系的构建

2.1. 评估指标的设计

在快递分拣流程的研究中,为全面评估其安全性,构建了一个结构清晰的评估指标体系。该体系以分拣流程为核心,细分为分拣准备、分拣作业安全、分拣后处理、分拣中心安全要求以及安全设备配置等7个维度。一级指标共7个,二级指标多达35个。其中,二级指标分别隶属于相应的一级指标,且涵盖场地安全(如场地检查、安全标识、安全通道合理性、耐火防雷等)、人员安全(如着装规范性、完整性检查)、设备安全(如分拣设备保护装置、传送设备保护装置、其他设备使用安全)以及管理安全(如风险管控、隐患排查与治理)等多个方面。此评估指标结构体系全面且细致,如图1所示,为深入剖析快递分拣流程的安全性提供了坚实的基础和科学的依据。

Figure 1. Structure diagram of the evaluation index

1. 评估指标结构图

2.2. 评估指标的优化

上述各个评估指标之间存在一定的相关性,在数据集的处理环节中应减少或消除各指标之间相关性,从而增强数据的可靠程度,为选取适宜的降维方法,在数据收集方面,我们考虑到快递分拣工作呈现出显著的动态性与复杂性特质。每日所处理的包裹数量极为庞大,且种类繁杂多样,涵盖了不同的尺寸、重量以及目的地等多元因素。为了能够全面且精准地描绘分拣环节的特征与规律,必须收集足量的数据点。鉴于此,依据该行业的实际工作状况,我们于不同的时间点进行数据采集,每日采集30条,总计收集到360条可用数据。在指标优化的方法选取上,我们对数据采用KMO和巴特利特检验。

Table 1. KMO and Bartlett tests for the sorting process

1. 分拣环节的KMO和巴特利特检验

KMO取样适切性量数

巴特利特球形度检验

近似卡方

自由度

显著性

0.526

12.801

15

0.618

根据表1的数据,KMO取样适切性量数为0.526,通常认为当KMO值大于0.5时,数据适合进行因子分析。此外,巴特利特球形度检验的近似卡方为12.801,自由度为15,显著性为0.618。虽然显著性大于0.05,表明变量间的相关性较弱,但综合考虑KMO值,本研究决定采用因子分析方法实现指标的降维。

采用因子分析法处理后,指标体系发生了显著的变化,如图2所示。初始时,评估体系的一级指标涵盖分拣准备、分拣作业安全、分拣后处理、分拣中心安全要求、安全设备配置、生产设备安全以及处理场所安全共7个方面,二级指标数量多达35个,虽然全面但稍显复杂冗余。

经优化整合,一级指标重构为分拣准备与前期保障、分拣作业中的安全管控、分拣后的后续处理与监管、分拣中心综合安全管理、关键安全设备配置与维护以及总体安全风险防控6个部分。二级指标亦精简至22个,通过对相似性较高的指标进行合理合并与优化,新的指标体系在结构上更为简洁紧凑,重点更为突出,极大地降低了指标间的冗余和重叠,能够更加精准地捕捉快递分拣流程安全的关键核心要素,使评估过程更具科学性、准确性和可行性,从而为切实提升快递分拣流程的安全性提供了更为明晰有力的指引和支撑。

Figure 2. Safety evaluation index of the optimized distribution center

2. 优化后的分拨中心安全评估指标

2.3. 风险等级的划分

为了更直观地体现出对于分拣环节安全预警,将安全等级由高到低划分为A、B、C、D等4个等级,其预警等级从低到高依次为“无风险、低风险、中风险、高风险”,在确定等级阈值时,我们对大量的历史数据进行了详细的统计分析。通过收集和整理长时间跨度、多批次的分拣环节相关数据,通过计算概率密度公式得出了数据的均值μ为0.5和标准差为0.06。利用这两个具有代表性的统计参数来构建高斯分布模型。

f( x;μ,σ )= 1 σ 2π e 1 2 ( xμ σ ) 2 (1)

在高斯分布中,均值0.5反映了数据的集中趋势,标准差0.06则衡量了数据的离散程度。基于此高斯分布,我们运用其累积分布函数(CDF)来计算得分的分位数阈值。

F( x )=P( Xx ) (2)

经过反复的验证和优化,最终选取了25%、50%、75%的分位数来确定等级的阈值,具体划分如表2

Table 2. Classification table of the sorting links

2. 分拣环节的等级划分表

评估等级

A级

B级

C级

D级

预警等级

无风险

低风险

中风险

高风险

得分值

得分 ≥ 0.54

0.54 > 得分值 ≥ 0.48

0.48 > 得分值 > 0.42

得分 ≤ 0.42

通过以上严谨、科学且基于充分数据依据的方法,我们得到了分拣环节的等级划分结果,为企业的安全管理提供了可靠的决策支持。

3. 预警模型的构建

3.1. LSTM-CNN-Attention预警算法设计

由于分拨中心的安全状况和风险因素确实常常随时间发生改变,在不同的时间段,分拨中心的货物流量、人员操作规范程度、设备运行状态等都可能存在差异。时间序列能够有效展示数据随时间的变化趋势和规律,这是因为在不同时间点上数据的观测值具有顺序性和相关性。因此采用时间序列数据可以更好地捕捉这些动态变化,从而准确预测风险趋势。

在实际应用中,时间序列方法可以动态监测与警报,因为它能够对连续的数据进行即时处理。通过实时分析时间序列数据,模型能够迅速发现异常变化,从而为及时采取措施提供有力支持。此外,时间序列方法与LSTM- CNN-Attention模型非常契合,这是由于LSTM记忆单元能处理序列数据的长期依赖性,并捕捉时间相关性;CNN则能够提取局部关键信息,它自动识别时间序列数据中重要的特征模式;而注意力机制能根据重要性分配权重,突出重要信息。这样的结合使模型能更全面地理解和利用时间序列数据特征,提高性能和泛化能力。因此,本文采用LSTM-CNN-Attention算法对分拣中心的风险进行预警,其总体框架如图3所示。

Figure 3. The LSTM-CNN-Attention overall framework

3. LSTM-CNN-Attention总体框架

本研究出了一个全面而严谨的数据处理与预测框架。输入数据作为起始环节,承载原始信息,随后经过数据预处理模块,进行归一化和标准化等操作,并使用因子分析方法对输入数据进行处理。在此过程中,运用了包括CNN在内的先进技术进行特征提取。通过因子分析的巧妙应用,结合Attention机制对关键数据的聚焦,对数据进行深度挖掘与整合,从而得出综合得分。各指标在整个流程中发挥着不可或缺的作用。同时,利用LSTM模型的强大预测能力,最终实现对风险等级的精确评估。该图所展示的架构,不仅体现了科学的数据处理流程和严谨的分析逻辑,还为后续的深入研究奠定了坚实的基础,提供了宝贵的理论支持和实践指导。

3.2. 仿真分析

3.2.1. 参数设置

在本研究的模型训练中,选用Adam梯度下降算法,其结合自适应矩估计优势,可动态调整学习率以高效寻优。设置最大迭代次数为1500次以平衡计算资源与训练效果。初始学习率1e−2使模型初期快速趋近最优解,引入学习率下降因子0.5及在700次训练后调整为0.01 × 0.1,确保后期精细收敛。每次训练打乱数据集,增加随机性以提升泛化能力。设置误差阙值le−6和le−3作为收敛标准。这些参数设置基于深入理解与实践经验,旨在实现高效训练与良好性能,如表3所示。

Table 3. Description of the training parameter setting

3. 训练参数设置说明

参数设置

算法选取

Adam梯度下降算法

最大迭代次数

1500

初始学习率

1e−2

学习率下降因子

0.5

数据集处理方式

每次训练打乱数据集

经过700次训练后的学习率

0.01 × 0.1

误差阙值

le−6

学习率

le−3

3.2.2. 仿真对比

为了验证LSTM-CNN-Attention神经网络模型的有效性和准确性,将本文提出的LSTM-CNN-Attention模型与CNN模型和LSTM模型进行对比,结果如图4~图9所示。

Figure 4. Comparison of prediction results of LSTM-CNN-Attention training set

4. LSTM-CNN-Attention训练集预测结果对比图

1) LSTM-CNN-Attention模型

通过对图4中训练集预测结果和图5中测试集预测结果的分析,该模型在处理时间序列数据时具有良好的预测能力和出色的泛化性能。该模型能够准确捕捉数据中包含的规律性,在训练集和测试集上都

Figure 5. Comparison plot of the prediction results of the LSTM-CNN-Attention test set

5. LSTM-CNN-Attention测试集预测结果对比图

Figure 6. Results prediction of CNN model training set

6. CNN模型训练集结果预测对比图

Figure 7. Comparison chart of CNN model test set prediction results

7. CNN模型测试集结果预测对比图

Figure 8. The prediction of LSTM model

8. LSTM模型训练集结果预测对比图

Figure 9. Results prediction of LSTN model test set

9. LSTN模型测试集结果预测对比图

显示出较高的预测准确性,有力地支持了分类过程的优化。通过仔细观察红线和蓝线的拟合度,可以对模型的预测能力做出初步判断。

2) CNN模型

对比图6中训练集结果和图7中测试集结果可知,其对数据的结果预测虽呈现出一定的规律性,但精准度欠佳。究其原因,时间序列数据的复杂性与该模型的架构复杂度未能达到理想匹配,致使在部分情形下,模型的预测结果与实际值之间存在显著的偏差。

3) LSTM模型

图8中LSTM神经网络的训练集数据情况和图9中测试集数据进行比较,可以发现在数据质量相同且排除数据过载和欠载的情况下,该模型训练集和测试集数据的预测值与真实值的预测结果非常相似,但相较于LSTM-CNN-Attention模型仍有劣势。

综上所述,这项比较研究表明,LSTM-CNN-Attention神经网络模型在处理时间序列数据方面具有显著优势,CNN神经网络在性能方面的表现存在一定局限性,LSTM神经网络在特定条件下仍然能实现较为准确的预测。

3.2.3. 模型合理性验证

表4聚焦于快递分拣环节,对CNN、LSTM以及LSTM-CNN-Attention这三种模型的性能展开了多维度、系统性的量化对比剖析,如表4所示。

表4具体借助平均绝对误差(MAE)、平均偏差误差(MBE)、平均绝对百分比误差(MAPE)、均方根误差(RMSE)、召回率、准确率和F1分数等一系列精准且具有代表性的量化指标,以详实的数据形式清晰而直观地呈现出各模型在性能上的显著差异。

Table 4. Comparison of the results of the related indicators

4. 相关指标结果对比

数据源

模型类型

R2

MAE

MBE

MAPE

RMSE

召回率

准确率

F1分数

快递分拣环节

CNN

0.353

0.054

0.002

0.115

0.050

0.484

0.654

0.625

LSTM

0.451

0.041

0.007

0.098

0.059

0.347

0.453

0.453

LSTM-CNN-Attention

0.843

0.018

-0.007

0.002

0.033

0.717

0.764

0.795

从数据呈现来看,在平均绝对误差方面,LSTM-CNN-Attention模型的值为0.843,相较于CNN模型的0.353和LSTM模型的0.451,优势显著,充分表明该模型的预测值与实际值之间的偏差程度相对较小,预测精度更为出色。在平均偏差误差维度,LSTM-CNN-Attention模型的0.018这一数值为最小,清晰地展示其在预测过程中更少出现系统性的偏差,具备更为稳定和可靠的预测性能。在平均绝对百分比误差层面,LSTM-CNN-Attention模型的−0.007这一数据彰显出其相对误差处于极低水平。而均方根误差仅为0.033,有效地彰显了该模型在预测结果方面的卓越准确性和优异的稳定性。

除此之外,在召回率、准确率和F1分数等综合评估指标上,LSTM-CNN-Attention模型分别取得了0.717、0.764和0.795的优异表现,进一步验证了其在综合性能方面的显著优势。

根据表4对相关指标数据对比做出可视化图像,如图10所示。

Figure 10. Comparison of the results of the related indicators

10. 相关指标结果对比

综上所述,表4所提供的丰富且精确的数据,为LSTM-CNN-Attention模型在快递分拣环节中性能的合理性与优越性提供了坚实且令人信服的量化依据,有力地为该模型在未来进一步探索其他领域的应用潜力提供支撑,以推动智能物流系统的发展。

4. 结论

本文聚焦快递企业的重要环节,深入开展安全评估工作。在前期,广泛收集了丰富的安全评估指标,并运用因子分析法精心筛选出相对更为重要的指标。随后,创新性地设计了LSTM-CNN-Attention预警算法,利用该模型对数据集进行全面的训练和严格的测试。通过与CNN模型以及LSTM模型的多个指标性能进行细致对比分析,充分论证了机器学习模型LSTM-CNN-Attention的最优性与合理性。由此,成功构建起一套相对科学、合理且具有较强实用性的快递分拣安全评估体系。这一体系的构建,对于切实提升快递分拣环节的安全管理水平、有力保障消费者的合法权益具有至关重要的意义。它不仅为快递企业的安全管理提供了科学的方法和工具,也为相关领域的学术研究提供了新的思路和参考。

参考文献

[1] 奇格奇, 张子贤, 卫振林, 等. 基于语义挖掘的快递运输货品风险评价研究[J]. 交通运输系统工程与信息, 2021, 21(4): 248-255.
[2] 李喜媛. 面向道路危险货物运输企业安全评估的应用系统研究[D]: [硕士学位论文]. 西安: 长安大学, 2022.
[3] Priadi, A.A., Benabdelhafid, A. and Tjahjono, T. (2014) Transportation Supply Chain Safety Assessment Based on Ro-Ro Ferry Shiphandling Difficulty Model Approach. International Journal of Business Performance and Supply Chain Modelling, 6, Article 395.
https://doi.org/10.1504/ijbpscm.2014.065279
[4] 王荧荧, 张敏, 朱文英. 农产品冷链物流安全评估体系研究[J]. 物流技术, 2013, 32(19): 4-6.
[5] 张奇, 王绪亭, 刘艳, 等. 数字建模安全预警技术在港口企业的应用研究[J]. 劳动保护, 2023(5): 101-103.