基于K-Shape和LSTM两阶段优化的船舶备件深度学习需求预测
Deep Learning Enabled Demand Forecasting for Ship Spare Parts Based on K-Shape Clustering and Two-Stage LSTM Optimization
DOI: 10.12677/orf.2025.155231, PDF, HTML, XML,    科研立项经费支持
作者: 陈薇如:上海理工大学管理学院,上海;傅文翰*:上海理工大学管理学院,上海;上海理工大学智慧应急管理学院,上海
关键词: 船舶建造备件需求预测长短期记忆网络K-Shape时间序列聚类Ship Building Spare Parts Demand Forecasting Long Short-Term Memory Network K-Shape Time Series Clustering
摘要: 船舶备件多为突发性需求,同时具有价值高、缺件损失大等特点,准确的需求预测可以帮助船舶企业优化库存,减少缺货导致的停航损失和紧急采购的高成本。因此,本文提出一种结合K-Shape聚类与两阶段LSTM的船舶备件深度学习预测方法。首先利用K-Shape算法对船舶备件产品的历史需求数据进行聚类;其次针对具有间歇性特征的备件构建两阶段LSTM模型,以期达到更好的预测效果;最后,以W公司为案例对所提方法进行验证。结果表明,两阶段LSTM在间歇性类别中预测效果最优,各评价指标优化率均明显优于其他类别,且相较于单阶段LSTM,RMSE、MAE、R2及MASE的优化率分别可达10.99%、15.39%、9.24%及16.10%。因此,所提出的两阶段LSTM方法适用于间歇性备件的需求预测,且预测效果更好。
Abstract: The demand for ship spare parts is often sudden and characterized by high value and significant losses due to shortages. Accurate demand forecasting can help enterprises optimize inventory, reduce losses from downtime caused by shortages, and lower the high costs of emergency procurement. Therefore, this paper proposes a deep learning enabled forecasting method that combines K-Shape clustering with a two-stage LSTM model. First, the K-Shape algorithm is used to cluster historical demand data for ship spare parts. Then, a two-stage LSTM model is constructed for spare parts with intermittent demand characteristics to achieve better forecasting performance. Finally, the proposed method is validated using Company W as a case study. The results show that the two-stage LSTM model performs best in the intermittent demand category, with all evaluation metrics significantly outperforming other categories. Compared to the single-stage LSTM, the optimization rates for RMSE, MAE, R2, and MASE are 10.99%, 15.39%, 9.24%, and 16.10%, respectively. Thus, the proposed two-stage LSTM method is suitable for demand forecasting of intermittent spare parts and offers superior forecasting performance.
文章引用:陈薇如, 傅文翰. 基于K-Shape和LSTM两阶段优化的船舶备件深度学习需求预测[J]. 运筹与模糊学, 2025, 15(5): 59-67. https://doi.org/10.12677/orf.2025.155231

1. 引言

自2009年国务院明确上海建设“国际航运中心”以来,上海逐步成为全球航运网络的关键节点,承担着中国约30%的对外贸易货物运输。《中国制造2025》将高端船舶列为重点领域,“十四五”规划提出打造长三角世界级船舶产业集群。上海船舶产业历经从“修船仿制”到“自主创新”的百年跨越,依托国家战略、龙头企业和长三角一体化优势,正从“造船大国”向“造船强国”迈进。

备件生产供应是上海船舶产业高效运转的基础支撑和核心竞争力的关键环节。在满足船舶综合保障需求的过程中,船舶主动力备件贯穿船舶维修保障的全过程,是保障船舶正常航运作业的关键装备[1]。由于备件需求受故障率、航运环境等因素影响,多为突发性需求,整体呈现出明显的间歇性,同时备件还具有价值高、缺件损失大等特点。备件的需求预测是船舶产业链高效运转的核心控制节点,直接影响企业成本及客户信任。准确的需求预测可以帮助企业优化库存,减少过剩或缺货的情况,从而减少缺货导致的停航损失和紧急采购的高成本。

当前,船舶维修备件管理的优化已成为行业关注的焦点,而其核心问题主要集中在备件分类及需求预测准确性两个方面。传统的分类方法最早起源于ABC分类法,该方法通过将备件按照重要性或价值分为A、B、C三类,实现资源的差异化管理和优化配置,是一个单一标准定量分类框架[2]。进而有学者采用ABC-FSN分类算法应用于企业库存管理中的物料件分类[3],基于物品价值和重要性的同时也参考物品的销售速度和周转率,以实现更精细化的库存管理。而在备件分类技术不断发展的背景下,多种分类算法应运而生。为了得到更准确的分类,一些学者用TOPSIS框架[4]、模糊评价[5]、粗糙集[6]等对备件进行多准则ABC分类。而在人工智能技术快速发展的背景下,越来越多的学者运用人工智能算法来解决多准则备件分类问题,如BP神经网络、支持向量机、聚类算法等被大量运用在备件分类领域。此外,也有多数学者运用组合方法对备件进行分类。CUI等[7]提出了两种混合分类算法——BBO-BPNN和AMPSO-BPNN算法。ZHANG等[8]提出一种改进K-means聚类算法与反向传播神经网络相结合的重要度评估及备件分类方法。赵青雨等[9]结合否定规则改进聚类算法,解决多指标的互补性问题,并提出了一种改进粒子群优化BP神经网络的备件分类模型,对新入库备件分类有持续更新能力。

简单基础的预测方法为备件需求预测打下了坚实的基础。在过去众多需求预测的文章中,指数平滑法是最流行的预测方法[10],其次是简单移动平均法(SMA)、类克罗斯顿法(Croston-like)和差分自回归移动平均(ARIMA)。随着对备件需求预测准确率要求的提升,机器学习方法近年来越来越流行。Feng Y W等人[11]在研究中深入探讨了民用飞机备件预测技术的现状,并系统阐述了多种预测方法,包括基于时间序列的移动平均法、Croston方法和SBA方法,基于回归模型的预测方法,故障观察法以及机器学习法,并结合民用飞机备件的特点,提出深度学习模型可用于实现更科学的预测。张佳琦等学者[12]利用改进的灰狼算法对支持向量机回归算法进行优化,并通过实验展示了其在备件预测中的显著效果。此外,组合的需求预测模型展示出其优异的性能,受到越来越多学者的青睐。王宁等[13]构建了一种ARIMA-BP-CNN组合预测模型,通过为ARIMA、BP神经网络和卷积神经网络分别赋予权重,并利用遗传算法(GA)优化这些权重系数来实现。李晓娟等人[14]针对受多因素影响的复杂备件需求预测问题,构建了主成分分析-反向传播(PCA-BP)模型,首先运用主成分分析(PCA)筛选出影响风电备件需求的关键要素,随后借助BP神经网络算法进行建模与预测,从而获得了高精度的预测结果。杨华强等人[15]针对间歇性和随机性特征的维修备件需求预测问题,提出了一种改进的Croston方法,他们根据Syntetos准则将备件需求分为四类,并针对波动性需求,结合集合经验模态分解(EEMD)和长短期记忆网络(LSTM)设计了集成预测模型,分别预测需求发生状态和需求量。

传统的一维标准分类方法往往因过于单一而难以满足复杂分类需求,难以实现理想的分类效果。而面对数量庞大且复杂的备件库,多维标准分类法和基于人工智能的分类法则能够提供更高的精确度和精准度。由于备件的类型和需求特征各异,不同类型的备件往往需要采用不同的预测方法来实现最佳的预测效果。一些备件可能受到季节性或趋势性因素的影响,这就需要进一步选择能够捕捉这些特征的预测技术。因此,最终预测的精准性不仅取决于所选方法的适用性,还取决于是否能够根据备件的具体需求特征进行灵活调整和优化。

2. 研究方法

本文拟采用如图1所示框架对船舶备件进行需求预测,主要由聚类和预测两部分构成。考虑到船舶备件产品的多样性,引入K-Shape聚类方法提取备件需求特征,从而在建模前提升数据的结构一致性。针对预测难度较大的间歇性备件,本文提出一种两阶段LSTM模型,用于提升对船舶备件的预测精度。

Figure 1. Spare parts forecasting framework

1. 备件预测框架示意图

2.1. K-Shape时间序列聚类

本文采用K-Shape时间序列聚类算法对备件进行预分类。K-Shape聚类算法是一种基于时间序列的聚类方法,用于将相似的时间序列分为同一类[16],适用于提取备件需求序列中的周期性、趋势性、间歇性等。其基本思想是通过对时间序列进行自动化预处理和转换,然后采用一种被称为基于形状的距离(Shape-Based Distance, SBD)的度量方法来计算时间序列之间的相似度,从而实现聚类[17]。与传统聚类算法相比,K-Shape不依赖序列的绝对数值,而强调其相对变化趋势,因而在处理需求频率与幅度差异显著的船舶备件时具有更强的适应性。

K-Shape算法的关键步骤主要包括形状特征提取、距离度量、簇的生成和簇的更新。首先,该算法通过对原始时间序列进行预处理,采用形状归一化技术消除不同序列在幅度上的差异,使其在保持原有趋势与结构的基础上,具有统一的尺度。完成归一化后,K-Shape算法采用SBD来评估序列间的相似性。SBD算法通过计算序列之间的距离,将原始序列分配给距离最近的质心所代表的簇。为实现平移不变性,算法固定参考序列Y不动,将目标序列X在时间轴上进行滑动,在每一个滑动位置下计算两序列的互相关值。设序列X和Y的长度均为m,它们分别表示为向量xy,滑动步长为s,则SBD距离函数可表示为:

SBD( x,y )=1 max s ( NC C s ( x,y ) ) (1)

基于SBD距离,K-Shape算法自动提取每种备件历史需求序列的主要形状特征并聚为若干簇。聚类目标是将形态相似的需求序列归为一类,使得同一簇内的备件具备相近的需求模式,从而在后续建模阶段便于采用结构匹配的预测方法。

2.2. 两阶段LSTM模型

船舶备件需求数据往往呈现出明显的时间依赖性和非线性特征,且具有高比例的零值观测。这类需求序列不仅需要捕捉长期与短期的变化趋势,还需有效区分“是否产生需求”与“需求量大小”两个阶段性特征。为此,本文引入了LSTM作为核心预测模型,并在此基础上设计了适用于间歇性需求的两阶段建模结构。

长短期记忆网络(Long Short-Term Memory, LSTM)是一种时间循环神经网络,LSTM的出现解决了RNN在处理长序列数据时面临的梯度消失或爆炸问题[18] [19],因此可以很好地处理长期依赖关系[20]。LSTM单元的结构包括输入门、遗忘门和输出门三个核心组成部分。遗忘门负责决定细胞状态中哪些信息将被丢弃,而输入门则决定新的信息将被存储在细胞状态中,细胞状态则负责存储和更新序列信息,而输出门则决定输出值,这四个部分共同协作,使得LSTM能够学习并记住长期依赖关系。

本文在传统LSTM的基础上进一步设计了一种两阶段的LSTM网络结构,以更好地适应间歇性需求预测任务中具有阶段性特征的预测目标。传统LSTM模型直接输出预测值,在面对大量零值与非零值混杂的数据时,往往难以同时兼顾两类样本的建模精度。而两阶段结构通过引入分类任务与回归任务,如图2所示,显著提升了模型的预测能力。

在两阶段模型中先使用LSTM提取时间序列的隐藏状态信息。设第t时刻输入序列为 x t ,对应的LSTM输出隐藏状态为 h t 。两阶段结构将隐藏状态 h t 分别送入两个子网络中,进行分类和回归任务建模。第一阶段为分类子网络,用于预测当前时刻是否存在需求,该阶段公式如(2)所示。

p ^ t =σ( W c ReLU( W 1 h t + b 1 )+ b c ) (2)

其中, p ^ t ( 0,1 ) 表示第t时刻预测的需求发生概率, ReLU( x )=max( 0,x ) 是激活函数。该阶段是一个二分类任务,训练过程中使用二元交叉熵损失函数 L class

Figure 2. Schematic of the two-stage LSTM model

2. 两阶段LSTM模型示意图

第二阶段为回归子网络,在第一阶段判定“有需求”后,进一步预测其具体数值 y ^ t ,使用均方误差作为损失函数 L reg

训练过程采用联合损失函数以同时优化分类与回归目标,公式如(3)所示。

L=α L class +( 1α ) L reg (3)

其中 α[ 0,1 ] 是平衡两个任务的加权系数。

两阶段LSTM架构通过任务分离、目标明确的方式,对间歇性需求的结构性特征建模能力更强,容易展现出更优的预测性能。

3. 案例分析

本文选择W公司最为案例研究的对象,旨在提高W公司备件预测精度,降低该公司的库存管理难度。W公司集炼钢、锻造、有色铸造、热处理、机械加工、成套设备制造于一体,是我国船舶行业重要的铸锻件生产基地,为上海船舶产业提供了大量高质量的关键零备件。同时,W公司为上海船舶产业提供高质量的维修备件和技术支持,其生产的船用铸锻件、液压系统备件等产品广泛应用于船舶维修和改造,确保船舶设备的正常运行。然而作为一家大型铸锻企业,W公司涉及多种备件的管理,库存种类繁多,管理难度较大。本文采用的数据集包括W公司33种不同型号产品近104周需求观测数据。为保护专有信息,历史数据已进行系统性转换。

3.1. 备件分类

本文采用K-Shape方法对33种产品的需求数据文件中单列数值序列进行读取,完成数据预处理、聚类分析和分类结果展示。其中在选择最优簇数量K值时,采用轮廓系数优化方法实现自动选择。在2~10的K值范围内,通过迭代测试评估每个K值的聚类质量,计算样本与同一簇内平均距离以及最近非所属簇平均距离,得出轮廓系数评分。最终选择得分最高的K值作为最优簇数,确保分类结果合理且区分度高。最终选取K = 5为最优簇数,将33种产品按其需求特性分为五类,如图3所示。

Figure 3. Demand trend chart by spare parts category

3. 备件分类需求趋势图

其中图3(a)图3(c)均呈现出明显的趋势,分别命名为“下降需求类”和“上升需求类”,特征表现为需求较为连续,且呈现出一定的趋势性;图3(b)无明显趋势,但需求量大且频率较高,命名为“高频需求类”;图3(d)图3(e)则明显呈现间歇性需求特征,即多数时间点需求为零,偶尔出现非零需求,根据需求间断时间的高低而分为“高间歇需求类”和“低间歇需求类”。

3.2. LSTM两阶段预测结果与分析

为了选取适用于本数据集的最优预测方法,本文在不考虑产品类型差异的前提下,统一对33种产品进行建模,分别采用长短期记忆网络(LSTM)、支持向量回归(SVR)、随机森林(RF)与Croston方法进行预测。将近104周需求观测数据缩放至0~200之间,按照7:3的比例划分训练集和测试集,采用相同的数据预处理流程,在相同的输入结构和训练策略下,分别记录每种方法在33类产品测试集上的四项评价指标RMSE、MAE、R2和MASE的值,并分别计算其平均值作为比较预测效果的指标。如表1所示,LSTM在整体预测性能上优于其他三种方法,表现出更强的泛化能力和对时序特征的刻画能力,因此被选为后续分析的基础预测模型。

Table 1. Baseline model comparison

1. 基础预测模型比较

预测模型

RMSE

MAE

R2

MASE

LSTM

19.48

13.52

0.65

0.35

SVR

23.03

15.11

0.54

0.49

随机森林

20.84

14.52

0.53

0.55

Croston

32.70

18.03

0.21

0.65

Table 2. Comparison of classification optimization

2. 分类优化比较

簇类

预测方法

RMSE

MAE

R2

MASE

簇1

单阶段LSTM

13.74

9.18

0.48

0.23

两阶段LSTM

13.09

8.71

0.51

0.22

优化比

4.77%

5.04%

6.00%

3.41%

簇2

单阶段LSTM

20.98

13.59

0.57

0.36

两阶段LSTM

20.33

12.84

0.55

0.35

优化比

3.09%

5.50%

2.20%

4.05%

簇3

单阶段LSTM

30.43

22.22

0.55

0.60

两阶段LSTM

29.94

21.28

0.55

0.58

优化比

1.63%

4.22%

0.71%

2.44%

簇4

单阶段LSTM

11.01

5.48

0.84

0.30

两阶段LSTM

9.69

4.90

0.88

0.26

优化比

12.01%

10.65%

4.22%

13.20%

簇5

单阶段LSTM

24.21

17.24

0.68

0.29

两阶段LSTM

21.55

14.58

0.75

0.24

优化比

10.99%

15.39%

9.24%

16.10%

考虑到不同备件类别在需求特性上的差异,本文进一步在各类别中分别引入两阶段LSTM建模策略,并将其预测效果与前文统一建模下的单阶段LSTM模型进行对比,以验证该策略在不同类型需求中的适用性。具体地,分别对每一类产品计算其在两种建模方法下测试集上的四项评价指标的平均值,作为比较依据,比较结果如表2所示。

在前3类产品中,两阶段LSTM模型在部分指标上略优于单阶段LSTM,MAE和RMSE略有下降,R²略有提升,整体表现出一定的提升,但幅度有限。这表明两阶段建模虽然有所改善,但边际增益相对较小。在对比中,第4类与第5类产品表现出典型的间歇性需求特征,零需求时间点占比较高,且需求发生的时点呈现高度不确定性。两阶段模型在这两类中展现出显著的建模优势。第4类中,RMSE下降12.01%,MAE下降10.65%,R²提高4.22%,MASE下降13.20%;第5类中,四项指标改善更为显著,R²提升9.24%,误差大幅降低,表明该策略能更有效地区分“有无需求”与“需求强度”,大幅提升预测性能。

尽管两阶段建模策略在所有产品类别中均实现了一定程度的性能提升,但其在前三类中表现出的优化幅度相对有限。而对于后两类典型的间歇性需求产品,该策略在“是否发生”与“发生强度”上的结构分解更好地契合了其数据特性,从而显著提升了模型的预测精度和稳定性。这一结果验证了基于需求特征进行模型结构匹配的必要性,也为今后的模型选择与预测策略制定提供了实践依据。

4. 结论与展望

本文针对船舶维修场景下的备件需求预测问题,提出了一种基于K-Shape聚类与LSTM两阶段优化的建模框架。通过对W公司备件产品的需求数据进行聚类分析,并进一步结合产品类别特征采用差异化的预测建模策略。实验结果表明,在整体建模中,LSTM方法在多个评价指标上优于SVR、随机森林与Croston等常见方法,展现出良好的预测能力。在进一步的分类建模中,LSTM两阶段模型在间歇性特征显著的产品类别中表现尤为突出,显著优于传统单阶段建模方法;而在趋势性或波动性较强的产品类别中,其预测性能提升相对有限,显示出不同需求结构下模型适配性的差异。当前船舶维修备件的管理仍面临信息孤岛、计划滞后、库存冗余等问题,本文所提出的建模思路为船厂在实际操作中提供了可执行的改进路径。通过对备件进行形态分类并有针对性地采用匹配的预测模型,企业可更精确地掌握不同类型备件的需求节奏。

当前提出的两阶段LSTM方法虽已在间歇性类别中取得较好效果,但模型结构和损失函数仍存在进一步优化空间。对于趋势性、波动性等类别产品,其建模思路与算法选择仍有待深入探索,后续研究可在此基础上进一步拓展。随着智能船厂与数字化运维体系的发展,备件预测将不再是一个孤立的技术问题,而是贯穿船舶全生命周期管理的重要环节。后续研究可进一步结合实时传感数据、设备故障记录、航行计划等多源信息,构建更全面的预测输入体系,嵌入船舶企业的维修管理系统和ERP平台中,用于优化库存配置、动态调整采购计划和制定更合理的安全库存策略,进而降低备件积压与缺货风险,提高运维保障能力。

基金项目

上海市高水平机构建设运行计划“软科学研究”项目(25692116600);上海高校青年教师培养资助计划(ZZ202203036)。

NOTES

*通讯作者。

参考文献

[1] 孟冠军, 杨思平, 钱晓飞. 基于红狐优化支持向量机回归的船舶备件预测[J]. 合肥工业大学学报(自然科学版), 2025, 48(1): 25-31.
[2] Teunter, R.H., Babai, M.Z. and Syntetos, A.A. (2010) ABC Classification: Service Levels and Inventory Costs. Production and Operations Management, 19, 343-352. [Google Scholar] [CrossRef
[3] 方忠民, 韩福义, 马蓉. 模糊ABC-FSN分类法在企业库存管理中的应用[J]. 物流技术, 2019, 38(1): 114-119.
[4] Tavassoli, M. and Farzipoor Saen, R. (2022) A Stochastic Data Envelopment Analysis Approach for Multi-Criteria ABC Inventory Classification. Journal of Industrial and Production Engineering, 39, 415-429. [Google Scholar] [CrossRef
[5] Yung, K.L., Ho, G.T.S., Tang, Y.M. and Ip, W.H. (2021) Inventory Classification System in Space Mission Component Replenishment Using Multi-Attribute Fuzzy ABC Classification. Industrial Management & Data Systems, 121, 637-656. [Google Scholar] [CrossRef
[6] Hu, Q., Chakhar, S., Siraj, S. and Labib, A. (2017) Spare Parts Classification in Industrial Manufacturing Using the Dominance-Based Rough Set Approach. European Journal of Operational Research, 262, 1136-1163. [Google Scholar] [CrossRef
[7] Cui, L., Tao, Y., Deng, J., Liu, X., Xu, D. and Tang, G. (2021) BBO-BPNN and AMPSO-BPNN for Multiple-Criteria Inventory Classification. Expert Systems with Applications, 175, Article ID: 114842. [Google Scholar] [CrossRef
[8] Zhang, S., Qin, X., Hu, S., Zhang, Q., Dong, B. and Zhao, J. (2020) Importance Degree Evaluation of Spare Parts Based on Clustering Algorithm and Back-Propagation Neural Network. Mathematical Problems in Engineering, 2020, Article ID: 6161825. [Google Scholar] [CrossRef
[9] 赵青雨, 苏之昀, 夏唐斌, 郑美妹. 基于改进聚类和神经网络的多准则备件分类[J]. 工业工程与管理, 2024, 29(5): 24-31.
[10] Goltsos, T.E., Syntetos, A.A., Glock, C.H. and Ioannou, G. (2022) Inventory—Forecasting: Mind the Gap. European Journal of Operational Research, 299, 397-419. [Google Scholar] [CrossRef
[11] Feng, Y., Chen, J., Lu, C. and Zhu, S. (2021) Civil Aircraft Spare Parts Prediction and Configuration Management Techniques: Review and Prospect. Advances in Mechanical Engineering, 13, 1-17. [Google Scholar] [CrossRef
[12] 张佳琦, 顾幸生. 基于改进灰狼算法优化的支持向量机锌耗预测[J]. 华东理工大学学报(自然科学版), 2022, 48(3): 343-351.
[13] 王宁, 李建华, 王军军, 等. 基于ARIMA与神经网络的备件需求组合预测方法[J]. 甘肃科技, 2020, 36(10): 61-65.
[14] 李晓娟, 张芳媛, 喻玲. 基于主成分分析-BP神经网络的风电备件需求预测[J]. 科学技术与工程, 2024, 24(1): 281-288.
[15] 杨华强, 熊坚, 张鹏. 基于改进Croston方法的多需求模式零备件预测[J]. 科学技术与工程, 2024, 24(21): 8987-8995.
[16] Paparrizos, J. and Gravano, L. (2015) k-Shape: Efficient and Accurate Clustering of Time Series. Proceedings of the 2015 ACM SIGMOD International Conference on Management of Data, Melbourne, 31 May-4 June 2015, 1855-1870. [Google Scholar] [CrossRef
[17] 李海林, 贾瑞颖, 谭观音. 基于K-shape的时间序列模糊分类方法[J]. 电子科技大学学报, 2021, 50(6): 899-906.
[18] Hochreiter, S., Bengio, Y., Frasconi, P., et al. (2001) Gradient Flow in Recurrent Nets: The Difficulty of Learning Long-Term Dependencies. In: A Field Guide to Dynamical Recurrent Networks, Wiley, 237-243.
[19] Bengio, Y., Simard, P. and Frasconi, P. (1994) Learning Long-Term Dependencies with Gradient Descent Is Difficult. IEEE Transactions on Neural Networks, 5, 157-166. [Google Scholar] [CrossRef] [PubMed]
[20] Tian, Y. and Pan, L. (2015) Predicting Short-Term Traffic Flow by Long Short-Term Memory Recurrent Neural Network. 2015 IEEE International Conference on Smart City/SocialCom/SustainCom (SmartCity), Chengdu, 19-21 December 2015, 153-158. [Google Scholar] [CrossRef