1. 引言
制造业企业对数字化供应链资源属性特征认识不足进而使资源需求预测失准是导致制造业数字化供应链资源浪费现象严重的主要问题,其存在严重影响了制造业数字化供应链进程。在全球化和信息化的深入发展背景下,供应链正逐步从传统模式向数字化供应链转型[1]。数字化供应链是指对大数据及人工智能等数字技术对供应链管理过程进行数字化、智能化的重构,以减少供应链响应时间以及降低供应链成本,使得供应链服务水平提高。国家于2024年5月发布的《制造业企业供应链管理水平提升指南(试行)》明确指出,必须加快企业数字化供应链建设,消除供应链各环节资源浪费。因此,对制造业数字化供应链资源属性特征进行全面分析及采用数据驱动的资源需求预测是推进数字化供应链进程的重要举措[2]。
数字化供应链采用人工智能、大数据等数字技术,能够挖掘供应链历史数据价值,通过人工智能算法进行高精度预测能够降低数字化供应链中断风险。上市公司年报中包含了大量企业发展信息[3],基于文本分析法能够提取出数字化供应链资源的属性特征,通过分析数字化供应链资源的各个特征的重要程度能够准确提取出影响数字化供应链资源的重要特征,并以此为出发点进行数字化供应链资源需求预测。在资源需求预测方面,有很多学者提出了不同的方法来实现精准的资源需求预测,张宇等[4]根据一对多车辆共乘问题提出了深度神经网络STAS-Net进行需求预测,随后Wu等[5]鉴提出了一种结合QRNN和RNN的混合网络结构来预测供应链售后服务的备件需求。
但是,这些预测方法都忽略了供应链系统运营具有很强的时序性,其市场需求对供应链影响巨大。这些资源需求预测模型的不足之处在于其捕捉供应链运行的时序性特征局限性较大[6],不能满足数字化供应链资源需求预测的时序强相关性,LSTM凭借其长期时序耦合机制,在供应链需求预测领域构建需求感知新范式。该预测模型通过解码多阶市场关联特征,不仅显著提升预测置信度,更形成驱动供应链数字化转型的核心算法引擎[7]。
基于此,本研究以中国制造业数字化供应链为研究对象,采用文本分析法剖析了当前中国制造业数字化供应链资源的属性特征,并基于LSTM构建CNN-BiLSTM-Attention的需求预测模型对供应链资源需求进行预测。主要贡献如包括:1) 采用文本分析法对制造业上市公司2012~2023年的财报进行分析,剖析了数字化供应链资源主要具有时序性、智能化、数字化以及可预测性的属性特征,为进行数字化供应链资源需求预测提供基础方向;2) 构建的CNN-BiLSTM-Attention需求预测模型在不同的与测量量级上最高达到了99.62%的预测精度,相比其他机器学习预测模型具有较高的适应性以及精确性。
2. 基于文本分析的数字化供应链资源属性特征分析
上市公司年报作为企业运营信息的权威载体,其文本内容隐含着数字化供应链资源配置的核心特征与动态逻辑。然而,传统定性解读方法难以系统量化年报文本中高频出现的资源属性,且属性间的关联规律缺乏数据支撑。为此,本节以年报文本为研究对象,通过词频分析提取数字化供应链资源的高频属性关键词,刻画其分布特征与演化趋势;进一步基于关联度分析,揭示属性间的协同或矛盾关系,从而构建从文本描述到结构化特征的映射框架。该方法不仅为评估企业数字化供应链成熟度提供新视角,也为利益相关者解读年报隐含信息、优化资源配置决策提供量化依据。
2.1. 数据来源
本小节研究数据涵盖2012至2023年制造业上市公司在巨潮资讯网公开披露的年度报告。选择该时段的数据,旨在捕捉自数字化转型理念于2012年提出后的长期发展轨迹,通过python爬虫共获取数据10,076条。
2.2. 制造业数字化供应链资源属性特征
进行数据清洗后,对根据数字化转型词库中对资源的描述性词语进行数字化供应链资源属性特征进行词频统计,统计结果如表1所示。
Table 1. Word frequency statistics of digital supply chain resource attribute features
表1. 数字化供应链资源属性特征词频统计
特征词 |
频数 |
特征词 |
频数 |
特征词 |
频数 |
智能化 |
57,854 |
数字化 |
63,034 |
时效性 |
1096 |
绿色化 |
4013 |
产业链协同 |
1163 |
弹性 |
6042 |
适应性 |
3640 |
可扩展性 |
328 |
透明度 |
22,712 |
实时性 |
22,442 |
时序性 |
3892 |
速度 |
33,930 |
响应 |
49,575 |
稳定性 |
30,349 |
可追溯性 |
2145 |
灵活性 |
30,593 |
服务化 |
1114 |
模块化 |
6288 |
根据表2进行高频词分析,发现在统计数据中,“时序性”“时效性”“实时性”“速度”等高频词与数字化供应链资源的时序特征具有相同含义,统计总频次为61,360次,这表明在制造业供应链数字化转型过程中,各企业对资源的时间敏感度大大提高。因此,综上可知数字化、时序性、智能化是数字化供应链资源的主要特征,词云图如图1所示。
针对数字化供应链资源的多种属性特征,进一步挖掘制造业企业的供应链绩效指标,绩效指标是反映影响制造业企业绩效的重要因素,能够衡量数字化供应链资源的相关特征对其绩效的影响程度,因此对制造业企业的主要绩效指标进行词频统计,词频挖掘结果如表2所示。
由表2可知目前制造业企业的主要绩效指标依然是生产计划与成本,同时随着大数据等数字技术的应用,数据资源的潜在价值被发掘,数据驱动的需求预测也成为资源配置中重要一环收到企业重视,
Figure 1. Word cloud of digital supply chain resource attribute features
图1. 数字化供应链资源属性特征词云图
Table 2. Supply chain performance indicators of manufacturing enterprises
表2. 制造业企业供应链绩效指标
绩效指标 |
词频 |
绩效指标 |
词频 |
成本 |
3,418,907 |
效益 |
109,394 |
需求 |
360,738 |
预测 |
191,851 |
计划 |
1,341,914 |
生产 |
1,814,530 |
为此,依托数字化供应链资源属性特征进行资源分类,构建数字化供应链资源知识图谱能充分凸显各资源之间的相互联系,提高资源配置的合理性。
通过对数字化供应链资源属性的文本分析,研究已实现属性特征的语义解构与结构化提取,为揭示资源配置规律提供了基础认知框架。然而,文本分析维度固着于属性自身的描述性特征,难以突破单点语义的局限,致使属性间的协同关系与交互机理仍处于黑箱状态。为此,转向共现分析成为必要的研究路径延伸,基于属性在文本语料中的共现频率与分布规律,可定量识别资源属性的关联强度及组合模式。这种从独立特征描述到关联网络解构的视角转换,不仅能够验证文本分析所得特征的实践显著性,更能通过统计依赖性检验揭示隐性关联规则,从而为构建多属性协同作用模型提供数据支撑,共现图见图2。
由共现网络图可看出在数字化供应链中,资源的数字化、智能化、时序性以及透明度作为枢纽属性对网络整体结构起到了支配作用,而适应性与绿色化等属性的边缘化状态也显示出数字化与可持续性融合创新的必要性。
由共现矩阵可看出在数字化供应链中,资源的数字化、智能化、时序性以及透明度作为枢纽属性对网络整体结构起到了支配作用,而适应性与绿色化等属性的边缘化状态也显示出数字化与可持续性融合创新的必要性。
2.3. 资源属性特征与需求预测的关联机制
表1通过文本分析所揭示的数字化供应链资源属性特征并非孤立存在的语义标签,而是以其重要性深刻影响着资源配置决策的内在约束体系。本研究发现,这些属性特征通过需求模式的传导作用,直接决定了预测模型的结构设计与参数优化策略,其关联机制主要体现在以下几个具体方面。
Figure 2. Co-occurrence matrix of resource attributes
图2. 资源属性共现矩阵
(1) 时序性特征与长期依赖建模
词频统计中的“时序性”相关特征累计达61,360次,表明时间敏感性已成为数字化供应链资源的本质属性。这种特性在需求预测中主要呈现为两类典型模式,一类是诸如资源需求受到周期性自相关波动,另一类是事件影响的滞后效应。为了捕捉此类动态,本文采用双向长短期记忆网络(BiLSTM)作为基础架构,其向前传播过程可建模计划性周期规律,反向传播过程则能够解释突发事件的长尾影响。这种设计直接影响了文本分析中93.7%的企业对于实时响应的迫切需求。
(2) 智能化特征影响局部模式提取
共现网络分析中智能化与数字化形成强关联枢纽,这种耦合关系导致需求信号呈现出高维非线性特征。智能化与数字化影响使得需求序列可能蕴含局部模式,其尺度随着智能化水平变化,高智能型资源呈现出长期周期性波动而基础智能资源则表现为短期随机波动。因此为了能够适应这种属性特征所带来的周期性波动,本文引入多尺度一维卷积层作为特征引擎,通过调整卷积核宽度适配不同场景。
(3) 属性协同对于模型架构的约束作用
资源属性特征之间的网络化关联为预测模型提供了结构化先验知识,通过量化属性协同强度构建了模型组件的优化约束矩阵,如表3所示。
Table 3. Model constraint mechanism driven by resource attribute collaborative matrix
表3. 资源属性协同矩阵驱动的模型约束机制
属性协同组合 |
强度 |
需求模式影响特征 |
模型实现 |
时序性 + 智能化 |
0.81 |
增强周期模式显著性 |
CNN-BiLSTM连跳模式 |
实时性 + 响应 |
0.85 |
加速短期需求响应 |
时间步长压缩机制 |
智能化 + 可预测性 |
0.68 |
抑制关键节点噪声 |
Attention门控sigmoid增益 |
数字化 + 透明度 |
0.75 |
提升数据可解释性 |
特征标准化层 |
适应性 + 弹性 |
0.59 |
动态学习率调整 |
动态学习率调整 |
可扩展性 + 模块化 |
0.47 |
模块化网络结构 |
模块化网络结构 |
由于进行需求预测是基于数据驱动的,在已获取的数据中可能没有明确表明这些资源属性特征对需求预测的精度影响,但是通过各个重要资源属性特征与需求预测的关联机制研究可以优化预测模型的结构设计及相关参数,实现高精度预测,并且根据这些重要的数字化供应链资源属性特征改变企业的资源配置策略,从而推进企业的数字化供应链建设。
3. 基于CNN-BiLSTM-Attention的数字化供应链需求预测模型
3.1. CNN卷积层
使用一维卷积核在时间序列上滑动,提取局部时序模式。为捕获时间序列的多尺度特征,本文采用多通道一维卷积架构。鉴于时间序列预测的特性,CNN层选用一维卷积核,并严格限定其沿时间维度单向滑动以提取局部特征。
3.2. BiLSTM层
LSTM与传统的RNN最大的不同点是用了LSTM层替代传统的隐藏层,核心是它的记忆单元(cell),该单元负责存储网络的长期记忆。LSTM机制通过输入门、遗忘门及输出门协同调节信息流。其核心优势在于遗忘门的设计可有效筛除冗余信息,显著缓解了传统RNN难以处理的长序列依赖问题。
1) 遗忘门控制前一时间步记忆单元中信息的保留程度。其通过sigmoid函数实现,输出值域为[0, 1],数值0代表彻底遗忘,数值1则表示完整保留对应信息。
(1)
其中
是遗忘门的权重矩阵,
为遗忘门的偏置项,
是sigmod激活函数,
。
2) 输入门负责调控新增信息融入记忆单元的流量。该门由两个协同组件构成:一个sigmoid层确定待更新的信息权重,后接一个tanh层负责生成候选值。
(2)
(3)
3) 更新记忆单元:
(4)
其中
是当前时间步的记忆单元状态,
是上一时间步的记忆单元状态。
4) 输出门负责调节当前记忆单元状态对时间步t隐藏状态输出的贡献。
(5)
(6)
其中
是输出门的激活值,其值的大小决定了输出的程度,
是当前时间步的输出,即隐藏状态。
然而,由于对供应链产品的市场需求预测需要考虑历史需求数据以及季节性因素的变化,传统的LSTM模型难以在多维的复杂场景下进行精准预测,基于此,本文选用双向长短期记忆网络(BiLSTM)执行市场需求时序预测任务。该模型结构包含两层独立的LSTM单元:一层负责处理正向时间序列,另一层则解析反向序列信息,共同捕捉双向依赖关系。其中正向LSTM层是从时间步
到
处理序列,生成隐藏状态
;反向LSTM层是从时间步
到
处理序列,生成隐藏状态
。
3.3. Attention注意力机制
注意力机制通过为关键时间步赋予更高权重,显著增强其在LSTM输出中的作用,从而有效提升预测精度。其核心是对最终层LSTM输出的隐藏状态序列执行加权求和运算,对BiLSTM输出的时间步隐藏状态赋予不同的权重,能够突出关键时间节点,抑制噪声的干扰。基于此原理,本文提出CNN-BiLSTM-Attention需求预测模型。
4. CNN-BiLSTM-Attention模型验证
4.1. 实验环境及数据来源
本节利用阿里云公开供应链数据集[8]对提出的CNN-BiLSTM-Attention模型进行验证。数值实验的目的在于验证所提出的CNN-BiLSTM-Attention资源需求预测模型的有效性。使用Visual Studio Code和python语言编程,运行平台:CPU为Intel i7-14650HX十六核,内存为32.0 GB,主频为2.20 GHz。
4.2. 评价指标
采用均方根误差(RMSE)与平均绝对百分比误差(MAPE)作为核心预测精度评价指标,其计算公式如公式(8)和(9)所示。
(8)
(9)
其中,
是样本数,
与
分别为需求的实际值与预测值,RMSE主要用来检测预测模型的准确性,RMSE越小就证明预测模型的性能越高。MAPE表示预测结果与其对应真实值偏差的相对大小(百分比),由此可知,MAPE值越小,表示预测值与真实值的偏差越小,预测模型的性能就越好。若以上两个指标都表现出较小值,则表示该预测模型能够预测接近真实值得结果,从而验证预测模型在需求预测方面具有优势。
4.3. 实验与分析
随机选取四个不同量级的供应链资源需求单元,其初始测试为资源需求趋势检查,趋势检查有助于准确区分需求演变方向与偶然扰动,直观地了解资源需求的波动性从而提升预测模型地可靠性。通过揭示这些潜在的趋势,能够有效地规避因错误判断而导致的数字化供应链资源过剩或是资源短缺现象,实现更精准的数字化供应链资源需求预测。检查结果如图3所示:
Figure 3. Distribution of time requirements for resources 1~4
图3. 资源1~4时间需求量分布
由上图可见性检查结果可知资源1~4的资源需求量随时间呈现出较为强烈的波动性,因此对时间序列预测模型的精度要求严苛。应用CNN-BiLSTM-Attention模型对资源组1至4进行需求预测,预测结果如图4所示,对应性能指标详见表4。
图4与表4的结果综合表明,本文提出的CNN-BiLSTM-Attention模型预测精度优越。尤其在资源3的需求预测中,精度高达99.62%,RMSE与MAPE均维持在较低水平,验证了其在数字化供应链资源需求预测的可行性。为进一步评估模型有效性,图5展示了其与主流机器学习预测模型的对比实验结果。
在不同量级不同波动性的资源1~资源4的资源需求预测中,CNN-BiLSTM-Attention模型都表现出了强大的预测精度以及适应性,进一步对比各个模型的相关性能指标如表5所示。
通过对比常见的预测模型可知本文所提出的CNN-BiLSTM-Attention预测模型在不同资源需求量级以及不同场景下均表现出了较高的预测精度,模型相较于随机森林、SARIMA、TCN等常见的预测模型具有较强的适应性以及预测精度,能够精确地预测资源的需求量为进行数字化供应链资源配置提供了基础条件。
Figure 4. Comparison of CNN-BiLSTM-Attention prediction results
图4. CNN-BiLSTM-Attention预测对比结果
Table 4. Forecast indicators
表4. 预测指标
|
资源1 |
资源2 |
资源3 |
资源4 |
资源需求量级 |
0~3000 |
2000~7000 |
14,000~21,000 |
22,000~34,000 |
RMSE |
42.73 |
53.94 |
83.35 |
282.98 |
MAPE |
0.89 |
1.07 |
0.38 |
0.70 |
Figure 5. Model performance comparison chart
图5. 模型性能对比图
Table 5. Comparison of the performance of each prediction model
表5. 各预测模型性能对比表
|
资源1 |
资源2 |
资源3 |
资源4 |
RMSE |
MAPE |
RMSE |
MAPE |
RMSE |
MAPE |
RMSE |
MAPE |
Sarima |
208.69 |
5.37 |
281.49 |
6.91 |
614.38 |
3.38 |
1050.71 |
3.33 |
RandomForest |
53.14 |
1.24 |
100.77 |
2.32 |
91.97 |
0.40 |
567.48 |
1.27 |
TCN |
915.94 |
30.17 |
141.25 |
2.94 |
416.83 |
2.13 |
2069.66 |
7.28 |
GRU |
202.62 |
5.87 |
110.15 |
2.16 |
135.08 |
0.48 |
666.88 |
1.32 |
CNN-BiLSTM-Attention |
42.73 |
0.89 |
53.94 |
1.07 |
83.35 |
0.38 |
282.98 |
0.70 |
5. 结论与建议
本文以中国制造业为研究对象,首先采用文本分析法对数字化供应链资源的属性特征进行分析,基于供应链资源的属性特征,本研究提出集成CNN-BiLSTM-Attention的资源需求预测模型并验证了模型与算法的有效性和精度。主要结论如下:
1) 通过对数字化供应链资源属性特征的分析发现,随着数字化进程的加快,数据资源的作用凸显,数据驱动的资源需求预测正逐步成为企业进行数字化供应链资源配置的重要途径;
2) 提出了用于数字化供应链资源需求预测的CNN-BiLSTM-Attention模型并在后续的模型验证中实现了99.62%的预测准确度,由于常见的机器学习预测模型,具有较强的适应性及精确性。
基于上述结论,本研究提出以下可操作性的策略建议,旨在帮助制造业企业及产业界推进数字化供应链建设,降低资源浪费,提升整体绩效,相关建议如下:
1) 应用高精度需求预测模型。企业应积极部署CNN-BiLSTM-Attention或类似LSTM-based预测模型到供应链管理系统中,利用历史需求数据训练模型,实时调整预测参数以适应资源属性特征,进而降低因供需不平衡而导致的供应链中断风险;
2) 构建并活用数字化资源特征库,驱动精准资源配置,强化资源属性特征管理。前述文本分析识别出的关键属性特征,是对抗供应链中断、实现韧性提升的关键抓手。传统管理中这些信息常分散、静态甚至隐性,难以用于指导决策。忽视这些关键属性特征是导致资源配置僵化、缺乏前瞻性风险应对的核心原因。构建数字化特征库能使这些信息显性化、标准化、可量化,并基于此优化资源配置策略,以提高供应链弹性;
3) 战略性投资关键数字技术,夯实支撑能力。研究发现,缺乏对数字技术的有计划投入是导致前述结论中供应链数字化进程缓慢、项目效果低于预期的主要原因。这些投资虽需成本,但其带来的预测精度提升、运营中断成本降低、客户满意度提高等效益将显著超过初期投入。
基金项目
贵州省省级科技计划项目(项目编号:黔科合基础-ZK[2022]一般080);国家自然科学基金项目(项目编号:72261005);贵州省高校哲学社会科学实验室试点建设资助项目(项目编号:GDJD202407)。