1. 引言
河南省地处我国中部,是连接东西部地区资源交换的核心枢纽,在全国经济版图中占据着承东启西的战略要冲地位,是当之无愧的关键战略腹地。2023年河南省人民政府发布《河南省加快实施物流拉动打造枢纽经济优势三年行动计划(2023~2025年)》,为河南省物流发展战略的制定和实施,以及物流需求预测在其中的重要作用,共同勾勒出了一幅河南省从交通优势向枢纽经济优势转变的宏伟蓝图。基于此,本文通过构建“灰色关联度–灰色预测-BP神经网络”组合预测模型对河南省物流需求展开预测分析,为河南省物流业的高质量发展提供理论支撑及参考意见。
现有学者对物流需求研究成果比较丰富。梁艳等[1]以天津市历年经济发展数据为基础,采用多元回归方法,通过选取农产品冷链物流需求指标、利用SPSS软件进行相关性分析确定主要影响因素,进而构建需求模型对天津市农产品冷链物流需求展开预测分析,并据此为其发展提出建议。其次是BP神经网络预测法。郝杨杨[2]等构建IPSO-BP预测模型对上海生鲜农产品物流需求进行预测。王佳颖等[3]则是采用主成分分析法、BP神经网络、灰色需求预测法三种方法相结合对青岛港口物流需求进行预测;徐妍[4]基于陕西省农产品物流的历史数据,构建了灰色预测模型来对该省农产品物流需求进行模拟与预测。经精度检验证实,该模型适配度良好,预测结果可靠,并据此给出了未来六年陕西省农产品物流需求的预估数据。李小玲[5]通过构建一阶多变量灰色GM(1, N)预测模型,对广东省生鲜农产品冷链物流进行研究,分析其发展影响因素。结果验证该模型具有较高的预测可信度与精度,且相对误差处于合理范围,表明其在实际应用中有效可行。贺梦桐[6]等人运用BP神经网络预测法对云南省十年总产值进行预测。
通过查阅文献可以发现,目前已经有学者采用了多种方法对物流需求量进行预测,如单一的多元线性回归分析、BP神经网络预测法[7]、灰色预测[8] [9]等,也有学者运用主成分分析法和BP神经网络相结合、遗传神经网络预测模型[10]、多元线性回归分析与BP神经网络相结合[11]等预测方法,得出了较好的预测结果,但这些方法多基于指定的影响因素进行分析,对于影响因素关联度大小的选取考虑较少。所以本文为了提高预测精度,选取目前较可能影响物流需求的影响因素,采用灰色关联度分析法分析出影响度较高的因素,并将影响度较高的因素作为BP神经网络的输入量进行物流需求量的预测。
2. 研究方法
第一步先运用灰色关联度分析[12]运算,从关联影响因素中得到主影响因素。把所获取的主影响因素指标原始数据设为BP神经网络的输入样本,同时把预测指标的原始数据Y当作该网络的输出样本,对网络展开训练;之后选取部分原始数据作为检验样本,以此明确BP神经网络的具体结构。在此之后,运用灰色预测模型计算得到灰色预测值,再把主相关因素的灰色预测值做归一化处理,将其作为输入数据导入提前训练完成的BP神经网络模型中开展预测工作,进而得到未来时段的灰色神经网络预测结果。紧接着把该预测结果和实际数值做对比:要是预测数据和实际数据的误差处于可接受区间,就说明这个模型是有效的,这也体现出该模型具备实际应用的价值,后续可把该模型应用到未来的预测案例里,这类案例通常存在强非线性关系,且多个变量之间会相互影响。与之相反,该模型便被判定为无效,这意味着该模型不适合用于对精度要求较高的预测场景,此时可考虑选用其他预测模型来完成任务。本文所构建的灰色神经网络模型的预测流程具体如图1所示。
Figure 1. Prediction process of grey neural network model
图1. 灰色神经网络模型预测流程图
2.1. 灰色关联分析
灰色关联分析是用于量化评估系统中某一核心因素与若干相关因素(子因素)之间关联紧密程度的系统分析方法。该方法通过对系统动态演变过程的量化比较,识别驱动系统发展的关键因素与次要因素。相较于传统统计方法,灰色关联分析在系统分析中展现出更强的适用性。它不苛求大量数据,无需数据符合典型分布或呈现规律性模式,计算过程简洁且高效,还能有效避免模型结果与定性判断不一致的情况,进而克服了传统数理统计方法的局限性。
灰色关联分析的步骤如下:
1) 明确数据序列类型
需区分两类数据序列:一类是直接反映系统行为特征的参考数列,另一类是影响系统行为的比较数列。前者是分析的目标对象,后者是潜在的影响因素。
2) 消除量纲差异
由于不同因素的物理意义或计量单位可能存在差异,直接比较原始数据可能导致误导。因此需对两类数列进行无量纲化处理,使数据处于同一量纲维度,确保后续分析的合理性。
3) 量化关联程度
通过计算参考数列与比较数列在各数据点的绝对差值,结合全局最小差和最大差并引入分辨系数调整灵敏度,最终得到灰色关联系数。该系数越接近1,表明两者关联性越强。计算公式为:
(1)
其中
为分辨系数,取值范围是(0, 1),常取
。
4) 求关联度
关联系数反映的是比较数列和参考数列在不同时刻的关联程度,所以这类数值并非单一存在,信息太过零散会给整体层面的对比带来不便。基于此,有必要把各个时刻的关联系数整合为一个数值,具体做法是计算它们的平均值,用这个数值来体现比较数列与参考数列之间关联程度的大小。
(2)
5) 分析结果:根据关联度大小对比较序列进行排序
关联序的核心在于通过关联度的大小顺序刻画因素间的关联关系。具体而言,将多个子序列针对同一母序列的关联度进行排序,形成关联序列表。这一序列直接反映了各子序列相对于母序列的“优先性”或“影响强弱”——关联度越高的子序列,在关联序中排位越靠前,表明其对母序列的作用或关联越显著。关联序的本质是通过对关联度的排序,提供一种相对优劣的判断依据。
2.2. BP神经网络
神经网络作为人工智能领域的核心算法框架之一,其设计灵感源于对动物神经系统尤其是人类大脑结构与功能的深度模拟。其中,BP神经网络属于多层深度前馈神经网络,它运用梯度下降算法来缩小误差,具备误差逆向传播的显著特点。BP神经网络运行原理:以“输入层–隐藏层–输出层”三层连接结构为基础,通过“正向传播”和“反向传播”的循环训练学会拟合数据规律:正向传播时,数据从输入层经权重加权、偏置调整及激活函数转换后,由输出层输出预测结果并计算与真实值的误差;反向传播则依据误差,用梯度下降法结合学习率,从输出层反向调整各层权重与偏置以减小误差;如此循环迭代训练,直至误差达标或训练完成。
1) 设定输入输出量。设BP神经网络输入和输出分别为
和
,其中n和m分别为输入和输出神经元数,采用tansig函数作为激活函数。
2) BP神经网络隐藏层神经元
的输出表达式为公式(3)。
(3)
3) 输出层神经元
的表达式为公式(4)。
(4)
式中:
表示从隐藏层的神经元
指向输出层神经元
的权值;
代表输出层神经元的偏置。
BP神经网络总误差
的表达式为:
(5)
其中,m为训练样本个数,k为输出个数。
为第i个样本第j个输出的预测值,
为对应的真实值。
4) BP神经网络的训练
BP神经网络的训练采用反向传播算法(Back Propagation),反向传播是一种优化算法,通过不断调整网络中各个神经元之间的连接权值,使得神经网络能够对输入和输出之间的映射关系进行学习。具体来说,反向传播算法通过计算每一层的状态和激活值,从最后一层向前推进计算误差,并更新参数以最小化网络预测输出与实际输出之间的误差。这个过程会不断迭代,直到满足停止准则。总的来说,就是每迭代一步,就使误差下降一小步,最终求得一个局部最优的权重和阈值。
2.3. 灰色预测法
灰色预测是将一切随机变量看作是在一定范围内变化的、与时间有关的灰色过程。对杂乱无章的原始数据序列进行生成处理,挖掘其隐藏的系统演化规律,从而建立微分方程模型,用以预测未来发展趋势。主要建模步骤:对原始非负数据进行累加生成;接着基于累加序列构建以发展系数a和灰色作用量b为参数的灰微分方程,并利用最小二乘法求解;然后建立时间响应函数,得到累加值的预测值;最后通过累减还原运算得到原始数据的预测结果,并必须经过残差与后验差等精度检验来确保模型的可靠性与有效性。
3. 河南省物流需求预测实证研究
河南省作为全国重要的综合交通枢纽和物流中心,其物流业在2020年至2024年间保持了稳健的发展态势。根据河南省统计局数据,2022年全省社会物流总额达到18.4万亿元,较2020年的16.1万亿元增长14.3%。这一期间,河南省物流运行呈现出以下特点:一是基础设施不断完善,郑州国家中心城市物流枢纽功能持续增强,2023年郑州机场货邮吞吐量突破70.5万吨,连续多年保持中部地区第一;二是国际物流通道建设取得新突破,中欧班列累计开行突破10,000列,2023年全年开行2560列,同比增长13%。准确的预测可以为河南省相关物流政策的实施提供决策依据。科学的需求预测能够帮助物流企业提前做好运力配置和市场布局,提升物流运行效率,进一步降低社会物流成本,为河南省建设现代物流强省提供有力支撑。
3.1. 灰色关联性分析
1) 数据无量纲化处理
Table 1. Nondimensionalization results of logistics demand data in Henan Province
表1. 河南省物流需求数据无量纲化处理结果
年份 |
货运量/亿吨 |
地区生产总值/万亿元 |
区域人口/亿人 |
第一产业贡献率/% |
第二产业贡献率/% |
第三产业贡献率/% |
区域居民人均消费水平/万元 |
全社会固定资产投资总额/
万亿元 |
人均全年可支配收入/万元 |
进出口总额/万亿元 |
2011 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
2012 |
1.19 |
1.16 |
1.01 |
0.86 |
0.95 |
1.13 |
1.14 |
1.07 |
1.14 |
1.73 |
2013 |
1.34 |
1.28 |
1.01 |
1.14 |
0.92 |
1.15 |
1.27 |
1.3 |
1.28 |
2.72 |
2014 |
0.91 |
1.39 |
1.02 |
1.14 |
0.89 |
1.21 |
1.37 |
1.57 |
1.41 |
3.1 |
续表
2015 |
0.99 |
1.52 |
1.03 |
1.08 |
0.89 |
1.25 |
1.45 |
1.86 |
1.49 |
3.33 |
2016 |
0.95 |
1.63 |
1.04 |
1.18 |
0.77 |
1.49 |
1.59 |
2.15 |
1.61 |
3.83 |
2017 |
1.01 |
1.77 |
1.06 |
1.14 |
0.64 |
1.76 |
1.68 |
2.43 |
1.71 |
3.93 |
2018 |
1.13 |
1.97 |
1.06 |
1.16 |
0.66 |
1.73 |
1.8 |
2.68 |
1.86 |
4.36 |
2019 |
1.28 |
2.2 |
1.06 |
0.92 |
0.66 |
1.76 |
1.94 |
2.9 |
2.01 |
4.59 |
2020 |
1.08 |
2.37 |
1.06 |
0.67 |
0.72 |
1.67 |
2.04 |
3.13 |
2.15 |
4.76 |
2021 |
1.08 |
2.39 |
1.06 |
4.12 |
0.14 |
2.39 |
1.91 |
3.26 |
2.19 |
5.54 |
2022 |
1.26 |
2.59 |
1.06 |
2.04 |
0.41 |
2.12 |
2.15 |
3.41 |
2.33 |
6.84 |
本文综合采用BP神经网络、灰色模型以及GM(1, 1)模型开展研究。结合三种方法特性,选取2011~2024年河南省货物量作为因变量,并把影响货物量的因素视作影响物流需求的因素。同时,选定河南省GDP指标、区域人口等十个影响物流需求的因素作为自变量,如表1所示。鉴于数据规模存在差异,先对数据进行无量纲化处理,结果见表1。
2) 灰色关联系数
在对数据进行无量纲化处理后,基于公式(1),采用2011~2024年度的相关统计数据,对9个自变量进行了灰色关联度分析。设定分辨系数为0.5,计算得到各变量的灰色关联系数,具体分析结果见表2。
Table 2. Grey correlation coefficient
表2. 灰色关联系数
年份 |
地区生产总值/万亿元 |
区域人口/亿人 |
第一产业贡献率/% |
第二产业贡献率/% |
第三产业贡献率/% |
区域居民人均消费水平/万元 |
人均全年可支配收入/万元 |
全社会固定资产投资总额/万亿元 |
进出口总额/万亿元 |
2011 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
2012 |
0.99 |
0.94 |
0.89 |
0.92 |
0.98 |
0.98 |
0.98 |
0.96 |
0.84 |
2013 |
0.98 |
0.89 |
0.93 |
0.87 |
0.93 |
0.97 |
0.98 |
0.98 |
0.67 |
2014 |
0.85 |
0.96 |
0.92 |
0.99 |
0.9 |
0.86 |
0.85 |
0.81 |
0.56 |
2015 |
0.84 |
0.99 |
0.97 |
0.96 |
0.92 |
0.86 |
0.85 |
0.76 |
0.54 |
2016 |
0.8 |
0.97 |
0.92 |
0.94 |
0.84 |
0.81 |
0.81 |
0.7 |
0.49 |
2017 |
0.79 |
0.99 |
0.96 |
0.88 |
0.79 |
0.81 |
0.8 |
0.66 |
0.49 |
2018 |
0.77 |
0.97 |
0.99 |
0.85 |
0.82 |
0.81 |
0.79 |
0.64 |
0.46 |
2019 |
0.75 |
0.93 |
0.88 |
0.82 |
0.85 |
0.81 |
0.79 |
0.63 |
0.46 |
2020 |
0.68 |
0.99 |
0.87 |
0.89 |
0.83 |
0.74 |
0.72 |
0.58 |
0.43 |
2021 |
0.68 |
0.99 |
0.48 |
0.75 |
0.68 |
0.77 |
0.72 |
0.56 |
0.39 |
2022 |
0.68 |
0.94 |
0.78 |
0.77 |
0.76 |
0.76 |
0.72 |
0.56 |
0.33 |
3) 灰色关联度
根据表3所列出的关联系数计算结果,通过求取每个影响因素在不同年份的算术平均值,得到了各自变量与因变量之间的灰色关联度
,详细结果展示在表3中。
Table 3. Gray correlation between each variable and the dependent variable
表3. 各自变量与因变量灰色关联度
评价项 |
地区生产总值/万亿元 |
区域人口/亿人 |
第一产业贡献率/% |
第二产业贡献率/% |
第三产业贡献率/% |
区域居民人均消费水平/万元 |
人均全年可支配收入/万元 |
全社会固定资产投资总额/万亿元 |
进出口总额/万亿元 |
关联度
|
0.818 |
0.963 |
0.884 |
0.887 |
0.859 |
0.849 |
0.835 |
0.738 |
0.556 |
排名 |
7 |
1 |
3 |
2 |
4 |
5 |
6 |
8 |
9 |
通常,灰色关联度大于0.6即可认定与因变量具有较强的关联性。依据表3的数据结果,地区生产总值、区域人口等8项指标满足关联度要求,进出口总额不符合,予以排除。由此设定因变量为货运量Y,自变量为上述8个影响因素,并依次记为
,
。
3.2. BP神经网络物流需求预测模型构建
选取河南省2011~2024年的数据作为研究样本,2022至2024年间的数据被用作测试样本。借助MATLAB R2016b这款软件开展运行分析工作,进而构建起用于物流需求预测的BP神经网络模型。分析之后,地区生产总值的影响因素,选取地区生产总值、第一、二、三产业产值等8个影响因素作为输入变量向量组,以货物量作为输出变量组。
1) 数据预处理
为避免数据梯度问题,对2011~2021年10年原始数据进行归一化处理,处理后的结果如表4所示。
Table 4. Normalized data
表4. 归一化处理后的数据
年份 |
x1 |
x2 |
x3 |
x4 |
x5 |
x6 |
x7 |
x8 |
2011 |
0.94 |
1 |
0.4 |
0.32 |
0.81 |
1 |
0.94 |
1 |
2012 |
0.94 |
0 |
0.06 |
0.57 |
0.6 |
0.82 |
1 |
0.66 |
2013 |
0.31 |
0.76 |
0.12 |
0.87 |
0.18 |
0.4 |
0.33 |
0.37 |
2014 |
1 |
0.03 |
0.37 |
0.58 |
0.47 |
0.66 |
0.97 |
0.58 |
2015 |
0.37 |
0.82 |
0.15 |
0.73 |
0.35 |
0.52 |
0.45 |
0.46 |
2016 |
0.09 |
0.64 |
0.05 |
0.95 |
0.09 |
0.12 |
0.03 |
0.11 |
2017 |
0.45 |
0.94 |
0.14 |
0.59 |
0.55 |
0.59 |
0.56 |
0.53 |
2018 |
0.8 |
1 |
0 |
0.68 |
0.48 |
0.9 |
0.83 |
0.86 |
2019 |
0 |
0.58 |
0.09 |
1 |
0 |
0 |
0 |
0 |
2020 |
0.23 |
0.7 |
0.14 |
0.88 |
0.15 |
0.32 |
0.22 |
0.31 |
2021 |
0.82 |
1 |
1 |
0 |
1 |
0.79 |
0.88 |
0.89 |
2) 确定数据
选择经灰色关联度得出的8个对目标变量有较强影响关系的因素构建的BP神经网络预测模型。其以Kolmogorov定律为基础,对隐含层神经元的数量进行了初步的计算,即根据公式
。其中,
为隐含层单神经元数,
为输入层神经元,
为输出层神经元,
的取值范围则在1~10之间。本文输入节点m = 8,输出节点n = 1。由上述计算过程得出隐含层神经元的范围为4至13,带入分析,得出当
时最好,形成的神经网络结构图如图2所示。
Figure 2. Neural network structure diagram
图2. 神经网络结构图
3) 训练网络
Figure 3. Logistics demand forecasting training regression curve
图3. 物流需求预测训练回归曲线
学习率是BP神经网络训练过程中的重要参数,它决定了权重更新的速度。学习率过大可能导致模型训练不稳定,而学习率过小则可能导致模型训练速度过慢。其一般取值在(0.000 001, 0.01)之间,迭代次数是指训练过程中更新权重的次数[13]。迭代次数太少,模型可能没有足够的时间来优化权重,导致训练不充分;迭代次数太多,则可能导致模型过拟合,产生欠拟合问题。通常情况下,通过交叉验证(CV)来确定合适的迭代次数。此模拟过程设定初始学习率为0.01,网络训练最大次数为1000,学习目标误差为1 × 10−6。当隐含层神经元设置为9时,迭代的次数和运算的精确程度已降到最低,并通过对样本进行误差检验可知,训练拟合误差目标值已达到1 × 10−6,说明此网络模型的性能达到了要求,可以用来预测。将2011~2021年的数据进行训练,回归曲线如图3、图4所示,此时训练集R2值为0.818 65,接近于1,说明训练集模拟效果较好。
Figure 4. Logistics demand forecasting training simulation curve
图4. 物流需求预测训练模拟曲线
3.3. 物流需求预测
运用灰色预测法,根据河南省2011~2024年主要影响指标数据对河南省2025~2027年的主要指标值进行预测,得出各影响因素预测值,如表5所示。
Table 5. Input of predictive factors for 2025~2027
表5. 2025~2027年预测影响因素输入量
年份 |
x1 |
x2 |
x3 |
x4 |
x5 |
x6 |
x7 |
x8 |
2025 |
6.792 |
1.074 |
9.845 |
25.915 |
64.721 |
2.377 |
5.017 |
3.664 |
2026 |
7.171 |
1.07 |
10.273 |
23.336 |
67.207 |
2.461 |
5.207 |
3.8 |
2027 |
7.56 |
1.066 |
10.703 |
20.779 |
69.724 |
2.547 |
5.398 |
3.937 |
运用BP神经网络模型对河南省2025~2027年的物流需求进行预测,预测结果表明,河南省物流需求量在未来三年将持续保持稳定增长态势。预测值将从2025年的24.0729亿吨增长至2026年的24.5041亿吨,并于2027年达到24.8828亿吨。这一清晰的上升曲线充分表明河南省的经济活动和区域枢纽地位正在不断增强,物流业发展前景广阔。
4. 结论
本研究以河南省货运量为核心指标,旨在科学预测其未来物流需求趋势。通过综合运用灰色关联度分析、灰色预测模型与BP神经网络模型,对河南省2011~2024年的历史数据进行分析,最终得到2025年至2027年的物流需求预测值。面对确定的增长趋势,河南省各级政府及物流相关企业应未雨绸缪,积极采取措施以应对即将到来的物流需求高峰。
根据本研究对河南省物流需求的预测结果与分析,为积极应对未来物流需求的增长,特提出以下建议:
1) 对政府层面的建议。强化物流基础设施规划与建设,建议省级及地市级政府将预测结果纳入物流业发展中长期规划。重点规划和完善以郑州国际航空货运枢纽、全国性铁路物流枢纽为核心,区域性物流节点为支撑的多层次物流基础设施网络,提前布局和建设一批高标准仓储设施、多式联运转运场站,以应对即将到来的物流量增长。优化综合交通运输网络,提升多式联运效率:持续推进“米字形”高铁向“多中心网络化”发展,释放普铁货运能力。完善“四纵四横”高速公路网与普通干线公路的衔接,打通物流“最后一公里”。大力发展“公转铁”、“空铁联运”等模式,统一多式联运标准,建设智慧化的多式联运公共信息平台,显著降低物流中转时间和成本。
2) 对企业层面的建议。加速数字化转型,投资智慧物流技术,建议物流、制造及商贸企业加大对物联网(IoT)、大数据、人工智能(AI)等技术的应用投入。通过建设智慧仓储管理系统(WMS)、运输管理系统(TMS),优化仓储布局和配送路径,实现自动化分拣、智能配载和全程可视化监控,从根本上提升运营效率与服务质量。聚焦核心能力建设,提升供应链韧性。面对需求的波动性与不确定性,企业应致力于打造柔性、敏捷、可靠的供应链体系。可通过建立协同化库存管理系统、拓展多元化运输解决方案、布局关键物流节点等方式,增强自身应对市场需求变化和突发事件的缓冲与恢复能力,保障供应链的稳定与畅通。
本研究主要基于历史数据进行趋势外推,未来可考虑将更多突发性政策、宏观经济波动等不确定性因素纳入模型,以进一步提升预测的精准度。同时,后续研究可针对预测结果所揭示的瓶颈领域,进行更深入的专项对策研究。