基于SVR-CV-GS模型的湖北省物流需求预测研究
Research on Logistics Demand Forecast in Hubei Province Based on SVR-CV-GS Model
DOI: 10.12677/ecl.2025.142553, PDF, HTML, XML,   
作者: 李晨阳:武汉科技大学管理学院,湖北 武汉;王如梦:云南民族大学经济与管理学院,云南 昆明
关键词: 支持向量回归网格搜索交叉验证超参数优化Support Vector Regression Grid Search Cross-Validation Hyperparameter Optimization
摘要: 随着城市物流需求的不断增长,精确的物流需求预测对提高资源配置效率、优化物流系统至关重要。本文提出了一种基于交叉验证法和网格搜索法优化支持向量回归模型的物流需求预测方法。首先,我们利用SVR模型进行物流需求的回归分析,并使用交叉验证法选择最优的核函数(包括线性核、径向基核项式核)。接着,为了提高SVR模型的预测精度,本文引入了网格搜索法对SVR的超参数进行优化,包括惩罚因子C、容忍度和核函数的参数。通过对湖北省历史物流需求数据的实验分析,验证了所提出方法在提高预测精度和模型稳定性方面的有效性。实验结果表明,与传统SVR模型相比,采用SVR-CV-GS模型能够显著提升预测准确性,为城市物流需求的科学决策提供有效支持。
Abstract: With the continuous growth of urban logistics demand, accurate logistics demand forecasting is essential to improve the efficiency of resource allocation and optimize the logistics system. In this paper, we propose a logistics demand forecasting method based on the cross-validation method and the grid search method to optimize the Support Vector Regression (SVR) model. Firstly, we use the SVR model to perform regression analysis of logistics demand, and use the cross-validation method to select the optimal kernel function (including linear kernel and radial basis kernel). Then, in order to improve the prediction accuracy of the SVR model, this paper introduces the grid search method to optimize the hyperparameters of the SVR, including the parameters of penalty factor C, tolerance and kernel function. Through the experimental analysis of the historical logistics demand data of Hubei Province, the effectiveness of the proposed method in improving the prediction accuracy and model stability is verified. Experimental results show that compared with the traditional SVR model, the SVR-CV-GS model can significantly improve the prediction accuracy and provide effective support for the scientific decision-making of urban logistics demand.
文章引用:李晨阳, 王如梦. 基于SVR-CV-GS模型的湖北省物流需求预测研究[J]. 电子商务评论, 2025, 14(2): 534-545. https://doi.org/10.12677/ecl.2025.142553

1. 引言

随着全球经济的发展,城市物流需求量不断增长,尤其是像湖北这样的中心省份,由于地理位置的突出,随着区域经济的快速发展,物流需求呈现出多样化、复杂化的趋势。为了优化物流资源配置,提高运输效率,精准的物流需求预测显得尤为重要。物流需求预测不仅有助于降低物流企业的成本,还能提升城市交通系统的运作效率,进而促进城市经济的可持续发展。

在实际应用中,物流需求预测面临着众多挑战,包括预测数据的非线性特征、环境因素的动态变化以及多种因素之间的复杂关系。传统的预测方法,如时间序列分析、回归分析等,虽然在一些场景下具有一定的预测能力,但在处理高维度、多因素影响的复杂问题时,往往表现不佳。

2. 研究综述

物流需求预测是物流管理中的核心问题之一,广泛应用于交通调度、库存管理、资源配置等领域。早期的研究主要集中在基于统计学的模型上,如时间序列分析、回归分析等,这些方法通常依赖于历史数据的规律性,并假设数据是平稳的。然而,这些传统方法在处理具有季节性、周期性或突发事件影响的数据时,往往会出现较大的预测误差。

这一领域学者选择了各种方法和模型对区域物流需求进行预测研究,姬栋媛等[1]使用灰色GM (1, 1)模型、线性回归模型以及ARIMA模型进行预测,并使用方差倒数给三种预测模型赋予权重,对浙江省物流需求进行预测,组合模型要比单一模型更加精准。江帆等[2]提出了一种结合GM (1, 1)和LSTM的组合预测模型对宁波港口进行预测。对比ARMA法、GM (1, 1)、BP神经网络和LSTM网络的预测效果,仿真结果表明GM-LSTM组合模型在准确性和稳健性方面有显著提升。程小等[3]使用三次指数平滑法和灰色GM (1, 1)模型作为预测工具,并构建了基于诱导有序几何加权平均算子的组合预测模型。通过对广州白云机场货运量数据进行实证分析,结果显示组合预测模型在预测精度和误差方面均优于单一模型。印如芸[4]使用改进的BP神经网络方法对江苏省冷链物流需求进行预测结果表明,改进后的模型具有更快的收敛速度。古俊杰等[5]据BP神经网络和神经网络模型以江西省生鲜农产品冷链物流需求为对象进行实证分析,依据经济水平、产业结构水平、物流行业因素、市场供需水平等四个方面建立影响因素指标体系,并用SPSS和MATLAB建立模型,结果表明BP神经网络相比于RBF神经网络,在预测结果上有更高的精确度。陈良等[6]运用GM (1, 1)模型对福建省2023~2032年农产品冷链物流需求量进行预测。通过灰色预测软件得到精度数据与预测值,数据表明,GM (1, 1)模型预测精度高。朱晓璐等[7]选取山东省七个沿海港口城市,采用GM (1, 1)模型对山东省主要沿海港口物流需求量进行预测,发现未来五年山东省沿海港口的物流需求逐年稳定提升。李蒙炀等[8]运用多元线性回归和灰色预测的方法对四川省区域物流的需求进行分析和预测。杨洋等[9]构建出岭回归模型,以自变量多重共线性为基础,利用GM (1, 1)模型对6个相关影响因素未来6年与货运量关联度较高的指标进行预测然后带入岭回归方程对广西物流需求进行预测。刘盼等[10]运用BP神经网络、二次指数平滑法、LSTM深度学习法三种预测方法以及权重分配组合法对重庆市生鲜农产品冷链物流需求进行预测,组合模型相比于单一模型更为准确。梁毅[11]使用支持向量机,机器学习方法对浙江省物流需求进行预测,与BP神经网络结果显示支持向量机,有更好的前景。杨新彪等[12]构建基于串行数据分解和量子加权深度网络的超短时物流需求多步预测模型,对超短时物流需求进行预测,对比结果表明这种模型对超短时物流需求有较好的效果。龚映梅等[13]单一预测模型的基础上,通过熵值法赋予灰色预测GM (1, 1)、时间序列ARIMA法和二次平滑指数法三种单一预测模型权重建立组合预测模型,利用云南省生鲜农产品生产量数据进行预测,预测结果表明组合预测法的预测精度要优于三种单一预测方法。王琰琰等[14]构建了基于遗传算法–蚁群优化–反向传播神经网络的物流需求预测模型。分别采用GA-ACO-BP模型、GA-BP模型和BP模型对全国日用消费品物流需求进行预测,结果表明,GA-ACO-BP模型更能拟合物流需求变化,预测精度较高。郝杨杨等[15]构建由改进粒子群算法优化反向传播神经网络的预测模型。通过上海生鲜农产品物流需求预测实例对模型的有效性进行验证,结果显示:IPSO-BP神经网络模型在预测精度及收敛速度上均明显优于传统PSO-BP神经网络和BP神经网络模型。

随着计算机科学与人工智能技术的飞速发展,越来越多的研究开始采用机器学习(ML)和深度学习(DL)方法进行物流需求预测。支持向量机(SVM)是一种广泛应用于分类和回归问题的监督学习算法,能够通过构建最优超平面来处理高维数据的分类任务。近年来,支持向量回归(SVR)作为SVM的一个扩展,被广泛用于回归问题中,尤其在处理非线性回归问题时表现出色。

现有预测方法是基于传统数理统计模型如灰色预测模型模型,传统机器学习模型支持向量机,神经网络模型,以及组合预测模型,组合预测模型可以通过加权处理等方式对不同模型进行赋权,以达到一种分配不同模型的权重的方式达到自己的预测效果,已有预测模型在处理小规模数据是具有较高的准确性,但面对数据量较大的问题时,则需要机器学习模型进行预测,本研究的创新是,选择基于支持向量机的变化模型支持向量回归(SVR)结合交叉验证与网格搜索方法选择核函数和模型的超参数,从四个核函数里面选取适合本文数据量的核函数,对于模型的超参数使用网格搜索方法进行选取,列举出不同的超参数范围,选择表现最优的超参数组合。

3. 省份物流需求预测指标体系建设

为了确保省份物流需求预测结果更加精准,选择合适的预测指标是关键步骤。为此,本文从多个角度分析了影响省份物流需求的各种复杂因素。在调研相关文献的基础上,结合实际情况,本文从经济因素和非经济因素两个维度探讨了其对省份物流需求的影响,预测指标见表1所示。

(1) 经济发展规模:经济规模与物流需求的关系早已有研究表明是正相关的。具体而言,经济发展越快,生产和消费活动的增长越明显,物流需求自然随之增大。比如,近年来中国一些新兴城市的物流需求增长速度与其GDP增速几乎同步。例如,深圳和杭州等城市的物流需求随着高新技术产业的兴起而快速增长,说明经济规模对物流需求有显著的推动作用。

(2) 产业结构:产业结构调整对于物流需求有显著影响。城市从传统的制造业向高技术服务业转型时,物流需求的类型和模式也会发生变化。比如,服务业的迅速发展带动了对快递、仓储和配送服务的需求,而制造业则更加依赖于大宗商品的长途运输。因此,城市物流需求不仅仅受经济总量的影响,更与产业结构的变化紧密相关。

(3) 商业贸易:商业贸易的增长直接增加了物流需求。尤其是对外贸易的变化,将影响进出口货物的流动,从而影响物流需求。以广州为例,作为重要的外贸口岸,其对物流的需求不仅体现在国内运输上,还包括国际货运服务。

(4) 居民消费水平:随着居民消费水平的提高,尤其是中产阶级群体的崛起,物流需求的模式也发生了变化。高消费水平带动了个性化、定制化配送的兴起。

(5) 资金投入:资金投入是推动城市物流需求发展的重要因素。特别是基础设施建设和物流技术的投入,能够有效提升物流服务的效率和质量。比如,在上海等大城市,政府对智慧物流平台、无人驾驶配送车、自动化仓储的资金投入,已经显著提升了城市物流的运作效率。这些技术和服务的普及,不仅提升了物流需求的响应速度,也增加了对高效运输服务的需求。

(6) 消费市场:消费市场是指人们在社会中进行的物质交换和经济活动,直接与物流需求的变化密切相关。特别是在人口密度较高的地区,消费市场的扩展将引发更多的物流活动。例如,北京、上海、广州等一线城市,由于高密度的人口和较强的消费能力,其消费市场的活跃程度较高,这也促使了相应的物流需求增长。通过研究这些城市的消费市场变化,可以看到,商业流通量的增加带动了对物流配送、仓储等服务的需求。

非经济因素:文中提到,非经济因素、宏观经济政策和外部环境等短期内对城市物流需求影响不大,因此可以忽略不计。这一点需要谨慎,虽然短期内这些因素可能影响较小,但在特定情境下,它们仍然会对物流需求产生一定的波动。例如,突发公共卫生事件(如COVID-19疫情)会在短期内影响消费者行为、供应链中断和运输系统的运作,进而影响物流需求。因此,虽然主要聚焦经济因素,但在具体模型和预测中,仍应考虑到可能的短期波动因素。

经济指标:本文决定只关注经济指标与城市物流需求的关系,用货运量来衡量物流需求的规模。货运量是一个重要的量化指标,它能够有效反映城市物流需求的总量及其波动情况。在实际的预测研究中,依据各区域的统计数据差异,构建相应的影响因素指标体系是合理的。

Table 1. Logistics demand forecasting index

1. 物流需求预测指标集

影响因素

详细指标

单位

变量

经济发展规模

地区生产总值

亿圆

X1

产业结构

第一产业增加值

亿圆

X2

商业贸易

消费品零售总额

亿圆

X3

收入水平

人均可支配收入

X4

资金投入

固定资产

亿圆

X5

消费市场

人口数量

X6

4. 预测建模过程

SVR是SVM的回归版本,其核心思想是寻找一个能够最大化间隔的超平面,并将大部分数据点的预测误差控制在容忍度 内。SVR能够有效处理高维、非线性的数据,因此在许多实际问题中得到了广泛应用,如金融预测、时间序列分析和物流需求预测等。

4.1. 引入SVR的基本概念

支持向量回归(SVR)是基于支持向量机(SVM)的回归模型,其目的是在高维空间中寻找一个回归超平面,该超平面能够使大部分数据点的预测误差小于一个指定的容忍范围 ,同时最小化模型的复杂度。

SVR的基本目标是寻找一个回归函数 f( x ) ,使得对于大部分数据点,预测误差不超过指定的 ,而只有少数数据点会有较大的误差。

在支持向量回归(SVR)中,最优超平面的目标是通过最大化间隔来找到一个合适的回归函数,使得大多数数据点的预测误差小于一个预设的容忍误差 。SVR的最优超平面不是一个简单的直线,而是通过核函数将数据映射到高维空间后定义的一个超平面。这个超平面的表达式可以通过以下步骤和公式来表示。

f( x )= ω T φ( x )+b (1)

其中x是输入数据点(特征向量), φ( x ) 是输入数据x映射到更高维空间的映射函数, ω 是权重向量,b是偏置项。

支持向量是指那些靠近超平面,且位于边界的训练点。支持向量的条件是满足以下的约束条件:

| y i f( x i ) |ϵ (2)

通过优化目标函数来最小化权重向量的平方,并且惩罚误差超过 的数据点。该目标函数如下:

min ω,b,ξ, ξ * ( 1 2 ω 2 +C i=1 n ( ξ i + ξ i ) ) (3)

s.t.| y i ( ω T φ( x i )+b ) |ϵ+ ξ i (4)

| y i ( ω T φ( x i )+b ) |ϵ+ ξ i (5)

其中C是正则化参数,控制模型的复杂度与误差之间的平衡, ξ i ξ i 是松弛变量,表示某些数据点,违反了误差容忍区间 b 是偏执项, ω 是权重向量,定义了回归超平面的向量, ω 2 是权重的平方,越小代表模型越简单。

核技巧与最优超平面的高维表示SVR的最优超平面不仅仅适用于线性问题。在实际应用中,通常使用核技巧(kernel trick)将数据映射到一个更高维的特征空间,在这个空间中数据可能是线性可分的最优超平面的表现形式如下:

f( x )= i=1 n α i k( x, x i )+b (6)

α i 是拉格朗日乘子,与支持向量的权重有关, k( x, x i ) 是核函数用于计算数据点x支持向量 x i 之间的相似度,在这种表示下,最优超平面是通过所有支持向量的加权组合来得到的。

为了将原始优化问题转化为对偶问题,使用拉格朗日乘子法引入约束条件。引入拉格朗日乘子 α i α i 对约束条件进行加权,通过对拉格朗日函数关于 ω,b,ξ, ξ 求偏导数并令其为零,可以得到最优条件如下:

max α, α * ( 1 2 i=1 n j=1 n α i α j k( x i , x j ) + i=1 n ( α i α i ) y i ) (7)

s.t. α i 0, α i 0,i=1,2,,n (8)

α i α i =0,i=1,2,,n (9)

其中 k( x, x i ) 是核函数用于计算样本点 x i x j 之间的相似度, y i 是训练样本 x i 的目标值。

SVR的核函数选择对于模型的表现具有重要影响。常见的核函数包括线性核、径向基核(RBF)、多项式核和SIGMOID核等。不同的核函数适用于不同的数据特性,选择合适的核函数能够显著提高SVR模型的预测性能。四种核函数的表达式如下:

(1) 线性核函数:

k( x i , x j )= x i T x j (10)

(2) 径向基核(RBF)函数:

k( x i , x j )=exp( x i x j 2 2 σ 2 ) (11)

(3) 多项式核:

k( x i , x j )= ( x i T x j +c ) d (12)

(4) sigmoid核函数:

k( x i , x j )=tanh( α x i T x j +c ) (13)

交叉验证(CV)是一种常用的模型评估方法,通过将数据集划分为多个子集,并在每个子集上进行验证,能够有效避免过拟合问题。在SVR的模型优化中,交叉验证不仅用于评估模型的性能,还可以帮助选择最合适的核函数。在多种候选核函数中,交叉验证能够根据模型在验证集上的表现,选择出最优的核函数,进而提高模型的准确性和泛化能力。

4.2. 交叉验证(CV)选择核函数的应用

交叉验证是一种用于评估机器学习模型性能的方法,通常通过将数据集分成多个子集,反复训练和验证模型,从而避免过拟合。最常用的交叉验证方法是K折交叉验证(K-fold Cross-Validation)。

4.2.1. K折叠交叉验证的步骤

1. 将数据集D划分为k个子集 D 1 , D 2 ,, D k ,每个子集的大小相等。

2. 对于每一折 k{ 1 ,2,,K } ,将子集 D k 作为验证集,其余的子集作为训练集,在训练集上训练模型,在验证集上评估模型性能,得到一个评估指标这里选择均方误差(MSE)。

3. 重复上述过程k次,最终得到k个评估结果。

4. 最终的结果是k次交叉的平均值。

设模型评估指标为L,对于每一次的交叉验证,评估计算指标如下:

L k = 1 | D k | x D k L( f( θ ^ ,x ),y ) (14)

其中 | D k | 表示验证集 D k 的样本数量, L( f( θ ^ ,x ),y ) 表示模型在样本x上的损失 f( θ ^ ,x ) 是模型的预测结果,y是真实标签, θ ^ 是在训练集上学到的模型参数。

交叉验证的平均评估指标为:

L CV = 1 K k=1 K L k (15)

其中 L CV 是最终的交叉验证评分。

4.2.2. 网格搜索

网格搜索是通过穷举所有可能的超参数组合,来寻找最优超参数的算法。网格搜索会遍历给定的超参数空间C γ 并评估每一组超参数的模型表现。

网格搜索的步骤:

  • 设定一组待优化的超参数及其可能的取值范围。例如,假设我们有两个超参数C γ ,他们的取值范围分别为 C 1 , C 2 ,, C m γ 1 , γ 2 ,, γ n

  • 构建一个超参数组合的网络 G={ ( C 1 , γ 1 ),( C 1 , γ 2 ),,( C m , γ n ) } ,每一个点代表一组超参数组合。

  • 对于每一个超参数组合:使用这个超参数组合训练SVR模型,并且在交叉验证的过程中评估模型的性能。

  • 选择性能最优的超参数组合。

对于每一组 ( C i , γ j ) ,通过交叉验证计算其性能指标:

L ( C i , γ j ) = 1 K k=1 K L k ( C i , γ j ) (16)

其中 L k ( C i , γ j ) 表示在第K次折叠中,使用超参数 ( C i , γ j ) 得到的最优评估指标。

网格搜索的最终结果是选择最优的超参数组合 ( C * , γ * )

( C * , γ * )=arg min ( C i , γ j ) L ( C i , γ j ) (17)

4.3. SVR-CV-GS模型的构建

Figure 1. SVR-CO-GS main structure

1. 支持向量回归预测流程

近年来,机器学习算法,特别是支持向量机(SVM)及其变种支持向量回归(SVR),在回归任务中取得了显著的效果。然而,SVR模型的性能在很大程度上依赖于超参数的设置,包括惩罚参数c、容忍度 和核函数γ的选择,这对模型的泛化能力有着直接影响。

为了进一步提升SVR模型的预测精度,本文提出了一种结合网格搜索和交叉验证(CV)的优化方法。在该方法中,网格搜索用于优化SVR模型的超参数,而交叉验证则用于选择最优的核函数。这种优化策略能够有效减小模型过拟合的风险,提高模型在未知数据上的泛化能力。模型流程如图1所示。首先是对所选取的数据进行预处理,对数据集进行划分,划分为训练集和测试集,然后通过交叉验证选择核函数避免模型过拟合,选择出表现最好的核函数,然后进行网格搜索选择最优超参数,通过网格搜索选择最优超参数组合对模型进行训练,再与其他模型进行对比如神经网络验证模型的可行性,验证优于其他模型后再进行最终的预测。

交叉验证提供了对模型泛化性能的稳定评估,通过多次划分训练集和验证集,避免了过拟合。网格搜索通过穷举所有超参数组合,能够寻找最佳的超参数组合,从而提高模型性能。

通过这种两阶段的优化流程,先选择最优的核函数,再对超参数进行细致调优,可以在保证模型稳定性的同时,最大化模型性能。这种结合方法在大规模数据集上尤为有效,能够在保证计算效率的同时,提升模型的准确性和鲁棒性。

4.4. 数据来源与数据预处理

Table 2. 2000~2022 year demand index of Hubei Province

2. 2000~2022年湖北省需求指标

年份

X1

X2

X3

X4

X5

X6

Y

2000

9611

3545.39

5936

395,314

1231.1

662.3

40,949

2001

10,692

3880.53

5956.6

510,930

1302.17

692.17

41,476

2002

11,855

4212.82

5978.2

676,581

1421.55

707

42,064

2003

13,330

4757.45

6000.5

905,475

1551.75

798.35

44,661

2004

15,172

5546.78

6001.3

117,621

1695.22

1008.87

47,073

2005

17,397

6469.66

5984.1

148,964

1883.59

1069.81

50,317

2006

19,597

7531.8

6038.3

207,056

2356.38

1125.52

52,885

2007

23,709

9451.39

6084.9

172,510

2834.75

1331.44

58,523

2008

28,092

11497.4

6110.8

259,321

3572.69

1716.03

75,778

2009

32,050

13192.1

6141.9

335,869

4534.14

1717.32

82,714

2010

35,179

16226.9

6176

319,640

5798.56

2043.2

97,007

2011

38,720

19942.4

6164.1

363,892

8211.85

2469.2

110,168

2012

43,217

22590.8

6165.4

430,640

10802.6

2674.82

125,392

2013

47,320

25378.0

6170.6

456,053

12935.0

2883.73

139,740

2014

51,415

28242.1

6162.3

393,976

16504.1

3001.59

154,736

2015

55,903

30344

6138.9

463,086

20753.9

3109.93

156,357

2016

60,561

33353

6156.8

528,024

25001.7

3406.46

165,125

2017

64,661

37235

6141.8

571,284

29191.0

3528.96

187,638

2018

71,110

42021.9

6172.9

620,834

29503.8

3548.17

203,704

2019

81,529

45428.9

6177.8

831,435

31872.5

3809.41

188,143

2020

84,478

43004.4

6160.1

927,308

33456.6

4133.2

160,428

2021

86,672

50091.2

6142.8

946,667

37890.8

4635.21

214,770

2022

87,765

53734.9

6131.4

967,865

38876.9

4986.72

209,480

Figure 2. Kernel functions represent scatter plots

2. 核函数表现散点图

Table 3. Kernel function hyperparameter optimization

3. 核函数超参数优化

参数

Liner

RBF

Poly

Sigmoid

mse

0.12

0.09

1.21

1.11

c

1

1000

100

1000

epsilon

0.1

0.001

0.01

0.001

gamma

0

0.001

0.01

0.01

根据本文第三章的物流指标体系建设,本文的数据全部来自于湖北省统计年鉴和国家统计网站,得到湖北省2000年到2022年的湖北省物流需求指标集的目标变量和特征变量,以X1~X6作为数据集的六个目标变量,以货运量作为目标变量Y,具体数值如表2所示。本研究选取六个目标变量,经济发展规模、产业结构、商业贸易、居民消费水平、资金投入、消费市场等经济因素,货运量作为目标变量直接反应湖北省的物流总需求,所选取的目标变量均为经济指标,经济发展规模、商业贸易水平、居民消费水平、消费市场等经济指标在这个网络电商高速发展的时代背景下,这些经济指标在很大程度上影响着湖北省的物流总需求,非经济因素对于短期物流需求影响较小,如疫情时代的物流需求量有略微下降,短期政治因素的影响对于长期物流需求预测的影响本研究这里暂不考虑,所选取的经济指标很大程度上影响着湖北省的物流需求总量。

为了消除各指标之间的维度对湖北省物流需求预测结果准确性的影响,在对湖北物流需求进行预测之前,需要对原始数据进行归一化处理。通过归一化操作可以使每个特征具有同等重要性,加快模型的收敛速度。划分训练集和测试集,百分之八十的数据划分为训练集,百分之二十的数据划分为测试集。

4.5. 模型测试与分析

根据图2表3可知在对不同核函数进行训练之后,根据散点图可以清晰地看出不同核函数的表现,根据可视化结果可以看出支持向量回归的四种核函数的表现如图2所示线性核函数和RBF核函数表现优于Poly和Sigmoid核函数。本研究选择RBF核函数,根据网格搜索结果不同核函数的超参数组合,我们选择c值为1000,epsilon值为0.001,gamma值为0.001的超参数组合,RBF核函数的表现是最好的均方误差最小mse值为0.09,这时的超参数取值如表3所示。

Figure 3. Comparison of actual and predicted values of training set

3. 训练集拟合效果

Figure 4. Comparison of actual and predicted values of testing set

4. 测试集拟合效果

图3图4分别展示了在SVR-CV-GS模型下真实值与预测值的拟合程度,根据拟合结果显示,预测值与真实值的差异较小,预测效果较为理想。为了说明回归SVM-CV-GS模型的优势和可行性,我们将本文的预测方法与其他文献的预测方法BP神经网络预测模型进行比较结果如表4所示,优化后的SVR模型的平均预测误差小于BP神经网络的误差,在预测过程中更加精准,验证了模型的可行性。

根据图表可以看到在测试集上的模型的表现如图4,改进后的SVR模型在训练集和测试集的拟合效果是优秀的,证明该模型在实际预测的可行性。

Table 4. Predicted and true values of different models

4. 不同模型的真实值与预测值

年份

真实值

SVR-CV-GS

误差

BP

误差

2018

203,704

206,634

0.0246

213,467

0.0567

2019

188,143

193,354

0.0253

196,548

0.0765

2020

160,428

178,546

0.0440

178,769

0.0863

2021

214,770

222,314

0.0462

223,451

0.0523

2022

209,480

214,675

0.0643

213,452

0.0764

根据图表可以看到在测试集上的两个模型的表现如表4,改进后的SVR模型误差小于BP神经网络,可知改进后的SVR模型表现优于BP神经网络模型,证明该模型在实际预测的可行性。

5. 结论

城市物流需求的准确预测是物流规划的重要依据,是区域物流综合规划的前提和基础,基础设施建设规模、网络空间布局等深刻影响着物流企业的发展方向及功能定位。以影响湖北物流需求的经济因素实际数据为例,针对湖北复杂物流系统,首先建立了湖北复杂物流系统的SVM-CV-GS预测模型进行训练和测试。实验结果表明,预测结果更接近现实。为了说明选择方法的可行性,本文将SVM-CV-GS预测模型与BP神经网络方法的预测结果进行了比较。实验结果表明,SVM-CV-GS预测模型具有较好的预测精度,相对误差为0.0374。因此,采用SVR-CV-GS模型对湖北省未来5年需求进行预测。根据预测结果,进一步规划湖北物流发展,未来五年湖北的物流需求将持续增长,需要从政策支持、物流服务、物流“互联网+”模式等方面进一步推动湖北省物流业健康发展。

6. 展望

SVR (支持向量回归)在小样本、非线性关系复杂的数据集中表现出显著优势,尤其是在数据规模有限且存在噪声的情况下,其非线性核函数(如RBF核)可以捕捉复杂的特征交互关系并实现精确的回归。然而,在大规模、高维数据的场景中,SVR面临着计算复杂度较高和过拟合风险增加的问题,这主要是因为SVR的训练复杂度随样本数量的平方增长,且在高维特征空间中,其决策边界容易变得不够稳健。对于以年为单位的短期物流需求预测,短期预测下政治政策影响对未来短期内的物流需求影响较大,我们可以加上短期政治政策的影响。因此,为了在这些场景中提升SVR的效率和性能,通常需要结合更优的模型或方法加以改进。

SVR的优化可以从多个方面进行探索。首先,通过引入自动化调参工具(如贝叶斯优化或遗传算法),可高效地选择最佳超参数组合,从而减少网格搜索带来的时间成本。其次,针对高维数据,可结合特征降维方法(如主成分分析PCA或线性判别分析LDA),将原始特征映射到低维空间,既降低模型复杂度,又提升训练效率。此外,通过与集成学习方法(如Bagging或Boosting)的结合,可以提升模型的泛化能力。例如,将SVR作为弱学习器集成到随机森林或梯度提升树中,可有效增强其对多样化数据集的适应性。综合来看,通过这些优化手段,SVR能在计算效率和预测精度之间实现更好的平衡,并在更复杂的实际应用场景中发挥作用。通过对国内外研究的调查发现组合预测模型的预测精度也有较大的提升,后续研究可以结合更多优秀的模型进行赋权处理,选择更加科学的赋权计算方法,提高所使用模型的预测精度,从而达到更加准确的预测结果。

参考文献

[1] 姬栋媛, 陆芬. 基于组合模型的浙江省物流需求预测[J]. 物流科技, 2024, 47(23): 22-25.
[2] 江帆, 刘利民. 基于GM-LSTM的港口物流需求预测——以宁波港域为例[J]. 物流科技, 2024, 47(24): 25-28, 50.
[3] 程小慷, 陈蔚璇. 基于IOWGA的航空物流需求预测研究[J]. 民航学报, 2024, 8(6): 6-10, 59.
[4] 印如芸. 基于BP神经网络的江苏省农产品冷链物流需求预测[J]. 中国储运, 2024(11): 83-84.
[5] 古俊杰, 刘东. 基于BP和RBF神经网络模型的江西省农产品冷链物流需求预测[J]. 中国储运, 2024(10): 62-63.
[6] 陈良云. 基于GM (1,1)模型的福建省农产品冷链物流需求预测[J]. 铁路采购与物流, 2024, 19(9): 55-58.
[7] 朱晓璐, 陈永祥, 张心慧. 基于GM(1, 1)的山东省沿海港口物流需求预测研究[J]. 价值工程, 2024, 43(22): 23-25.
[8] 李蒙炀. 基于灰色-回归模型的四川省区域物流需求分析及预测[J]. 中国储运, 2024(8): 123-125.
[9] 杨洋, 朱芳阳. 基于岭回归模型的广西物流需求预测研究[J/OL]. 物流科技, 1-9.
http://kns.cnki.net/kcms/detail/10.1373.F.20240729.1432.002.html, 2024-12-15.
[10] 刘盼. 基于组合预测的重庆市生鲜农产品冷链物流需求预测与对策研究[J]. 中国储运, 2024(7): 145-146.
[11] 梁毅, 徐超飞. 基于SVM的区域物流需求建模与预测仿真——以浙江省为例[J]. 物流研究, 2024(3): 54-60.
[12] 杨新彪, 陈彦如, 秦娟, 等. 基于VMD-EWT-QWLSTM-TPE深度学习模型的超短时物流需求多步预测[J]. 控制与决策, 2024, 39(6): 1859-1868.
[13] 龚映梅, 王宁. 基于组合预测法的云南省生鲜农产品冷链物流需求预测[J]. 江苏商论, 2024(5): 33-37.
[14] 王琰琰, 任俊玲. 基于GA-ACO-BP神经网络的日用消费品物流需求预测[J]. 北京信息科技大学学报(自然科学版), 2024, 39(1): 91-98.
[15] 郝杨杨, 邹宇. 基于BP神经网络的上海生鲜农产品物流需求预测[J]. 上海海事大学学报, 2024, 45(1): 39-45, 69.