1. 引言
中国经济蒸蒸日上,人民生活水平日益提高的同时,机动车保有量也节节攀升。交通拥堵、停车难的问题越来越凸显,尤其是大城市。IBM的一项调查表明,由于车辆在道路上寻找空闲停车位,导致城市道路交通拥堵的比例接近40% [1]。为了解决居民停车需求增长和停车泊位供应不足的矛盾,智慧交通系统引入了停车诱导[2]。停车引导系统是一种有效改善停车压力的方式[3],而短时有效停车泊位的准确预测是停车引导系统的重要内容。停车场泊位预测本质上是一个时间序列预测问题,目前已有不少研究成果。常用的预测方法可分为两类,一类是以ARIMA模型、马尔科夫链为基础的传统时间序列预测方法;另一类是以神经网络为基础的预测方法,如以小波神经网络、长短时记忆网络为基础的预测方法。传统预测方法原理简单,方便实现,但对于非线性、不确定性高的停车泊位数据预测精度不够理想。近年来,基于循环神经网络RNN及其变体的时间序列预测模型成为主流[4],其方法的有效性在许多领域得到应用,如交通流预测、电网负荷预测和风速预测等。但单一模型对于处理非线性非平稳数据的能力有限,已有越来越多的学者使用组合预测模型来研究相关问题。对比表明,在预测准确率上,组合预测模型要优于单一模型。为了更好地预测非线性非平滑的时间序列数据并取得良好效果,一些学者在时间序列预测问题中引入了信号分解的相关方法。在传统预测方法研究领域,Yu等人利用ARIMA建立剩余泊位预测模型,预测中心商场停车场剩余泊位数,但是在剩余泊位数量变化较大时,难以保证预测的准确性,需要采用相应的方差分析方法[5];Ji等人提出了一种将小波分析与马尔科夫链结合的空闲停车占用率预测模型,先通过小波分解将原始时间序列分解为代表趋势的低频信号和代表扰动的高频信号,再利用马尔科夫模型分别预测低频和高频信号,最后综合得出预测结果,并利用算例分析来验证模型的适用性。但其准确性要看数据库的实时更新情况而定[6];韩印等人提出了灰色–小波神经网络的组合模型,能有效降低初始数据波动性干扰,从而大幅提高有效泊位预测精确度,但模型在应用时需要实时数据的积累和训练,只能进行短期预测[7];在使用神经网络模型预测方法领域,杨培红等人提出了一种基于LightGBM-SVR-LSTM的停车区剩余车位预测模型,该模型具有良好的提取特征能力,并且利用LSTM有效修正预测误差,提高模型的预测精度,增强鲁棒性[8];在组合预测模型研究领域,Zhou等人为提高短时空中交通流量预测精度,利用基于贝叶斯优化和差分处理的互补集合经验模态分解和长短时记忆网络的组合模型,对短时空中交通流量进行预测,研究结果表明,该组合模型的预测精度和拟合度相较于经典时间序列预测模型有较大提高[9];田丰等人建立带自适应噪声的完全集合经验模态分解和门控循环单元相结合的组合预测模型,用于短期交通流预测,可以使交通流数据的非线性特征被充分挖掘,更好拟合交通流的变化趋势[10]。上述针对有效停车泊位预测的研究多采用预测模型直接进行预测,而不考虑停车泊位数据的非平稳性和非线性,因此预测结果难以达到较高精度,而其他领域的相关研究如交通流预测则验证了利用模态分解方法结合神经网络的组合预测模型可以应用于时间序列预测问题的研究。但实际应用于停车泊位预测的相关研究较少,因此,本研究基于先分解后预测的思想,探索采用变分模态分解方法结合长短时记忆网络的组合预测模型,构建有效停车泊位预测模型,提出基于VMD-LSTM的停车泊位组合预测模型。首先将非平稳非线性的停车泊位数据进行变分模态分解,得到几个线性稳定的分量,然后将各分量分别输入LSTM模型进行预测,再将预测结果进行叠加重构,得到最终的预测结果。
2. 基本理论
2.1. 变分模态分解
变分模态分解(VMD)方法是Konstantin Dragomiretskiy在2014年通过求解频域变分优化问题来估计各种信号分量而提出的一种新的时频分析方法[11]。VMD一经提出便受到广泛关注,目前已经在交通流量预测,光伏功率预测,短期风力预测等领域得到应用。
变分模态分解的过程是变分问题的求解过程,它能自适应匹配每种模态的有限带宽和最佳中心频率,其算法的核心思想主要由构造变分问题和求解变分问题两部分组成[12]。变分模态分解的求解过程有两点要求:一是所有分解得到的模态分量中心频率的带宽相加之和最小;二是所有模态分量相加之和需要与原信号相等。其过程大致如下所示:
① 对每个模态函数
,通过希尔伯特Hilbert变换求单边频谱;
② 将各个模态的单边频谱移动与估算的中心频率
相乘;
③ 通过梯度的平方
范数,计算各的模态信号的带宽。
其变分约束模型为:
(1.1)
(1.2)
其中
为Dirac分布函数,K为分量总数;
为原始的停车泊位输出信号。
通过引入拉格朗日Lagrange算子
和二次惩罚因子
,将不等式约束变换为等式约束,相应的增广Lagrange表达式如下:
(1.3)
其中,
降低了高斯噪声的影响,
保证了约束问题的严格性。
各分量
及相应中心频率
通过交替方向乘子法优化求解[13],其更新方法如下:
(1.4)
(1.5)
(1.6)
式中:
、
和
分别为
、
和
的傅里叶变换;
为频率;n为迭代的次数,
为噪声容忍度,满足信号分解的保真度要求,对于含有强噪声的信号,可设
。
VMD主要迭代求解过程如下:
初始化
,
,
和最大迭代次数N,
;
利用公式(4)(5)更新
和
;
利用公式(6)更新
;
精度收敛判断依据
,若不满足
且
,则返回第二步,否则完成迭代,输出最终
和
。
图1为VMD算法流程示意图。
2.2. 长短时记忆网络
循环神经网络RNN是一种适用于序列数据处理的神经网络结构,长短时记忆网络LSTM是RNN的一种改进版本,在处理长序列时表现出色,主要用于解决RNN容易出现梯度消失和梯度爆炸的问题。
LSTM主要通过遗忘门、输入门和输出门三个门来控制信息的传输,从而解决长距离依赖问题。LSTM中的门是用来控制数据的流向,门状态为全开启(信息通过的机率为1),全闭合(信息通过的机率为0),半开启(信息通过的机率介于0到1之间)。在神经网络中,sigmoid函数是一个介于0和1之间的表示,可以用于LSTM中门的计算。LSTM的内部结构如图2所示:
Figure 1. VMD algorithm process
图1. VMD算法流程示意图
Figure 2. Internal structure of LSTM
图2. LSTM内部结构
其中,
表示t − 1时刻的细胞状态,
表示t − 1时刻的隐藏层状态,
表示t时刻的输入,
表示遗忘门,
表示输入门,
表示候选值,
表示输出门。数据流向的计算过程如下:
① 利用t − 1时刻的隐藏层
计算遗忘门
的结果,
的计算公式为
(1.7)
② 利用t − 1时刻的隐藏层
计算遗忘门
的结果,
的计算公式为
(1.8)
③ 利用t − 1时刻的隐藏层
计算遗忘门
的结果,
的计算公式为
(1.9)
④ 利用t − 1时刻的隐藏层 计算遗忘门
的结果,
的计算公式为
(1.10)
⑤ 利用t − 1时刻的细胞状态
,遗忘门
,输入门
和候选值
,计算t时刻的细胞状态
,
的计算公式为
(1.11)
⑥ 根据输出门
和细胞状态
计算外部状态
,
的计算公式为
(1.12)
其中
表示使用遗忘门
对t − 1时刻的细胞状态
遗忘;
表示整体需要增加的信息,两部分结合表示t时刻的细胞状态需要从t − 1时刻的细胞状态中保留的部分信息以及t时刻新增信息的总和。
3. VMD-LSTM有效停车泊位预测模型构建
3.1. VMD-LSTM模型
直接使用原始数据会影响空闲停车泊位预测的效果,原因在于空闲停车泊位数据具有非线性和非平稳的特性,使用VMD将非线性非平稳的泊车位数据序列分解成若干平顺序列,以降低预测误差,进一步提高预测的准确性。
对于分解后的分量,先分成训练集和测试集,在训练集上分别用LSTM来训练各分量,在测试集上进行预测,再将各分量的预测值叠加,得出最后的预测结果。构建以VMD-LSTM为基础的有效泊位预测模型,主要分为5个过程。
① 使用高位摄像机,对路边停车位的空闲停车泊位数据进行采集,分析数据特点,进行数据处理,获取合适的数据;
② 根据数据特征,选取合适参数,使用变分模态分解方法对空闲停车泊位数据进行分解,得到K个分量;
③ 针对每个分量,将其分为训练集和测试集,分别将训练集数据输入到长短时记忆网络中进行训练;
④ 将测试集的数据分别输入到长短时记忆网络中,得到不同分量的预测值,将所以分量的预测值进行叠加重构,得到最终的预测结果;
⑤ 对空闲停车泊位的最终预测结果进行误差分析,并且分别与其他预测方法进行比较,分析组合模型的预测效果。
VMD-LSTM流程图如图3所示。
Figure 3. VMD-LSTM flowchart
图3. VMD-LSTM流程图
3.2. 评价指标
为了验证模型的预测效果,本文采用平均绝对误差(Mean Absolute Error, MAE),均方根误差(Root Mean Square Error, RMSE)和平均绝对百分比误差(Mean Absolute Percentage Error, MAPE)量化预测误差。其计算公式为:
(2.1)
(2.2)
(2.3)
其中n为停车泊位数据总采样数,m为训练集样本数,
为停车泊位实际值,
为预测值。
4. 实例与结果分析
4.1. 实验准备
本实验数据选取上海市闵行区某区域路边停车车位数据为研究对象,共涉及19个路段,562个停车位。对2024年3月18至3月22日的停车泊位进行分析,时间间隔为5分钟。首先对高位摄像机采集到的数据进行预处理,共得到1440个停车泊位数据点。以预测点前60分钟的数据作为模型输入,以预测的停车泊位数据作为模型输出,以前四个工作日的数据作为训练集,最后一个工作日的数据作为测试集,构建R2,RMSE,MAE和MAPE4个评价指标,分别使用LSTM,EMD-LSTM,CEEMDAN-LSTM和VMD-LSTM四种预测模型,对空闲停车泊位数据进行预测。
4.2. 基于VMD的停车泊位数据分解结果
停车泊位数据具有非平稳性和非线性,采用变分模态分解对停车泊位原始数据进行分解,得到线性的,平稳的分量,以消除偶然因素的影响,并进一步挖掘停车泊位的特征。对于变分模态分解,需要的参数是需要分解的变量个数k以及中心频率α。本研究以重构信号和原始信号的重构误差最小为目标,经过多次实验确定变分模态分解的参数,其中tau,DC,init和tol取默认值,分别为0.3,0,1和1e−7,k的取值为9,α的取值为1530时,重构误差最小。变分模态分解后各分量如图4所示。
Figure 4. VMD components
图4. VMD各分量
分解之后,得到九个分量,非线性非稳定的停车泊位数据变得相对线性、稳定。其中低频分量反映了停车泊位的变化趋势,高频分量反映了停车泊位受到偶然因素的影响,分解后的分量既保持了原始停车泊位数据的特征,又避免了模态混叠。
4.3. 基于VMD-LSTM模型预测结果
将变分模态分解得到的九个模态分量分为训练集和测试集后,分别输入到长短时记忆网络中进行预测,将各预测值进行叠加重构得到最终的预测结果。选取前80%数据点用于训练,后20%数据点进行测试。长短时记忆网络设置为两层,数据采样步长为12,即用前1小时的数据预测后五分钟的数据,隐藏层神经元数量为32,损失函数采用MSE,优化器选择Adam,以均方误差作为损失函数,迭代次数为100,dropout为0.2防止过拟合。预测结果如图5所示。
Figure 5. Actual values and VMD-LSTM model prediction results
图5. 实际值和VMD-LSTM模型预测结果
由此可见,VMD-LSTM模型预测的结果与实际值比较接近,预测的结果较好。
4.4. 预测结果分析
为验证VMD-LSTM模型的性能,将其与LSTM模型、EMD-LSTM模型和CEEMDAN-LSTM模型预测结果对比,各模型评价指标对比见表1,结果取10次平均值。
Table 1. Comparison of evaluation indicators for various models
表1. 各模型评价指标对比
模型 |
R2 |
RMSE |
MAE |
MAPE |
VMD-LSTM |
0.9965 |
1.4518 |
1.1900 |
0.4293% |
CEEMDAN-LSTM |
0.9899 |
2.4855 |
2.0221 |
0.7231% |
EMD-LSTM |
0.9854 |
2.9909 |
2.4313 |
0.8704% |
LSTM |
0.9713 |
4.1919 |
3.2265 |
1.1359% |
各预测模型未来一小时预测结果图如图6所示。
Figure 6. Forecast results of each model for the next hour
图6. 各模型未来一小时预测结果图
在进行有效停车泊位的预测时,引入变分模态分解方法使得预测模型的精度得到进一步提高。从表1可以看出,VMD-LSTM模型的RMSE相比于LSTM模型、EMD-LSTM模型和CEEMDAN-LSTM模型分别低65.37%、51.46%和41.59%;MAE分别低63.12%、51.06%和41.15%;MAPE分别低62.21%、50.68%和40.63%。说明只使用LSTM模型进行预测的结果最差,使用了LSTM的改进模型EMD-LSTM和CEEMDAN-LSTM模型的效果均有提升,但改善效果有限,使用VMD-LSTM的结果改善幅度较大,表明仅使用LSTM模型预测的结果是最糟糕的。这证明,变分模态分解可以有效降低原停车泊位数据的非线性、非平稳性,从而使预测结果有更显著的改善,预测效果也更加精准。
5. 结束语
本文围绕有效停车泊位预测问题,基于变分模态分解和长短时记忆网络设计并提出了一种组合预测模型VMD-LSTM模型,并通过实证研究,验证了其在预测有效停车泊位数量方面的有效性和优越性。模型的核心思路是利用VMD技术将非平稳、非线性的停车泊位原始数据分解为若干线性和平稳的分量,针对每个分量分别建立LSTM网络进行预测,并通过对各分量预测结果的叠加与重构,生成最终的整体预测结果。通过使用实际采集的路边停车泊位数据对该模型进行训练和仿真,实验结果表明,与未采用模态分解的传统神经网络预测模型相比,VMD-LSTM模型的预测精度显著提升,达到40%~62%的改进幅度,充分验证了组合模型的优势和可靠性。
通过对VMD-LSTM模型的研究和实验分析,得出如下结论:
(1) 变分模态分解方法的有效性:VMD方法在处理非平稳、非线性时间序列数据方面具有显著优势,能够有效分离出不同频率和特征的分量,从而将复杂的原始数据转化为更适合预测建模的线性和平稳数据。这种方法为后续预测模型提供了更高质量的输入,提高了预测模型的训练效率和稳定性。
(2) 组合预测模型的显著性能:基于先分解后集成思想的VMD-LSTM模型,通过对分解后的各分量分别建模并最终整合预测结果,能够更好地捕捉数据中的潜在特征,相较于直接应用传统LSTM模型,组合模型在预测精度和效果方面都有显著提升。
(3) VMD与LSTM的协同创新:VMD技术的引入,为LSTM模型提供了更明确的目标和更清晰的特征结构,两者的结合在有效停车泊位预测领域展现出较高的适用性。模型不仅适用于短期预测,还能够在长期趋势变化中表现出较强的鲁棒性,为复杂环境下的停车泊位预测提供了可靠的解决方案。