1. 引言
随着社会的快速发展和经济的繁荣增长,我国汽车数量直线上升,交通流量成阶梯式增长,对短时交通量的预测也逐渐被国内外学者研究。目前,关于短时交通量预测的文献大多偏重于对交通量进行准确的单步预测,但是为了实现更有预见性和主动性的交通管理,还需对交通量进行多步预测;并且随着数据不确定性水平的提高,交通量点预测会出现信息不完备、不可靠的问题。
多步预测方法目前有直接多步预测、递归多步预测以及直接递归混合多步预测。2016年Cai [1]等人提出了一种面向短时交通多步预测的时空相关k近邻模型。2020年,Zhao [2]等提出了一种基于互补集成经验模态分解(CEEMD)和自回归积分移动平均(ARIMA)模型的多步预测模型。2020年,Li [3]等提出了一种基于混合深度分解的非平稳和非高斯过程的多步预测方法,结果表明该算法具有较高的预测精度、良好的稳定性和较强的通用性。
2021年,Li [4]等人设计了一个新的图形注意机制的变体,基于这种动态图卷积(DGC)模块,提出了一种多步交通预测模型——动态图卷积网络(DGCN)。2022年,Xiang [5]等提出了一种基于CEEMDAN二次分解和长短期记忆(LSTM)网络的多步预测方法,结果证明具有较高的预测精度。
2022年,Peng [6]等提出了一种基于时变注意力–时间卷积网络(TVA-TCN)的多步预测模型。2022年,Ye [7]等人提出了一种基于注意力机制且考虑外部因素的时空图卷积网络,并用于多步交通流预测。2022年,Zhao [8]等人提出一种基于时间序列相关性的注意力编码器–解码器双图卷积网络的模型(AED-DGCN-TSC),并用于多步交通流预测。
2023年,Huang [9]等人提出了一种可解释的TFP局部流动注意力(LFA)机制用于交通流多步预测。2023年,Hai [10]等人提出了一个名为内在模式转换(Intrinsic Pattern Transform, IPT)的新模块来进行短时交通流多步预测。
2. 基于TEL-BiLSTM-PSO-CKDE模型的短时交通量不确定性多步预测方法
2.1. 多步预测策略与模型框架
2.1.1. 多步预测方法概述
在交通量预测问题中,单步预测仅输出下一个时刻的交通量值,虽然实现简单,但难以满足实际智能交通系统对连续时间预测的需求。相比之下,多步预测可一次性预测多个时刻的交通状态,具有更强的实用价值。然而,随着预测步长的增加,模型误差易于累积,因此需构建稳定、高效的多步预测策略。
根据已有研究,多步预测主要可分为四类策略:递归式预测、直接式预测、直接递归混合式预测和多输出预测(见图1)。本文在充分对比后,选用递归式预测方法作为核心方案,其仅需构建一个单步预测模型,通过迭代不断输入上一步预测值,扩展为多步预测序列,具有模型结构简单、可重复使用、易于维护等优点。
Figure 1. Bi-LSTM recursive multi-step prediction flowchart
图1. Bi-LSTM递归多步预测流程图
2.1.2. 不确定性建模策略
传统预测模型给出的往往是点值预测,而在交通流高度不确定、动态变化的背景下,仅依赖点预测会导致预测误差放大,进而影响交通决策的鲁棒性。因此,引入区间预测机制成为近年来研究热点之一。
本文引入条件核密度估计(CKDE)模型,在预测残差的基础上构建概率密度函数(PDF),并由此推导出预测值的上下置信区间(Prediction Interval, PI)。此外,为获得最优带宽,本文引入粒子群优化算法(PSO)对CKDE模型进行调参优化,从而提升预测精度与区间稳定性。CKDE建模过程简洁、结果透明,能有效避免传统概率建模中的高维复杂性。
2.2. 数据二次分解方法TVF-EMD-LMD
2.2.1. TVF-EMD方法简介
TVF-EMD (Time-Varying Filter Empirical Mode Decomposition)是在传统经验模态分解(EMD)基础上引入时变滤波器的一种改进型数据预处理方法。其主要特点在于:
利用自适应滤波器避免端点效应;
提高分解的模态分离度,解决模态混叠问题;
保留信号原始的非线性与非平稳特征。
TVF-EMD可将复杂交通流序列分解为若干本征模态函数(Intrinsic Mode Functions, IMF)和残差项,使得后续模型更易学习序列特征。
2.2.2. LMD方法简介
Figure 2. TVF-EMD-LMD data decomposition flow chart
图2. TVF-EMD-LMD数据分解流程图
LMD (Local Mean Decomposition)是一种高效的非线性信号分解方法,适用于将非平稳信号分解为一系列具有物理可解释性的乘积函数形式的PFs (Product Functions)。相比EMD,LMD在保留信号低频信息方面具有更强表达能力。
将TVF-EMD与LMD联合使用,形成数据二次分解结构(TEL) (见图2),TVF-EMD着重处理高频扰动,适用于提取细粒度特征;LMD则关注低频平稳趋势,二者结合形成从粗到细的信号分层机制,理论上增强了预测模型的分辨能力。
2.3. Bi-LSTM模型设计与构建
2.3.1. Bi-LSTM网络结构
双向长短期记忆神经网络(BiLSTM)由正向LSTM和反向LSTM组成,能够同时捕捉时间序列数据的前向与后向依赖关系,在时序数据建模方面具有显著优势(图3)。
BiLSTM的核心结构包括遗忘门、输入门、记忆单元与输出门,其计算公式如下所示:
其中,
表示Sigmoid激活函数,
表示Hadamard积,
表示t时刻输入向量,
表示隐藏层输出。
最终的BiLSTM网络输出为正向与反向隐藏层拼接结果:
Figure 3. Bi-LSTM model structure diagram
图3. BI-LSTM模型结构图
2.3.2. BiLSTM递归多步预测流程
了实现多步预测,本文采用递归策略:首先由BiLSTM对训练数据进行单步预测,输出结果作为下一时刻输入,继续预测下一个时间点,依次迭代,最终获得完整的多步预测序列。
这种方法能够有效控制模型复杂度,但同时也存在误差传递问题,需配合后续不确定性建模方法进行误差补偿与稳定性增强。
2.4. PSO优化的CKDE残差建模
2.4.1. CKDE模型介绍
入条件变量的改进模型,其基本思想为:在已知条件x下估计目标变量y的概率分布函数
。其表达形式如下:
其中,
表示带宽为h的核函数,
为历史样本对。
CKDE相较传统KDE更适合用于动态条件下的交通残差建模,可更好地捕捉预测误差的变化特征。
2.4.2. 粒子群优化带宽参数
CKDE模型性能高度依赖于带宽选择,本文引入粒子群优化算法(PSO)对带宽参数进行全局搜索。PSO通过模拟群体协作行为,引导粒子在解空间中搜索最优值,其基本更新公式如下:
其中,
、
分别表示粒子位置与速度,
为个体历史最优位置,
为全局最优位置,
为随机因子,
为惯性因子。
3. 案例实验与模型对比分析
为验证本文提出的TEL-BiLSTM-PSO-CKDE组合模型在短时交通量不确定性多步预测中的适用性与有效性,本文基于重庆市某主干道交叉口的实测交通数据开展实验。通过与ARIMA模型、BP神经网络模型以及未融合优化策略的BiLSTM模型进行对比,全面评估各模型在不同预测步长下的预测能力及稳定性,分析其在交通流高度非线性背景下的鲁棒性与推广潜力。除与ARIMA与BP神经网络比较外,亦引入典型深度模型(如GCN, DGCN)作为结构增强对比,以验证TEL架构的普适性。
3.1. 数据来源与预处理
实验所使用的数据采集自重庆市江北区红旗河沟路口,具体来源为交叉路段A/B方向视频检测系统所记录的五分钟分辨率流量数据,数据由路口视频检测系统采集而得,包含全天候五分钟粒度的交通流量记录(见图4)。交通量作为核心变量被用于后续模型训练与预测。考虑到原始数据中可能存在的缺失值和异常值问题,首先对数据进行了标准化预处理。缺失部分采用插值方法补齐,异常值则通过箱线图分析法剔除,并进一步完成归一化处理,使数据分布更加平滑并便于神经网络训练。在样本划分方面,按时间顺序将原始数据集分为训练集与测试集,比例为80%与20%,确保模型学习过程与实际预测环境具有一致性。此外,未来实验可引入节假日、恶劣天气等复杂场景数据,以检验模型对非常态数据的鲁棒性与泛化能力。
交通流量的时间序列表现出明显的周期性与不稳定性,早晚高峰期间存在流量剧烈波动的现象,而夜间则相对平稳,这种多尺度、非平稳的动态特征对预测模型提出了较高要求。通过图示可以清晰观察到交通流在一天内的典型变化趋势,为后续建模与误差分析提供了直观基础。
Figure 4. Normalized sequence diagram of traffic flow (5-minute granularity) at the intersection of Hongqi River Ditch in Chongqing
图4. 重庆红旗河沟交叉口交通流量(5分钟粒度)归一化序列图
3.2. 模型配置与性能评价方法
在实验中,本文所构建的TEL-BiLSTM-PSO-CKDE模型由三部分组成:前端以TVF-EMD与LMD组成的数据二次分解结构对原始数据进行预处理,中间层采用BiLSTM神经网络对每个分量分别建模并输出预测结果,后端利用PSO优化CKDE对预测残差进行概率密度建模,最终构建交通量的区间预测输出。为了确保模型的通用性与可复现性,各子模型参数均基于已有研究设定或通过实验调优获得。TVF-EMD中采用时变滤波器自动确定IMF分量数量,LMD分解步骤则严格基于信号包络线提取进行,确保生成的子序列具有平稳性特征。BiLSTM网络由两层64单元的LSTM组成,激活函数为tanh,采用Adam优化器进行参数更新,学习率设置为0.001。
CKDE部分选用高斯核函数表示残差密度函数,模型关键的带宽参数通过粒子群算法动态优化获得。PSO优化过程中,粒子数量设置为30,最大迭代次数为100,惯性因子与学习因子均参考文献设定为常规数值,保证全局搜索能力和局部收敛效率的平衡。在各模型训练过程中均保持相同的训练轮数与早停机制,以排除训练过程对实验结果的干扰。
模型性能的衡量不仅依赖于传统误差指标,还引入区间预测相关指标以全面评估预测结果的可信程度。四项主要误差指标包括均方根误差(RMSE)、平均绝对误差(MAE)、平均绝对百分比误差(MAPE)与相对均方根误差(RMSRE)。这些指标共同衡量预测值与真实值之间的数值偏差。此外,为检验不确定性建模的效果,本文引入区间覆盖率PICP、区间宽度PINAW与基于宽度与覆盖率加权的CWC指标,从而更加全面反映模型的稳定性和区间可信度。
3.3. 多步预测结果展示与拟合效果分析
在实验中,分别设置预测步长为1、3与5个时间点,通过递归方式生成多步预测结果(见图5)。在测试集中选择具有代表性的时间段,分别绘制各模型在不同步长下的预测输出与真实值的拟合曲线,以直观对比模型性能的变化趋势。从图示可以看出,ARIMA模型在面对非平稳交通数据时拟合效果较差,尤其在高峰段产生明显滞后现象。BP神经网络虽具有一定非线性建模能力,但预测曲线波动较大,表现出明显的不稳定性。BiLSTM模型相较传统神经网络具有更好的序列记忆能力,在短步长情况下表现尚可,但随着预测步长的增加,其误差积累问题逐步显现,导致预测曲线偏离实际数据轨迹。
相较之下,TEL-BiLSTM-PSO-CKDE模型在多个时间段均能较好跟踪交通流变化趋势,尤其在高波动区间内依然维持较高的预测一致性。其预测曲线平滑,偏差较小,展现出较强的时间建模能力与抗扰性。在5步预测情形下,该模型依旧维持相对合理的预测范围,误差控制效果优于其他模型,验证了其在多步预测任务中的实际价值。
为了评估各模块对整体性能的影响,本文设计了三组消融实验,依次移除LMD模块、PSO优化与CKDE模型。结果显示,缺少PSO后区间预测精度下降18.7%,验证其关键作用。
Figure 5. Multi-step prediction fitting effect of each model under different prediction step sizes (time 60~100 of the test set)
图5. 各模型在不同预测步长下的多步预测拟合效果(测试集第60~100时刻)
3.4. 指标对比与性能验证
由为了更直观地比较各模型在数值精度与区间预测能力上的差异,本文对所有模型在k = 1~5的五个步长下分别计算四项误差指标与三项区间指标(见表1),统计结果列于表格中。从实验结果来看,TEL-BiLSTM-PSO-CKDE模型在多个方面展现出了显著的优势。首先,该模型的PICP值为0.9215,在所有模型中最高,表明其预测区间覆盖真实值的概率最大,预测区间的可靠性最强。其次,尽管其ACE值为0.1070,不是最低,但仍在可接受范围内,说明预测区间的平均覆盖误差较小。更重要的是,TEL-BiLSTM-PSO-CKDE模型的PINAW值为0.0285,是所有模型中最低的,表明其预测区间最窄,预测精度最高。最后,该模型的CWC值为0.5517,同样为所有模型中最低,显示了其在保证较高覆盖率的同时,能够保持较窄的预测区间,综合性能最优。
Table 1. Uncertainty predictors for three different models
表1. 三种不同模型的不确定性预测指标
预测模型 |
PICP |
ACE |
PINAW |
CWC |
ARIMA |
0.8996 |
0.0090 |
0.1204 |
0.1204 |
Bi-LSTM |
0.8635 |
0.0865 |
0.0185 |
1.4170 |
TEL-BiLSTM-PSO-CKDE |
0.9215 |
0.1070 |
0.0285 |
0.5517 |
基金项目
全国大学生创新创业训练项目,项目编号:X202310618004。