基于时序图卷积网络的交通速度预测
Traffic Speed Prediction Based on Temporal Graph Convolution Network
DOI: 10.12677/CSA.2022.126154, PDF, HTML, XML, 下载: 306  浏览: 717 
作者: 蒋欣彤, 冯慧芳:西北师范大学数学与统计学院,甘肃 兰州
关键词: 智能交通交通速度图卷积网络时序卷积网络预测Intelligent Traffic Traffic Speed Graph Convolution Network Temporal Convolutional Networks Prediction
摘要: 准确的交通流预测不仅能够为交通拥堵控制决策提供有效的支持,也为居民出行提供指导。本文结合图卷积网络与时间卷积网络,提出了一种基于时序图卷积网络的交通速度预测模型。根据交通路网拓扑结构和交通流构建动态加权图网络,引入图卷积网络挖掘交通流的空间特征,利用时间卷积网络捕获交通流的短程与长程时间相关性。融合路网空间特征和交通流近邻性、周期性等时间特征,构建基于混合深度学习框架的交通速度预测模型。以真实数据集为基础验证了模型预测效果,实验结构表明提出的模型能够刻画交通流的时空演化特征,和基准模型相比,具有良好的预测性能。
Abstract: Accurate traffic flow prediction can not only provide effective support for traffic congestion decisions, but also provide guidance for residents to travel. Combining graph convolutional network and temporal convolutional network, a traffic speed prediction based on temporal graph convolution network is proposed in this paper. A dynamic weighted graph network is constructed according to the traffic road network topology and traffic flow, a graph convolutional network is used to mine the spatial characteristics of the traffic flow, and a temporal convolutional network is used to capture the short-range and long-range temporal correlation of the traffic flow. The traffic speed prediction based on the hybrid deep learning framework is constructed by integrating the spatial characteristics of the road network with the characteristics of the proximity and periodicity of the traffic flow. Experiments on real datasets show that the proposed model can characterize the spatiotemporal evolution of traffic flow, and has good multi-step prediction performance compared with the base-line model.
文章引用:蒋欣彤, 冯慧芳. 基于时序图卷积网络的交通速度预测[J]. 计算机科学与应用, 2022, 12(6): 1544-1552. https://doi.org/10.12677/CSA.2022.126154

1. 引言

精准的交通预测能够更合理地引导车辆,提高路网的运行效率。交通预测是智能交通系统(Intelligent Traffic System, ITS)的核心模块之一 [1]。随着城市化进程的加快以及人工智能技术的快速发展,交通数据呈爆炸式增长,这些交通大数据是城市交通的基础数据,他们既能体现城市交通状态,也为交通流准确的分析和预测提供了强有力的数据支撑。高效准确的交通速度预测对城市交通运行规划、交通管理及控制等具有重要意义。

目前,针对交通预测问题,国内外学者围绕交通流量、交通速度、交通需求和通行时间等主要交通状态指标的预测开展了大量的研究。早期的一些研究主要考虑交通状态序列的时间相关性。卡尔曼滤波模型 [2]、SVR模型 [3] 和ARIMA模型及其变体 [4] 均被用于交通流预测。这些模型对平稳性时间序列的预测性能较好,对非平稳、非线性的时序数据预测效果不好。循环神经网络对时间序列的非线性特征具有很好的学习能力,近几年被广泛应用到交通流预测中。王祥雪 [5] 等建立了长短期记忆网络(Long Short-Term Memory, LSTM)的短时交通流预测模型,应用深圳市南海大道路网实测数据验证了预测模型的有效性。He [6] 等应用LSTM建立了长时交通流预测模型。卢生巧 [7] 等提出了一种深度神经网络预测模型,将卷积神经网络和门控循环单元(Gate Recurrent Unit, GRU)神经网络相结合做短时交通流预测。陆文琦 [8] 等利用双向长短期记忆神经网络(Bi-directional Long Short-Term Memory, BiLSTM)和注意力机制构建混合深度学习交通流速度预测模型,并以北京市的交通速度数据进行算法性能验证,实验结果表明提出的混合深度学习的模型具有较好的单步与多步预测性能。LSTM、GRU等循环神经网络具有长记忆功能,能够刻画交通流的时间相关特征,但是不能刻画交通流的空间相关特征。

交通网络在实际生活中是一个复杂动态的系统,其复杂多变性表现为一条道路某时刻的交通状态不仅和该条道路的前多个历史交通状态有关,而且与其周围的多条道路的交通状态有关。也就是说某条道路的交通状态不仅与其历史交通状态有关,而且与路网的空间结构也有明显相关性。卷积神经网络可以捕获网格时空数据的空间相关性,而图卷积神经网络能够捕获非拓扑结构的交通流的空间相关性。冯宁 [9] 等提出了一种基于深度学习的多组件时空图卷积网络对高速公路交通流进行预测,该模型利用空间维图卷积网络和时间维卷积网络有效捕获交通流空间和时间相关性特征。Zhao [10] 等结合图卷积(Graph Convolutional Networks, GCN)和GRU建立了路网交通通行速度的预测模型。Seng [11] 等基于多图卷积网络和门控循环单元提出了一种对不规则区域交通流量预测的模型。并在三个真实数据集验证了所提模型预测性能。深度学习模型与早期的模型相比,虽然在预测性能上取得了一定的提升,但是其超参数调整,如何对隐藏层神经元数和网络层数进行选择,是值得进一步研究的方向。Peng [12] 等应用图卷积网络对动态图学习交通流的空间特征,结合长短期记忆神经网络学习交通流的时间特征,提出了基于强化学习的长期交通流预测模型,并以纽约自行车数据集验证了模型在长期预测中的稳定有效性。图卷积网络能够捕获路网复杂的拓扑结构,将传统卷积推广到图数据上对序列空间相关性进行建模,结合循环神经网络等时序模型可对交通流进行更精确的建模预测。目前基于图卷积神经网络的交通预测已成为该领域最活跃最重要的研究热点,近期取得了一些丰富的研究成果。文献 [13] [14] [15] 综述了图神经网络在交通预测领域的最新研究进展,详细介绍了基于图卷积网络的交通流预测模型及其各类变体。

虽然基于深度学习的交通预测研究取得了丰硕成果,但仍然存在没有克服的问题和值得深入研究的方向,比如大规模交通路网流量预测、交通流的长期预测精度、拥堵状态下的交通预测、交通数据缺失时的预测等。本文提出了一种基于时序图卷积网络预测模型来提高交通流预测精度。我们以图卷积网络、时序卷积网络为基础,提出了一种混合深度学习框架的交通速度预测模型。该模型不仅能够很好地捕获交通流的动态时空相关特征,也能防止网络层数较深时造成的网络退化,从而优化神经网络训练效率。

2. 基于时序图卷积网络的交通速度预测模型

2.1. 构建动态加权时序网络

设静态加权复杂网络 G = ( V , E , A , W ) ,其中, V R N 表示交通网络中传感器监控节点的集合,即 V = { v 1 , v 2 , , v N } 。记 E = { e i j = ( v i , v j ) | v i V , v j V } 为边集合,节点 v i 与节点 v j 相连,则它们之间存在边 e i j A R N × N 为图G的邻接矩阵,该矩阵表示了节点间的邻接关系,如果两个节点相邻,则其值为1,否则为0。 W R N × N 是图G的加权邻接矩阵。

当静态加权无向图G的要素V、E或W随时间变化时,静态图就转为动态加权时序图

G ( t ) = ( V , E , A , W ( t ) ) 。本文中传感器监控节点及其连边不随时发生变化,但其权重 W ( t ) 表示路段的交通速度,该参数随时间的变化而变化。图的基本要素 V , E , A , W ( t ) 称为动态加权时序图的图信号, W ( t ) 称为图

的特征矩阵。

2.2. 图卷积网络

图卷积网络(Graph Convolutional Network, GCN)是深度学习的一种神经网络结构 [16]。与传统深度学习的网络模型CNN相比,图卷积网络能够处理非欧式结构的时空数据。交通路网是典型的复杂网络结构,其网络特征是用非欧式结构的数据刻画,利用图卷积网络能够提取复杂网络中节点与其周围节点的拓扑关系,从而准确提取交通数据的空间特征,为提高交通速度预测精度奠定基础。

在谱域图卷积中 [17],用卷积核 g θ 对图G进行卷积:

g θ G X = g θ ( L ) X = g θ ( U Λ U T ) X = U g θ ( Λ ) U T X (1)

其中, G 表示图卷积运算, L = D 1 / 2 ( D A ) D 1 / 2 = I N D 1 / 2 A D 1 / 2 D R N × N 为度矩阵,定义为 D i i = j A i j I N N × N 的单位矩阵,X为图的特征矩阵。L的特征值分解为: L = U Λ U T Λ = d i a g ( λ 1 , λ 2 , , λ N ) 是一个由L的特征值组成的对角矩阵。 U = { u 1 , u 2 , , u N } 由L的特征向量组成。

由于交通路网的图结构较大,为了避免较高的计算复杂度,采用切比雪夫多项式获得有效的近似,故图卷积可重新写为:

g θ G X k = 0 K 1 θ k ( L k ) X = k = 0 K 1 θ k T k ( L ˜ ) X (2)

其中, T k ( L ˜ ) R N × N 是切比雪夫多项式的第k阶项,其中 L ˜ = 2 L / λ max I N ,满足递归公式: T k ( X ) = 2 X T k 1 ( X ) T k 2 ( X ) T 0 ( X ) = 1 T 1 ( X ) = X λ max 表示L的最大特征值, θ R K 是多项式系

数的向量,K是图卷积核的大小。

2.3. 时序卷积网络

时序卷积网络(Temporal Convolutional Network, TCN) [18] 用于处理时序数据,该网络模型由一组残差单元组成,每个残差单元包含两个卷积单元和非线性映射,如图1所示。

残差单元中的卷积功能由膨胀因果卷积网络实现,膨胀因果卷积网络引入了膨胀系数,通过膨胀系数对输入数据进行间隔采用,这样增大了网络感受野,当网络层数增加时,网络能够捕获更长的历史记忆。给输入序列 X R N ,其扩张卷积运算F定义为:

F ( s ) = ( X d f ) ( s ) = i = 0 k 1 f ( i ) X s d × i (3)

其中 d 表示为扩张卷积算子,d为膨胀参数,k为滤波器大小,s为输入序列的长度。TCN中的残差连是加入跨层连接的恒等映射,残差连接不仅能够有效解决梯度消失问题,而且可将浅层网络扩展为深层网络,有效的扩大网络感受野,捕获时间序列的短程与长程时间相关性特征。

Figure 1. Temporal Convolutional Network

图1. 时序卷积网络TCN

2.4. 基于时序图卷积网络的交通流预测模型

基于图数据的交通预测问题就是利用观测到的p个历史图信号,预测未来q步的图信号,从而得到交通路网未来的交通状态,即

[ Y ^ ( t + 1 ) , Y ^ ( t + 2 ) , , Y ^ ( t + q ) ] = f ( [ G ( t p + 1 ) , G ( t p + 2 ) , , G ( t ) ] ) (4)

其中 f ( ) 是我们建立的交通流预测模型。该预测模型结合图卷积网络与时间卷积网络,预测模型总体框架如图2所示。

2.5. 基于多层次数据融合的交通流预测模型

由于交通流具有明显的日周期和周周期,故预测未来时空交通流时不仅考虑历史近邻数据,还要考虑其周期性数据。以这三类历史数据为基础,分别采用2.3中的预测模型预测未来时刻交通流,将三个融合后的最终预测:

Y ^ = W h Y ^ h + W d Y ^ d + W w Y ^ w (5)

其中, 是哈达玛乘积, W h W d W w 是权重参数,反映了三个不同组块对预测目标的影响程度。 Y ^ w Y ^ d Y ^ h 分别为周周期、日周期和近邻数据的预测结果; Y ^ 为融合后的预测结果。

Figure 2. The framework of prediction model

图2. 预测模型总体框架

3. 实验与结果分析

3.1. 性能评价指标

实验选取平均绝对误差(Mean Absolute Error, MAE)、均方根误差(Root Mean Square Error, RMSE)和绝对百分比误差(Mean Absolute Percentage Error, MAPE)为预测评价标准,各指标的定义分别为:

MAE = 1 n i = 1 n | y i y ^ i | (6)

RMSE = 1 n i = 1 n ( y i y ^ i ) 2 (7)

MAPE = 1 n i = 1 n | y ^ i y i y i | × 100 (8)

其中 y i 为实际交通速度, y ^ i 为预测交通速度,n为样本数量。预测模型的MAE,RMAE,MAPE等指标的参数值越小,说明模型的预测性能越好。

3.2. 数据集

本文选取了洛杉矶高速公路META-LA交通数据集作为实验数据集 [19]。该数据集是洛杉矶公路207个传感器收集到的交通数据,采样时间间隔为5分钟。选取时段为2012年3月1日~6月30日的数据进行试验。为提高网络的收敛效率,对数据进行z-score标准化预处理,将数据的浮动范围压缩到[0,1]之间。

3.3. 实验参数设置

本文采用Pytorch深度学习框架实现了预测模型。数据集按7:2:1划分为训练集、验证集和测试集。

在图卷积网络中,使用64个大小相同的卷积核对交通速度的空间特征进行挖掘。在时序卷积网络中,使用6层k = 2且膨胀因子为2的扩张因果卷积来获取时间相关性,通道数为64。训练过程中,使用学习率为0.001的Adam优化器,Dropout = 0.7,损失函数采用均方误差损失。

3.4. 实验结果与分析

图3(a)~(c)为编号80的传感器节点的交通速度真实值与未来3步(15分钟)、6步(30分钟)及12步(60分钟)的预测值。由图中可知,本文提出的基于时序图卷积网络的短时交通速度预测能够较好地捕获交通速度的整体趋势,预测值与真实值非常接近。

为了验证预测模型的有效性和预测精度,将ARIMA [20] (Autoregressive Integrated Moving Average Model)、SVR [21] (Support Vector Regression)、FC-LSTM [22] (Fully Connected LSTM)、WaveNet [23]、STGCN [24] (Spatial Temporal Graph Convolutional Networks)等基线模型与本文提出的模型进行比较。图4为各模型的预测性能参数值。由图4可知本文提出的模型的预测在三个评价指标中均具有最好性能。时间序列ARIMA模型能够刻画交通流的时序特征,但是缺乏对时空序列空间特征挖掘,与深度学习模型相比,预测精度较差,SVR模型能够刻画交通流的非线性特征,预测性能优于ARIMA模型。FC-LSTM、WaveNet、STGCN等深度学习模型充分提取数据的时空特征,提升了预测性能,取得了较好的预测效果。相比之下,本文建立的深度学习预测模型充分考虑交通流的时空相关动态性特征,采用图卷积网络捕获交通网络空间特征,采用时间卷积网络捕获交通流时间维度的短程与长程相关性,模型更符合真实交通场景,很好地挖掘了交通速度流的动态时空模型,进一步提升了模型的预测性能。

另外,从图4可知,预测时长越长,预测误差越大,预测精度越差。本文提出的模型在短期与中长期的预测中精度均优于其他基线模型,并且其预测误差比其他基线模型的预测误差增长更加缓慢。这表明时间维度上的时间卷积网络与空间维度的图卷积结合的策略能充分挖掘交通流的时空模式,在中长期预测中具有更加明显的优势。

我们进一步通过消融实验研究数据融合对模型预测性能的影响。实验1记为基于近邻数据的预测,实验2记为基于近邻数据和日周期融合数据的预测,实验3为基于近邻数据和周周期融合数据的预测,实验4为近邻数据、日周期数据及周周期数据融合的预测。图5为四个实验预测性能,实验结果表明只考虑交通流近邻特征的预测效果不佳,当考虑了日周期或周周期时,结果预测性能得到了改善,同时考虑交通流三个特征时,预测性能最好。

(a) 3步预测 (b) 6步预测 (c) 12步预测

Figure 3. Traffic speed prediction visualization

图3. 交通速度预测可视化

(a) MAE (b) RMSE (c) MAPE

Figure 4. Performance comparison for prediction models

图4. 模型预测性能比较

(a) MAE (b) RMSE

Figure 5. The effect of temporal features on prediction performance

图5. 不同时间特征对预测性能的影响

4. 总结

本文提出了一种由图卷积网络与时间卷积网络融合的时序图卷积网络的交通速度预测。该模型利用图卷积网络捕获交通路网拓扑结构的优势,挖掘交通流的空间特征。利用时间卷积网络捕获交通流的短程与长程时间相关性,将时空特征与交通流参数相结合,实现了准确的交通速度预测。实验结果表明提出的模型能够刻画交通流的时空演化特征,和基准模型相比,具有良好的预测性能。后续将在更多数据集上进一步评价模型性能,同时考虑如何加入外部特征(例如天气,突发事件等)来提高预测性能。

基金项目

国家自然科学基金(71761031)。

参考文献

[1] Nagy, A.M. and Simon, V. (2018) Survey on Traffic Prediction in Smart Cities. Pervasive and Mobile Computing, 50, 148-163.
https://doi.org/10.1016/j.pmcj.2018.07.004
[2] 周晓, 唐宇舟, 刘强. 基于卡尔曼滤波的道路平均速度预测模型研究[J]. 浙江工业大学学报, 2020, 48(4): 392-396+404.
[3] Hong, W.C., Dong, Y.C., Zheng, F.F. and Wei, S.Y. (2011) Hybrid Evolutionary Algorithms in a SVR Traffic Flow Forecasting Model. Applied Mathematics and Computation, 217, 6733-6747.
https://doi.org/10.1016/j.amc.2011.01.073
[4] 李文勇, 李俊卓, 王涛. 基于Box-Cox指数变换改进的ARIMA模型交通流预测方法[J]. 武汉理工大学学报(交通科学与工程版), 2020, 44(6): 974-977.
[5] 王祥雪, 许伦辉. 基于深度学习的短时交通流预测研究[J]. 交通运输系统工程与信息, 2018, 18(1): 81-88.
[6] He, Z.X., Chow, C.Y. and Zhang, J.D. (2019) STCNN: A Spatio-Temporal Convolutional Neural Network for Long-Term Traffic Predic-tion. 2019 20th IEEE International Conference on Mobile Data Management (MDM), Hong Kong (China), 10-13 June 2019, 226-233.
https://doi.org/10.1109/MDM.2019.00-53
[7] 卢生巧, 黄中祥. 基于深度学习的短时交通流预测模型[J]. 交通科学与工程, 2020, 36(3): 74-80.
[8] 陆文琦, 芮一康, 冉斌, 谷远利. 智能网联环境下基于混合深度学习的交通流预测模型[J]. 交通运输系统工程与信息, 2020, 20(3): 47-53.
[9] 冯宁, 郭晟楠, 宋超, 朱琪超, 万怀宇. 面向交通流量预测的多组件时空图卷积网络[J]. 软件学报, 2019, 30(3): 759-769.
[10] Zhao, L., Song, Y.J., Zhang, C., Liu, Y., Wang, P., Lin, T., Deng, M. and Li, H.F. (2020) T-GCN: A Temporal Graph Convolu-tional Network for Traffic Prediction. IEEE Transactions on Intelligent Transportation Systems, 21, 3848-3858.
https://doi.org/10.1109/TITS.2019.2935152
[11] Seng, D.W., Lv, F.S., Liang, Z.Y., Shi, X.Y. and Fang, Q.M. (2021) Forecasting Traffic Flows in Irregular Regions with Multi-Graph Convolutional Network and Gated Recurrent Unit. Frontiers of Information Technology & Electronic Engineering, 22, 1179-1193.
https://doi.org/10.1631/FITEE.2000243
[12] Peng, H., Du, B.W., Liu, M.S., Liu, M., Ji, S., Wang, S., et al. (2021) Dynamic Graph Convolutional Network for Long-Term Traffic Flow Prediction with Reinforcement Learning. Infor-mation Sciences, 578, 401-416.
https://doi.org/10.1016/j.ins.2021.07.007
[13] Ye, J.X., Zhao, J.J., Ye, K.J. and Xu, C. (2022) How to Build a Graph-Based Deep Learning Architecture in Traffic Domain: A Survey. IEEE Transactions on Intelligent Transportation Systems, 23, 3904-3924.
https://doi.org/10.1109/TITS.2020.3043250
[14] 周毅, 胡姝婷, 李伟, 承楠, 路宁, 沈学民. 图神经网络驱动的交通预测技术: 探索与挑战[J]. 物联网学报, 2021, 5(4): 1-16.
[15] Yin, X.Y., Wu, G.Z., Wei, J.Z., Shen, Y., Qi, H. and Yin, B. (2021) Deep Learning on Traffic Prediction: Methods, Analysis and Future Directions. IEEE Transac-tions on Intelligent Transportation Systems, 23, 4927-4943.
https://doi.org/10.1109/TITS.2021.3054840
[16] Jiang, W.W. and Luo, J.Y. (2021) Graph Neural Network for Traffic Forecasting: A Survey.
[17] Simonovsky, M. and Komodakis, N. (2017) Dynamic Edge-Conditioned Filters in Convolutional Neural Networks on Graphs. 2017 IEEE Conference on Computer Vision and Pattern Recognition (CVPR), Honolulu, 21-26 July 2017, 3693-3702.
https://doi.org/10.1109/CVPR.2017.11
[18] Yu, F. and Koltun, V. (2016) Multi-Scale Context Aggregation by Dilated Convolutions. International Conference on Learning Representa-tions (ICLR), Caribe Hilton, 2-4 May 2016, 1-4.
[19] Li, Y., Yu, R., Shahabi, C. and Liu, Y. (2018) Diffusion Convo-lutional Recurrent Neural Network: Data-Driven Traffic Forecasting. International Conference on Learning Representa-tions 2018, Vancouver, 30 April 2018-3 May 2018, 1-16.
[20] Fernandez-Manso, A., Quintano, C. and Fernan-dez-Manso, O. (2011) Forecast of NDVI in Coniferous Areas Using Temporal ARIMA Analysis and Climatic Data at a Regional Scale. International Journal of Remote Sensing, 32, 1595-1617.
https://doi.org/10.1080/01431160903586765
[21] Cortes, C. and Vapnik, V.N. (1995) Support-Vector Networks. Machine Learning, 20, 273-297.
https://doi.org/10.1007/BF00994018
[22] Ilya, S., Oriol, V. and Quoc, V.L. (2014) Sequence to Sequence Learn-ing with Neural Networks. Annual Conference on Neural Information Processing Systems, 3104-3112.
https://doi.org/10.48550/arXiv.1409.3215
[23] Oord, A.V.D., Dieleman, S., Zen, H., Simonyan, K., Vinyals, O., Graves, A., Kalchbrenner, N., Senior, A. and Kavukcuoglu, K. (2016) WaveNet: A Generative Model for Raw Audio. arXiv:1609.03499.
[24] Yu, B., Yin, H.T. and Zhu, Z.X. (2018) Spatio-Temporal Graph Convolutional Networks: A Deep Learning Framework for Traffic Forecasting. Proceedings of 27th International Joint Conference on Artificial Intel-ligence (IJCAI), Stockholm, 13-19 July 2018, 3634-3640.
https://doi.org/10.24963/ijcai.2018/505