1. 引言
城市轨道交通作为现代通勤的首选方式,具有时效性高、便利性强和运量大的特点,已成为解决城市交通问题的新方式,截止2022年,我国内地共计新增城轨交通运营线路长度1085.17 km,新增运营线路25条 [1] 。随着城市轨道交通运营里程的增加,准确的客流预测能让城市轨道交通管理者掌握线路客流情况、合理调整列车运行方案,对运力资源进行合理分配,同时给居民出行提供参考。由于客流环境受多种因素的影响,中长期客流预测没法精确地把控城市轨道交通客流的动态转变趋向。因此需要短时客流预测来对客流变化规律进行把控,更好地管理城市轨道交通相关工作,协调路网线路关系。
目前,国内外学者对于短时客流预测方法的研究主要分为三类:线性模型 [2] [3] [4] 、非线性预测模型 [5] 和神经网络模型 [6] [7] [8] 。单一预测方法不足以应对当下复杂客流情况,基于当下庞大的客流数据与影响客流因素复杂多样化的特点,组合神经网络模型 [9] [10] [11] 逐渐成为学者们在短时客流预测领域研究的焦点。许心越等提出了一种结合时空修正的短时客流预测方法,它融合了动态因子模型(DFM)和支持向量机(SVM),不仅更为全面考虑到客流数量和客流趋势的变化,还能准确地对多个车站的异常时段进行识别 [12] 。段中兴等提出了一种短时客流预测模型IBA-LSTM,该模型通过改进蝙蝠算法(IBA)来优化长短期记忆(LSTM)神经网络,有效降低了模型参数对于预测精度的影响 [13] 。蒲悦逸等使用CNN-ResNet-LSTM模型在传统模型的基础上实现了更高的准确率,同时减少模型使用的参数 [14] 。HE等提出了一种地理加权套索(Ada-GWL)框架来建模预测地铁客流量,该框架涉及回归协同收缩和局部模型选择 [15] 。它考虑了地铁网络的布局,采用了基于网络的距离度量,考虑多站点之间存在的协同影响。岂常禄等构建混合地理加权回归(MGWR)模型,考虑对客流量影响因素的类型划分,得出MGWR模型相对于OLS模型预测精度更高 [16] 。
综上所述,本文提出一种基于改进麻雀搜索算法与长短期记忆神经网络相结合的ISSA-LSTM模型对城市轨道交通短时客流数据进行预测。针对麻雀搜索算法在寻优过程中易陷入局部最优解的问题,通过引入混沌映射和柯西变异对麻雀搜索算法进行优化,使得SSA算法在陷入局部最优空间后能及时跳出,避免陷入局部最优。同时为防止单隐层的LSTM网络进行预测时易出现过拟合的现象,本文增加了一层LSTM神经网络隐层。利用改进麻雀搜索算法在参数寻优时的优点,对LSTM神经网络的学习率、迭代次数、第一隐层节点数、第二隐层节点数这四个参数进行优化寻参,得到LSTM神经网络的最佳参数。本文提出的改进算法能够降低参数给预测模型精度带来的影响,并减小预测误差、提高预测精度。
2. 预测算法
2.1. LSTM网络
长短期记忆神经网络(Long Short-Term Memory neural network, LSTM)是一种改进递归神经网络(Recurrent neural network, RNN),用于解决处理长序列数据时出现梯度爆炸问题,LSTM神经网络是通过引入“时序”概念对递归神经网络进行改进的。它在处理时间序列数据时,通过利用之前的输出来影响当前的输入,能够有效地捕捉时间序列中的长期依赖关系,使得模型能够更好地理解和预测时间顺序上的数据变化。
LSTM由输入层、多个LSTM层和输出层构成。每个LSTM层包含一个“记忆单元”,是LSTM的核心。记忆单元由输入门、输出门、遗忘门和记忆细胞四部分组成。图1为LSTM基本结构。
2.2. 改进麻雀搜索算法
2.2.1. SSA算法
麻雀搜索算法是一种新型群智能优化算法,由XUE等 [17] 提出。该算法灵感源于麻雀的捕食行为和反捕食行为。在算法中,麻雀种群被分为发现者和加入者两类。在自然状态下,不同个体相互监视,并且加入者会争夺资源较高的同伴的食物保有资源,以提高自身的捕食率。同时,所有个体都对周围环境保持警惕,防止天敌的到来。麻雀搜索算法通过适应度函数计算麻雀种群的适应度值,从而实现角色和位置的变换,避免传统优化算法陷入局部最优解的问题。
(1)
(2)
(3)
(4)
(5)
式(1)中,X为混沌映射初始化的麻雀种群;x表示种群内个体;n表示种群内个体数;d表示空间的维度大小,与LSTM神经网络待优化参数个数相同。式(2)中,Gx麻雀种群适应度矩阵;g为适应度值。(3)中,iter表示当前迭代次数;itermax为最大迭代次数;
为第i个麻雀在第j维上的位置信息,R2和ST表示预警值和安全值,Q为按照正态分布生成的随机数。式(4)中,
是当前迭代中的最优解位置,
与之相反;A为随机矩阵,每个元素赋值为1或−1。式(5)中,
是当前全局最优位置;
为步长控制参数;
为第i只麻雀的适应度值;
为全局最优适应值,
与之相反;
为随机非零常数。
根据公式(1)至(5)可知,麻雀种群中不断更新发现者和加入者的位置,直到达到设定的迭代阈值,找到适应度最高的麻雀,即为全局最优解。
2.2.2. SSA改进策略
从麻雀算法的迭代寻优过程可以看出,麻雀算法的寻优能力与个体质量密切相关,在觅食过程中,加入者总是能够搜索到拥有最丰富食物资源的发现者,然后从该发现者搜索到的食物资源中获取食物或者在该发现者周围进行觅食,在没有外围麻雀警戒出现天敌情况下,该位置也即是当前最佳觅食地点。即陷入局部最优空间。另外,加入者位置主要根据发现者最佳位置和最差位置进行更新,没有充分考虑种群中其他发现者所拥有的食物资源,并且由于初始位置随机情况,发现者和加入者的比例始终保持不变,所以可能在当前搜索区域内,初始位置分布不均,两方面的因素都降低了算法在全局范围内的搜索能力。
为了增强麻雀搜索算法的全局搜索能力,防止陷入局部最优空间。本文采用多策略联合改进:首先采用混沌映射对麻雀种群进行初始化,使每个麻雀均匀分布在搜索区域内,避免因分布不均造成的局部搜索最优。其次在觅食过程中,加入者总是能够搜索到拥有最丰富食物资源的发现者,加入者会在附近觅食甚至发生争夺,使得双方的身份发生改变,为避免算法陷入局部最优空间,引入柯西变异策略,在加入者中进行扰动,提升全局寻优能力,扩大搜索范围,提升全局搜索能力。
混沌映射:混沌系统指的是在确定性系统中存在着可能随机的不规则运动,是非线性动力系统固有的特性,并广泛存在于非线性系统中。混沌映射频数分布直方图用于描述混沌映射输出值的频率分布情况,如图2所示。同时混沌映射的散点图可以展示混沌序列中相邻两个值之间的关系,有助于观察混沌序列的随机性和规律性,如图3所示。
Logistic-tent混沌映射,映射过程如下:
(6)
对式(6)进行编码,可以看出Logistic-tent混沌映射值分布在[0,1]之间十分均匀,映射效果良好。
柯西变异:柯西分布类似于正态分布,是一种连续的概率分布,但柯西分布比正态分布引入扰动更大。采用柯西变异,在更新麻雀个体的当前最优位置时,可以生成更大范围的扰动。更容易跳出局部最优空间。从而使得麻雀算法能够更快速的收敛。
(7)
改进后得到的ISSA流程如图4所示:
2.3. 评估指标
本文采用均方根误差(Root Mean Square Error, RMSE)、平均绝对误差(Mean Absolute Error, MAE)、平均绝对百分比误差(Mean Absolute Percentage Error, MAPE)、相关系数R四个评估指标进行误差检验,在进行误差检验时,RMSE、MAE和MAPE三个指标表示的是样本的离散程度,值越小越好;R值越大且越接近于1,则拟合回归效果越好,说明预测值与观测值之间的线性相关程度越高。
在进行模型评估时,单一评估指标结果不够全面,选取上述四种评估指标相互补充,使得对于模型评估更准确。相关数学表达式如下:
(8)
(9)
(10)
(11)
本文使用评价指标对MLP、LSTM、SSA-LSTM和ISSA-LSTM等四个模型进行对比评估,验证本文所提出模型的先进性。
3. 预测模型搭建
初始化:以LSTM网络的学习率、迭代次数、第一隐层节点数和第二隐层节点数作为优化对象。确定麻雀的种群大小、捕食空间、初始最佳捕食位置和最坏捕食位置,混沌映射使得麻雀种群中的麻雀尽量均匀分布在捕食区域内。
适应值:给LSTM算法随机赋初始变量值,确定麻雀的适应值。

Figure 5. Overall flowchart of the prediction model
图5. 预测模型整体流程图
位置变化:在更新麻雀个体位置后,计算种群中每个个体的适应度值,并保存当前种群中的最优和最差个体位置,同时边缘麻雀进行警戒,注意天敌是否出现。
扰动:引入柯西变异,对加入者位置进行扰动,判断是否陷入局部最优。在多次扰动后,最优位置不改变,即为全局最优解,否则跳转回步骤3。
优化结果输出:以ISSA算法得出的最优网络参量作为LSTM的学习率、迭代次数、第一隐层节点数和第二隐层节点数。
以最优参数重构的LSTM网络,再对数据进行预测,处理预测结果并进行误差分析。
基于ISSA-LSTM的短时客流预测模型如图5所示。
4. 算例分析
4.1. ISSA优化LSTM网络参数
图6(a)为学习率曲线,图6(b)为迭代次数曲线,图6(c)为第一隐层节点数,图6(d)为第二隐层节点数,合适的学习率能够有效提高预测精度,初始学习率取[0,0.01]之间的随机值。迭代次数设置应当适当,过少会使得预测结果精度较低,过多又会出现过拟合现象。隐层节点设置,过多会增加计算量,过少达不
(a)(b)
(c) (d)
Figure 6. Optimization parameter curve; (a) Learning rate; (b) Iterations; (c) Number of nodes in the first hidden layer; (d) Number of nodes in the second hidden layer
图6. 优化参数曲线;(a) 学习率;(b) 迭代次数;(c) 第一隐层节点数;(d) 第二隐层节点数
到预测所需精度,所以这四个值在改进麻雀算法下进行寻优找到最佳值。同时,从(a)图可以看出在麻雀搜索算法的50次迭代中,学习率由于陷入局部最优,SSA无法跳出当前局部最优空间,而ISSA能在多次扰动之后,跳出最优空间,最后找寻到全局最优。表1为SSA与ISSA优化后的参数值。

Table 1. Control mode switch principles
表1. 优化网络参数结果
4.2. 预测结果
选取广州地铁历史AFC数据为研究对象,数据截取时间为7.6~7.30,每15分钟数据记为一组,每天从早上6:15开始记录数据,每天数据共68组,选择了前20天共1360组数据作为测试集,并选取了接下来的5天共340组数据作为验证集,对比四个模型预测结果。同时也单独进行了工作日(周一到周五)与双休日客流情况的预测,数据一共25天,7天为双休日,18天为工作日,均以最后一天作为验证集。图7为客流情况预测结果图,实验截取平峰数据进行局部放大。图8为工作日与双休日的预测结果图,表2为各模型的评估指标。
4.3. 结果分析
从图6可以看出,改进后的ISSA在陷入局部最优空间之后,能够及时跳出当前最优空间,避免算法出现误差,同时也能看出改进后的ISSA多次跳出局部最优空间。从表1可以看出,ISSA优化的四个网络参数,相比较于传统SSA优化的四个网络参数。学习率和第二隐层节点数相差较大,从而导致了最终结果的误差。因为柯西变异的引入,ISSA的运行时间为3156秒左右,SSA运行时间为3092秒左右,时间上增加了60秒左右,增加时间用于算法扰动,但收敛速度加快。
从图7可以看出,基于ISSA-LSTM的模型对于客流的预测情况与真实值拟合度更高,从任意节点看,都比其他三种算法效果更好。从图8能看出,ISSA-LSTM针对工作日与双休日进行的预测准确度都比较高,工作日客流数据会出现早晚高峰期,客流人数变化较大;双休日的客流数据总体比较平缓,呈现的是一个总体平峰,下午出现了一次小高峰现象,但总体一天客流情况总体平缓。
(a)
(b)
Figure 8. Forecast results for weekend and working days; (a) Forecast results chart for weekend; (b) Workday forecast results chart
图8. 双休日与工作日预测结果图;(a) 双休日预测结果图;(b) 工作日预测结果图

Table 2. Evaluation indicators for each model
表2. 各模型评估指标
综合看来,ISSA-LSTM模型相较于其他三种模型预测精度更高,能更加准确的把握客流信息数据,对于未来客流情况能做出更准确的预测。
5. 结论
本文充分考虑相关影响因素对客流预测的影响,选择了节假日和工作日类型,并结合历史客流数据来构建输入序列,选用双隐层神经网络模型进行训练,有效地提高了预测精度。
本文通过引入混沌映射以及柯西变异对SSA进行优化,加快了麻雀算法的收敛速度,增强了算法的全局搜索能力,有效避免陷入算法陷入局部最优解。有效解决了人工调参复杂费时且预测精度不高的问题。