1. 引言
目前,我国地铁建设已步入发展高潮阶段。随着国家政策的制定,我国各大城市积极鼓励建设地铁交通,使得地铁建设速度远超之前的30年[1]。2022全年,我国新增地铁运营线路20余条,新增运营里程达800公里[2]。根据中国城市轨道交通协会发布的《城市轨道交通2022年度统计和分析报告》,地铁运营线路8008.17公里,占比77.84%,且2022全年累计地铁客流量193.02亿人次[3]。因舒适性高、准点率高等优势,地铁成了越来越多出行者的主要出行工具。随着地铁网络规模不断扩大以及地铁客流量不断增加,如何利用地铁客流量数据准确预测地铁客流量,这对于地铁公司提前调整线路、车辆、人员等资源,以满足需求,提高服务水平和运营效率至关重要。
地铁客流量预测包括短时和中长期客流预测两种。自20世纪80年代初以来,地铁短时客流量预测一直是大多数交通系统的关键组成部分[4] [5]。关于地铁短时客流量预测,目前已有大量研究,主要集中于降低各种干扰因素的影响以及提高短时客流量预测模型的精度[6]-[10]。这些研究为北京冬奥会、杭州亚运会等大型赛事期间短时客流量突增情况下的交通需求引导和管理决策提供了高精度的数据支撑。然而,地铁中长期客流量预测却没能引起人们的广泛关注[11]。本文的目的是利用地铁客流数据准确预测地铁中长期客流量,以识别客流的长期趋势和周期性规律。目前关于地铁中长期客流量预测的研究主要分为回归模型,机器学习和灰色GM(1,1)模型。对于回归模型和机器学习,如自回归综合移动平均(ARIMA)模型[12],基于ARIMA和人工神经网络组合预测模型[13],基于季节求和自回归移动平均(SARIMA)模型和GA-BP神经网络组合预测模型[14]等,它们在大样本时间序列方面进行客流预测表现良好,一旦样本量不足,它们的预测精度可能会降低。但在现实问题中,很难甚至不可能收集足够多的样本,例如道路事故的信息或大规模客流间接导致的踩踏事件的信息。与回归模型和机器学习相比,灰色GM(1,1)模型的优势在于可以通过累积生成算子(AGO)削弱原始数据的随机性,预测灰色系统未来的变化并且对于小样本的不确定性信息系统具有良好的预测性能[15]。基于灰色GM(1,1)模型,潘杰等[16]选取西安地铁客流量,采用滑动无偏灰色马尔科夫模型进行预测,预测表明相较于传统灰色GM(1,1)模型,改进后的模型预测精度有显著提高。但不足在于受疫情,突发事件等影响,对于波动较大非平稳的样本预测误差较大甚至不能进行预测。为此在原有模型基础上,对灰色GM(1,1)模型进行改进具有重要的研究意义。
为弥补上述不足,从单一模型到组合模型预测地铁客流量愈加丰富且准确,但处理小样本并同时融合等维新息原理以及应用马尔科夫修正的论文研究较少。为了更准确预测中长期客流量,本文将等维新息思想融入灰色模型并与马尔科夫模型结合。首先对原始数据序列进行预处理以满足建模要求。其次,建立灰色GM(1,1)模型并利用等维新息的思想对模型进行改进,提高中长期的预测精度。接着运用残差、后验差以及小误差概率三种指标对模型精度进行检验。最后,通过将马尔科夫链纳入融合等维新息的灰色模型优势互补来修正残差。本文选用2013~2019年上海地铁日均客流量进行预测,进一步说明并验证了融合等维新息的灰色马尔科夫模型在地铁中长期客流量预测方面优于单一模型,且预测精度为Ⅰ级(优)。
2. 融合等维新息的灰色马尔科夫模型构建
2.1. 地铁客流量灰色GM(1,1)模型
设
由n个非负数据组成的集合,其中
代表年日均地铁客流量,并且
。
预测之前,需要对年日均地铁客流量数据进行检验,以确定
是否能够建立灰色GM(1,1)模型。为了检验年日均地铁客流量数据序列是否满足建模要求,一般来说用数列的级比
的大小与其所在区间的对应关系来进行判断,如式(1)所示:
(1)
若
成立,则可认为
满足建模要求;反之,若不成立,则可使用平移变换或者对数变换方法,使
满足建模要求。如果多次变换后仍然在区间外,则
不满足建模要求。
第一步,对
一阶累加,降低初始年日均地铁客流量数据的波动性和随机性,得到新数据序列
。其中
如式(2)所示:
(2)
式中:u为初始序列位数;k为新序列位数。
第二步,令
为
的紧邻均值生成序列:
,其中
如式(3)所示:
(3)
第三步,GM(1,1)的灰色微分方程模型如式(4)所示:
(4)
式中:称GM(1,1)模型中的参数a为发展系数,反映了
与
的发展态势。b为灰色作用量。GM(1,1)模型中的参数
为待估参数。
第四步,构建累加序列
的一阶微分方程,如式(5)所示:
(5)
第五步,引入数据矩阵B,
并运用最小二乘估计参数a,b,如式(6)所示:
(6)
第六步,GM(1,1)模型
的时间响应序列,如式(7)所示:
(7)
第七步,累减还原值,如式(8)所示:
(8)
2.2. 融合等维新息预测原理
在使用灰色GM(1,1)模型进行预测时,随着时间的推移,一些不确定因素可能会破坏原有数据的发展趋势。随着预测时间的延后,预测结果的可靠性逐渐降低,为了提高地铁中长期客流量预测的准确性,我们可以考虑结合等维新息的思想[17],并构建融合等维新息的灰色GM(1,1)模型,预测流程如图1所示。该模型使用历史数据预测新数据,并将其视为新的历史数据用于后续预测,这种方法可以提高中长期预测的准确性。
Figure 1. Forecasting flowchart
图1. 预测流程图
2.3. 模型精度检验
在预测之前,应对模型精度进行检验,以确保所建立的模型具有可靠的预测能力。如果检验结果未能达到规定的标准,则应对模型进行修正。本文所用检验方法包括残差、后验差以及小误差概率三种检验方法。
2.3.1. 残差检验
残差检验是对模型预测结果和实际观测值之间的误差进行逐点检验的方法。首先,根据所建立的GM(1,1)模型,计算出相应的预测值序列,按照模型计算相应的预测模型模拟序列:
然后计算预测值与原始序列值的绝对残差序列,如式(9)所示:
(9)
进而计算相对残差序列,如式(10)所示:
(10)
最后计算平均相对残差,如式(11)所示:
(11)
给定
,当
,且
成立时,称模型为残差合格模型。
2.3.2. 后验差检验
首先设原始序列的均值和方差:
然后令
为残差序列,则均值和方差:
最后计算均方差比值,如式(12)所示:
(12)
对于给定
,当
时,称模型为均方差比合格模型。
2.3.3. 小误差概率检验
小误差概率如式(13)所示:
(13)
对给定的
,当
时,称模型为小误差概率合格模型。
通常,可以将模型的精度按照4个不同的等级进行划分[18],具体检验指标参照详见表1。如果3种检验方法所得到的参照指标值中有一个未能达到当前的精度等级,那么认定该模型预测值的准确性未能达到所期望的精度等级。
Table 1. Accuracy test grade reference table
表1. 精度检验等级参照表
精度等级 |
相对误差
|
均方差比值C0 |
小误差概率P0 |
I (优) |
0.01 |
0.35 |
0.95 |
II (良) |
0.05 |
0.50 |
0.80 |
III (合格) |
0.10 |
0.65 |
0.70 |
IV (不合格) |
0.20 |
0.80 |
0.60 |
2.4. 融合等维新息的灰色马尔科夫模型
用马尔科夫链修正融合等维新息的灰色模型,其中马尔科夫修正过程是根据年日均地铁客流量数据状态的转移概率来预测其他年的状态,从而得到预测值。具体修正过程有以下几个步骤:
(1) 分割状态
根据马尔科夫链的原理,将年日均地铁客流量数据分成大致几个状态。任一状态区间可表示为:
,其中,
和
为状态E的上下限的边界值。为提高对弹性较大的年日均地铁客流量数据修正的有效性,并提高预测精度,本文将年日均地铁客流量数据分割为3个不同状态。
(2) 计算概率
状态划分之后,需要计算状态转移的概率,以确定状态转移矩阵。其中
表示年日均地铁客流量数据由状态
经过k步转变为
的概率,计算如式(14)所示:
(14)
式中:
为状态
出现的总次数,
为状态
经过k步转变为
的次数。
(3) 确定状态转移矩阵
通过计算概率来确定状态转移矩阵,由状态
转变为
的k步转移概率为
,将每个k步转变概率组成一个状态转移矩阵,如式(15)所示:
(15)
式中:
为由状态概率组成的k步状态转移矩阵。
对于多步转移概率矩阵,除具有一步转移概率矩阵的性质外,还具有以下的性质,如式(16)所示:
(16)
(4) 计算预测值
当确定好状态转移矩阵之后,我们可以根据某一年日均地铁客流量所处的状态,来预测其下一年日均地铁客流量可能的状态,从而得到马尔科夫修正值。
(5) 计算马尔科夫链修正后的预测值
预测客流量下一步所处状态
,其区间值为
,则通过模型预测值的修正公式如式(17)所示:
(17)
式中:
为地铁客流量第k年的预测值;
为经过马尔科夫模型修正的第k年预测值,当预测值高于实际值时取“+”号,预测值低于实际值时取“−”号。
3. 实例分析
3.1. 数据来源
选取2013~2019年上海地铁日均客流量,利用该数据进行中长期客流量预测。数据来源于上海地铁上海申通地铁集团有限公司2013~2019年度社会责任报告,详见表2。
Table 2. Average daily passenger traffic of Shanghai Metro from 2013 to 2019
表2. 2013~2019年上海地铁日均客流量
年份 |
2013 |
2014 |
2015 |
2016 |
2017 |
2018 |
2019 |
年日均客流量(万乘次/日) |
684.93 |
774.00 |
840.55 |
930.68 |
969.32 |
1015.51 |
1062.73 |
3.2. 上海地铁客流量灰色GM(1,1)预测
选取2014~2019年上海地铁日均客流量作为原始数据序列进行级比检验,根据式(1)进行计算,我们得到2014~2019年日均地铁客流量数据
,级比范围为0.9032~0.9601,符合检验条件。因此,我们选取2014~2019年上海地铁日均客流量的数据,并且使用灰色GM(1,1)模型进行预测。根据式(2)~(7),得到灰色GM(1,1)预测模型:。采用式(8)进行累减,通过累减还原值得到2014~2019年的灰色GM(1,1)预测值。
3.3. 融合等维新息的灰色GM(1,1)预测
根据等维新息原理,建立融合等维新息的灰色GM(1,1)模型进行预测,此时选用2013~2019年上海地铁日均客流量数据序列,我们得到融合等维新息的灰色GM(1,1)预测模型:。同样根据式(8)进行累减,累减还原值得到2014~2019年的融合等维新息的灰色GM(1,1)预测值。上述两种模型的预测值对比分析,详见表3。
Table 3. Comparison of the predicted values of the gray GM(1,1) model and the equal-dimensional neo-interest gray GM(1,1) model
表3. 灰色GM(1,1)模型和等维新息灰色GM(1,1)模型的预测值对比
实际值及模型预测值 |
2014 |
2015 |
2016 |
2017 |
2018 |
2019 |
实际值 |
774.00 |
840.55 |
930.68 |
969.32 |
1015.51 |
1062.73 |
灰色GM(1,1)预测值 |
774.00 |
861.64 |
909.83 |
960.71 |
1014.43 |
1071.16 |
等维新息灰色GM(1,1)预测值 |
774.00 |
853.92 |
908.90 |
967.42 |
1029.70 |
1095.99 |
为了保证所构建的模型具备可信赖的预测能力,我们按照式(9)~(13)中的方法进行了2种不同模型的预测精度对比,得到2种模型的预测精度对比结果,具体结果详见表4。
根据表1精度等级划分标准,通过对比2种模型的残差、后验差以及小误差概率,我们可以比较出上述2种模型的
,
,
,精度等级均为II (良)。相较于灰色GM(1,1)模型,融合等维新息的灰色GM(1,1)模型表现出更高的预测精度。为了获得更准确的地铁中长期客流量预测模型,我们将其预测值用于马尔科夫链进行修正,并构建融合等维新息的灰色马尔科夫模型。这种方法可以提高预测模型的性能,更加适用于地铁中长期客流量预测。
Table 4. Comparison of the prediction accuracy of the 2 models
表4. 2种模型的预测精度对比
模型 |
|
C |
P |
精度等级 |
灰色GM(1,1) |
1.09 |
0.017 |
0.95 |
Ⅱ (良) |
等维新息灰色GM(1,1) |
1.005 |
0.013 |
0.98 |
Ⅱ (良) |
3.4. 融合等维新息的灰色马尔科夫预测
根据融合等维新息的灰色GM(1,1)模型预测的相对误差进行状态划分,本文划分为3个区间,分别记为
,
,
。根据不同年份的状态可得到2014~2019年各个年份之间的状态划分情况,详见表5。
Table 5. Status breakdown
表5. 状态划分情况
年份 |
实际值(万乘次/日) |
预测值(万乘次/日) |
相对误差/% |
状态 |
2014 |
774.00 |
774.00 |
0.00 |
E2 |
2015 |
840.55 |
853.92 |
−1.59 |
E3 |
2016 |
930.68 |
908.90 |
2.34 |
E1 |
2017 |
969.32 |
967.42 |
0.20 |
E2 |
2018 |
1015.51 |
1029.70 |
−1.40 |
E3 |
2019 |
1062.73 |
1095.99 |
0.51 |
E2 |
根据表5的数据分析,我们可以观察到以下情况:E1出现了1次,E2出现了3次,E3出现了2次。由式(14)~(16),一步至三步转移矩阵分别为:
在预测值相对误差较小的情况下,一般指相对误差不超过1%的情况,在这种情况下,通常不需要使用马尔科夫链进行修正。因此,我们只需对2015年、2016年和2018年的结果预测进行修正。以下为2015年的预测值修正过程示例,根据式(17),修正后的预测值为:
同理,根据式(14)~(17),计算得出2016年和2018年的马尔科夫修正结果。基于融合等维新息的灰色马尔科夫模型,我们得到2014~2019年日均地铁客流量数据的马尔科夫修正结果,详见表6。
融合等维新息的灰色马尔科夫模型
,
,平均相对误差
,根据表1可知模型精度为Ⅰ级(优)。因此,可以得出结论,与其他两种模型相比,融合了等维新息的灰色马尔科夫模型在地铁中长期客流量预测方面表现更为准确,主要在于马尔科夫链修正使得平均相对误差
,模型精度由Ⅱ级(良)提高为Ⅰ级(优)。图2显示了实际值和的等维新息的灰色马尔科夫模型预测值的对比结果。从图2可以明显看出,融合等维新息的灰色马尔科夫模型在预测时间延长的情况下,其预测值与实际值保持紧密,这说明了该模型能够有效克服预测时间过长导致数据波动性带来的影响。
Table 6. Markov correction results
表6. 马尔科夫修正结果
年份 |
实际值(万乘次/日) |
修正结果(万乘次/日) |
相对误差/% |
2014 |
774.00 |
774.00 |
0.00 |
2015 |
840.55 |
839.77 |
0.09 |
2016 |
930.68 |
913.47 |
1.85 |
2017 |
969.32 |
967.42 |
0.20 |
2018 |
1015.51 |
1024.58 |
−0.89 |
2019 |
1062.73 |
1095.99 |
0.51 |
Figure 2. Gray Markov model prediction results for equidimensional new information
图2. 等维新息的灰色马尔科夫模型预测结果
Figure 3. Comparison of relative error values of 3 models
图3. 3种模型相对误差值对比
3种预测模型的相对误差对比如图3所示。其中,ε1、ε2、ε3分别表示为灰色GM(1,1)模型、融合等维新息的灰色GM(1,1)模型、融合等维新息的灰色马尔科夫模型的预测值与实际值之间的相对误差。比较这3种模型相对误差值,发现融合等维新息的灰色马尔科夫模型具有更小的相对误差,进一步验证了融合等维新息的灰色马尔科夫模型在地铁中长期客流量预测方面更为准确。这也说明了相较于单一模型,该组合模型更适用于中长期客流量预测。
4. 结论
本文基于融合等维新息的灰色马尔科夫模型进行地铁中长期客流量预测,选取2013~2019年上海地铁日均客流量进行实证研究,为验证模型的精确性,将融合等维新息的灰色马尔科夫模型与灰色GM(1,1)、融合等维新息的灰色模型进行对比分析。结果表明融合等维新息的灰色马尔科夫模型可以有效克服样本量不足的缺陷,并提高地铁中长期客流量预测精度。相较于单一模型,融合等维新息的灰色马尔科夫模型预测精度更高且为Ⅰ级(优)。本文的研究结果为地铁网络中长期规划和精细化交通需求管理提供决策支持。
基金项目
国家自然科学基金(71871143);上海“科技创新行动计划”社会发展科技攻关项目(22dz1203405);教育部人文社科青年基金项目(22YJC790189)。