1. 引言
公交车到站时间预测模型在交通流量调控与路线指引方面发挥着重要基础作用[1] [2],为公交车出行者提供了具有可靠性的信息服务,对于推动城市公共交通朝着智能化方向迈进至关重要,且能为其发展注入强大动力。然而,交通系统是一个高度复杂的体系,现有的公交车到站时间预测手段常常难以达到令人满意的程度。本文从理论层面的深入研究以及实际场景的应用探索两方面开展。
在数据预处理环节,实时采集到的公交线路运营数据具备数据量大、时效性要求高的特点,与预测模型的具体需求进行融合,这一过程涵盖了实时数据的匹配与转换工作。数据匹配的关键在于将实时获取的经纬度数据与公交线路进行精准对应,明确站点所在区域并准确识别站点位置。之后借助标准化处理手段,将数据转化为符合预测要求的标准形式。
在预测方法方面,本文首先从技术可行性与实际应用价值两个维度对公交车到站时间预测技术展开了深入研究。然后构建随机排队预测优化模型[3],并运用实际数据进行验证,以评估该模型的有效性。
2. 预测公交站点间车辆运行时间的方法
公共汽车到达站点的运行时间受诸多因素影响,车辆运行时间的预测存在显著的不确定性。为有效应对这一难题,研究者们结合了多种方法,诸如时间序列分析、历史趋势分析、随机排队理论模型、神经网络方法、卡尔曼滤波和交通仿真等。公共交通系统具备一定的固有运行特性,如公交车在进出公交站点时会因减速和加速额外耗费时间,以及在公交站点处因乘客上下车必须停车等。
本文采用改进后的随机排队理论模型来对路段运行时间进行预测。这里的路段具体是指从上游交叉路口的出口停止线起始,一直延伸至下游信号交叉路口的出口停止线这一区间。公共汽车作为交通流的重要组成部分,与其他车辆一同行驶,这意味着它们在该路段上的运行时间能够反映出整个交通流的运行状况。
当车辆驶入特定路段之后,其行驶过程所耗费的时间并非固定不变,而是会因交通流量状况的动态改变而出现波动,尤其是在交通流量达到一定密度时。此时车辆之间开始相互干扰,致使行驶速度减缓,在下游甚至可能在由交通信号灯控制的交叉路口停车等待。通常而言,除非车辆到达信号灯控制的交叉路口,否则在路段上行驶的车辆不会停车。与停车等待时间相比,车辆在路段内因相互作用产生的延误通常可忽略不计,因此只需考虑交通流量和交通信号灯控制的影响。
车辆通过路段到达车站的总行驶时间可划分为以下五个部分[4]:
1) 车辆以正常行驶速度在该路段上的平均行驶时间;
2) 下游交叉口因信号控制所致的排队等待时间;
3) 车辆通过交叉口的时间;
4) 前几个站点因乘客上下车停车等待的时间;
5) 进出前几个站点时车辆减速和加速而损失的时间。
3. 站点间车辆运行时间预测模型
假设交通量遵循泊松分布来估算行车时间,本文构建了一个在平稳、有代表性交通流条件下的单车道站点间运行时间预测模型。依据预测的时间间隔t0 (s)对一天中各时间段进行依次编号。
将第i个时间段标记为i,对应表示为区间
。路网由n个路段构成,第j条路段标记为j。在时刻t路段j下游交叉口的车辆排队等待时长记为
。在时刻t车辆于路段j上行驶所耗费的时间可表示为
,而车辆通过该路段j下游交叉口所花费的时间记为
。
以下为构建时间的五个组成部分模型。
3.1. 行驶时间
行驶时间特指车辆在路段上的运行时长,不包含与交通信号无关的临时停车时长、乘客在车站上下车的等待时长以及因技术故障导致的停车时长。
(1)
其中,Lj表示路段j的整体长度,
表示第i个时间段内路段j下游交叉口车辆所呈现的平均排队长度,
表示路段j上所有车辆在行驶过程中的平均速度水平,
表示公交车在路段j行驶时的速度修正系数。
3.2. 排队等待时间
当路段为单车道时,由于交叉口通行能力有限,车辆会在交叉路口排队等候,遵循M/M/1/Nj/∞排队模型,即系统容量存在限制的单队列排队模型。值得注意的是当系统处于稳态运行状况时,k辆车在交叉路口出现排队现象的概率
与时刻t不存在关联。
在给定的时间段i中,针对路段j下游交叉口,当其从无车排队状态过渡到有一辆车排队时,转移概率为
,其计算取决于车辆到达率
,该值可通过时刻t采集到的检测数据或其他预测方法获取,
为与时刻t有关的函数,取
。
设定路段j下游交叉口在单位时间内的最大通行能力为
,所研究交叉口行进方向的绿信比为
,从而有效服务率为
。
设定在任意时间段i的单位时间内,该交叉口的通行能力保持恒定不变,即取
,每当有车辆从排队队列离开时,该状态间转换概率为
。
状态稳态概率方程为:
(2)
根据
,令
。则得:
(3)
进而得到时段i路段j上排队车辆数量的计算公式:
(4)
(5)
其中,
表示k辆车在交叉口排队的概率,
表示路段j的通行能力,
表示第i时段内路段j的下游交叉口在行驶方向上的绿信比,
表示路段j的下游交叉口单位时间的最大通行能力,
表示时段i内路段j的平均车辆到达率,
表示在时段i下交叉口所呈现的交通强度。
3.3. 通过交叉口的时间
(6)
式中符号意义同前。
3.4. 前几个站点因乘客上下车停车等待的时间
乘客上下车时间受站点客流量及上下车方式影响。借鉴已有研究成果及文献[5] [6],得出乘客上下车时间有两种获取方法:一是经验值推荐,可取一位乘客上车或下车时间为2.5 s;二是现场调查方法,可以在连续几周的同一时间段内取均值,如可取连续三周周一上午8:00~8:30的时间段。获得基础乘客上车或下车人数可用两种途径:一是可用数据采集设备获得,在公交站点适宜位置安装视频记录设备或车门上安装红外自动采集系统,但安装和维护成本较高;二是运用公交IC卡获取乘客上下车人数。本文实证研究中应用公交IC卡获得原始数据集,利用指数平滑法预测上下车人数。
指数平滑预测法是加权滑动预测法的改进,但比加权滑动预测法更为灵活,且准确度更高。其基本表达式如下[5]:
(7)
其中,
为平滑系数,
。
预测模型初值的确定:
用指数平滑预测法进行预测时,有一个确定初值的问题:当t = 1时,
(8)
只有确定了F1,才能求出F2,而
(9)
若无F0,则无法求出F1。故一般令
(10)
3.5. 进出前几个站点时车辆减速和加速而损失的时间
此外,车辆于前几个站点通过时,因进出站时的减速和加速动作而产生的额外延误也应考虑。用
表示决策变量:
(11)
其中,
表示车辆在特定站点经历的减速与加速时间。
基于前述分析,所需确定行程时间的五个组成部分均已得出,从而可以计算出总行程时间,具体计算公式如下:
(12)
设定车辆进入研究路段的数量遵循泊松分布[5],泊松分布适用于车辆到达随机、相互间影响微弱,也不受外界因素干扰的情况,具体表现在交通流密度不大的时期。
泊松分布的基本模型:
计数间隔t内到达k辆车的概率:
(13)
其中,
表示计数间隔t内到达k辆车的概率,
表示计数间隔t内平均到达的车辆数,
表示平均到达率(辆/秒)。
为了提升预测结果的准确性,本文综合考虑了车流量、路段长度、信号周期、绿信比、服务强度等多种因素对行程时间的影响,并采用多元回归拟合法对模型进行优化调整。
时段i与路段j的行程时间修正项为:
(14)
由于
,
,代入上式可得:
(15)
其中,sij表示时段i路段j的下游交叉口信号周期,Qij表示时段i路段j上的单方向车流量,gij、μj意义同前,aij、bij表示回归常数参量。
aij、bij回归常数参量由下述非线性回归方程确定:
(16)
由上述分析可得车辆在时刻t路段j的行程时间模型:
(17)
经参数拟合处理后,能够明确模型参量aij、bij的固定取值。当获取流量、道路长度以及绿信比等相关数据时,便可在短时间内推算出对应路段的行驶时间。
此模型具备数据采集便捷、预测时间跨度可灵活调整、预测准确度较高等诸多实用优势,这些优势相互协同,进而增强了该模型的适用范围。
4. 模型求解算法设计与模型验证
为衡量模型的实用效能,本研究选取了上海奉浦快线的公交运营数据展开分析。相较于普通机动车,公交车辆的运行特征具有显著的特殊性[7],基于此,预测算法在设计过程中需充分考量实时路段所面临的随机性干扰因素。其预测算法的具体设计如图1所示。
Figure 1. Instantaneous operation diagram of the bus
图1. 公交车瞬时运行情况图
图1描绘了某一时刻在路网中行驶的公交车,进行的是单线单向预测。其中B1、B2、B3表示三辆公交车依照当前顺序运行于同一条线路上;1、2、3、4、5、6表示编号的六个路段;①、②、③表示公交站点的标记;L1、L2、L3分别表示每个公交站点与所在路段起始位置的距离;DB1、DB2、DB3则代表每辆公交车与所在路段起始位置的距离。
下面对①、②、③公交站点电子站牌所显示的预测时间值进行分析。
4.1. ①号和②号公交站点电子站牌显示时间的计算方法
①号公交站点作为发车起点,其配备的电子站牌能够依据①号公交车的运行时刻表,显示下一班公交车的出发时刻。
在①号和②号公交站点这一区间内,无其他公交车投入运营。由此可以推断得出,②号公交站电子站牌所展示的下一趟公交车辆预计抵达时间(记为T2),实际上等同于B1号公交车从①号公交站行驶至②号公交站所耗费的时间。
(18)
其中,T1−2表示在①号公交车站到②号公交车站之间的公交车行驶时长:
(19)
其中,N代表预测起始时刻,t1和t2分别是1号路段与2号路段预测所需的运行时长。如图1所示,L1和L2是①号公交车站和②号公交车站到各自所属路段起始点的距离。v1与v3表示1号路段和3号路段上的平均行驶速度,α1和α2表示路网中公交车辆在1号路段与3号路段的行驶速度。
4.2. 对下一辆公共汽车抵达③号公交车站时间的预测
公交车与普通机动车在运行特性上存在显著差异。普通机动车能够在路段间保持一定速度连续行驶,无需中途停车。然而,公交车必须在指定站点停靠,以便乘客上下车。因此,公交车在靠近站点时需减速,驶离站点时需加速。部分公交线路在路段间设有停靠站点。
过往用于预测路段运行时间的模型和算法有历史趋势分析法、多元线性回归法、随机排队理论模型、神经网络法[8]等。这些模型和算法应用在公交车站间运行时间的预测时,往往会产生较大偏差。
根据上述分析,公交车运营应考虑两类时间[9],公交车站点等候时间和公交车进出站因减速和加速所损失的时间。本研究重点在于预测所有车辆抵达③号公交车站的时间,预测过程为在每个时间间隔内估算距离该站最近车辆的到达时间。
B1、B2、B3中的任意一辆公交车均有可能率先抵达③号公交站点,这是因为车辆的调度方式会影响抵达③号公交站点的时间。调度方式如快车、区间车、放车等。驶向第③站的公交车包括B1、B2、B3。
(20)
(21)
(22)
(23)
其中,TB1、TB2、TB3分别表示公交车B1、B2、B3抵达③号公交站所需的运行时间,
表示公交车辆TB1在站点②进出站减速和加速损失的时间,T3表示下一辆公交车抵达该站点的预测运行时间,该时间将显示于第③公交站的电子站牌上,v4、v6分别表示4号路段和6号路段上的平均行车速度,α4、α6分别表示公交车于4号路段、6号路段行驶过程中所涉及的速度修正系数。
5. 广义回归神经网络
国内外的学者们在公交运行时间预测模型方面取得众多研究成果,例如回归模型、时间序列、卡尔曼滤波、支持向量机、神经网络模型等等。
5.1. 广义回归神经网络的含义
广义回归神经网络(GRNN)是径向基神经网络的一种变化形式,有很好的非线性映射能力,在分类能力、函数逼近和学习速度等方面均优于其他神经网络,相对于传统的数据分析预测方法,它更适合处理模糊、非线性和模式特征不明确的问题,能充分挖掘数据间关系,比传统神经网络预测精度更高,是一种广泛应用于函数逼近的RBF神经网络。利用广义回归神经网络自适应、自学习及非线性的特点,通过网络本身的学习功能来映射输入(GRS数据)和输入(公交车辆运行时间)的关系。
5.2. GRNN在公交站点运行时间的预测映射
1) GRNN有三层组织结构,如图2所示[5],Q为径向基层神经元的个数(即节点数),R为输入层输入矢量的维数,W为连接权值,b1为径向基层阈值,第一层是输入层,第二层是径向基层,其中神经单元数目等于训练样本的数目。取欧几里得度量函数(
)作为径向基层的激活函数,是用于挖掘输入层和径向基层的权值LW1, 1之间的关系,欧几里得度量函数公式如下:
(24)
其中,
。
Figure 2. GRNN network diagram
图2. GRNN网络示意图
2) 网络的积函数将输入权值与隐含层阈值相乘,其结果传送到隐含层的传递函数上,即为高斯函数,高斯函数是呈正态分布的密度函数,其函数图像是两边衰减且径向对称的。
(25)
其中,X表示1维输入向量时间t;ci表示第i个(
)基函数的中心,与输入向量时间的维数相同;
是向量
的范数,其为向量x和ci之间的距离函数;σi表示第i个感知的变量,又称光滑因子,表示基函数围绕中心范围的距离,σ越大,基函数越光滑;m表示感知单元个数。
3) 进行归一化处理。归一化处理的主要作用是归纳样本数据概率分布的特点,把样本数据映射在0到1的范围之内方便数据处理,其过程在0~1范围内是统计的概率分布,在(−1, 1)范围内是统计的坐标分布。利用神经网络进行预测时,采用的方式是利用样本数据在事件中统计分布的概率进行预测,归一处理即是将数据转换为在(0, 1)之间的概率分布。
采用线性函数转换方法,表达式为:
(26)
其中,X表示网络输入归一化值,X、x表示转换前后的数据值,xmax、xmin表示样本数据中的最大值和最小值。
6. 预测结果分析
将本文提出的模型与广义回归神经网络模型进行预测结果对比分析,以便验证模型的可行性和实用性。数据获取来自2024年11月11日至15日上海市奉浦快线一周数据,车辆位置用GPS监测定位数据,公交乘客数据为读取公交IC卡数据。公交运行数据利用线性变换做归一化处理,转换后的样本数据值均落在(0, 1)区间上。优化结果如图3和图4所示。
Figure 3. GRNN prediction diagram
图3. 广义回归神经网络预测示意图
Figure 4. Stochastic queuing model prediction diagram
图4. 随机排队模型预测示意图
通过对两种模型的训练得到对比示意图,结果表明,在考虑多因素影响下的公交车到站时间预测,本文提出的模型准确性提高了近12%,为实际应用提供了参考依据。
7. 结论
本研究聚焦于公共交通智能调度领域的需求,建立了一种基于随机排队理论的动态预测模型,旨在提升车站运行时间预测的精准度。为实现这一目标,研究通过整合GPS (全球定位系统)、GIS (地理信息系统)、数据库管理以及数据预处理等多项技术,构建了多源数据采集与分析框架。该框架不仅能够实现对公交车辆运行状态的实时监测,还能有效融合各类数据,为后续分析提供坚实的数据基础。模型将车辆行程时间分解为行驶时间、信号交叉口排队延误时间、交叉口通过时间、站点停歇时间及加减速损失时间五部分,并基于Poisson分布假设与多元回归方法对关键参数进行动态修正,显著提升了预测模型的适应性与鲁棒性。
通过上海市奉浦快线示范线路的实证分析表明,模型能够有效捕捉复杂交通环境下的动态变化特征,预测准确率较传统方法提升12%,验证了其在实际场景中的可行性与有效性。研究成果为公交智能化调度系统提供了理论支撑,对优化乘客出行体验、降低站点拥堵及提升公交运营效率具有一定应用价值。
后续有待研究问题如下:
1) 对公交车当前所处路段的判定
借助GIS与GPS,能够获取公交车的实时地理位置信息,进而明确公交车所在的具体路段。后续拟采用基于距离的实时判定方法,每隔5秒周期性地检测公交车与下一个路段起始端的距离。当此距离小于预先设定的阈值时,便判定公交车正在驶过该路段[10]。同时,及时更新公交车所在路段的编号记录。
2) 确定下一车站编号与下一路段编号
鉴于车站编号和路段编号在整个路网中是统一编制的,在某条公交线路上的编号并非连续排列。为实时、快速地确定下一站点编号和下一路段编号,可采用基于字符串比对的搜索机制。当检测到公交车正在通过一个路段时,将公交车的原始路段编号与该线路沿线的路段编号序列进行比对,确定当前路段在序列中的具体位置。随后,通过选取序列中的后续编号来确定下一路段编号。采用类似方法还可确定公交车停靠时前方的车站编号。此外,利用该搜索机制还能确定公交车在两个站点之间,或者在其当前位置与下一个公交站点之间需要经过的完整路段总数以及各路段的编号。
基金项目
国家自然科学基金项目(52372304);上海市科技创新行动计划软科学重点项目(23692112200)。