1. 引言
如何科学提高公交的服务水平,将居民出行从私家车转向公交,是解决城市交通问题的有效途径。城市居民是否优先选择公交出行,主要取决于公交的满意度高低,其因素涉及居民自身的基本属性、公交系统状态、车内状态、车外状态、交通信息化程度和运营状态等各个方面。因此,亟待研究公交满意度的变化特征及其原因,在对其影响因素分析基础上,揭示公交满意度的内外因素对其影响程度,为如何调整公交服务水平提供科学的依据。
目前,国内外众多学者关注公交满意度研究,主要如下:巩丽媛 [1] 运用非集计模型理论建立公交乘客满意度模型,采用模糊评价方法对济南公交服务进行评价。胡国兵 [2] 等采用四分图模型,从时间调控、线路安排、服务质量等方面的满意度进行打分测评,从而建立公交满意度的评价体系。陈明伟 [3] 利用层次分析法和模糊综合评定法,对整个城市公交线路逐条分析,评价出城市公交系统的满意度。彭晗 [4] 等在分析乘客需求特征的基础上,根据指标体系设计原则,构建了科学全面实用的乘客满意度评价指标体系。苟蕾 [5] 等运用交叉列联表的独立性检验,因子分析方法,得到影响乘客满意度的五个主要因子。张磊 [6] 及刘亚坤 [7] 均以乌鲁木齐市公交运营线路为研究对象,使用模糊数学法对调查结果进行分析,对常规公交服务水平进行合理定量评判。胡晓伟 [8] 等从乘客满意度的角度出发,利用结构方程模型进行评价指标的筛选,从公交运营者和出行者两方面确定评价模型变量。欧阳剑 [9] 等利用朴素贝叶斯分类法分析调查数据,建立候车时间、步行时间和乘车环境满意度等9个属性与乘客总体满意度之间的满意度模型。霍月英 [10] 等建立一个快速公交系统的顾客满意度模型,以有序Logistic回归作为建模方法,发现在住房位置和长椅的可用性对顾客满意度的影响很大,乘客的社会经济特征对顾客满意度有很大的影响。李琼 [11] 等利用结构方程模型进行数据分析,建立由感知质量、感知价值和乘客期望等潜变量构成的结构方程模型。由上可知,现有公交的满意度研究尚未深入揭示居民个人属性与公交信息化、配套设施和服务质量之间关联性,并且已有研究侧重量化这些影响因素与公交满意度之间关联性,没有深入刻画数据不完备与它们之间状态转移耦合关系,与实际应用存在一定差异。
贝叶斯网络是表示变量之间的概率联系的网络模型,将该方法引入公交系统满意度评估中,它能在不确定的因素下利用可视化的图形进行表示影响因素与满意度之间状态转移关系,从而达到预测和决策的目的,不仅能够真正有效地处理不完整的数据,同时它能有效地避免对数据的过度拟合。综上所述,本文在分析公交满意度的影响因素基础上,从出行居民个人状况、居民出行的基本情况、交通信息化水平、公交附属设施和公交服务质量这五个方面出发,基于贝叶斯网络挖掘影响因素和公交满意度之间关联性,并通过比较贝叶斯网络与其它模型的分类正确率,从而验证模型的有效性。
2. 数据来源及描述性统计
数据来自南通市人民政府于2013年委托地方院校调查新城区和老城区公交满意度所得问卷。调查问卷设计如表1所示,调查内容包括个人特征及出行特征、居民对公交系统的感受两部分,涉及个人基本属性、出行活动、交通信息化水平、附属设施、服务质量以及满意度评价六方面,总共22个调查指标。

Table 1. Questionnaire design and basic attributes
表1. 调查问卷设计及基本属性
通过对调查数据校对核验和筛选后,最终获得了1216个有效个体样本,其中新城区有效个体样本669个,老城区有效个体样本547个(图1)。对样本进行整理分析后,发现新城区和老城区所获得的样本在总体上保持着高度的一致性,但在某些因素方面也存在着一定的差异,如:新城区乘客较老城区相比向年轻化发展,大多集中在18~25岁;同时,新城区乘客学历较老城区有了较大的提高,有70%的乘客学历集中在大专及大专以上。这些属性属于乘客的个人状况的因素,对于公交系统满意度也有着一定的影响。因此,应该区分新老城区居民的公交满意度差异,据此改善公交服务水平。

Figure 1. General characteristics of residents in new and old urban areas
图1. 新老城区居民的总体特征
3. 公交满意度特征分析的贝叶斯网络模型构建
根据贝叶斯网络的基本原理,构建公交满意度特征分析模型的核心在于节点变量定义、确定各条件和决策变量的取值范围及先验概率分布、结构学习和参数学习四部分,主要步骤如下。
步骤1:变量节点定义。共有
个节点变量
,分为n个条件和1个决策变量节点,其中条件变量为22个调查指标,决策变量是公交满意度的调查结果。
步骤2:汇总n个条件和1个决策变量节点的取值范围及它们之间先验概率分布。
步骤2.1:查找任意变量
的取值范围
,根据专家知识,对之进行离散化处理,共有K个特征取值状态空间为
,其中:
。
步骤2.2:计算变量
取值状态
的概率
,以及两个变量
和
取它们不同状态值之间的先验概率分布
,其中
表示事件
在样本集D出现的次数。
步骤3:构建公交满意度特征分析的贝叶斯网络各节点之间拓扑结构,描述其涉及个人基本属性、出行活动、交通信息化水平、附属设施、服务质量以及满意度评价六方面和公交满意度之间因果关系。
步骤3.1:采用K2算法,在训练集上进行无监督的机器学习,得到初始网络结构;
步骤3.2:利用专家的先验知识,基于条件独立性检验方法,若任意两个结点
和
之间相互依赖,存在有向边相连接
,对网络结构进行微调。
步骤3.3:检测获得调整后的网络结构是否符合要求,若满足要求,输出公交满意度特征分析的贝叶斯网络结构图S;否则返回步骤2.3.2,继续微调网络结构。
步骤4:在上述网络结构基础上,利用最大似然估计方法,估计公交满意度的影响因素和评价结果之间条件概率分布表。
步骤4.1:将先验分布和似然函数相结合,估计参数
。
步骤4.2:令
的分布为Dirichlet函数,
的似然函数为
,又由于
,根据
,计算
,其中:
为
的取值数目;
为节点
取值第k个值时,在父节点取值第j个值的数量。
步骤4.3:根据上述公式推导过程,可计算它们之间条件概率。
在上述基础上,根据预测客流或行驶时间的概率高低,预报公交环境变化,并进行反向推理其外部环境可能的变化原因,为公交动态调度提供决策数据支撑。
4. 实证分析与政策反馈
采用SPSS Modeler的贝叶斯网络工具箱对调查问卷数据进行分析,选择合适的贝叶斯网络模型,计算影响公交满意度的重要性程度,得出这些影响因素与公交满意度之间概率推理关系,为公交系统改善提供政策反馈。
4.1. 模型选取
贝叶斯网络模型的种类众多,选取TAN算法、Markov算法和Markov-FS算法三种模型进行评估进而选择最佳预测模型,由图2可知:TAN模型与Markov、Markov-FS模型都生成了相似的结果,从训练数据来看TAN模型具有较好的准确率,从测试数据来看Markov模型具有很好的准确率,而Markov-FS算法模型具有更高的预测准确率。因此,本文选取Markov-FS分析公交满意度,具体的正确率结果如表2所示。

Figure 2. Comparison of prediction accuracy of each model
图2. 各模型预测准确率比较图

Table 2. Prediction accuracy and consistency of each model
表2. 各模型预测准确率及一致性
4.2. 影响公交满意度的因素重要性程度分析
如图3所示,公交满意度的影响因素重要性程度从高到低前4名依次为公交电子站牌利用率、公交专用道利用率、站台上下车方便度、车内设施以及车内卫生,计算结果符合直观分析,因为:
1) 城市电子公交站牌投入使用以来为乘客提供了大量的便利,给乘客合理安排乘车提供了基础,因此公交电子站牌利用率成为影响公交系统满意度的重要因素。
2) 公交专用道利用率是影响公交满意度的重要因素,重要性高达26.51%。站台上下车便捷程度也起到了重要作用,其重要性为17.3%。
3) 车内卫生以及车内设施也是影响乘车体验的重要因素,公交公司要提高自身的服务意识,紧抓卫生,组织公交驾驶员的培训活动,及时更新车内设施,从而更加直接的提高满意度。
此外,由于南通市新老城区居民组成差异较大,故它们关注的公交满意度影响因素也稍微不同,图3中的两者公交满意度的因素重要性差异决定了改善公交满意度的政策反馈也应该稍微差异,主要如下:

Figure 3. Comparison of the importance of each factor between new and old urban areas
图3. 新、老城区各因素重要性比较
4.3. 影响公交满意度的各因素之间因果关系分析
影响公交满意度的各因素之间因果关系如图4所示:

Figure 4. Bayesian network prediction chart based on Tan algorithm
图4. 基于TAN算法的贝叶斯网络预测图
5. 总结
本文通过贝叶斯网络对公交满意度的影响因素以及产生原因进行深入的剖析,以南通市问卷调查所得数据为基础,分析其影响因素,得到了公交电子站牌利用率、公交专用道利用率、站台上下车方便度、车内设施以及车内卫生对公交系统满意度有较大影响的结论。同时,将新、老城区各因素重要性作比较,给出了针对不同城区的解决措施。最后,将TAN作为贝叶斯分类器的情况和将Markov相结合的情况作了比较,从而验证模型合理性。本研究可以为交通管理部门以及公交公司等提出合理的决策方案,对提高公共交通选择率,缓解城市交通压力有较大的帮助。