1. 引言
随着交通环境和机动车行业的快速发展,机动车保有量持续增加,这不仅给人们的生活带来了极大的便利,但同时也造成了交通出行安全隐患。交叉口是事故频发点,易发生车辆间或与行人、自行车、摩托车、障碍物间的碰撞。因此,交叉口事故成因以及事故严重程度是重要的研究方向。
目前,国内外学者已对不同情况下的交通事故及严重程度进行了深入研究。文献 [1] 提出了基于混合有序Logit模型,利用一系列阈值将事故严重性划分为多个级别。结果显示,采取教育、执法等方式可降低驾驶员在道路上的激进行为。文献 [2] 将非致命和致命视为二进制变量,构造了一个二进制逻辑回归模型,描述了影响交叉路口事故严重性的若干因素,如年龄、性别、速度、交通管制类型、事故发生时间、撞车类型和安全带的使用情况等。文献 [3] 利用多项式Logit模型来研究影响摩托车事故严重性的因素,这些因素包括摩托车司机的特征、道路几何形状和环境因素等。文献 [4] 利用多项式Logit模型,将严重程度分为轻度、重度及死亡事故三类,总结出车辆属性、驾驶员特征、道路条件及环境等19个与事故相关的影响因素,研究结果有助于交通管理者采取合适的策略降低交叉口单车事故严重程度。
有序Probit模型也常用于事故严重性研究。文献 [5] 分别采用了有序Logit模型和有序Probit模型对美国北卡罗来纳州的385个事故数据进行分析,因素变量中,安全带、路面状况、道路几何形状和路面类型对事故严重性有着显著影响。文中表明,有序Logit模型和有序Probit模型均适用于研究事故严重程度。文献 [6] 基于有序Probit模型分析了影响追尾事故严重性的因素,显著性检验结果显示有序Probit模型对于该类研究具有明显作用。文献 [7] 利用了有序Probit模型,将道路情况、天气状况等因素视为变量,来预测特定事故的严重程度。研究表明系好安全带可以降低高速公路交通事故严重程度。文献 [8] 比较了Logit和Probit模型的性能指标后,最终选定了Probit模型来分析货车事故严重程度的影响因素,模型研究结果表明,涉及重型车辆的事故会加重严重程度。
根据目前的研究,影响事故严重程度的主要因素主要包含:车辆类型、交叉路口配置、驾驶员以及环境因素 [9]。未系安全带是公认的事故主要因素之一。文献 [10] 发现事故严重程度与安全带使用之间存在正相关关系。此外,乘客的位置也很重要,左后座是最危险的位置。文献 [11] 发现系安全带可让事故严重程度和死亡人数分别降低15%和15.6%。在文献 [12] 的研究中,发现前部安全气囊或两侧安全气囊的展开能使受伤的可能性分别降低7.84%和9.03%。年轻的驾驶员更可能表现出驾驶激进行为,会增加事故发生的可能性。此外,酒驾、毒品会影响车祸致死率 [13]。道路设计和交通状况对事故严重程度也有较明显的影响。
尽管人们已经对事故严重程度研究进行了大量工作,但仍然存在局限性。引发事故的原因各异,影响单车事故的因素与多车事故也有所不同。本文基于前者的研究基础,利用有序Probit模型对美国佛罗里达的交叉路口事故数据进行了分析,考虑了事故类型、驾驶员特征、交叉路口设置和环境等42个潜在的影响因素,分析了各自的影响程度,意在找到影响交叉口事故严重程度的因素,以减少事故的发生率和严重程度。
2. 数据描述
事故数据来源于美国佛罗里达交通运输部(FDOT)事故数据库,事故点为交叉路口。事故类型、驾驶员、车辆类型和交通状况都能在该数据库中获取。共有35个变量和91,398条事故记录。其中,单车事故为7996,两辆车或以上的事故有76,247起,本研究仅涉及7996条单车事故数据。
本文将事故严重程度(Injury Severity)分为四个级别:无伤害、轻度伤害、中度伤害和重度伤害。“无伤害”表示事故中无任何人伤害;“轻度伤害”表示没有明显的受伤迹象,但伤者可能表示疼痛;“中度伤害”表示事故造成了明显的外在伤害,例如瘀伤,擦伤等;“重度伤害”是指事故后导致30天内人员死亡。
表1显示了此数据库中每种事故严重程度的百分比。在此预测模型中,事故严重程度视为响应变量,定义如下:
事故严重程度 = 0,无伤害;
事故严重程度 = 1,轻度伤害;
事故严重程度 = 2,中度伤害;
事故严重程度 = 3,重度伤害。

Table 1. Data description of injury severity
表1. 事故严重程度数据描述
因素变量可以分为五类:事故类型、驾驶员、车辆、交叉口配置、环境条件。其中7:00~10:00和16:00~19:00为高峰期。如果事故发生在小于2500平方英里的地方视为市区,而超过2500的视为郊区。路面状况分为干燥和湿润,天气和光照条件只分为好与坏。地点分为住宅区和商业区。路肩类型包括已铺砌和未铺砌。道路分为直线级、直线上坡/直下坡、曲线下型和曲线上坡/下坡。年龄小于20岁的视为青年驾驶员,成年驾驶员为20至60岁,超过60岁的视为老年驾驶员。只要涉及酒驾或者毒品或同时涉及的驾驶员均被视为酒驾/涉毒。低速定义为小于20 mph,中速为20 mph至45 mph,高于45 mph则为高速。安全带的使用情况为使用和未使用。
综合以上因素,可生成42个变量,以反映它们对事故严重程度的影响。表2显示了此模型中选择的所有变量。粗体变量表示该变量在其类别中用作参考变量。
从表2中可知,“行驶中的汽车撞到其他目标(MV-Hit)”是最频繁发生的事故类型,占所有类型的39%。男性驾驶员(65.2%)多于女性驾驶员(34.8%)。76.8%的驾驶员不酒驾或涉毒,而73.2%的驾驶员不系安全带。82.6%的人选择以35 mph的中速行驶。在这项研究中,对信号灯交叉口、停车标志交叉口和无交通控制交叉口的事故都进行了调查。不同的交叉路口类型可能会影响驾驶员的驾驶行为。路面、天气和照明视为事故发生的环境。63%的事故发生在市区,37%来自郊区。
从数据库中提取的7996个事故数据中,经过数据清理后,保留了5665个事故数据,以用于模型构建和验证。
3. 模型描述
假设
为连续的潜在变量,令
索引函数,其中β是一组系数,x是表2中变量集。
表示观测到的影响因素变量,而
是随机误差,表示未观察到的因素。
根据假设,事故严重程度的离散观测值可以表示为
。其中
的值可依据以下规则确定:
,当
,当
,当
,当
其中
是阈值集合。每个阈值对应一类事故严重程度。当误差项
服从标准正态分布时,该模型即为有序Probit模型,并且任意一种严重程度的概率是两个阈值的正态累积分布函数之差:
其中
为正态分布概率密度函数。
4. 模型结果
该模型包含五类变量:事故类型、驾驶员、车辆、交叉口配置和环境条件。有序Probit模型的最终结果以90%的置信度显示其统计意义。表3中显示了解释变量对应的系数值和t值。变量的系数反映了其对事故严重程度的影响。正系数表示此变量与事故严重程度正相关,负系数则相反。
该模型包含五类变量:事故类型,驾驶员,车辆,交叉口配置和环境条件。有序Probit模型的最终结果以90%的置信度显示其统计意义。
表3中显示了解释变量对应的系数值和t值。变量的系数反映了其对事故严重程度的影响。正系数表示此变量与事故严重程度正相关,负系数则相反。
4.1. 事故类型
在“事故类型”组中,影响因素包括:高峰期、碰撞类型、工作日/周末和是否冲出道路。参考变量为“行人”,和“工作日”。
结果表明,“与行人碰撞”和“与自行车碰撞”对事故严重程度的影响相同。“冲出车道”、“与

Table 2. Selected variables for single-vehicle crash
表2. 事故严重程度影响因素(变量)

Table 3. Results of explanatory variables
表3. 解释变量结果
行驶中的车辆碰撞”、“与固定物体碰撞”、“翻车”和“其他”会导致较低的严重程度。“乘客被抛出”是所有类型中影响最大的,因为只有非常严重的事故才有可能导致驾驶员或者乘客被抛出车外。“道路是否关闭”变量为正系数0.210,因此在关闭的道路上行驶,更可能造成更严重的交通事故。根据表2,事故是否在发生在高峰时段对严重程度无影响,从表1中可知,大部分(66.8%)的事故发生在非高峰期。变量“工作日”、“周末”也是如此,事故发生在哪一天不会影响事故严重程度,在其他因素相同的情况下,无论事故是发生在工作日还是周末,严重程度是相同的。
因此,交叉路口单车事故的发生时间不会影响其事故严重程度。在“事故类型”变量中,碰撞类型与事故严重程度息息相关。
4.2. 驾驶员
驾驶员的年龄、性别、酒驾/毒品和安全带是驾驶员特征组中考虑的因素。本研究将“青年”视为参考变量。
从表3中可以看出,在三个年龄段中,老年驾驶员会引发更严重的事故,而成年人和青年驾驶员对事故的影响相同。这是因为老年的视力和反应能力较差,易看不清交通标志,应急能力相对迟缓。“性别”的系数为−0.102,可知女性更可能导致严重的事故。与男性驾驶员相比,女性更为脆弱,驾驶反应相对慢。酒精和毒品会对驾驶员产生负面影响,酗酒或吸毒会让驾驶员变得激进,影响他们的注意力,从而严重地影响反应能力。“安全带”系数为−0.170,即使用安全带会降低事故的严重程度,这与以前的研究一致。数据显示仍然有26.8%的驾驶员不使用安全带。
根据以上信息,禁止酒驾和涉毒、佩戴安全带可降低事故严重程度。
4.3. 车辆
本组主要考虑车辆类型和行驶速度这两个因素。低速视为参考变量。文献 [1] 表明,与客车相比,货车(重型车辆)会导致更多的交通事故。但是,从本研究结果可知,重型车辆的事故严重程度低于客车。也就是说,发生事故的可能性与事故严重程度不同,影响因素自然也不同。虽然重型车辆更容易发生事故,但重型车辆的事故严重程度低于客车。这是因为重型车辆比普通车辆更坚固。速度越高,越可能发生严重事故,因此限速可降低事故严重程度。
4.4. 交叉口配置
在“交叉口配置”组中,影响因素包含:交叉口交通控制类型(信号灯控制,停止标志控制,无控制,其他控制),路肩类型(铺砌、未铺砌、城市道路路肩),道路特征和路面状况。其中信号灯控制,铺砌的路肩和直线型道路均用作参考变量。
在所有的交叉口交通控制类型中,信号灯控制路口会发生更严重的事故,而有停车标志的路口事故严重程度最低。通常,有信号灯控制的交叉路口路况更为复杂,而在有停车标志的路口,各方向的车辆需低速行驶,自然会降低交通事故的严重性。
未铺砌的路肩更可能发生严重的事故。一般情况下,有路肩的路要更安全。但在城市道路上,有路肩的道路可能会发生更严重的事故。路肩可帮助驾驶员识别道路状况,从而减少撞车事故的发生,但是当汽车驶出车道,冲向路肩,由于路肩上可能有行人和自行车,因此事故可能更为严重。道路弯曲程度会影响事故严重程度。数据显示,在弯曲道路的上/下坡度行驶不具有明显的影响,可能是此类事故样本数量不足,未反应其影响。
交叉路口配置方面的因素差异较大,改善交通道路的几何条件是提高安全性水平的重要途径。
4.5. 环境条件
本组包含四个变量:天气、光线、城/郊区和位置类型。商业区用作“位置类型”中的参考变量。郊区十字路口的事故比城市的更为严重。车辆在郊区的行驶速度比在市区的快,速度越快,可能导致更严重的事故。本研究结果显示天气和光线的影响不明显,无论天气或光线条件是否良好,事故严重程度都无差异。通常认为,恶劣的天气或光线会影响驾驶员的视野,并增加事故的可能性和严重性。可是当环境条件非常适合驾驶时,驾驶员会更放松和懈怠,可能会超速行驶,此时可能发生更为严重的交通事故。但当环境不是很舒适,人们会更谨慎行驶,以免发生事故。因此在某种程度上表明天气和光线并不影响事故严重程度。此外,事故发生的位置不会影响严重性。发生在商业区、居民区或郊区的事故,具有相同的严重性值。
因此,从环境状况方向考虑,主要因素是事故发生在郊区还是城区,其他环境因素对单车交叉路口事故严重程度无影响。
5. 模型验证
提取FDOT数据集中的20%数据并将其用于模型验证。表4和表5给出了观测数据与利用有序Probit模型预测结果的对比。事故严重程度的阈值计算结果如下:
,当
,
,当
,
,当
,
,当
。

Table 4. Aggregate model validation results
表4. 整体验证结果

Table 5. Disaggregate model validation results
表5. 个体验证结果
5.1. 整体验证结果
观测组中,事故严重程度的平均值为0.889,方差为0.856。预测组中的事故严重程度平均值为0.819,方差为0.758。表4为观测组和验证组的数据对比。对统计数据进行“z检验”以验证有序Probit模型是否有效。
z检验的零假设(H0)为:有序Probit模型的预测结果与实际观察到的结果在统计学上没有差异。
是观测组和预测组的事故严重程度均值,
为各自的方差,
是各自的样本数。根据z值计算,它不能拒绝零假设,也就是说,严重程度的预测值在统计上与95%置信度下的严重程度观测值相同,因此模型能够用于预测事故伤害的严重程度。
5.2. 个体验证结果
本节对每个样本的观测值和预测进行了比较,统计了它们之间的差异值(观测值 − 预测组),来验证模型的准确性和适用性。差异值为0表示观察值和预测值是一致的。表5提供了这两者之间的比较。
在预测组的1119个事故数据中,有49.8%的观测值与预测值相同,约84.6%的预测值与观测值相差一个级别以内,因此大多数预计结果在可接受的误差内。
结果表明,差异值为“1”的样本数比差异值为“−1”的多,同样的趋势也发生在“2”和“−2”这对上。此外,存在差异值为“3”的情况,而“−3”不存在,可能是因为发生重度交通事故的数据量不足。因此,在某些情况下,预测的事故严重程度比实际的要低。也就是说,该模型可能会在某种程度上低估了事故严重程度。
6. 结论
本文分析了五组可能影响交叉口单车事故的严重程度的因素,包括事故类型、驾驶员、车辆、交叉配置和环境条件,共42个自变量。事故严重程度分为无伤害、低级、中级和高级。随后建立有序Probit模型来反映事故严重程度与几个决定因素的关系。结果表明该模型能够预测事故严重程度,并解释了每个影响因素对事故严重程度的影响。研究表明,与安全特征相关的变量,如事故类型,驾驶员的年龄、性别、酒驾/毒品、是否系安全带、车辆速度、是否为重型车辆、交叉口配置情况、车速等均显示出它们对事故严重程度的影响。
在模型验证中使用了1119个事故数据来测试该模型的预测能力。通过验证可知,有序Proit模型显示出良好的适用性。在总体验证中,z检验表明在95%的置信度下,平均预测值和观测值在统计学上是相同的。在个体验证中,将每个样本的观测值与预测值比较,84.6%的预测结果与观测值相同或差一个级别的严重程度。因此本研究中建立的模型对交叉路口单车事故是可以接受的。
NOTES
*通讯作者。