融合事故类型与频次的高速公路交通风险评估方法研究
Research on Highway Traffic Risk Assessment Method Integrating Accident Types and Frequencies
DOI: 10.12677/ojtt.2026.152022, PDF, HTML, XML,    科研立项经费支持
作者: 崔 建, 孙砚涛, 李 璇, 白雪倩:山东高速股份有限公司,山东 济南;刘 凯*, 孟依冉:山东交通学院交通与物流工程学院,山东 济南
关键词: 交通安全高速公路风险评估熵权法K-Means聚类Traffic Safety Expressway Risk Assessment Entropy Weight Method K-Means Clustering
摘要: 为评估高速公路交通事故风险特征,本研究提出一种融合事故类型风险程度与频次的风险评估方法,并以某省事故数据为例分析其时空特征。首先,构建涵盖事故清障时间、清障类型、车辆数目以及类型的评估指标体系,采用熵权法确定不同事故类型(如侧翻、追尾等)的风险系数;其次,以单位路段或时间长度为基准,基于不同交通事故类型风险系数和频次,采用线性加权方法确定综合风险值;最后,采用K-means聚类方法划分风险等级,探究时空分布规律。结果表明,侧翻事故的风险最高(0.735),追尾(0.657)和自燃事故(0.540)次之;空间上,弯道中高风险比例高于直道,坡度越大高风险占比越低;时间上,白天的交通事故风险高于夜间和凌晨。该研究方法以易获取的事故处理和车辆数据为基础,为高速公路运营部门提供了一种高效可行的风险识别工具,有助于提升交通安全管理决策水平。
Abstract: To assess the risk characteristics of expressway traffic accidents, this study proposes a risk assessment method that integrates the risk degree and frequency of accident types, and takes the accident data of a certain province as an example to analyze its spatio-temporal characteristics. Firstly, an evaluation index system covering accident clearance time, clearance type, number of vehicles and types is constructed. The entropy weight method is adopted to determine the risk coefficients of different accident types (such as rollover, rear-end collision, etc.). Secondly, taking the unit road section or time length as the benchmark, based on the risk coefficients and frequencies of different types of traffic accidents, the comprehensive risk value is determined by using the linear weighting method. Finally, the K-means clustering method is adopted to classify the risk levels and explore the spatio-temporal distribution patterns. The results show that the risk of rollover accidents is the highest (0.735), followed by rear-end collisions (0.657) and spontaneous combustion accidents (0.540). Spatially, the proportion of high-risk sections in curves is higher than that in straight sections, and the greater the slope, the lower the proportion of high-risk sections. In terms of time, the risk of traffic accidents during the day is higher than that at night and in the early hours of the morning. This research method, based on easily accessible accident handling and vehicle data, provides an efficient and feasible risk identification tool for highway operation departments, which is conducive to improving the decision-making level of traffic safety management.
文章引用:崔建, 孙砚涛, 李璇, 白雪倩, 刘凯, 孟依冉. 融合事故类型与频次的高速公路交通风险评估方法研究[J]. 交通技术, 2026, 15(2): 239-247. https://doi.org/10.12677/ojtt.2026.152022

1. 引言

高速公路作为交通系统的重要组成部分,在提供高效出行服务的同时,也面临着突出的交通安全挑战。由于其运行速度高、交通流量大、通行环境相对封闭,一旦发生交通事故,极易引发大规模交通拥堵乃至二次事故,导致通行效率急剧下降与安全形势迅速恶化。因此,高速公路交通风险评估一直是国内外学者关注的一个重要主题,旨在精准识别事故风险时空特征,从而为构建主动、精准的高速公路交通安全防控体系提供理论与决策基础。

目前,国内外学者围绕高速公路交通风险评估开展了系列研究,相关研究可以分为两类。一类通过单维指标评估高速公路交通风险,如张长生等[1]以改进后的当量事故率为核心指标,结合质量控制法确定事故率临界上限,进而通过比较路段实际当量事故率与该临界值实现对高速公路事故风险路段划分。Golov [2]选取国际平整度指数(IRI)作为核心指标,通过构建二次函数模型量化路面粗糙程度与事故风险的关联关系,划分道路风险等级。另一类研究则侧重构建多维度交通风险评估指标体系,并通过赋权与集成计算确定综合风险值。例如,鲍彦莅[3]基于交通事故数据以及道路设计资料,构建包含核心风险因素与动态风险因子的多维指标体系,并运用层次分析法确定指标权重,进而计算交通环境风险指数实现风险的量化;Iqbal [4]采用事故点权重法对死伤人数及仅财产损失事故数赋予差异化权重,通过计算事故点权重值,量化路段事故综合严重程度;赵敏[5]基于高速公路实地调研数据,以及路段路域环境和交通管理等基础数据,从人、车、路环境和交通安全管理四个维度构建风险评估指标体系,通过判断矩阵计算权重并识别关键风险因素;贾洪飞等人[6]基于高速公路实地调查数据,从道路线性和驾驶行为等方面选取6项指标构建风险评估指标体系,并通过超标率法将指标实测值与临界值均值比值归一化,进而结合模糊综合评判法计算综合风险评价值以划分安全等级;杨妮[7]通过加权整合死亡、受伤人数及事故频次确定事故当量指标,并利用Relim算法挖掘历史事故频繁项集以识别高风险路段;Wang等[8]基于GIS标准化事故次数,结合HDBSCAN密度聚类算法提取的事故空间集中度,构建量化指标体系,实现对风险等级的划分。综上所述,学者们围绕交通风险评估已开展较为丰富的研究,为交通风险辨识奠定了坚实的基础。然而,现有风险评估指标体系多集中于事故频次、伤亡和损失等因素,虽然这些是衡量交通风险的关键指标,但事故伤亡与损失数据通常需要跨部门协作,存在获取成本高、时效性差的问题,不利于高速公路运营部门对道路风险进行及时评估;此外,现有综合风险评估未充分考虑不同类型事故对风险的影响差异。值得注意的是,国外研究表明,事故处理过程及涉事车辆相关指标对其严重程度具有重要影响价值[9]-[13],基于此,本研究拟构建以事故处理和车辆相关指标为驱动的风险评估指标,进而探究融合事故频次与不同类型事故风险系数的高速公路交通风险评估方法,旨在为高速公路运营部门提供一种数据易获取、操作性强的风险评估工具,从而为其的安全管理与决策提供理论支持。

2. 研究思路

本研究首先基于国内外相关研究[9]-[13] [14]-[16]构建涵盖事故清障时间、清障类型、车辆数目及类型的高速公路交通事故风险评估指标体系,并采用熵权法确定不同类型事故的风险系数;其次,以单位路段(10 km)或时段(1 h)为评估单元,结合不同类型事故风险系数与发生频率,通过线性加权计算各路段或时段的综合风险值;最后,运用K-means聚类分析方法将综合风险值划分为不同等级,进而探究高速公路交通风险时空特征,最终实现对高速公路交通事故风险的精准识别,研究思路图如图1所示。

Figure 1. Research idea design drawing

1. 研究思路设计图

3. 研究方法

3.1. 熵权法

熵权法是基于信息熵的客观赋权方法。与传统主观赋权方法相比,熵权法可基于数据离散程度客观赋权,既可避免人为干扰、贴合实际情形,又具有计算简洁、结果易解释等优势[17]。为了更科学地量化不同类型交通事故的风险水平,本研究基于构建的高速公路交通事故风险评估指标体系,引入熵权法,以确定不同事故类型(如追尾、撞护栏)的风险系数。具体计算步骤如下:

第1步:交通事故风险评估指标数据标准化处理:

设事故类型数量为n,指标数为m,原始指标矩阵为 x= ( x ij ) n×m ,对正向指标采用极差标准化,

x ij = x ij min( x i ) max( x i )min( x i ) (1)

式中: i=1,2,,7 j=1,2,,m x ij 为第i类事故第j个指标的原始值。

第2步:交通事故风险评估指标比重计算:

p ij = x ij i=1 m x ij (2)

式中:m为指标总数。

第3步:交通事故风险指标熵值计算:

e j = 1 lnm i=1 m p ij ln p ij (3)

式中:若 p ij =0 ,令 p ij ln p ij =0

第4步:交通事故风险指标权重计算:

ω j = 1 e j j=1 m ( 1 e j ) (4)

式中:m为指标总数, ω j 为第j个指标的权重。

第5步:不同事故类型风险系数计算:

S i = j=1 m ω j × Z ij (5)

式中: s i 为第i类事故类型的风险系数, ω j 为第j个指标的权重, z ij 为第i类事故类型在第j个指标上的标准化得分。

3.2. 线性加权法

为实现高速公路交通事故风险的综合评定,本研究基于不同类型事故的风险系数和发生频率,以单位路段长度(10 km)或时段长度(1 h)为单元,采用线性加权法计算各单元的交通事故综合风险值。线性加权计算公式如式6所示:

R= i=1 n ( S i × f i ) (6)

式中:R为路段/时段单元的综合风险值;n为事故类型总数; s i 为第i类事故类型的风险系数, f i 为路段/时段单元内第i类事故的发生频次。

3.3. K-means聚类

K-means聚类是James MacQueen (1967)提出的经典无监督算法[18],核心原理为以欧氏距离判定数据相似度,通过初始质心迭代将数据聚为指定类别,该方法具有计算高效、聚类快速,且算力要求低等优势。本研究采用K-means聚类将所有路段/时段的交通事故综合风险值划分为不同等级,实现对风险路段和时段的精准辨识。K-means聚类的计算方法如下:

d= k=1 N ( b k a k ) 2 (7)

式中:d为路段/时段单元数据到聚类中心的欧氏距离,N为数据集合中路段/时段单元的数量, b k 为第k个路段/时段的交通事故风险值, a k 为第k个聚类中心的特征值。

4. 案例分析

4.1. 数据来源与预处理

4.1.1. 数据来源

本研究数据集源于2024年1~5月某省高速公路事故处理记录,覆盖19条主要高速公路,原始数据包含案件编号、智慧大脑id、案件描述等25项字段,完整记录事故发生与处置等信息。

4.1.2. 数据预处理

为保障数据质量与后续分析的可靠性,对原始数据集进行了系统的预处理。首先,剔除“智慧大脑id”“事故类型”等关键字段存在缺失的无效样本;随后,对分类字段进行标准化处理,确保其取值的一致性与可比性;最终获得1857条有效样本,作为后续研究分析的基础数据。

4.2. 高速公路不同类型交通事故风险程度量化

为了便于运管部门评估高速公路交通事故风险等级,本研究基于国内外相关研究[9] [10] [14]-[16],提取与事故处理过程和涉事车辆有关的交通风险评估指标,包括清障时间、清障类型、车辆数量、车辆类型,这些指标数据较伤亡和财产损失数据等,具有便于获取等优势。针对构建的高速公路事故风险评估指标体系,本研究采用熵权法确定不同指标的影响权重以及不同类型事故的交通风险系数,结果分别如表1表2所示。

表1结果显示,事故车辆类型的权重占比最高,达到37.97%,表明是影响交通事故风险评估的首要指标;清障时间和车辆数量权重占比接近,分别为24.48%和24.41%,均为重要影响指标;清障类型权重占比相对较低,为13.13%。表2结果表明,侧翻事故的风险系数最高(0.734),已有研究[16] [19]也表明侧翻事故是严重程度极高的事故类型;其次是追尾事故(0.658),这可能与高速公路追尾事故具有高发性、高关联风险有关[20]。自燃、货物洒落、撞护栏、车辆故障、撞障碍物的风险系数依次降低,其中撞障碍物事故风险权重最低。

4.3. 高速公路交通事故风险空间特征分析

根据已有研究[21],本文以10公里为单位长度,基于不同类型事故的风险系数和发生频率计算不同路段的交通事故综合风险值,并运用K-means聚类算法将综合风险值划分为高、中、低三个不同等级,结果如表3所示。结果表明,样本数据共有2个高风险路段,72个中风险路段,其余为低风险路段。

Table 1. The calculation results of the weight of traffic accident risk assessment indicators

1. 交通事故风险评估指标权重计算结果

指标名称

指标熵值( e j )

信息效用值( 1 e j )

权重( ω j )

清障时长

0.892

0.107

0.244

清障类型

0.942

0.057

0.131

车辆数量

0.893

0.106

0.244

车辆类型

0.833

0.166

0.379

Table 2. Risk coefficients for different types of traffic accidents

2. 不同类型交通事故风险系数

事故类型

侧翻

车辆故障

货物洒落

撞护栏

撞障碍物

追尾

自燃

风险系数

0.738

0.238

0.461

0.254

0.183

0.657

0.540

Table 3. Cluster analysis results of all road sections

3. 所有路段聚类分析结果

聚类类别

加权风险值(聚类中心)

个案数(单元数量)

风险等级

聚类1

1.400

299

低风险

聚类2

5.655

72

中风险

聚类3

20.760

2

高风险

为进一步识别不同道路空间高速公路的交通风险特征,本研究分析了平直和弯曲两种道路线形以及平坡、缓坡和陡坡三种坡道条件下的的不同类型风险路段的占比,结果如图2所示。从道路线形来看,平直道路的中高风险路段占比为56.81%,而弯曲路段对应的占比为60.86%,这一结果与预期一致,弯曲路段更容易发生事故,但同时也反映了平直路段的交通风险也不容忽视,这可能与平直路段车速离散性大、易因单调而引发分心和视距良好而产生超预期冲突等因素有关。从坡度来看,高风险路段占比随坡度增大而显著降低,平坡、缓坡与陡坡段分别为7.84%、6.56%与0.19%。这一现象可能源于:陡坡路段风险较高,通常实施了严格的工程管控措施(如设置避险车道、强化防护设施),从而有效抑制了事故严重程度,而平缓路段因风险隐蔽性强,易诱发驾驶疏忽,故高风险路段占比较高。

Figure 2. A layout map showing the proportion of road features and accident risk levels

2. 道路特征与事故风险等级占比分布图

4.4. 高速公路交通风险时间特征分析

为了探究高速公路交通事故风险随时间的演化趋势,本文以1 h为单位长度,基于不同类型事故的风险系数和发生频率计算不同时段的交通事故综合风险值,并运用K-means聚类算法进行风险等级划分,结果如图3所示。高风险时段包含5个,分别为9~11时、15~16时,综合风险值突破60,其中15时综合风险值达到顶峰,该时段成为高速公路事故风险最高的时段。中风险时段包括10个,分别为7~8时、12~14时、17~20时及23时,综合风险值介于30~55之间。低风险时段主要集中在0~6时及21~22时,聚类中心加权风险值为19.888。总体来看,高速公路白天的交通事故风险高于夜间和凌晨,这主要与白天交通流量高有关,研究结果与认知一致,也证实了提出的高速公路交通事故风险评估方法的合理性。

Figure 3. Comprehensive risk value and risk level distribution map of time units

3. 时间单元综合风险值与风险等级分布图

5. 总结

研究首先构建了涵盖事故清障时间、清障类型、涉及车辆数目及类型的高速公路交通风险评估指标体系,采用熵权法确定侧翻、追尾等不同事故类型的风险系数;其次,基于不同类型交通事故的风险程度和发生频率,采用线性加权方法确定高速公路各路段或时段交通事故综合风险值;最后,运用K-means聚类分析划分交通风险等级,进而探究不同空间(道路线形和坡道类型)和时间条件下高速公路交通风险特征。研究结果表明,侧翻事故风险系数最高(0.735),追尾(0.657)与自燃事故(0.540)次之。从空间来看,弯曲道路的中高风险路段占比显著高于平直道路,高风险路段占比随道路坡度增大而显著降低;从时间来看,高速公路白天的交通事故风险高于夜间和凌晨,特别是在9~11时和15~16时。上述结果表明,高速公路交通管控应考虑不同类型事故的风险差异,针对高风险系数的侧翻、追尾及自燃事故,应加强对车辆装载合规性检查、利用车路协同技术对车间距实施动态管控以及强化对在役车辆的维保监督等。对于弯曲道路,应增设警示标识与车速监测设施,陡坡路段则需完善避险车道的配置与预警装置。在事故高发时段,可采用空地协同技术对高速公路进行巡检,实现对危险路段的全域感知,提高对交通事故的响应处置能力,提升道路通行效率。本研究提出的融合事故类型与频次的高速公路交通风险评估方法,为高速公路交通风险评估提供了一种新的思路。然而,受限于数据,本研究尚未探究路段单元间交通量的差异以及不同线形道路单位里程的综合风险值,也未验证“清障时间/类型”与真实伤亡或损失数据的关系以及所提方法在不同季节和月份的稳定性,未来在数据允许的条件下,将会进一步验证所提风险评估方法的有效性和普适性。

基金项目

山东省交通运输厅:2024B43-02,基于精准营销的智慧高速会员信用评价体系构建关键技术研究及应用;山东高速股份有限公司:SDGS-2024-0524,基于精准营销的智慧高速会员信用评价体系构建关键技术研究及应用。

NOTES

*通讯作者。

参考文献

[1] 张长生, 马荣国. 山区高速公路交通事故分析及多发路段鉴别[J]. 长安大学学报(自然科学版), 2010, 30(6): 76-80.
[2] Golov, E., Evtyukov, S., Protsuto, M., Evtyukov, S. and Sorokina, E. (2022) Influence of the Road Surface Roughness (According to the International Roughness Index) on Road Safety. Transportation Research Procedia, 63, 999-1006. [Google Scholar] [CrossRef
[3] 鲍彦莅. 基于交通环境的车辆风险分析及在途车速预警研究[D]: [硕士学位论文]. 昆明: 昆明理工大学, 2019.
[4] Iqbal, A., Rehman, Z.U., Ali, S., Ullah, K. and Ghani, U. (2020) Road Traffic Accident Analysis and Identification of Black Spot Locations on Highway. Civil Engineering Journal, 6, 2448-2456. [Google Scholar] [CrossRef
[5] 赵敏. 高速公路长大纵坡路段交通安全风险评估与分析[J]. 山西交通科技, 2023(1): 107-110.
[6] 贾洪飞, 桑珩, 杨丽丽, 等. 新建高速公路潜在事故风险点(段)识别方法[J]. 北京工业大学学报, 2016, 42(8): 1233-1238.
[7] 杨妮. 基于多源数据的高速公路路段风险判别[D]: [硕士学位论文]. 昆明: 昆明理工大学, 2023.
[8] Wang, D., Huang, Y. and Cai, Z. (2023) A Two-Phase Clustering Approach for Traffic Accident Black Spots Identification: Integrated Gis-Based Processing and HDBSCAN Model. International Journal of Injury Control and Safety Promotion, 30, 270-281. [Google Scholar] [CrossRef] [PubMed]
[9] Rahman, M.A., Moomen, M., Khan, W.A. and Codjoe, J. (2024) An Analysis of the Impact of Injury Severity on Incident Clearance Time on Urban Interstates Using a Bivariate Random-Parameter Probit Model. Stats, 7, 863-874. [Google Scholar] [CrossRef
[10] Li, R., Pereira, F.C. and Ben-Akiva, M.E. (2015) Competing Risks Mixture Model for Traffic Incident Duration Prediction. Accident Analysis & Prevention, 75, 192-201. [Google Scholar] [CrossRef] [PubMed]
[11] Jeon, H., Kim, J., Moon, Y. and Park, J. (2021) Factors Affecting Injury Severity and the Number of Vehicles Involved in a Freeway Traffic Accident: Investigating Their Heterogeneous Effects by Facility Type Using a Latent Class Approach. International Journal of Injury Control and Safety Promotion, 28, 521-530. [Google Scholar] [CrossRef] [PubMed]
[12] Drakopoulos, A., Shrestha, M. and Örnek, E. (2001) Freeway Crash Timeline Characteristics and Uses. Transportation Research Record: Journal of the Transportation Research Board, 1748, 132-143. [Google Scholar] [CrossRef
[13] Lee, S., Park, J. and Abdel-Aty, M. (2024) Hazards-based Duration Time Model with Priorities Considering Unobserved Heterogeneity Using Real-Time Traffic and Weather Big Data. Transportation Research Record: Journal of the Transportation Research Board, 2679, 1695-1707. [Google Scholar] [CrossRef
[14] 戢晓峰, 吴亚欣, 袁华智, 等. 二级公路交通流特征对事故严重程度的影响[J]. 中国公路学报, 2020, 33(2): 135-145.
[15] 戴学臻, 胡传喜, 陈茜, 等. 涉事车辆分类的高速公路重特大交通事故成因与严重程度研究[J]. 安全与环境学报, 2022, 22(5): 2583-2591.
[16] 温惠英, 马肇良, 赵胜, 等. 山区高速公路货车事故影响因素分析[J]. 华南理工大学学报(自然科学版), 2025, 53(7): 93-103.
[17] 乔建刚, 柯秋雨. 基于灰色关联分析和熵权法的山区干线公路事故影响因素研究[J]. 河北工业大学学报, 2020, 49(3): 81-85.
[18] McQueen, J.B. (1967) Some Methods of Classification and Analysis of Multivariate Observations. In: Cam, L.L. and Neyman, J., Eds., Proceedings of the Fifth Berkeley Symposium on Mathematical Statistics and Probability, The University of California Press, 281-297.
[19] 孙翠羽, 董倩, 王益文, 等. 基于机器学习的翻车事故严重程度分析方法[J]. 交通工程, 2024, 24(11): 68-77.
[20] 李子辉. 基于数据驱动的高速公路交通安全风险识别与预测研究[D]: [硕士学位论文]. 济南: 山东建筑大学, 2023.
[21] 董春娇, 许博, 李鹏辉, 等. 轨迹数据驱动的高速公路事故风险研判[J]. 北京交通大学学报, 2024, 48(6): 12-21.