基于贝叶斯网络的高处坠落事故致因分析
Cause Analysis of Falling Accident Based on Bayesian Network
DOI: 10.12677/mos.2025.142193, PDF, HTML, XML,   
作者: 吴小钧:上海理工大学管理学院,上海
关键词: 高处坠落事故贝叶斯网络关联规则Falling Accident Bayesian Network Association Rule
摘要: 随着中国经济的迅猛发展,建筑行业内的新技术和新工艺同样迅速进步,导致施工挑战性日益提升,安全生产问题频发,并且高处坠落事故是建筑业中最高发的事故。本文以1267起建筑高处坠落事故调查报告为分析对象,基于HFACS理论和TF-IDF算法,整理归纳出导致高处坠落事故的4个层次原因、15个致因因素,构建建筑高处坠落事故致因体系。然后基于apriori算法计算关联规则,得到各致因因素间的关联关系及其强度。最后,利用关联关系进一步建立贝叶斯网络模型,并利用逆向推理、致因的敏感性分析明确引起高处坠落事故的关键致因、敏感致因和一般致因,以及导致事故的最大的因素影响路径,根据模型结果提出相关的管理措施。根据研究结果可以找到高处坠落事故的源头致因,并根据致因等级可为施工单位的安全管理工作提供有效参考,做出针对性的预防措施,以防止事故的发生。
Abstract: With the rapid development of China’s economy, the construction industry is also developing rapidly, a variety of new technologies, new processes emerge in an endless stream, the construction difficulty is increasing, safety accidents occur from time to time, and height fall accident is the highest occurrence of accidents in the construction industry. This paper takes 1267 investigation reports of height fall accidents as the analysis object, and based on HFACS theory and TF-IDF algorithm, summarizes 4 levels of causes and 15 causes of height fall accidents, and constructs an identification index system of building collapse causes. Then, the association rules are calculated based on apriori algorithm to obtain the correlation and intensity among the factors. Finally, the Bayesian network model is further established by using correlation relationship, and the key causes, sensitive causes and common causes of height fall accidents are identified by reverse reasoning and sensitivity analysis of causes, as well as the influence path of the biggest factors leading to accidents, and relevant management measures are proposed according to the results of the model. According to the results of the study, the source causes of height fall accidents can be found, and according to the cause level, it can provide effective reference for the safety management of construction units, and make targeted preventive measures to prevent accidents.
文章引用:吴小钧. 基于贝叶斯网络的高处坠落事故致因分析[J]. 建模与仿真, 2025, 14(2): 768-777. https://doi.org/10.12677/mos.2025.142193

1. 引言

近年来,建筑业已成为我国各地推动经济增长的重要产业之一。据中国建筑业协会统计,建筑业增加值增速连续两年高于国内生产总值增速[1]。然而,随着建筑业的迅速壮大,其施工安全事故也逐渐成为阻碍行业稳步前行的重要问题。以2020年全国房屋市政工程生产安全事故类型分布情况[2]为例,高处坠落事故这一类型在所有事故中占比最高,达到59.07%,远超其他类别,是该领域内最为频发的事故类型。为了切实降低整体事故数量与伤亡程度,对高处坠落事故的深入预防与有效控制成为了至关重要的课题。

Chi等人应用故障树模型分析了411起建筑事故,发现一个事件是由多个原因导致的[3]。仇国芳等人通过ISM模型对不同层级的致因要素进行分析,得到事故发生的深层原因,并揭示了不同事故等级下人和物因素的关键性差异[4]。孙世梅等人从个人和组织两个层面分析十起典型高处坠落事故,构建了“2-4”模型[5]。李珏等人通过文本挖掘和社会网络分析方法,对中国2012至2018年的558例建筑施工高处坠落事故调查报告进行分析,提取出28项事故致因,并构建了致因网络[6]。曾凡奎等人构建DEMATEL综合影响矩阵,根据ISM方法分配各因素间的逻辑关系,分析得出引起事故发生的致灾因素为基础性因素、间接因素与直接因素,并找出了关键性直接因素[7]。何佳斌等人通过分析2010—2020年间611起高处坠落事故报告,基于N-K模型计算耦合交互信息值,采用模糊DEMATEL计算各风险因素的中心度、原因度,发现了哪些是最重要影响因素和多因素耦合作用中最重要的因素等结论[8]。成连华等人基于394起房屋建筑施工事故案例,利用Gephi软件构建网络模型,通过计算拓扑参数,结合ABC分类法,识别28项关键致因因素和24个强关联节点对,为施工安全提供了管理策略[9]

现有对于高处坠落事故的研究多在造成事故的原因分析上,但是较少深入探究影响因素间的关系,发现影响高处坠落事故致因因素之间的相互作用关系,识别关键因素,对减少或避免此类事故的发生具有重要的现实意义。本文通过搜集整理官方公布的2019~2023年间1257起高处坠落事故调查报告,从数据中识别高处坠落事故致因体系,计算各致因因素之间的关联关系后构建贝叶斯网络,分析致因关键影响路径,为高处坠落事故的预防提供新思路。

2. 构建高处坠落事故致因体系

为了确保时效性,本文选择搜集2019年至2023年期间的事故调查报告,能够较为准确地反映事故发生的状况与趋势以便提炼出事故致因,同时为制定针对性强、有效的安全管理策略提供坚实依据。

本文的研究所涉及的建筑高处坠落事故调查报告及其具体内容,主要利用python的爬虫从各省市应急管理局、住房与城乡建设局等网站搜集2019年至2023年间的建筑高处坠落安全事故调查报告,经过筛选掉重复或者数据不完整的事故调查报告后,保留高处坠落事故调查报告1267份用于本文研究。

数据预处理是数据分析的第一步,包括数据清洗、格式转换等。数据清洗是预处理的重要环节,目的是去除无效或错误的数据。在本研究中,主要通过检查数据的完整性和一致性来清洗数据,用pandas库读取csv文件和Excel文件,以获取文本数据和过滤词列表。首先采用jieba库进行中文分词,并引入包含专业建筑术语的“建筑词汇大全”作为自定义词库,然后借助常见的停用词词典来辅助词语筛选。最后采取TF-IDF算法作为筛选依据,通过计算词频(TF)和逆文档(IDF)频率,选取TF-IDF高的值的单词,根据收集到的事故调查报告内容和文献研究,构建事故致因体系。

TF,即词频,是衡量一个词汇在文本中出现频率的指标。从整体来看,高频词汇相较于低频词汇,往往更能体现文本的重要性和核心意义。在实际研究中,词频的计算有数种方式,其中最简单的就是直接计数词汇出现的次数。计算方式如公式(1)所示。

TF( t,d )= n t,d t d n t d (1)

其中, n t d 是词t在文档d中出现的次数,分母是文档d中所有词的出现次数之和。

IDF即逆文档频率,是一个词在语料库中的罕见程度的度量。如果某个词在很多文档中都出现,那么它可能不太具有代表性,IDF会给它一个较低的权重。计算方式如公式(2)所示。

IDF( t,D )=log N | { dD:td } | (2)

其中N是语料库中的文档总数, | { dD:td } | 是包含词t的文档数目。

最终的TI-IDF值由TF和IDF相乘得到,计算方式如公式(3)所示。

TFIDF( T,d,D )=TF( T,d )×IDF( t,D ) (3)

Table 1. Falling accident cause system

1. 高处坠落事故致因体系

致因分类

因素提炼

不安全行为(A)

安全意识淡薄(A1)

违规违章操作(A2)

技能不足(A3)

个人防护不当(A4)

不安全行为的前提条件(B)

作业环境复杂(B1)

防护措施不足(B2)

设备安全性能不足(B3)

续表

安全监督(C)

交底不到位(C1)

施工方案不健全(C2)

安全检查不到位(C3)

现场管理漏洞(C4)

安全监管不到位(C5)

组织影响(D)

安全教育培训不到位(D1)

违法转包分包等(D2)

责任制度未落实(D3)

经过计算和排序,得出TF-IDF值极高和极低的词汇,TF-IDF值高的词大部分跟安全管理相关,比如培训、排查、分包都属于是管理的范围,而TF-IDF值低的词大部分与安全管理关系不太大,主要是建筑某部位名词如檩条、楼面等,最后选取前50个高TF-IDF值的单词,阅读事故调查报告中对于事故原因的总结,分析相关文献,提炼总结出来了15个事故致因因素,根据HFACS理论,即一种用于识别、分析和分类事故中人的因素的工具[10],分为不安全行为、不安全行为的前提条件、安全监督和组织影响四个类型,构建的高处坠落事故致因体系,如表1所示。不安全行为主要是包括一线作业人员的自身工作条件或者是设备使用情况。不安全行为的前提条件主要是包括施工环境和施工设备、工地防护措施等施工条件。安全监督主要是包括现场管理、安全检查和监督等。组织影响是指组织层面的工作或者管理不完善或者有问题等。

3. 基于关联规则的高处坠落事故贝叶斯网络模型

3.1. 事故致因的关联规则分析

建立高处坠落事故致因体系之后,基于1267份相关事故调查报告明确每起事故的致因,并将这些致因在每起事故中的出现情况整理成一个数据矩阵。在这个矩阵中,如果某一致因在某起事故中未发生,则用“F”标记;若发生,则用“T”表示。如此对数据做出标记,最后汇总的致因发生频率统计表为表2所示。

Table 2. Causative frequency statistics table

2. 致因发生频率统计表

序号

事故信息

事故致因

时间

等级

A1

A2

A3

D1

D2

D3

1

2019.4.15

一般

T

T

T

T

T

T

2

2019.10.10

一般

T

T

T

T

F

T

3

2019.10.10

一般

T

T

T

T

T

T

4

2019.10.12

一般

T

T

T

T

T

T

5

2019.10.12

一般

T

T

F

T

T

T

6

2019.10.13

一般

F

T

T

T

T

T

7

2019.10.14

一般

T

T

T

T

T

T

续表

1257

2023.9.6

一般

T

T

T

T

F

T

本文将继续以搜集到的调查报告为数据,借助Apriori算法,计算致因因素间的关联,包括因素间两两影响的方向与关系、以及对应的这种影响的可信程度,以用于后续构建网络拓扑结构。

当前,评估关联规则算法的主流方法是采纳支持度–置信度评估体系,该体系能有效剔除对数据库预测贡献较小的规则。支持度(Support)、置信度(Confident)、提升度(Lifi)计算公式如式(4)~(6)所示。

Support( AB )= Count( AB ) N (4)

Confident( AB )= Support( AB ) Support( A ) (5)

Lift( AB )= Confident( AB ) Support( B ) = P( B|A ) P( B ) (6)

本文利用以上规则和公式,进行致因与致因之间的关联规则计算。在探究分析时,适当扩大考察范围,涵盖更多潜在的事故致因和因素间的关系,更能确保全面、有效地为现实安全管理工作提供指导。因此,在设定阈值之时,最终确定最小支持度为0.10,最小置信度为0.70,最大前项数为1,设置最小提升度为1.0,利用Apriori算法进行关联规则计算共计得到138条结果,本文仅展示支持度前10的关联规则,如表3所示。

Table 3. Association rules with top 10 support degrees

3. 支持度前10的关联规则

序号

前项

后项

支持度(%)

置信度(%)

提升度

1

C4

A4

99.6054

95.4041

1.0006

2

C4

A2

99.6054

94.8494

1.0006

3

C4

D2

99.6054

93.3439

1.0014

4

C4

C1

99.6054

80.9826

1.0000

5

C4

B1

99.6054

76.7829

1.0019

6

D1

C3

99.4475

99.9206

1.0048

7

C3

D1

99.4475

99.9206

1.0048

8

C3

D3

99.4475

98.8095

1.0031

9

D1

D3

99.4475

98.7302

1.0023

10

D1

C5

99.4475

95.7143

1.0014

3.2. 构建贝叶斯网络模型

3.2.1. 构建贝叶斯网络拓扑图

本文采取数据驱动的方式,利用获得的关联规则,结合专家规则,自动学到有向贝叶斯网络。但是,关联规则的生成只是基于数据驱动的结果,需要结合文献或者是现实进行进一步的筛选,例如,规则“A3技能不足→D1安全教育培训不到位”的置信度虽高,但不符合实际发生规律,故将此规则删去,最后筛选出37条规则。本文借助GeNIe软件构建的贝叶斯网络拓扑图如图1所示。

Figure 1. Topological diagram of Bayes network caused by height fall accidents

1. 高处坠落事故致因贝叶斯网络拓扑图

3.2.2. 贝叶斯网络学习参数

在贝叶斯网络中,节点的概率分布通常是通过先验概率和条件概率来定义的。对于根节点,其概率分布即为先验概率分布;而对于非根节点,其概率分布则是通过其父节点的状态和条件概率表来确定的。通过结合先验概率、条件概率以及贝叶斯定理,贝叶斯网络可以进行有效的推理和预测[11]

先验概率是指在A发生前,对B的概率进行的判断即为B的先验概率,以 P( B ) 表示。后验概率是指在B发生后,A发生的概率被称为A相对于B的后验概率,以 P( A|B ) 表示。设AB是随机事件,且 P( B )>0 ,那么在B发生的条件下,A发生的概率被称为条件概率,可表示为P(A|B),计算公式如式(7)所示。

P( A|B )= P( A )×P( B|A ) P( B ) (7)

Figure 2. A posteriori probability diagram of the risk index system of falling accidents

2. 高处坠落风险指标体系后验概率图

利用GeNIe软件对贝叶斯网络进行参数学习,将网络中的每个节点转化为二进制形式(T代表发生/yes,F代表不发生/no)进行统计。随后,这些节点与已构建的高处坠落事故致因体系模型进行对应,确定参数学习的目标网络模型,给每个节点设定一个代号,比如A1表示“安全意识淡薄”。接着,将经过统计和标准化处理的数据与预设的贝叶斯网络模型相匹配并进行更新,得到更新后的高处坠落事故致因体系模型的后验概率分布,如图2所示。

3.2.3. 贝叶斯网络模型验证

贝叶斯网络模型的验证是指将多组已知结果的数据输入至模型中,快速计算出各影响因素节点的概率分布,进而检验模型输出结果的准确率。本文在收集到的1257份事故调查报告的基础上利用GeNIe软件对模型进行准确性验证,利用软件中的交叉验证计算模型和节点的准确度,结果发现模型的综合准确率达到86.33%,说明该模型对高处坠落事故致因的因果关系和关系的量化表述地较为正确,具有较高准确性和可靠性,可以进行下一步分析。其中节点C3 (安全检查不到位)、C4 (现场管理漏洞)、D1 (安全教育培训不到位)的准确度最高,达到了99%,节点B2 (防护措施不足)、B3 (设备安全性能不足)的准确度最低,说明其预测性能一般,可能的原因一是涉及此节点的样本量较少,二是事故致因之间复杂的关系,不可避免的导致了其准确度偏低,在今后的研究中需收集更多的数据对模型不断修正。

3.3. 关键影响路径分析

关键致因路径分析是有效的事故致因研究方法,其核心在于利用后验概率推断影响因素及其相互间的关联性,进而识别出风险因素链。这种方法旨在明确项目中的关键控制点和路径。实施关键致因路径分析时,步骤是从根节点出发,逆向追踪具有最大后验概率的父节点,以此来构建高处坠落事故的致因链。致因链分析主要刻画导致事故发生的关键影响路径。

本文采取诊断推理和支持推理来寻找关键影响路径,从最终节点“Accident”往前一步推理寻找后验概率最大的节点。首先设置最终节点“Accident”发生的概率为100%,可以求出“Accident”的后验概率如表4所示,由表可知,A4 (个人防护不当)的后验概率最大,是导致事故发生的概率最大的致因,可以推理出“A4→Accident”。

Table 4. A posteriori probability table of the “Accident” parent

4. “Accident”父节点的后验概率表

节点

A2 (违规违章操作)

A4 (个人防护不当)

B2 (交底不到位)

B3 (设备安全性能不足)

C2 (交底不到位)

概率

94.79%

95.34%

67.01%

56.51%

73.88%

把节点“A4”设成新的子节点,将其发生概率设置为100%并进行下一步的推理运算,可以求出“A4”的8个父节点的后验概率,此时C3 (安全检查不到位)的后验概率最大为99.94%,是导致节点“A4”发生的概率最大的致因,可以推理出“C3→A4→Accident”。

继续往前推理,把节点“C3”设成新的子节点,可以求出“C3”的5个父节点的后验概率,节点“D1”是发生的概率最大的致因,为99.69%,可以推理出“D1→C3→A4→Accident”,D1前面没有父节点,不再往前推理,所以得到的高处坠落事故发生的关键影响路径为“D1安全教育培训不到位→C3安全检查不到位→A4个人防护不当→高处坠落事故发生”。

3.4. 敏感性分析

敏感性分析的目标是识别那些对项目综合风险变动最为敏感的风险指标。当某一参数的微小变动能够显著影响另一指标时,即该参数的导数显著,意味着该参数的细微偏差可能导致目标后验概率出现大幅差异,这样的参数被称为敏感性因素,反之则为非敏感性因素。

后验概率T与参数p之间的关系通常可以表达为 T= ( a×p+b )/ ( c×p+d ) ,式中,abcd是四个系数,这些系数可通过GeNIe软件的灵敏度分析功能计算得出。进而,可以计算出目标节点在特定状态下后验概率T对参数p的一阶导数,以此评估参数的灵敏度。此外,通过目标值范围功能,可以展示所选目标结果的最小和最大后验概率值;而参数范围功能则能显示参数的最小和最大值,这些范围直接受参数分布的影响。

将最终的致因因素设置为target,然后对整个关联图的敏感性进行分析,将敏感度由大到小排序,找出对结果影响最为敏感的因素。本文得到的高处坠落致因因素敏感性分析如表5所示。

Table 5. Accident-induced sensitivity analysis table

5. 事故致因敏感度分析表

编号

致因因素

敏感度

A1

安全意识淡薄

0.095

A2

违规违章操作

0.024

A3

技能不足

0.015

A4

个人防护不当

0.397

B1

作业环境复杂

0.013

B2

防护措施不足

0.032

B3

设备安全性能不足

0.001

C1

交底不到位

0.002

C2

施工方案不健全

0.001

C3

安全检查不到位

0.314

C4

现场管理漏洞

0.241

C5

安全监管不到位

0.151

D1

安全教育培训不到位

0.433

D2

违法转包分包等

0.066

D3

责任制度未落实

0.033

具体来看,D1 (安全教育培训不到位)、A4 (个人防护不当)、B3 (设备安全性能不足)、C3(安全检查不到位)、C4 (现场管理漏洞)、C5 (安全监管不到位)、A1 (安全意识淡薄)处于较高风险等级,这一结论与诊断性分析和致因路径分析结果基本一致,间接验证了模型结果的吻合性。

4. 高处坠落事故预防和控制措施

4.1. 事故致因预防和控制等级划分

根据第四章节内容分析,本文将导致事故发生的致因因素定性为关键致因、敏感致因和一般致因三类。

(1) 关键致因。根据关键影响路径的计算结果,可得关键的影响因素有D1 (安全教育培训不到位)、C3 (安全检查不到位)、A4 (个人防护不当),再根据对于致因频率的统计,列出的3个致因因素都属于发生频率比较高的情况,故将D1 (安全教育培训不到位)、C3 (安全检查不到位)、A4 (个人防护不当)划分为关键致因。

(2) 敏感致因。根据敏感性分析的结果,选取中位数以上的致因因素,剔除已划分为关键致因的因素,则划分出来4个敏感致因,分别为A1 (安全意识淡薄)、C4 (现场管理漏洞)、C5 (安全监管不到位)、D2 (违法转包分包等)。

(3) 一般致因。本文将除了关键致因和敏感致因以外的致因因素划分为一般致因,则为D3 (责任制度未落实)、A2 (违规违章操作)、B1 (作业环境复杂)、B2 (防护措施不足)、B3 (设备安全性能不足)、C1 (交底不到位)、C2 (施工方案不健全)、A3 (技能不足)。其中有部分致因在收集的事故调查报告中发生的频率也较高,如D3 (责任制度未落实)、A2 (违规违章操作),也应该关注其预防和控制措施。

4.2. 预防和控制措施

为了有效预防高处坠落事故,建筑工程管理应侧重于加强安全教育培训,确保每位员工都能充分理解并遵守安全操作规程。通过定期的安全培训和考核,提高员工的安全意识和自我保护能力。同时,强化现场的安全检查制度,确保所有安全措施得到有效执行,及时发现并整改潜在的安全隐患。

在施工过程中,应优化作业环境管理,减少作业环境的复杂性,明确标识危险区域,确保作业环境的安全性。此外,完善责任制度,明确每个岗位的安全责任,确保责任到人,对违反安全规定的个人或团队进行严肃处理。

针对敏感致因,如安全监管不到位,应加强现场监管,确保安全规定得到遵守,对违规行为进行及时纠正。同时,提高设备的安全性能,使用符合安全标准的设备,并定期进行维护和检查,确保设备在最佳状态下运行。

此外,规范施工方案的制定也至关重要,应包括安全措施和应急计划,确保施工过程中的每一步都有明确的安全指导。通过这些综合性措施,可以显著降低高处坠落事故的风险,保障施工人员的安全,提升整个建筑行业的安全管理水平。

通过这些措施的实施,建筑工程管理不仅能够提升施工效率,更重要的是能够保障工人的生命安全,为建筑行业的可持续发展提供坚实基础。这些措施的执行,需要从最高管理层到现场操作人员的全面参与和支持,确保安全文化深入人心,形成全员参与的安全管理体系。

5. 结语

本文以建筑高处坠落事故调查报告为数据基础,总结出了较为主要的15个致因因素,并分为不安全行为、不安全行为的前提条件、安全监督、组织影响四类。然后运用关联规则得到建筑高处坠落事故致因致因因素间的关系,根据此结果构建贝叶斯网络拓扑结构,推断引发事故的关键影响路径为“安全教育培训不到位→安全检查不到位→个人防护不当→高处坠落事故发生”,分析出较为敏感的因素为安全教育培训不到位、个人防护不当、设备安全性能不足、安全检查不到位、现场管理漏洞、安全监管不到位、安全意识淡薄。本文的研究不仅为建筑行业的安全管理提供了理论支持,也为实际操作提供了指导,这有助于行业的管理者更有侧重地进行施工的安全管理,通过加强安全教育培训、改善工作环境、强化个人防护等措施,可以有效降低高处坠落事故的发生率,切实保障建筑施工人员的生命安全与健康。

参考文献

[1] 中国建筑业协会. 2023年建筑业发展统计分析[EB/OL].
https://mp.weixin.qq.com/s/86-Ek74K51TdfnvDR-IgnQ
, 2024-3-11.
[2] 住房和城乡建设部办公厅. 住房和城乡建设部办公厅关于2020年房屋市政工程生产安全事故情况的通报[EB/OL].
https://www.mohurd.gov.cn/gongkai/zc/wjk/art/2022/art_17339_768565.html, 2021-05-21.
[3] Chi, C., Lin, S. and Dewi, R.S. (2014) Graphical Fault Tree Analysis for Fatal Falls in the Construction Industry. Accident Analysis & Prevention, 72, 359-369.
https://doi.org/10.1016/j.aap.2014.07.019
[4] 仇国芳, 郑艳, 张涑贤. 基于ISM的建筑施工高处坠落事故致因分析[J]. 安全与环境学报, 2019, 19(3): 867-873.
[5] 孙世梅, 赵金坤, 傅贵. 基于“2-4”模型的高处坠落事故行为原因研究[J]. 中国安全科学学报, 2019, 29(8): 23-28.
[6] 李珏, 王幼芳. 基于文本挖掘的建筑施工高处坠落事故致因网络分析[J]. 安全与环境学报, 2020, 20(4): 1284-1290.
[7] 曾凡奎, 王婷. 基于DEMATEL和ISM的支模脚手架高处坠落事故致灾因素建模[J]. 沈阳工业大学学报, 2021, 43(3): 342-348.
[8] 何佳斌, 龙丹冰, 许浒, 等. 基于N-K模型和模糊DEMATEL的高处坠落事故致因分析[J]. 工业建筑, 2023, 53(S2): 771-774.
[9] 成连华, 曹东强, 李欣. 房屋建筑施工事故致因因素分类研究[J]. 中国安全科学学报, 2023, 33(2): 16-22.
[10] Wiegmann, D.A.A. (2003) A Human Error Approach to Aviation Accident Analysis. Ashgate Publishing.
[11] 陈雍君, 李晓健, 王劲, 等. 基于因果贝叶斯网络的接触网风险评估模型研究[J]. 铁道科学与工程学报, 2023, 20(8): 3061-3071.