基于文本挖掘的高校实验室事故致因识别研究
Research on Identifying the Causes of Accidents in University Laboratories Based on Text Mining
DOI: 10.12677/orf.2024.144394, PDF, HTML, XML,    科研立项经费支持
作者: 陈锐坤, 盛 阳:武汉科技大学管理学院,湖北 武汉;杨中华*:武汉科技大学管理学院,湖北 武汉;湖北省产业政策与管理研究中心,湖北 武汉;武汉科技大学服务科学与工程研究中心,湖北 武汉
关键词: 高校实验室安全事故文本挖掘事故致因University Laboratories Safety Accidents Text Mining Accident Cause
摘要: 为有效预防和减少高校实验室事故的发生率,使用ROST CM6文本挖掘工具和UCINET社会网络分析工具,基于从各网络、媒体收集的2006~2022年间的高校实验室事故报道26份,从词频分析、共现矩阵分析、事故致因可视化处理、中心性分析四个角度切入,探索不同事故致因的出现频率和事故致因之间的相互关系。研究结果显示:违规操作致因出现的频率最大,为35.71%;安全管理体系缺失致因、安全意识不足致因与违规操作致因共现次数最多,达3次;违规操作致因属于事故致因网络的中心位置且中心度最高,与其他致因关联性最强,是最中心的事故致因。
Abstract: For the purpose of guarding effectively against and decreasing the incidence of accidents in university laboratories, using the ROST CM6 content mining system and UCINET social network recognition tool, based on 26 university laboratory accident reports collected from various networks and media from 2006 to 2022, this study explores the risk patterns and interrelationships from four perspectives: word frequency analysis, co-occurrence matrix analysis, accident cause visualization processing, and centrality analysis. The results showed that the frequency of causes of violations was the highest, at 35.71%. The most common causes of the lack of safety management system, insufficient safety awareness, and violation of regulations were three times. The cause of illegal operations belongs to the central position of the accident cause network, with the highest centrality and the strongest correlation with other causes, making it the most central accident cause.
文章引用:陈锐坤, 杨中华, 盛阳. 基于文本挖掘的高校实验室事故致因识别研究[J]. 运筹与模糊学, 2024, 14(4): 254-263. https://doi.org/10.12677/orf.2024.144394

1. 引言

高校实验室是大学进行科学研究教育的重要场所,可以锻炼学生的实际动手能力,也可以加深学生对基础理论的理解。随着大学招生规模的不断扩大,实验室的数量也在逐年增加,实验室事故也越来越频发。研究表明:在2010年前,高校实验室安全事故发生数有一个稳定增长期,在2010年至2018年期间,高校实验室安全事故数量从15起降低至3起,师生伤亡人数也有所减少,这可能归因于院系和实验室管理人员对实验室事故的安全防范意识有所提高[1]。在2018年后,事故发生数又有明显增长的趋势[2]。为了学生的安全,教育部办公厅于2021年12月10号印发通知,部署开展加强高校实验室安全专项行动,着重关注安全薄弱环节,将安全事故遏制在根源处,保障校园安全稳定,确保师生生命安全[3],并于2023年2月14日专门印发《高等学校实验室安全规范》的通知,督促省、市各级各类高校遵照执行,强化高校实验室的安全管理工作[4]。显然,加强实验室的安全管理,对学生个体、家庭、学校以及整个社会都具有重大意义。

高校实验室安全事故致因的识别是高校实验室安全管理的基础,为提出科学有效的风险规避措施,不少学者从事故致因分析的角度对安全事故管理展开了研究。刘晓霞利用“Tripod-Delta”模型建立高校实验室火灾事故致因集体系,对高校实验室火灾事故进行致因因子分析以挖掘事故的主要成因[5]。李洪兵等人首先基于24Model的原因模块辨识实验室爆炸事故致因,然后利用序关系分析法确定各致因的权重,结合DEMATEL-ISM方法和MICMAC方法识别实验室爆炸事故致因的属性特征[6]。徐超等人为建立高校易燃易爆实验室事故行为分析模型,利用“2-4”模型统计分析了高校实验室事故致因的频次和占比,最终提出了针对性事故防范对策[7]

上述对于高校实验室事故致因的分析与研究已取得一定成果,可以对高校实验室安全管理提供一定的帮助,但大多研究只针对于一种类型的事故进行分析,如单针对火灾事故、爆炸事故等,所得结论的适用范围有限,不具备一般适用性。随着互联网的数据越来越多,电脑设备的算力越来越充足,相关领域的专家逐渐使用文本挖掘的方法探究各类安全事故的致因,该技术分析过程受主观因素影响小,可以充分利用大量文本数据,适用多类型、多内容的样本分析。郑秀梅等人基于文本挖掘研究方法分析通用航空事故致因网络的中心性和核心边缘结构,提出了通用航空事故关键致因模型[8]。金一南等人采用文本挖掘的研究方法,收集2013年以来近9年的辽宁省建筑工程事故调查报告,挖掘、分析海量报告中的有效内容,探索其中的风险规律[9]。郑彬彬等人基于文本挖掘研究方法,从2017~2021年间的1256份燃气事故案例中提取城镇燃气事故致因因素,采用Apriori算法挖掘城镇燃气事故致因的关联规则,系统分析影响城镇燃气安全的事故致因及其关联性[10]

为了更全面地研究高校实验室事故致因,本研究采用文本挖掘法,利用ROST CM6文本挖掘工具和UCINET社会网络分析工具对2006~2023年中国高校实验室事故报道进行分析,探索高校实验室事故致因的分布规律和内部相关性,加强对实验室事故风险的致因识别,为高校实验室安全管理提供新视角。

2. 研究设计

2.1. 研究方法

文本挖掘方法,也称文本数据挖掘,是一种从海量文本数据中提取目标信息的技术,它结合了自然语言处理、信息检索、数据挖掘和机器学习等领域的技术[11]。这个过程旨在将非结构化文本转换为结构化格式,以发现有意义的模式和全新洞察。本研究中,首先通过网络和媒体收集2006~2022年间的高校实验室事故报道26份,并汇编成一个文档;然后用文本替换功能将相同含义的不同词语标准化转译,用ROST CM6进行分词处理;其次再用ROST CM6进行词频统计,并输出实验室事故致因语义网络图;最后利用ROST CM6生成的共现矩阵,利用UCINET进行中心性分析,得到各事故致因的中心度及中心度占比。

本研究的具体工作流程如图1所示。

Figure 1. Research methods and processes

1. 研究方法与流程

2.2. 研究工具

本研究选取ROST CM6软件作为文本挖掘工具,选取UCINET软件作为社会网络分析工具。

ROST CM6是国内辅助人文社科研究的大型计算平台,能够对海量的数字化人文资料数据进行组织、标引、检索和利用,以保证人文研究的海量性、智能性和客观性,并可通过定性分析和定量分析的结合,从中归纳出具有说服力的普遍性结论。

UCINET是国际主流的辅助社会网络分析计算平台,具有丰富的功能和灵活的应用性。它提供了广泛的分析工具和算法,包括中心性指标、网络结构检测、子群组发现等,可帮助用户深入理解各种网络现象。其友好的用户界面使得数据导入、分析和可视化变得轻松,无需深入了解编程知识。此外,UCINET还支持用户自定义数据格式和算法,满足不同研究需求。因此,它在社会科学、管理学、信息学等领域得到广泛应用。

3. 数据预处理

3.1. 构建语料库

研究收集了2006~2023年的有较完整报道的高校实验室安全事故共26起[12] [13] (详见表1),在查询到媒体相关的报道和事故报告后,截取有价值的片段如“伤亡人员情况”“事故发生经过”“相关事项调查情况”“事故原因”等,作为初始文本挖掘语料,使用ROST CM6软件批量文本处理器功能合并26份截取段落。

Table 1. Typical university laboratory safety accidents from 2006 to 2023

1. 2006年~2023年典型高校实验室安全事故报道

序号

时间

安全事故名称

事故

类型

事故后果

报告来源

1

2006.3.15

复旦大学化学西楼实验室发生爆炸

爆炸

实验室严重损毁,无人员伤亡

新京报

2

2009.4.7

兰大实验室发生氨气泄漏事故

氨气

泄漏

无人员伤亡

兰州晨报

3

2010.12.9

东北农业大学实验感染事件

病毒

感染

学校28名师生陆续确诊感染布病

南方周末

4

2011.10.10

中南大学化工学院实验楼火灾

火灾

过火面积约500平方米,无人员伤亡

和讯网

5

2012.2.15

南京大学实验室发生甲醛泄漏近

甲醛

泄漏

老师、学生稍感不适

科学网

6

2012.3.17

仪器发生爆炸,华南理工一实验室起火

火灾

实验室严重损毁

中国聚合物网

7

2013.4.1

复旦投毒案

投毒

受害者死亡

百度百科

8

2013.4.30

南京理工大学:民工擅自切割废料导致爆炸

爆炸

2人受伤,3人被埋

新华网

9

2014.3.18

北师大化学实验室起火系实验操作不慎

火灾

过火面积约5平米,无人员伤亡

京华时报

10

2014.12.4

江苏常州一高校实验室发生爆炸

爆炸

实验室严重损毁

人民网

11

2015.4.5

中国矿业大学“4·5”爆炸死亡事故

爆炸

1人死亡,4人受伤

徐州市安监局

12

2015.9.22

北大化学楼一实验室起火明火已扑灭

火灾

实验室轻微损毁

新京报

13

2015.12.5

华理工学生实验时突发爆溅

火灾

2人受伤,实验室轻微损毁

新民晚报

14

2015.12.18

12·18清华大学何添楼火灾事故

火灾

1人死亡

搜狗百科

15

2016.1.10

北京化工大学一实验室起火

火灾

无人伤亡

北京晨报

16

2016.9.21

9·21东华大学爆炸事故

爆炸

1人轻伤,2人重伤

搜狗百科

17

2017.3.18

山西太原中北大学实验室火灾

火灾

过火面积约270平方米

中国新闻网

18

2017.3.27

关于我校化学西楼实验室事故的情况通报

爆炸

1名学生受重伤

复旦大学新闻文化网

19

2018.12.26

12·26北京交通大学实验室爆炸事故

爆炸

3名学生死亡

百度百科

20

2019.3.27

上海复旦大学实验室爆炸

爆炸

1名学生手臂受伤

新浪新闻

21

2020.12.21

关于一起实验室安全事故的通报

火灾

未造成人员受伤和财产损失

西南交通大学通报

22

2021.7.27

药学院关于7.27实验安全事故通报

试管

炸裂

1名学生被刺破手臂动脉血管

中山大学药学院通报

23

2021.10.24

南航实验室爆燃事故

爆炸

2人死亡,9人受伤

腾讯新闻网

24

2022.4.20

实验室爆燃学生烧伤

爆炸

1名学生被烧伤

潇湘晨报

25

2022.6.7

港大化学实验室事故致内地女博士溅伤

爆炸

1名学生被严重烧伤

香港新闻网

26

2023.8.17

台大化工系一实验室爆炸起火

爆炸

9人受伤

中时新闻网

3.2. 标准化转译

由于在中文里同个含义可以由不同的词语表达,如“实验失误”可以表达为“操作不慎”、“操作失误”、“实验失当”、“操作不当”等,为了使文本挖掘的结果更加准确,将具有相同含义的词语标准化,使用ROST CM6的文本替换功能对语料进行处理,词条标准化对照表见表2

Table 2. Comparison chart of terms standardization

2. 词条标准化对照图

序号

源词条

标准化词条

1

操作不慎

实验失误

操作失误

实验失当

操作不当

2

安全教育培训不足

实验室安全管理体系缺失

安全管理制度不完善

安全工作重视程度不够

3

不具备必要的安全条件

实验室环境恶劣、资质不全

未釆取有效安全防护措施

4

违规试验、作业

违规操作

违反操作规程

违反实验操作规程

3.3. 分词

为了确保分词结果的准确性,在ROST CM6软件的自定义分词词表中加入“实验室安全事故相关词库”如消防安全设备不足、电器短路、安全意识不足、试剂处置及管理不当、仪器老化等,删除无研究意义的词语如老师、学生、人员、学校、医院、调查等。

4. 文本挖掘结果

4.1. 事故致因词频统计

模对事故致因进行分级排序:定义I级事故致因的频率大于30%,定义II级事故致因的频率大于10%,小于30%,定义III级事故致因的频率小于10%。利用ROST CM6软件的词频分析功能,分析经分词处理后的文本数据,可得高校实验室事故致因词频表,并依据频率大小对致因等级进行排序。

由输出结果可得不同事故致因的影响程度,10种事故致因中违规操作出现的频率最高,为35.71%,频数为10,属于为I级致因。其次依次是试剂处置及管理不当、实验失误、安全意识不足、安全管理体系缺失、仪器设备问题,属于II级致因,最后是消防安全设备不足、实验室资质不全、电器短路、实验室环境恶劣,属于III级致因(详见表3)。

Table 3. Frequency statistics of laboratory accidents

3. 实验室事故致因词频统计

序号

事故致因

等级

频数

频率

A1

违规操作

10

35.71%

A2

试剂处置及管理不当

6

21.43%

A3

实验失误

6

21.43%

A4

安全意识不足

5

17.86%

A5

安全管理体系缺失

5

17.86%

A6

仪器设备问题

4

14.29%

A7

消防安全设备不足

2

7.14%

A8

实验室资质不全

2

7.14%

A9

电器短路

2

7.14%

A10

实验室环境恶劣

1

3.57%

4.2. 事故致因共现矩阵分析

运用ROST CM6软件的构建矩阵功能对文本数据进行共现矩阵分析,可以得到事故致因之间的内在关系。若一组事故致因同时出现在一份事故报告中,则算作一次共现,若这组事故致因在不同的事故报告中再次同时出现,则算作再一次共现,以此类推。两个致因的共现次数越多,则代表这两个致因的关联性越强。向ROST CM6软件输入经分词处理的文本数据和词频统计数据,得到共现矩阵,详见表4

Table 4. Co-occurrence matrix of laboratory accident causes

4. 实验室事故致因共现矩阵


A1

A2

A3

A4

A5

A6

A7

A8

A9

A10

A1


1


3

3

2

1

1



A2

1



1

2


1




A3






1





A4

3

1




1

1




A5

3

2




1


2



A6

2


1

1

1



1



A7

1

1


1







A8

1




2

1





A9











A10











由矩阵可知,“违规操作”与“安全意识不足”、“安全管理体系缺失”共现的次数最多,达到3次,表明这三个致因共同出现的几率相较最高,一个致因的出现往往伴随着其余两个致因。在实验室事故预防中需加强对该三个致因的防控强度,可以有效降低事故的发生率。由矩阵还可以得知“电器短路”与“实验室环境恶劣”没有与其他事故致因共同出现过,都是单独出现即引发事故,表明这两种致因直接导致事故的发生,具有很强的危害性,在实验室日常安全维护中需重点检查电器是否正常运行以及环境是否适宜进行实验。

4.3. 事故致因可视化处理

运用ROST CM6软件的语义网络和社会网络生成工具对事故致因进行可视化处理,语义网络图中节点与节点的连线可以形象的表现各致因的分布与致因间的关系,更加直接的理解事故致因之间的关系。两个节点相连代表两个致因共现,连线越多代表该致因与其他致因共现越多,致因越处于图中心位置,与其他致因联系越紧密(详见图2)。由于该图只能表现致因之间的共现关系,所以当某一事故致因单独出现时,与其他致因没有共现关系,在语义网络图中就没有显示。由表4可知“电器短路”与“实验室环境恶劣”都与其他事故致因没有共现关系,所以语义网络图中没有这两个事故致因。

由图可知“违规操作”致因处于中心位置,与其他节点连线最多,表明该节点与网络中的多个其他节点有着紧密的联系,在事故致因的链条中起到枢纽作用,属于实验室安全事故的中心致因。由于其核心地位,中心节点的变化或异常往往能显著影响事故的发生概率和严重程度,是事故预防和控制的重点,故需要加强对应的防控措施以降低事故发生率;“实验失误”与其他致因共同出现最少,处于语义网络图的边缘位置,代表该因素对事故的发生可能有一定的影响,但这种影响相比于中心节点要小得多。虽然边缘节点在当前事故中作用有限,但它们可能是未来事故的潜在预警信号,需要在预防措施中予以考虑。

Figure 2. Semantic network diagram of causal causes of laboratory accidents

2. 实验室事故致因语义网络图

4.4. 事故致因中心性分析

中心性是指在网络或图形中某个节点的重要程度或中心地位,是衡量某一致因在整个数据集中重要程度的指标。在社会网络分析中,中心度(degree)是指节点在网络中的连接数量或度数。它表示一个节点与其他节点直接相连的边的数量。一个节点的度越高,意味着它与更多节点直接相连,通常被认为在网络中更为重要或具有更大的影响力。标准化度(nrmdegree)是将节点的度数标准化后得到的值,标准化度可以提供关于节点在网络中的相对重要性或连接性的信息,而不受网络规模的影响,它对于比较不同节点在网络中的度数具有更大的可比性。运用UCINET软件的中心性分析功能分析高校实验室事故致因,输出内容详见表5

Table 5. The centrality of the causal nature of laboratory accidents

5. 实验室事故致因的中心性

排序

事故致因

中心度

标准中心度

占比

1

A1

11.000

52.387

0.250

2

A5

8.000

38.095

0.182

3

A6

6.000

28.571

0.136

4

A4

6.000

28.571

0.136

5

A2

5.000

23.810

0.114

6

A8

4.000

19.048

0.091

7

A7

3.000

14.286

0.068

8

A3

1.000

4.762

0.023

中心性分析结果显示:违规操作(A1)的中心度占比在0.2以上且占比远高于其他致因,说明该致因与其他致因的内部关联性最强,位处致因网络的中心位置,可能直接或间接地影响了多个事故致因链路,是事故预防和控制的重点;实验失误(A3)的中心度占比最小,表明该事故致因与致因网络关联最弱,独立发生的可能较大,与实验室事故致因语义网络图(图2)得到的结论相佐证。

5. 结论与启示

5.1. 研究结论

1) 基于词频分析从26份事故报道中提取的11个事故致因中,“违规操作”致因出现的频率最大,超过30%,属于I级事故致因;“试剂处置及管理不当”、“实验失误”、“安全意识不足”、“安全管理体系缺失”这些致因出现的频率在10%~30%之间,属于II级事故致因;“消防安全设备不足”、“实验室资质不全”、“电器短路”、“实验室环境恶劣”、“仪器设备问题”这些事故致因出现的频率在10%以下,属于III级事故致因。

2) 通过事故致因的共现矩阵分析,发现:“违规操作”与“安全意识不足”、“安全管理体系缺失”共现的次数最多,达到3次;“违规操作”与“仪器设备问题”、“试剂处理及管理不当”与“安全管理体系缺失”、“安全管理体系缺失”与“实验室资质不足”各共现2次;“违规操作”与“试剂处置及管理不当”、“试剂处置及管理不当”与“安全意识不足”、“仪器设备问题”与“实验失误”、“仪器设备问题”与“安全意识不足”、“仪器设备问题”与“安全管理体系缺失”、“消防安全设备不足”与“违规操作”、“消防安全设备不足”与“试剂处置及管理不当”、“消防安全设备不足”与“安全意识不足”、“实验室资质不全”与“违规操作”、“实验室资质不全”与“仪器设备问题”各共现1次。

3) 基于对事故致因的可视化处理和中心性分析,可以直观地了解到事故致因“违规操作”处于事故致因网络的中心位置,中心度占比最高,与其他事故致因的关联性最强,并现的可能性最大;“实验室失误”处于事故致因网络的边缘位置,中心度占比最低,与其他致因共线的可能性最小,单独频发的可能性大。

5.2. 管理启示

首先,加强规范操作培训,建立操作审查机制。“违规操作”不仅是实验室事故致因中最频繁出现的,而且还处于事故致因网络的中心位置,管理者应特别重视对违规操作的预防和管理。管理者可以通过定期举办操作规范培训课程,向实验室工作人员介绍正确的操作流程和安全规程,强调规范操作的重要性。此外,建立和执行严格的操作审查机制,对实验操作进行监督和检查,及时察觉并改正错误的操作行为,从而有效地降低违规操作导致事故的风险,同时,管理者应重点关注违规操作与其他致因的关联性,加强交叉检查和整合管理,从而全面提升实验室的安全管理水平,降低事故风险,确保实验室工作的顺利进行。

其次,定期检查实验电器,保持安全实验环境。“电器短路”与“实验室环境恶劣”为单独出现即引发事故的致因,具有很强的危害性,在实验室日常工作中应建立一套全面的电器检查体系,保每台设备都有明确的检查周期和标准流程,覆盖所有可能的安全隐患点。对于检查中发现的问题,应立即采取措施修复或更换设备。同时,根据设备的使用年限和技术更新情况,适时升级换代,确保实验室电器始终保持在最佳状态。

最后,举办安全学习活动,健全安全管理体系。违规操作与安全意识不足、安全管理体系缺失等因素共现次数较多,表明通过提升实验室工作人员的安全意识、完善实验安全管理体系也能有效预防实验室安全事故的发生。管理者可以通过举办安全知识培训、安全演习等活动,增强实验室工作人员对安全问题的认识和警惕性,培养他们自觉遵守安全规程的习惯。同时,建立健全的安全管理体系和流程,包括事故报告与处理机制、安全巡检制度等,进一步降低事故发生的可能性。

基金项目

湖北省大学生创新创业训练训练项目“基于文本挖掘的高校实验室安全事故致因识别研究”(编号:S202410488083);湖北省大学生创新创业训练计划项目“基于年报文本分析的制造业上市企业数字化能力的影响因素研究”(编号:S202310488095)。

NOTES

*通讯作者。

参考文献

[1] Bai, M., Liu, Y., Qi, M., Roy, N., Shu, C., Khan, F., et al. (2022) Current Status, Challenges, and Future Directions of University Laboratory Safety in China. Journal of Loss Prevention in the Process Industries, 74, Article ID: 104671.
https://doi.org/10.1016/j.jlp.2021.104671
[2] 盛耀楠, 卢恩达, 贠兆恒, 等. 我国高校实验室安全事故原因分析及对策[J]. 南京医科大学学报(社会科学版), 2023, 23(6): 591-596.
[3] 教育部办公厅. 教育部办公厅关于开展加强高校实验室安全专项行动的通知[EB/OL].
http://www.moe.gov.cn/srcsite/A16/s7062/202112/t20211224_589878.html, 2021-12-10.
[4] 教育部办公厅. 教育部办公厅关于印发《高等学校实验室安全规范》的通知[EB/OL].
http://www.moe.gov.cn/srcsite/A16/moe_784/202302/t20230220_1045998.html, 2023-02-14.
[5] 刘晓霞. 基于对应分析的高校实验室火灾事故致因分析[J]. 安全与健康, 2022(7): 68-71.
[6] 李洪兵, 刘可, 吴鑫, 等. 高校实验室爆炸事故致因定量分析方法研究[J]. 现代职业安全, 2023(11): 36-41.
[7] 徐超, 郭琳, 赵春雨, 等. 基于“2-4”模型的高校易燃易爆实验室事故致因与对策[J]. 实验技术与管理, 2021, 38(5): 248-254.
[8] 郑秀梅, 田晓康, 柳青, 等. 通用航空事故致因文本挖掘和社会网络分析[J]. 安全与环境学报, 2024, 24(2): 602-609.
[9] 金一南, 孙艳丽. 基于文本挖掘的建筑工程事故致因与风险管理研究——以辽宁省为例[J]. 黑龙江科学, 2023, 14(15): 139-143, 148.
[10] 郑彬彬, 冯婷婷, 王佳贺, 等. 基于文本挖掘的城镇燃气事故致因及关联分析[J]. 中国安全科学学报, 2023, 33(7): 190-195.
[11] 阮彤, 王昊奋, 陈为, 等, 编. 大数据技术前沿[M]. 上海: 电子工业出版社, 2016: 67-69.
[12] 南华大学国有资产与实验室管理处. 高校实验室安全事故案例(2022-1) [EB/OL].
https://zcc.usc.edu.cn/info/1050/1618.htm, 2022-06-24.
[13] 南华大学国有资产与实验室管理处. 高校实验室安全事故案例(2022-2) [ EB/OL].
https://zcc.usc.edu.cn/info/1050/1646.htm, 2022-09-13.