1. 概述
施工现场环境多变且复杂,工程施工人员交叉作业多、安全意识薄弱,因此施工区域是一个具有一定安全隐患的复杂环境。目前,施工现场的工程监理仍然采用的是人工监察,人工监管具有效率低、排查慢、预防性差等特点,与此同时也常常出现监督人员不足、管理工作量大、违规行为操作无法有效杜绝、事故发生处理不及时、取证难度大等问题。随着科技的进步,视频监控系统和计算机图像识别等技术的结合为施工区域所暴露的问题提供了解决的新思路,并引入了智慧工地的管理概念。
“智慧工地”是智慧城市理念在建筑施工行业的具体体现,它通过应用高度集成的信息管理系统,基于物联网的感知和大数据的深度学习系统等支撑工具,“了解”工地的过去,“清楚”工地的现状,“预知”工地的未来,对已发生或可能发生的各类问题,有科学的决策和应对方案 [1] [2] 。这不仅对安全文明施工意义重大,同时也有助于推动建造方式变革,提升建筑业科技创新能力,促进建筑产业提质增效,推进建筑产业转型升级。
针对于施工区域的智能监测与预警,提出利用机器视觉方法,通过现场视频监测展示工地施工实时情况,对不同危险区域进行自动化连续监测,建立施工现场安全监控数据集。利用施工现场数据集,有助于快速、准确全面识别危险区域、施工现场状况。提出深度学习的目标检测方法来监控工地的危险区域、材料堆场、车辆运动轨迹,识别工人违规进入危险区域的行为,为安全快速施工提供依据 [3] [4] 。
2. 关键技术
2.1. 计算机视觉
计算机视觉旨在通过对人类视觉系统进行建模,让机器具备感知视觉信息的能力 [2] 。近年来,计算机视觉技术的快速发展为建筑工程安全管理提供了可能性。计算机视觉技术的发展被认为是一种自动识别不安全行为和不安全状态的可靠方法。从工程的角度来看,计算机视觉技术旨在实现人类视觉系统无法执行任务的自动化,可以更加智能、高效地检测施工现场的人为因素和物理因素,实现风险的识别与预警。同时,随着多种数字技术和深度学习技术的发展,将这些技术与计算机视觉技术相结合,其自动化水平将会进一步提升。
2.2. 深度学习
传统的机器学习方法处理原始数据能力有限,为了简化监察的过程,利用深度学习的表征学习,可以实现多维数据中自动地从端到端学习并提取复杂特征 [5] 。深度学习是学习样本数据的内在规律和表示层次,通过组合低层特征形成更加抽象的高层表示属性类别或特征,以发现数据的分布式特征表示。通过将深度学习方法(例如神经网络)与通过使用计算机视觉获得的图像相结合,可以自动提取特征工程并用于从训练数据中进行学习。不同于人工神经网络(ANN),深度学习模型是多个感知器而构成,如图1所示,这些处理层从具有多个抽象级别的数据表示中进行学习。

Figure 1. Comparison between artificial neural networks and deep learning models [6]
图1. 人工神经网络与深度学习模型对比 [6]
在深度学习中最为广泛使用的是卷积神经网络(CNN),它主要由三种类型的神经层组成:卷积层、池化层及全连接层,其一般化架构如图2所示。在计算机视觉领域,基于CNN的深度学习方法已被广泛应用于一系列工作,如图像分类、目标检测、语义分割和姿态估计。

Figure 2. General architecture of convolutional neural networks [6]
图2. 卷积神经网络的一般化架构 [6]
其中深度学习的主要技术包括迁移学习和数据增强。考虑到大部分数据或任务都是存在相关性的,我们可以通过迁移学习将已经学到的模型参数通过某种方式来分享给新模型从而加快并优化模型的学习效率。目前常用的深度迁移学习方法主要包括 [7] :基于实例的、基于映射的、基于网络的和基于对抗的深度迁移学习 [8] ;为了在较少训练数据集获得良好的性能(即准确性),需要通过数据增强技术进行数据扩充,从而避免了数据过度拟合并提高了模型的泛化能力。流行的数据增强技术包括:翻转、旋转、缩放比例、裁剪、移位、高斯噪声等技术。这些与深度学习等相关技术构成了施工区域的智能监测及预警的基础。
3. 施工区域不安全行为识别
不安全行为是指违反安全规定,可能引起事故的危险行为 [9] [10] 。影响公路施工区域安全性的因素包括外在环境影响、施工工具设备故障、施工团队、人为自身因素以及自然环境影响。同时不安全行为主要集中在施工现场实体及实体间关系识别、工人个人防护设备(Personal Protective Equipment, PPE)使用情况识别、工人动作识别三方面。
3.1. 施工现场实体及实体间关系识别
施工现场实体及其关系识别,即识别各类实体(包括柱子、楼板、临边、洞口等静态实体和工人、机械、车辆、器具等动态实体)及实体之间的关系。后者通常包括共存关系与空间位置关系,本质是在目标检测与对象识别的基础上判断实体间的关系。主要包括静态实体识别与定位和动态实体识别、定位与追踪。动态实体识别中基于计算机视觉技术的动态实体识别与定位,即从施工现场图像或视频中识别出目标实体(如工人、机械),并获取其空间信息,以支持工人与其他实体之间的空间关系分析。
3.2. 防护设备使用情况识别
施工区域的安全需要确保人们佩戴个人防护装备,如安全帽、警示背心、高空作业时的安全带、适当的鞋类、手套、安全眼镜等。然而研究进一步表明,建筑施工中发生的大量伤害是由于人们不佩戴PPE造成的 [11] 。为了解决这个普遍存在的问题从而开发了一些算法,用于识别没有佩戴个人防护装备的人,这些算法基于以下方法:1) 手工特征;2) 深度学习。基于计算机视觉技术的识别,即从现场视频或图像中识别工人是否穿戴PPE,不需要工人额外佩戴传感器,对作业影响较小。工人PPE使用情况识别相关研究现虽已取得一定进展,但基于可穿戴式技术的方法需要工人佩戴额外设备,对作业产生不便;而基于计算机视觉技术的方法局限于安全帽、安全带穿戴情况的识别,较少考虑其他PPE的识别,且对PPE使用情况的识别关注较少。
3.3. 工人动作识别
施工现场工人动作识别主要分为三个步骤:数据采集与预处理、特征提取与动作表示,以及动作分类与识别。根据采集技术的不同,通常可分为基于可穿戴式技术的识别方法和基于计算机视觉技术的识别方法。
基于计算机视觉技术的识别,即通过采集工人动作的图像序列(如二维彩色图像、深度图像并逐帧提取特征(如角点、密集轨迹、人体剪影、人体关节)进行组织后以表示动作,通过训练的方法(如传统基于模板的方法、传统基于概率统计的方法、深度学习方法)或非训练的方法(如基于规则的区分方法)实现动作分类与识别。
4. 智能监测
基于上述不安全行为提出了高速公路施工区域的智能监测方法。通过该方法实现对高速公路施工的远程实时监管,规范施工安全作业。
4.1. 步骤
基于计算机视觉和深度学习的智能监测与预警系统应包含以下四个步骤:观察和记录;理解;学习及预警不安全行为,整个过程如图3所示。

Figure 3. Framework based on computer vision and deep learning methods
图3. 基于计算机视觉和深度学习方法框架
观察和记录:通过识别各种不安全行为要找出不安全因素从而对其不安全行为进行直接反馈。通过计算机视觉来实现分析个人的不安全行为(例如频率、类型、位置和时间)。首先使用传感器来识别人的身份和位置信息,利用计算机视觉监视人的活动,并从视频中提取坐标来获取位置信息。然后综合传感器获得的信息和计算机视觉技术,根据人的坐标通过整合时空信息提取特征来识别视频流中个体的深度学习方法。
理解:从不安全行为的源头进行正向分析,从而理解人们为什么会做出不安全行为。在正向分析过程中有必要认识到人们构建各种行为背后的意图以确保从根源上杜绝不安全行为的产生。
学习:基于计算机视觉提出交互式个性化安全培训建议,并且可以利用虚拟现实技术,以提供模拟一种在建筑工地上的感觉,在模拟过程中计算机视觉捕捉到的场景可以用于安全的环境的体验。
4.2. 实例
基于深度学习的计算机视觉方法具有智能监测、准确检测并预警不安全行为的潜力。监测具体是指对容易诱发安全事故的问题因素进行实时监控。这些诱导因素主要有自然天气影响、人为主观判断操作失误、机械设备在使用过程中故障等。

Figure 4. Example of worker detection based on deep learning [10]
图4. 基于深度学习检测工人的例子 [10]

Figure 5. HOG description method for detecting workers without wearing safety helmets
图5. 检测工人不戴安全帽的HOG描述方法

Figure 6. Visual based monitoring of moving object collision accidents
图6. 基于视觉的移动物体碰撞事故监测
Fang等人 [12] 开发了一种混合学习方法,该方法集成了一个Faster R-CNN和一个Deep CNN,以检测在高空工作时没有佩戴安全带的人,并对不同视角、气候条件、光照条件、工人姿势、遮挡情况下的识别结果进行了比较。其中Deep CNN模型被用来分类那些戴着和没有戴着安全带的人,在检测没有穿戴个人防护装备的人方面取得了进展。最先进的CNN (例如,Faster R-CNN,SSD,Mask R-CNN,YOLOv3)以及用于目标检测的深度神经网络(ZFNet, ResNet) [13] ,可用于识别人员、厂房和设备,识别结果如图4所示。
在帕克等人 [14] 的研究中,首先通过手动特征标识使用HOG描述符来检测人和安全帽,进而匹配它们的几何和空间关系,识别结果如图5所示。
在施工现场通常可以发现两种类型的危害:静态危害和动态危害。静态危害包括临时工程,危险物质的储存,现场交通控制,和物理危害,如在一个楼层上的服务或楼梯井的开口;动态危害,即人员、重型设备、起重机等进行作业时移动风险。Kim等人 [15] 将计算机视觉与模糊理论方法相结合,以监测和评估在重型设备附近工作的人的安全,如图6所示。
5. 预警与处理
连续的智能监控是系统能够正确并及时预警的必备条件。通过设备设施运行监测数据和历史故障信息,总结设备设施预警模型。预警模型因素包括故障类型、异常特征、故障时间以及运行时间等,利用深度学习算法进行训练,推演新的预警模型,通过收集的故障信息,结合深度方法算法循环神经网络,推演新的预警模型,不断完善预警模型库,模型建立流程如图7所示。

Figure 7. Model establishment flow chart
图7. 模型建立流程图
在高速公路施工阶段,需要做到施工的预警管理,确保施工过程的安全性,对突发事件的及时处理以及事故发生时救援工作及时开展。确保施工阶段的安全需要各部门各组织之间进行协调分工,落实分内工作任务并做好对施工阶段过程的实时监控,严格地按照遵守施工操作手册的相关规定,以确保安全第一、提前预防、多方治理的准则作为施工生产方针 [16] 。
为了最大限度地降低公路施工安全事故发生的可能性,保障施工过程的安全、顺畅运行,针对公路施工危险区闯入这类危险源进行了智能识别技术研究。首先设置危险区 [17] ,对图像进行灰度化、锐化等预处理后进行前景目标检测,实现了前景像素和背景像素的有效分离,然后通过连通区域检测对前景区域进行区分,识别危险区闯入人员,实现自动报警提醒功能。基于机器视觉的公路施工危险区闯入自动识别技术方法,该算法计算量小、计算速度快,满足工程应用实时性的要求,危险区闯入自动识别技术的实现必将推动公路工程项目施工安全管理信息化的发展,有利于公路工程项目的综合优化协调,逐步实现公路施工管理“零伤亡”。
6. 结论
本文总结归纳了当前高速公路施工区的关键技术,并从施工现场、防护设备使用和施工人员动作角度对施工区域不安全行为的识别技术进行了详细分析,接着分析了施工区域智能监测与预警技术。研究有助于深入了解高速公路施工区域的相关智能技术。
随着信息技术和智能化技术的不断发展,智能监测与预警技术在高速公路施工领域的应用也将越来越广泛。未来的研究可以从以下几个方面进行:1) 加强传感器技术研发,使得监测系统能够更加全面、准确地感知施工区域内的情况,提高监测系统的精度和覆盖范围。2) 建立智能预测模型,通过对历史数据的分析和处理,加上智能分析算法,实现对施工区域未来可能发生的异常情况的预判,提前采取措施避免事故发生。3) 探索多种传输和处理技术,如边缘计算、云计算与人工智能等,实现对监测数据快速处理和分析,从而提高监测效率和精度。4) 强化决策支持系统的建设,建立决策模型,协助决策者及时、准确地做出决策,并采取针对性的预警措施,保障施工人员的生命财产安全。总之,未来高速公路施工区域智能监测与预警技术的研究将持续深入发展,为保障交通安全和施工安全提供更为可靠的保障。