1. 引言
接触网是牵引供电系统的重要组成部分,接触线作为电力机车受电弓取流的直接摩擦接触部件[1],其既是受电弓的滑道,又是牵引电流的主要承载者和传输者,是牵引供电系统的关键组成部分之一[2],接触线在长期运营过程中主要有3种失效形式:磨耗、腐蚀、疲劳断裂,具体表现为侧磨量超标、表面拉丝、局部毛刺等缺陷[3],若未及时对接触线进行维护检修,极易引发弓网接触不良、打火放电等故障,严重时甚至导致接触线断线、轨道交通停运等重大安全风险。目前,接触线缺陷检测仍停留在人工目视检查阶段,该检测方式存在作业风险高、检测效率低、识别精度不足等突出问题。因此,寻找一种能够高效、精准检测接触线磨耗的方法,已成为近年来轨道交通供电系统运营维护领域的研究热点。
针对轨道交通接触线缺陷检测这一工程核心问题,国内外诸多专家学者已围绕检测方法、技术设备等方面开展了广泛而深入的相关研究。刘铭等[4]采用光学检测技术构建弓网检测系统,通过采集弓网接触过程中的光学信号,实现了弓网受流状态的自适应分析,为接触线运行状态监测提供了可靠的光学检测方案;李广明[5]以图像识别技术为核心,引入人工智能算法构建弓网状态监测模型,通过对弓网图像的特征提取与分析,完成了弓网运行状态的实时监测,提升了接触线缺陷检测的智能化水平;王红艳[6]聚焦弓网接触压力与接触线硬点检测,设计研发了弓网接触压力检测装置,通过精准采集接触压力数据,可高效定位接触线硬点位置,为接触线维护检修提供数据支撑;李振民[7]基于线结构激光测量技术,研发了接触网参数检测设备,突破传统接触式测量的局限,实现了接触网关键参数的非接触式连续测量,提升了检测效率与作业安全性。
为支撑接触线缺陷识别算法的训练、验证与性能测试,本文构建了接触线缺陷自建数据集,数据集样本均来源于轨道交通现场实际运营场景,保证了数据的真实性与工程适用性。本文以YOLOv5s_6.0算法网络结构为基础改进框架,结合接触线缺陷检测“轻量化部署 + 高精度识别”的核心需求,引入Ghost轻量化模块与CA (Coordinate Attention)注意力模块对原算法进行针对性改进优化。改进设计旨在兼顾模型轻量化与检测精度,在通过Ghost模块缩减网络计算量、降低模型体积的同时,借助CA注意力模块强化接触线缺陷特征提取能力,确保改进后算法既具备轻量化部署优势,又拥有较高的缺陷识别精度,最终使其更适配轨道交通接触线缺陷现场实时检测的应用场景,为后续算法性能验证提供可靠的模型基础。
2. YOLOv5s_6.0算法的改进
2.1. 接触线缺陷数据集的制作
本研究中接触线缺陷数据集的制作流程主要包含图像采集、数据增强、标签制作与数据集划分四个关键步骤。本文采用自制数据集,现场采集得到500张接触线原始缺陷图像,涵盖偏磨、异常磨耗、电弧灼烧等轨道交通运维中常见的缺陷类型,其中异常磨耗缺陷的典型样本如图1所示。
Figure 1. Contact wire abnormal wear diagram
图1. 接触线异常磨耗图
为弥补原始样本量不足的问题,提升模型泛化能力,对原始图像实施多方式数据增强。通过镜像、90˚旋转、180˚旋转的变换及添加高斯噪声的像素处理,将样本数量扩充至2000张。标签制作环节选用Labelimg可视化标注工具,按目标检测任务要求完成所有增强图像的缺陷框选与类别标注,保证标注信息的准确性与一致性。为科学评估模型性能,将完成标注的2000张图像按8:1:1的比例划分为训练集、验证集与测试集,分别用于模型参数学习、训练过程调优及最终性能验证。
2.2. YOLOv5s_6.0算法简介
YOLOv5目标检测网络包含s、m、l、x四种不同架构,各架构的核心差异在于子模块的模型深度与卷积层通道数配置,其调控逻辑由yaml配置文件中的网络深度系数与网络宽度系数两个关键参数决定。四种架构在检测速度与识别精度之间采用不同配比设计,可灵活适配不同场景下的应用需求,满足从轻量化快速部署到高精度检测的多样化任务要求。在四种架构中,YOLOv5s的网络深度与宽度系数最小,这一特性使其具备四种架构中最优的灵活性,更易于在各类硬件设备上实现快速部署,有效降低模型部署的硬件成本与技术门槛。同时,YOLOv5s凭借精简的网络结构,检测速度在四种架构中最优,能够满足接触线缺陷实时检测的核心需求,因此本文选用YOLOv5s_6.0版本作为基础改进模型。YOLOv5s_6.0算法的网络结构整体分为四大模块,分别为输入端(Input)、骨干网络(Backbone)、颈部网络(Neck)及预测端(Prediction),各模块协同工作,完成接触线缺陷的特征提取、特征融合与目标检测任务。YOLOv5s_6.0算法的网络结构特点如图2所示。
Figure 2. The network structure diagram of the YOLOv5s_6.0 algorithm
图2. YOLOv5s_6.0算法的网络结构图
2.3. 基于Ghost模块的轻量化改进
GhostNet轻量化卷积神经网络是面向移动设备及嵌入式系统设计的专用网络架构,其核心设计目标为在保障较高检测精度的前提下,显著降低网络计算资源开销,满足工程场景中轻量化部署的实际需求,为嵌入式设备上的实时目标检测任务提供技术支撑。该网络的核心组件为Ghost模块,作为一种高效的特征提取单元,该模块属于即插即用型结构,实现难度较低,无需对原有网络结构进行大幅重构。此外,该模块的核心优势在于通过生成冗余特征图的方式,在显著降低网络计算复杂度、缩减模型参数总量、实现模型轻量化的同时,能够有效维系网络原有的特征提取能力与检测精度,兼顾检测性能与部署效率。从结构构成来看,Ghost模块主要包含三个核心环节,分别为常规卷积特征图生成、Ghost特征图生成,以及常规卷积特征图与Ghost特征图的拼接融合,如图3所示。其中常规卷积负责生成基础特征,Ghost特征图补充细节特征,二者融合后提升特征表达的完整性。
Figure 3. Ghost module schematic diagram
图3. Ghost模块示意图
基于上述Ghost模块的轻量化特性,结合本文接触线缺陷实时检测的核心需求,构建轻量化改进结构时,将YOLOv5s_6.0算法Backbone网络中CSP1_x结构的Resunit残差模块替换为GhostBottleneck模块,具体实施方案为将Resunit残差模块中的普通卷积层替换为Ghost模块,以实现网络计算量的缩减与模型轻量化。为便于后续表述,将替换后的卷积层定义为GhostConv,替换后的CSP1_x结构定义为GhostCSP1_x,简称GCSP1_x,如图4所示,为后续算法性能验证与分析奠定基础。
Figure 4. Diagram of the GCSP1_x module
图4. GCSP1_x模块示意图
2.4. 添加CA注意力模块
YOLOv5s_6.0算法输入端易引入大量无关冗余信息,其中以轨道交通现场检测场景中的多余背景信息最为典型。此类无关信息会引发算法信息过载问题,不仅增加网络计算冗余、降低算法任务处理效率,还会干扰缺陷特征的有效提取,影响算法检测准确率与泛化能力。为解决上述问题,兼顾算法处理效率与检测性能,提升模型对接触线缺陷特征的识别针对性,需要在YOLOv5s_6.0算法中引入注意力机制。通过注意力机制精准分配特征权重,强化对接触线缺陷目标特征的关注,抑制无关背景信息的干扰,有效缓解信息过载问题,进而提升算法的任务处理效率、检测准确率及泛化性能。
Figure 5. Diagram of the GCSP1_x module
图5. CA注意力模块结构图
CA注意力模块全称为CoordAtt (Coordinate Attention)注意力模块,如图5所示。其核心优势在于可在通道注意力机制中有效存储特征图的横向与纵向位置信息。该设计思路通过精准捕捉特征图的空间位置特征,使CA注意力模块既能获取大范围的空间位置信息,又可避免额外增加网络计算量,兼顾特征提取的全面性与算法运行效率。相较于其他注意力模块,CA注意力模块具备良好的兼容性,可直接插入至网络的多个位置进行应用,无需对原有网络结构进行复杂重构,因此选用CA注意力模块作为本研究算法的注意力改进模块。
在添加注意力机制中,将CA注意力模块添加到YOLOv5s_6.0算法中Backbone网络的最后一层,即在GCSP模块后添加CA注意力模块。
2.5. 改进后的算法网络结构图
改进后的YOLOv5s_6.0算法的Backbone网络代码如图6所示。其中,Conv代表CBS模块;GCSP代表轻量化后的CSP模块;CoordAtt代表CA注意力模块。
Figure 6. Improved Backbone network code
图6. 改进后的Backbone网络代码
改进后的YOLOv5s_6.0算法的网络结构,如图7所示。
Figure 7. The network structure diagram of the improved YOLOv5s_6.0 algorithm
图7. 改进后的YOLOv5s_6.0算法的网络结构图
3. 网络训练及模型评价
3.1. 网络训练环境
改进后的YOLOv5s_6.0算法的网络训练的环境配置如表1所示。
Table 1. Environment configuration for network training
表1. 网络训练的环境配置
名称 |
版本号 |
CPU |
Intel(R) Core(TM) i7-12700F @2.10 GHz |
GPU |
NVIDIA RTX 3080 |
运行内存 |
32 GB |
操作系统 |
Windows10 64位 |
编程语言 |
Python3.9 |
深度学习框架 |
Pytorch1.71 |
GPU加速环境 |
CUDA10.1 |
训练过程采用的优化算法为随机梯度下降优化算法(SGD),每次训练的批次(batch size)设置为32,训练的权重衰减率(weight decay)为0.0005,训练的初始学习率(learning rate)为0.01,训练的动量因子(momentum)设置为0.937,训练的次数(epochs)为200次。
3.2. 改进后算法的训练结果
常见的模型评价指标有精确率(Precision)、召回率(Recall)和平均精度均值(mAP)。精确率是模型在训练过程中,正确预测为正的数量占所有预测为正的比重;召回率是模型在训练过程中,正确预测为正的占所有实际为正的比重;平均精度均值是模型在训练过程中,所有类别的AP的平均值。
改进后的YOLOv5s_6.0算法训练结果如图8所示。由图可知,训练完成后的模型,其精确率、召回率及平均精度均值均达到良好收敛状态,未出现过拟合现象,验证了改进后YOLOv5s_6.0算法训练过程的稳定性与有效性,表明模型训练效果良好。
Figure 8. Improved training results of YOLOv5s_6.0
图8. 改进后的YOLOv5s_6.0训练结果
为更直观地验证改进后YOLOv5s_6.0算法的实际缺陷识别效果,本文将图1所示的接触线异常磨耗样本图像输入该算法进行接触线缺陷检测,其缺陷识别示意图如图9所示,其置信度为0.91。
Figure 9. Defect identification diagram
图9. 缺陷识别示意图
3.3. 改进后的算法与原始算法对比
为了进一步验证改进后的YOLOv5s_6.0算法的能力,将原始的算法按照相同的训练环境和训练过程进行网络训练。将原始的YOLOv5s_6.0算法的训练结果与改进后的算法进行比较,结果如表2所示。
Table 2. Comparison between the improved algorithm and the original algorithm
表2. 改进后算法与原始算法的对比
识别模型 |
精确率 |
召回率 |
平均精度均值 |
FPS |
模型体积 |
改进后的算法 |
97.35% |
97.43% |
98.13% |
87.21 |
122MB |
原始算法 |
95.72% |
95.54% |
97.46% |
73.63 |
178MB |
由表2可知,改进后的YOLOv5s_6.0算法与原始算法相比,各项性能指标呈现优化态势:精确率提升1.63个百分点,召回率提升1.89个百分点,平均精度均值提升0.67个百分点,每秒帧率(FPS)提升13.58,模型体积缩减56MB。上述对比结果表明,改进后的YOLOv5s_6.0算法在精确率、召回率及平均精度均值三大核心识别指标上,与原始YOLOv5s_6.0算法基本持平;而FPS较原始算法提升18.44%,模型体积较原始算法缩减31.46%。研究证实,改进后的YOLOv5s_6.0算法具备更轻量化的模型体量,同时保持较高的缺陷识别准确度。
3.4. 消融实验
为进一步验证改进后模型的性能,将YOLOv5s_6.0、YOLOv5s_6.0 + Ghost模块、YOLOv5s_6.0 + CA模块(Backbone网络的最后一层)、YOLOv5s_6.0 + CA模块(Backbone网络的第一层)、YOLOv5s_6.0 + Ghost模块 + CA模块进行消融实验,实验情况如表3所示。
Table 3. Comparison of ablation experiment results
表3. 消融实验结果对比
识别模型 |
精确率 |
召回率 |
平均精度均值 |
FPS |
模型体积 |
YOLOv5s_6.0 |
95.72% |
95.54% |
97.46% |
73.63 |
178 MB |
YOLOv5s_6.0 + Ghost模块 |
94.12% |
94.36% |
96.55% |
89.84 |
98 MB |
YOLOv5s_6.0 + CA模块(Backbone网络的第一层) |
98.34% |
98.54% |
98.81% |
68.52 |
202 MB |
YOLOv5s_6.0 + CA模块(Backbone网络的最后一层) |
98.75% |
98.77% |
99.42% |
69.16 |
202 MB |
YOLOv5s_6.0 + Ghost模块 + CA模块 |
97.35% |
97.43% |
98.13% |
87.21 |
122 MB |
如表3中数据所示,YOLOv5s_6.0 + CA模块(Backbone网络的最后一层)与YOLOv5s_6.0 + CA模块(Backbone网络的最后一层)相比,其精确率提升了0.41个百分点,召回率提升了0.23个百分点,平均精度均值提升了0.61个百分点,FPS提升了0.64,模型体积基本保持不变,表明将CA模块放置于Backbone网络的最后一层相比于放在第一层为最优解。YOLOv5s_6.0算法在加入Ghost模块后,其精确率、召回率和平均精度均值都有所下降,但是FPS提升了16.21,模型体积降低了80MB;YOLOv5s_6.0算法在加入CA模块后,其精确率、召回率和平均精度均值都有所提升,但是FPS略有下降,模型体积增加了13.5%。YOLOv5s_6.0算法在加入Ghost模块和CA模块后,相比于YOLOv5s_6.0 + Ghost模块,其精确率、召回率和平均精度均值都有所提升,FPS降低了2.63,模型体积增加了24 MB;相比于YOLOv5s_6.0 + CA模块,其精确率、召回率和平均精度均值略微下降,FPS和模型体积均得到了优化,这说明Ghost模块可以提升模型的FPS和减少模型体积,但是会降低平均精度均值,而加入了CA模块可以降低对平均精度均值的影响,表明YOLOv5s_6.0+Ghost模块+CA模块的综合性能在表中的模型中最优。
4. 结论
本文针对传统轨道交通接触线缺陷检测存在的作业风险高、检测效率低、识别精度不足等工程痛点,以YOLOv5s_6.0算法为基础网络框架,开展针对性改进优化:将算法Backbone网络中Resunit残差模块的普通卷积替换为Ghost轻量化模块,并在GCSP模块后嵌入CA注意力模块。基于自建接触线缺陷数据集的对比实验结果表明,改进后的YOLOv5s_6.0算法相较原始算法,各项性能指标均实现优化提升:精确率提升1.63个百分点,召回率提升1.89个百分点,平均精度均值提升0.67个百分点,每秒帧率(FPS)提升13.58,模型体积缩减56MB。即在精确率、召回率及平均精度均值三大核心识别指标基本保持稳定的前提下,改进算法的FPS较原始算法提升18.44%,模型体积较原始算法缩减31.46%。研究结果证实,改进后的YOLOv5s_6.0算法在保持较高缺陷识别精度的同时,实现了模型的轻量化与检测速度的提升,但是由于数据集中的图片数量较少,未来需要在实际工作中采集更大规模、更多样化的数据进行进一步验证。