1. 引言
1.1. 研究背景
作为电力系统电能传输的核心载体,高压输电线路广泛分布于山区、丘陵、城区等复杂地理环境,其运行状态直接决定电网安全稳定水平。截至2025年,我国220 kV及以上高压输电线路总长度突破80万km,特高压输电容量与长度均居全球首位。由于长期暴露于户外,输电线路易受自然环境(雷击、覆冰、大风)与人为因素(异物悬挂、树障入侵)影响,引发绝缘子自爆、导线断股、鸟巢搭建等缺陷,若未及时检测处理,可能导致线路短路、跳闸甚至大面积停电事故,造成重大经济损失[1]。
传统高压输电线路巡检主要依赖人工登塔检查与地面目视观测,存在三大突出问题:一是效率低下,单人日均巡检里程不足10 km,难以覆盖广袤的线路网络;二是漏检率高,复杂地形与恶劣天气下,人工对微小缺陷的识别能力显著下降,据国家电网运维统计,人工巡检对绝缘子自爆、导线小断股的漏检率可达15%~20% [2];三是安全风险高,登塔作业与山区巡检易引发人员坠落、迷路等安全事故,年均电力巡检人员伤亡事件超百起[3]。
随着人工智能与无人机技术的快速发展,基于图像识别的智能巡检已成为替代传统人工方式的核心方向。无人机搭载高清摄像头或红外设备,可快速获取线路图像数据,通过目标检测算法自动识别缺陷,大幅提升巡检效率与安全性。目前,YOLO系列、Faster RCNN等算法已在输电线路巡检中初步应用,但仍面临特殊挑战:小目标缺陷占比高,绝缘子自爆碎片、导线断股等缺陷在图像中像素占比常低于5%,现有算法检测精度不足90%;背景干扰复杂,线路图像中树木、云层、建筑物等背景元素易与缺陷特征混淆,导致误检率升高;实时性要求高,无人机巡检图像传输速率达30 frame/s,算法需满足实时处理需求以避免数据积压[4]。YOLOv11作为最新迭代的单阶段目标检测算法,在精度与速度上实现双重提升,但针对输电线路特殊场景的适配性仍需优化。
1.2. 国内外研究现状
1.2.1. 输电线路巡检图像识别技术研究进展
国外方面,2024年,学者提出融合自适应特征金字塔网络的YOLO改进算法,用于无人机巡检路径规划,提升了巡检覆盖效率,但未涉及图像识别算法优化[5]。2025年,学者针对传统YOLOv10算法在无人机航拍图像中可能存在的小目标检测精度不足、复杂背景抗干扰能力弱等问题,提出了融合APFU模块的改进YOLOv10算法,但复杂光照场景下鲁棒性不足[6]。2025年,学者针对绝缘子缺陷类型多样、户外巡检对算法实时性及硬件适配性要求高的特点,提出基于轻量化YOLOv8n网络的检测方法,提升了夜间巡检效果[7]。
国内研究更聚焦工程应用与算法优化:唐鹤卿提出YOLOv5s-CTW算法,改善小型异物检测效果,但复杂光照下检测稳定性不足[8];回媛媛在YOLOv8的基础上引入ECA注意力模块,输电线路缺陷检测mAP达92.1%,但小目标缺陷召回率仍有提升空间[9];陈诺等采用BiFPN优化YOLOv10的特征融合结构,小目标检测精度提升3.8%,但未解决光照畸变导致的检测失效问题[10]。现有研究多针对单一缺陷或特定场景优化,缺乏对高压输电线路多缺陷、复杂环境的全面适配,且最新YOLO系列算法的场景化定制化优化尚未充分落地。
1.2.2. YOLO系列算法改进研究现状
YOLOv11作为当前主流单阶段目标检测算法,通过C3k2模块替代传统C3模块、优化SPPF空间金字塔池化结构、采用轻量化解耦检测头,实现了精度与速度的协同提升[11]。但其在输电线路巡检中的应用仍需优化:数据层面,现有数据集多聚焦单一缺陷,缺乏多样化场景覆盖;网络结构层面,Neck层特征融合能力不足,难以兼顾小目标与大目标检测;损失函数层面,原始损失对小目标定位误差敏感,易导致定位偏移[12]。针对这些问题,学者们提出多种改进方向:注意力机制(CBAM、ECA等)可增强缺陷区域特征权重;特征融合结构优化(BiFPN)可提升多尺度特征利用效率;损失函数改进(CIoU、DIoU)可优化定位精度[13]。然而,这些改进多分散验证,未形成针对高压输电线路巡检场景的系统性优化方案。
2. 相关技术基础
2.1. YOLOv11算法基本结构
YOLOv11采用“端到端”检测框架,整体结构分为输入层(Input)、骨干网络(Backbone)、颈部网络(Neck)与检测头(Head)四部分,具备参数量少、推理速度快、部署友好等优势。
输入层支持多尺度图像输入,核心功能包括:① 图像尺寸自适应调整,通过LetterBox操作将输入图像缩放至640 × 640或1280 × 1280,保持宽高比以避免图像畸变;② 原生数据增强,集成Mosaic、MixUp、HSV色彩空间调整等策略,扩大数据集多样性;③ 自适应锚框计算,基于训练数据集自动聚类生成适配目标尺寸的锚框,提升初始检测框匹配精度。
采用C3k2模块构建骨干网络,替代传统C3模块与C2f模块。C3k2模块通过双分支卷积设计,一支采用1 × 1卷积降维并保留核心特征,另一支通过3 × 3卷积捕获局部细节特征,最终融合输出,在减少计算量的同时增强特征提取能力。骨干网络包含4个C3k2模块与优化后的SPPF模块:SPPF模块采用1 × 1、3 × 3、5 × 5三种尺度的最大池化,在保持有效感受野的同时降低计算复杂度,增强对不同尺度目标的特征捕捉能力。
采用改进型PANet作为颈部网络,通过自上而下与自下而上的双向特征融合路径,实现浅层特征(高分辨率、低语义)与深层特征(低分辨率、高语义)的融合。相较于前代算法,YOLOv11的Neck层简化了部分冗余连接,提升了特征传递效率,但仍存在多尺度特征融合不充分、背景干扰抑制不足的问题。
采用轻量化解耦检测头设计,分离分类与回归分支,分别专注于目标类别判断与边界框定位。检测头集成分布focal loss (DFL)机制,通过对边界框坐标的概率分布建模,提升定位精度;同时采用自适应NMS策略,有效减少冗余检测框。检测头针对大、中、小三种尺度目标,分别在3个特征图(80 × 80、40 × 40、20 × 20)上进行检测,其中80 × 80特征图用于检测小目标,40 × 40用于中目标,20 × 20用于大目标。
2.2. 目标检测评估指标
为量化评估算法性能,采用目标检测领域常用的Precision (准确率)、Recall (召回率)、mAP (平均精度均值)与FPS (每秒帧率)作为核心评估指标。
准确率表示检测结果中真正例(TP,正确检测到的缺陷)占所有检测为正例(TP + FP,FP为误检的非缺陷)的比例,反映算法的误检控制能力;召回率表示真正例占所有实际正例(TP + FN,FN为漏检的缺陷)的比例,反映算法的漏检控制能力。
平均精度(AP)是Precision-Recall曲线下的面积,反映算法在不同召回率下的准确率表现;mAP是所有缺陷类别的AP平均值,综合衡量算法对多类别缺陷的检测精度。本文采用mAP@0.5 (即IoU阈值设为0.5)作为核心精度指标,符合输电线路巡检对缺陷定位准确性的要求。
FPS表示算法每秒处理的图像帧数,反映算法的实时性。对于无人机巡检系统,FPS需不低于20 frame/s才能满足实时数据处理需求。
3. 改进YOLOv11算法设计
针对原始YOLOv11在高压输电线路巡检中的适配性不足,从数据增强、网络结构、损失函数三方面进行系统性改进。
3.1. 适配性数据增强策略设计
高压输电线路巡检图像具有光照变化剧烈(强光、阴影、过曝、过暗)、背景干扰复杂(树木、云层、建筑物)、缺陷尺度差异大(鸟巢与绝缘子碎片)的特点,原始YOLOv11的原生数据增强策略难以满足场景化需求,因此设计“Mosaic + MixUp + 自适应光照调整”组合增强策略,具体如下:
Mosaic增强:随机选取4张不同场景的巡检图像(如晴天山区、阴天城区、雾天线路),按随机比例拼接成1张图像,同时随机调整图像亮度、对比度与饱和度参数(调整范围±30%),扩大数据集场景覆盖范围,增强模型对复杂背景的抗干扰能力;
MixUp增强:随机选取2张图像,按λ∈[0.2, 0.8]的随机权重进行像素级融合。MixUp可增强模型对缺陷局部特征的鲁棒性,避免因缺陷位置偏移、局部遮挡导致的检测失效。
针对巡检图像中常见的强光过曝、阴影过暗问题,设计基于HSV颜色空间的自适应光照调整算法,具体步骤如下:将图像从RGB空间转换至HSV空间,分离亮度通道(V通道)与色彩通道(H、S通道),避免光照调整影响图像色彩信息;计算V通道的灰度直方图,采用Otsu自适应阈值分割算法,自动确定过曝区域(像素值 > 240)与过暗区域(像素值 < 20);对过曝区域进行Gamma校正(γ = 0.5),通过非线性变换降低亮度;对过暗区域进行线性拉伸,将像素值映射至[40, 220]区间,提升亮度细节;将调整后的V通道与原始H、S通道转换回RGB空间,得到光照均衡的图像。
通过组合增强策略,可有效解决巡检图像数据多样性不足、光照畸变导致的检测精度下降问题,为后续算法训练提供高质量数据支撑。经统计,组合增强后训练集样本的光照分布标准差降低42%,小目标缺陷样本有效特征占比提升35%。
3.2. Neck层改进:CBAM注意力模块与BiFPN融合
原始YOLOv11的Neck层采用改进型PANet进行特征融合,但仍存在两方面不足:一是对缺陷区域的特征关注度不足,背景特征易干扰检测;二是特征融合路径单一,多尺度特征融合效率低。为此,在Neck层引入CBAM注意力模块,并采用BiFPN替代原始PANet,具体改进如下:
将CBAM模块嵌入YOLOv11 Neck层的特征融合路径中,具体位置为:在每个特征融合节点(深层特征与浅层特征融合前)添加CBAM模块,对输入特征图进行注意力加权后再进行融合操作,提升缺陷特征的显著性。实验验证,CBAM模块的引入仅增加0.8MB参数量,对推理速度影响极小。
采用双向特征金字塔网络BiFPN替代YOLOv11 Neck层的PANet,构建“自上而下–自下而上–自上而下”的三轮特征融合路径,具体结构如下:
第一轮自上而下:将Backbone输出的深层特征(P5)上采样后,与中层特征(P4)通过加权融合得到P4';将P4'上采样后与浅层特征(P3)加权融合得到P3';
第一轮自下而上:将P3'下采样后与P4'加权融合得到P4'';将P4''下采样后与P5加权融合得到P5'';
第二轮自上而下:将P5''上采样后与P4''加权融合得到最终的P4''';将P4'''上采样后与P3'加权融合得到最终的P3''';
通过三轮融合,实现浅层高分辨率特征与深层高语义特征的充分交互,显著提升对小目标缺陷的特征表达能力。相较于原始PANet,BiFPN的特征融合效率提升30%,小目标特征传递损失降低25%。
3.3. 检测头优化:锚框调整与WIoU损失
YOLOv11采用无锚框检测架构,其检测头通过解耦设计直接预测目标的中心坐标偏移量、宽高缩放因子,无需依赖传统Anchor-Based模型中预定义的锚框进行匹配与回归。该设计的核心优势是避免了锚框尺寸适配、跨数据集迁移性差等问题,同时简化了模型训练流程。
但在高压输电线路巡检的特定场景中,原架构的宽高预测机制存在显著痛点:小目标缺陷的像素占比极低(绝缘子自爆碎片15 × 20像素、导线断股10 × 30像素,图像中像素占比常低于5%),且宽高比差异大(如螺栓松动为1:1,导线断股为1:3),直接通过缩放因子预测宽高时,缺乏有效约束易导致预测值偏离真实尺寸,出现定位框过大或者过小、宽高比失配等问题。复杂背景下(如树木遮挡、云层干扰),小目标的特征响应弱,宽高预测的随机性增强,进一步放大定位偏差。
为此,本文引入K-means聚类获取目标先验尺寸的优化方案,其核心目的并非将YOLOv11重构为Anchor-Based架构,而是为Anchor-Free的宽高预测提供统计约束基准。通过聚类挖掘数据集内缺陷的尺寸分布规律,指导检测头的宽高预测方向,在保留Anchor-Free灵活性的同时,降低小目标宽高预测的随机误差,提升定位精度。具体步骤如下:
统计数据集中所有缺陷真实框的宽高尺寸,并归一化至640 × 640图像尺寸;
采用K-means算法(距离度量为1-IoU,避免因目标尺寸差异导致的聚类偏差)对归一化后的真实框进行聚类,K值设为9 (对应3个检测尺度,每个尺度3个锚框);
得到适配输电线路缺陷的锚框尺寸,如表1所示,其中小尺度检测头(80 × 80)的锚框尺寸显著小于原始YOLOv11,更适配绝缘子自爆、导线断股等小目标。
Table 1. Comparison of anchor box sizes before and after improvement (Unit: Pixel)
表1. 改进前后YOLOv11锚框尺寸对比(单位:像素)
检测尺度 |
原始YOLOv11锚框 |
改进后锚框 |
适配缺陷类型 |
80 × 80 |
(11, 16), (18, 32), (33, 23) |
(5, 8), (10, 15), (15, 20) |
绝缘子自爆、导线断股 |
40 × 40 |
(30, 61), (62, 45), (59, 119) |
(20, 30), (35, 50), (50, 80) |
螺栓松动、小型异物 |
20 × 20 |
(116, 90), (156, 198), (373, 326) |
(80, 120), (120, 200), (200, 300) |
鸟巢、覆冰、大型异物 |
YOLOv11的边界框回归损失默认采用CIoU,其核心优势是综合考虑了边界框的重叠面积、中心点距离与宽高比一致性,但在小目标检测中仍存在不足。CIoU的宽高比惩罚项权重固定,未考虑目标尺度差异,导致小目标的宽高比误差对定位精度的影响被放大;同时,CIoU的梯度更新在边界框重叠度较低时收敛较慢,易导致小目标漏检。
为解决上述问题,本文引入WIoU (Weighted IoU)损失函数。公式为:
(1)
(2)
WIoU在CIoU的基础上引入了动态权重因子α,通过边界框的重叠程度自适应调整惩罚项权重,与CIoU相比,WIoU的优势在于:重叠度较低时,如小目标初始检测阶段,α较小,降低宽高比惩罚强度,避免梯度消失;重叠度较高时,α增大,强化宽高比适配性,提升定位精度。
4. 实验验证与结果分析
4.1. 实验环境与数据集构建
实验数据集采用“实测数据 + 公开数据”结合的方式构建,确保数据的真实性与多样性:
实测数据:与广西水利电力建设集团有限公司合作,采集广西地区3条220 kV高压输电线路(涵盖山区、城区、丘陵三种地形,包含晴天、阴天、雾天三种天气)的巡检图像,采用无人机(大疆M300 RTK,搭载禅思P1全画幅相机)与地面巡检机器人(海康威视DS-2TD6266-10/P,分辨率1920 × 1080)采集,共获取原始图像4200张;
公开数据:从国家电网巡检数据集(SGID)、电力设备缺陷公开数据集(PEDD)补充绝缘子、导线缺陷图像1620张;
数据标注:采用LabelImg工具对图像中的6类缺陷(绝缘子自爆、导线断股、鸟巢、异物悬挂、杆塔螺栓松动、线路覆冰)进行标注,标注格式为PASCAL VOC,生成XML标注文件;标注过程由3名资深电力运维工程师交叉审核,确保标注准确率 ≥ 99%;
数据集划分:按8:1:1比例划分为训练集(4656张)、验证集(582张)、测试集(582张),训练集采用3.1节设计的组合数据增强策略扩充至18,624张,确保模型充分学习不同场景下的缺陷特征。
数据集统计信息如表2所示,可见小目标缺陷(绝缘子自爆、导线断股)占比达42%,符合高压输电线路巡检的实际缺陷分布特点,能够有效验证算法对小目标的检测能力。
Table 2. Statistics of high-voltage transmission line inspection datasets
表2. 高压输电线路巡检数据集统计
缺陷类型 |
图像数量(张) |
占比 |
目标平均像素尺寸 |
缺陷特点 |
绝缘子自爆 |
1280 |
22% |
15 × 20~30 × 40 |
小目标、高反光、形状不规则 |
导线断股 |
1180 |
20% |
10 × 30~20 × 50 |
小目标、线性特征、易被遮挡 |
鸟巢 |
920 |
16% |
80 × 100~150 × 200 |
中目标、不规则形状、颜色多样 |
异物悬挂 |
880 |
15% |
50 × 80~120 × 150 |
中目标、多样性强、无固定形态 |
螺栓松动 |
780 |
13% |
20 × 20~40 × 40 |
小目标、颜色单一、特征不明显 |
覆冰 |
780 |
14% |
200 × 150~300 × 250 |
大目标、纹理特征明显、边界清晰 |
合计 |
5820 |
100% |
- |
- |
4.2. 实验设计与结果分析
4.2.1. 消融实验:改进模块有效性验证
为验证本文设计的“组合数据增强”“CBAM注意力模块”“BiFPN特征融合”“锚框调整 + WIoU损失”四个改进模块的有效性,设计消融实验,以原始YOLOv11为基准,依次添加改进模块,实验结果如表3所示。
Table 3. Ablation experiment results
表3. 消融实验结果
实验编号 |
改进模块组合 |
绝缘子自爆 AP |
导线断股 AP |
鸟巢AP |
异物悬挂 AP |
螺栓 松动AP |
覆冰 AP |
mAP@0.5 |
FPS (frame/s) |
1 |
原始YOLOv11 (基准) |
90.2% |
88.7% |
94.5% |
93.8% |
89.5% |
96.3% |
92.2% |
52 |
2 |
基准 + 组合数据增强 |
92.5% |
91.3% |
95.1% |
94.3% |
91.8% |
96.7% |
93.6% |
50 |
3 |
基准 + 组合数据增强 + CBAM |
94.3% |
93.5% |
95.6% |
95.2% |
93.6% |
97.1% |
94.9% |
48 |
4 |
基准 + 组合数据增强 + CBAM + BiFPN |
95.7% |
94.8% |
96.2% |
95.8% |
94.9% |
97.3% |
95.8% |
46 |
5 |
基准 + 组合数据增强 + CBAM + BiFPN +锚框 + WIoU |
97.2% |
96.1% |
96.8% |
96.5% |
95.9% |
97.5% |
96.5% |
45 |
由表3可知:
组合数据增强(实验2 vs实验1):mAP@0.5提升1.4个百分点,其中小目标缺陷(绝缘子自爆、导线断股) AP提升2.3~2.6个百分点,说明光照调整与MixUp增强有效改善了数据质量,增强模型对复杂光照场景的适应能力;
CBAM注意力模块(实验3 vs实验2):mAP@0.5提升1.3个百分点,小目标AP提升1.8~2.2个百分点,表明CBAM可有效抑制背景干扰,增强缺陷区域特征权重,对小目标检测的提升尤为显著;
BiFPN特征融合(实验4 vs实验3):mAP@0.5提升0.9个百分点,小目标AP提升1.4~1.3个百分点,验证了BiFPN的多尺度特征融合效率优于原始PANet,能够更充分地传递小目标特征;
锚框调整 + WIoU损失(实验5 vs实验4):mAP@0.5提升0.7个百分点,小目标AP提升1.5~1.3个百分点,说明适配小目标的锚框与WIoU损失显著提升了定位精度,减少了小目标缺陷的漏检;
所有改进模块叠加后,mAP@0.5达96.5%,较原始YOLOv11提升4.3个百分点,FPS保持45 frame/s,远高于无人机巡检实时性要求(≥20 frame/s),验证了改进算法在精度与速度上的平衡优势。
4.2.2. 鲁棒性实验:复杂场景适应性验证
为测试改进算法在复杂场景下的鲁棒性,选取“雾天”“强阴影”“密集背景(树木遮挡)”三种典型复杂场景的测试集图像(各100张),对比改进YOLOv11与原始YOLOv11的mAP@0.5,结果如表4所示。
Table 4. Experimental results of robustness in complex scenarios
表4. 复杂场景鲁棒性实验结果
场景类型 |
图像数量(张) |
原始YOLOv11 mAP |
改进YOLOv11 mAP |
提升幅度 |
雾天 |
100 |
83.5% |
92.8% |
9.3% |
强阴影 |
100 |
84.2% |
93.5% |
9.3% |
密集背景(树木遮挡) |
100 |
82.8% |
94.1% |
11.3% |
平均 |
300 |
83.5% |
93.5% |
10.0% |
由表4可知,在三种复杂场景下,改进YOLOv11的mAP@0.5均显著高于原始YOLOv11,平均提升10.0个百分点,其中密集背景场景提升最显著(11.3%),雾天与强阴影场景提升9.3%。这表明改进算法的组合数据增强策略有效缓解了光照畸变与背景干扰问题,CBAM注意力模块增强了缺陷特征的抗干扰能力,整体鲁棒性更适配高压输电线路复杂巡检环境。
5. 工程应用案例
为验证改进YOLOv11算法的工程实用性,将其部署于无人机巡检系统,在广西电网3条220 kV高压输电线路(南宁–崇左Ⅰ线、柳州–来宾Ⅱ线、桂林–贺州Ⅲ线)开展工程应用测试,应用周期为2025年8月~2025年10月,共完成1200 km线路巡检。
无人机巡检流程采用“自主规划–实时检测–数据回传–检修闭环”模式:路径规划:基于GIS系统导入线路杆塔坐标,自动生成巡检路径,设置飞行高度(距线路20~30 m)与拍摄间隔(每50 m拍摄1张图像),避开禁飞区与障碍物;图像采集:无人机按规划路径飞行,相机实时拍摄线路图像,图像分辨率压缩至1920 × 1080 (平衡精度与速度),格式为JPG;实时检测:边缘计算模块运行改进YOLOv11算法(经TensorRT量化加速),对图像进行实时检测,检测速度达42 frame/s,若识别到缺陷,立即记录缺陷位置(GPS坐标)、类型、置信度及拍摄时间;数据回传:巡检完成后,通过4G/5G网络将缺陷数据与原始图像回传至地面管控平台,自动生成巡检报告,标注缺陷等级(一般、严重、紧急);检修闭环:运维人员根据巡检报告制定检修计划,检修完成后再次巡检验证缺陷消除,形成闭环管理。
在南宁–崇左Ⅰ线(山区线路,全长420 km)的应用中,改进YOLOv11算法共检测出缺陷42处,其中绝缘子自爆8处、导线断股6处、鸟巢15处、异物悬挂7处、螺栓松动6处,缺陷识别准确率达95.5% (42/44,2处误检为树木枝干),漏检1处(微小螺栓松动,像素尺寸12 × 15),漏检率2.3%。单次巡检时间为26 h,较传统人工巡检(80 h)缩短67.5%,大幅提升了山区线路巡检效率。
6. 结论
针对高压输电线路巡检中传统人工方式效率低、现有算法小目标检测精度不足的问题,本文提出一种基于改进YOLOv11的巡检图像识别算法,通过实验验证与工程应用,得出以下结论。
设计的“Mosaic + MixUp + 自适应光照调整”组合数据增强策略,有效解决了巡检图像数据多样性不足、光照畸变的问题,使模型mAP提升1.4个百分点,复杂场景鲁棒性显著增强;在Neck层引入CBAM注意力模块与BiFPN特征融合网络,mAP进一步提升2.2个百分点,对小目标缺陷的检测效果尤为突出;优化的小目标适配锚框与WIoU损失函数,使mAP再提升0.7个百分点,减少了检测框偏移与漏检;改进算法在测试集上的mAP达96.5%,FPS为45 frame/s,较原始YOLOv11在精度与速度上均具明显优势。
致 谢
感谢本人所在单位对本研究项目的申报、立项、研究及成果认定等方面工作提供的支持,感谢本研究课题组成员为项目研究工作各阶段所作出的努力,这使得项目研究各阶段如期取得了预期的成果。感谢本研究领域的相关学者们,你们的研究成果为本论文研究提供了必要的科研基础。
基金项目
广西电力职业技术学院2025年度科研能力提升项目“图像识别技术在高压输电线路巡检中的应用研究”(2025ZKY07)。