1. 引言
煤矿变电所作为煤矿供电系统的重要枢纽,其内部的高低压开关柜的安全可靠运行直接关系到矿下安全生产。高低压开关柜上的指示灯和仪表显示开关柜当前的运行状态。通常由值班人员、运维人员对站内设备定期进行实时巡检,以保证变电所的正常运行。为了推动智能电网发展,实行开关柜指示灯及仪表的巡检的去人工化。同时,随着自动化技术的发展,煤矿变电所的设备状态和仪表读数会上传到监控中心,变电所可以无人值守但需有人巡检,定期巡检依旧是保障供电系统安全运行不可或缺的一部分。实现开关柜状态实时检测的难点在于对开关柜的目标快速精准定位。
近年来,随着深度学习模型在目标识别算法的应用,目标识别算法具有高效的自动学习能力和分类能力。目标检测算法主要包括以YOLO为代表的单阶段目标检测算法和以R-CNN系列网络为代表的双阶段目标检测算法 [1] 。双阶段目标检测算法在第一阶段通常会生成一些可能包含目标的候选框,在第二阶段对这些候选框进行分类和位置回归,最终确定目标的位置和类别。而单阶段目标检测算法通过使用一组预定义的锚框在整个图像上直接预测目标的位置和类别。双阶段目标检测算法在检测精度方面表现较好,单阶段目标检测算法在速度方面更快。文献 [2] 为了提高YOLOv3对小目标的检测的性能,增加了特征图的加权融合。文献 [3] 对Faster R-CNN模型中的非极大值抑制(NMS)和锚点框生成机制进行改进,实现对采集的变电站设备视频图像进行缺陷检测。综上所述,基于深度学习的目标检测算法在开关柜中应用具有广泛的前景,这些算法能够有效地检测和识别开关柜中的设备,提高智能电网的运维管理效率。
上述研究在开关柜目标识别上已经取得一定进展,但仍可以进一步优化:1) 煤矿变电所开关柜的数据集匮乏;2) 目前主流的目标检测算法多为深层网络,对GPU要求高,可以减少计算量和参数数量,实现网络的轻量化;3) 优化算法损失函数,提高检测的准确率和稳定性。
针对上述问题,本文提出一种改进的YOLOv5n模型。合理运用图像增强扩充煤矿变电所开关柜数据集;在YOLOv5模型的基础上将主干网络中C3_1的瓶颈层替换为Faster_Block,Faster_Block的PConv (部分卷积)可以减少计算量和参数数量,实现网络的轻量化;将YOLOv5模型的定位损失函数替换为α-CIoU损失函数,α参数提升高IoU的目标与对应的边界框的权重,从而提高检测的准确率和稳定性。在pc端将本文的模型与另外两种轻量化模型在煤矿变电所数据集上进行测试,以评估它们在精度和速度方面的表现,验证模型性能。
2. YOLOv5n网络结构
YOLOv5n的网络结构包括输入端、Backbone (主干网络)、Neck和Head [4] 。在输入端,YOLOv5采用了Mosaic数据增强方法,该方法会随机选择四张图片,并将它们随机缩放后拼接在一起,从而极大地增加了数据集的多样性。同时,这种随机缩放方法还能够增加很多小目标,从而提高了网络的鲁棒性。Backbone是用于提取输入图片特征信息的关键部分,本文使用的YOLOv5n的Backbone去掉了Focus结构,降低计算量和模型大小,以便更好地应用于实际场景中 [5] 。它主要由CBS、C3和SPPF组成。其中,CBS是由Conv (卷积)、BN (批量归一化)和SiLu (激活函数)三个模块构成的;而C3中的C代表CSPNet (跨阶段局部网络),3表示这个模块有三个卷积层。Neck为多尺度特征融合网络,由CBS、下采样和Concat组成,用于融合Backbone提取的特征,提高网络的性能。Head是用于对不同大小目标进行预测的分类器,并根据预测结果生成相应的边界框和类别。它能够根据输入图片的不同特征,自适应地进行分类和边界框的生成 [6] 。YOLOv5网络框图如图1所示。

Figure 1. YOLOv5 network architecture
图1. YOLOv5网络框图
3. YOLOv5n网络改进
3.1. 主干网络改进
在卷积层中,每个卷积核会在输入图像的不同位置提取特征。这些特征可能包括边缘、纹理、颜色、形状等,因为卷积神经网络具有共享权重的特性,即相同的卷积核会在不同位置提取相似的特征。图2为开关柜图像经过一次卷积后所得到的部分特征图,某些特征图相似度很高,需要减少冗余计算,提高计算速度 [7] [8] 。

Figure 2. Feature map after the first convolution
图2. 第一次卷积后特征图
3.1.1. PConv和PWConv
许多研究致力于减少神经网络的FLOPs,来提高神经网络的训练速度。但是延迟等于FLOPs除以FLOPS (每秒浮点运算次数),只有在保持FLOPS变化很小的情况下降低FLOPs,才能有效地降低网络的延迟。许多神经网络的FLOPS非常低,即使降低FLOPs也难以改善网络,而导致FLOPS低的主要原因是频繁的内存访问。因此提出PConv,它可以有效减少计算冗余以及内存访问量 [9] [10] 。PConv如图3所示。
PConv可以充分利用特征图的冗余,在输入特征图的一部分通道上应用卷积操作,而不影响其他通道 [11] 。它实现了slicing和split_cat两种前向传播方式,以slicing为例,它将输入张量按通道数分为两部分,其中一部分经过卷积操作,另一部分保持不变,最后将两部分张量进行拼接,从而实现仅在部分通道上应用卷积。一般将第一个或最后一个连续的通道为整个特征图的代表进行计算,在不丧失一般性的情况下默认输入和输出特征图具有相同数量的通道。
由于PConv只对部分通道进行卷积,为了剩余通道信息不被浪费,在PConv的基础上增加了PWConv (逐点卷积)。PWConv使用1 × 1的卷积来对输入特征图进行卷积操作,实现通道数的调整和特征图的压缩,从而可以在模型中减少计算量和参数数量 [12] 。
3.1.2. Faster_Block
Faster_Block包含Adjust Channel、PConv、两个PWConv (或者Conv 1*1)、DropPath和shortcut。在前向传播过程中,如果输入通道与设定的值不一样,将使用Adjust channel对输入的通道数进行调整,然后将调整后的结果传入PConv中。图像经过部分卷积传入PWConv (或者Conv 1*1)层,再通过DropPath进行正则化,最后进行残差连接。其网络框图如图4所示。
本文使用Faster_Block替换主干网络里C3_1的瓶颈层,从而轻量化网络,降低计算量和参数量 [13] 。
3.2. 损失函数改进
YOLOv5模型通过三种不同类型的损失函数来综合考虑目标分类、目标位置和目标置信度等因素,以更好地进行目标检测任务。它采用二元交叉熵作为置信度损失和分类损失的损失函数,提高模型准确性和收敛速度;采用CIoU作为定位损失的损失函数,更好地处理不同目标之间的交叉问题,提高模型的稳定性和泛化能力。
本文使用α-CIoU做定位损失,除了CIoU的部分,还引入了一个α参数。它可以使得高IoU的目标与对应的边界框的权重增加,这样就能更加关注与目标相匹配的边界框,从而减少噪声边界框对模型性能的影响。α-CIoU在训练轻量级模型时表现良好,且更具鲁棒性和稳定性,能很好地处理噪声边界框,提高了检测准确率和稳定性 [14] 。
4. 煤矿变电所开关柜数据集制作
以某煤矿变电所为研究对象,它包含高压开关柜10台,低压开关柜30台。
4.1. 煤矿变电所开关柜数据集制作
本文的某煤矿变电所开关柜数据集由巡检装置拍摄,共采集图片439张,其中,开关柜目标检测类别包括:
1) 带汉字的仪表(c instrument):这些仪表通常是用于保护、监测和控制电力系统的设备。例如,微机综合保护器用于检测和保护变电站的设备,绝缘在线监测装置用于监测变压器和其他设备的绝缘状态,智能电弧光保护装置用于检测和控制电弧光的风险。
2) 数字仪表(d instrument):这些仪表通常是用于测量和显示电力系统的电参数,如电流、电压、功率因数和电能。例如,电流表用于测量电路中的电流,电能表用于测量电路中的电能。
3) 开关柜智能操显装置(mc):这些装置通常是用于控制和监测开关柜中的设备,例如断路器、隔离开关和接地开关等。智能操显装置可以实现对开关柜设备的遥控和遥测。
4) 开关(switch):这些设备通常是用于控制和切换电路中的电流和电压。在变电所中,开关通常是断路器、隔离开关和接地开关等。
5) 指示灯(led):这些设备通常是用于显示设备的状态和工作情况。在变电所中,指示灯通常是用于显示设备的开关状态、电流状态和故障状态等。
6) 通过检测这些不同的类别,可以帮助变电所运维人员了解变电所中各个设备的状态和工作情况,及时发现和处理潜在的故障和问题,确保电力系统的安全和稳定运行。开关柜目标检测类别如图5所示。
使用LabelImg对原图进行标注,它的标注格式有三种:VOC数据格式(xml文件)、YOLO数据格式(txt文件)和Create ML(json文件),本文选择的是YOLO数据格式。标注时要保证标签和原图一一对应,且所有原始图片格式需要相同。
4.2. 图像增强
图像增强是一种处理图像的技术,它可以改善图像的质量、突出其特征以及减少噪声等。这种技术可以应用于医学图像处理、视频分析、安全监控和目标检测等领域。在目标检测中,若数据集比较有限,且样本之间存在相似性,这容易导致模型出现过拟合现象。通过使用图像增强技术,可以生成新的样本数据,扩充数据集规模,增加模型的泛化能力,从而提高目标检测的准确度和稳定性 [15] [16] 。
为了扩充数据集,选择了blend、blur、contrast和emboss增强方式。数据增强后生成了带标签的开关柜图片共466张,其中27张图片是对小目标的局部增强。训练集和测试集按照9:1的比例分割数据集。经过图像增强后的开关柜图片如图6所示。

Figure 5. Switchgear target detection category
图5. 开关柜目标检测类别

Figure 6. Image after data augmentation
图6. 开数据增强后开关柜图片
5. 实验结果与分析
本文实验的操作系统为Windows11,使用Anaconda创建虚拟环境。其中,python版本为3.8,pytorch版本为1.12.1,GPU为NVIDIA RTX3050。YOLOv5的requirements文件里包含所需的依赖包,可以一键安装。若个别依赖包安装失败,则需查询失败原因再手动安装。
5.1. 实验参数
YOLOv5的输入端可以对输入图片的大小调整,预设定图片大小为640 * 640。将图片的长边按比例缩放为640,短边则填充为32的整数倍。由于本台设备的显存有限,所以将batchsize设定为4,work设定为1。训练轮数为150轮,采用随机梯度下降作为优化算法,权重衰减系数为0.0005,初始学习率为0.01。
5.2. 实验对比
本文选取YOLOv5n、YOLOv5n_MobileNetV3、YOLOv5n_GhostNet和本文改进的YOLOv5n_Faster模型进行对比,在超参数完全相同的情况下,于同个实验设备上运行,从精确率(P)、召回率(R)、全类平均精度(mAP)和GFLOPs四个方向对比评价,不同算法实验结果如表1所示。使用改进的YOLOv5n_Faster算法对开关柜上不同类别检测结果如表2所示。
(1)
(2)
其中,TP表示正确检测的样本数量,FP表示误检的样本数,FN表示漏检的样本数。

Table 1. Comparison of recognition results of different algorithms on switch cabinet dataset
表1. 不同算法在开关柜数据集上识别结果对比

Table 2. Identification results of different categories of switchgear
表2. 开关柜的不同类别识别结果
本文选择了两种YOLOv5n轻量化方法与本文提出的轻量化方法在同台机器进行对比。从表1的五个方向对照分析,虽然本文的YOLOv5n_Faster算法的FPS不是最高的,GFLOPs也不是最低的,但它运算速度仅低于YOLOv5n_MobileNetV3,验证了它可以有效减少内存的频繁访问和冗余计算。且综合来看它具有最高的平均精度、较高的精确率和召回率,这意味着它在检测目标物体时更准确、更快速。
6. 结论
本文针对变电所实时巡检需求来轻量化YOLOv5n网络,采用Faster_Block替换C3_1的瓶颈层,解决特征冗余带来的无用计算的问题;图像增强方法对自制数据集进行扩充,针对开关等小目标进行额外的图像增强;为增大具有高IoU值的目标与对应的边界框的权重,在计算定位损失的CIoU上加入α系数。
据上述实验表明,提出的算法相较于传统的YOLOv5n算法提高了0.3%的精度,平均时间缩短了55.621 ms。此外,该算法相较于其他轻量化算法有更好的整体性能,在模型轻量化的同时,仍然保持了较高的精确率、召回率和全类平均精度指标。并且它的FPS较高,这意味着其能够更快速地完成目标检测任务。因此,YOLOv5n_Faster是一种既能保持高精度又能实现轻量化的目标检测模型,适合用于一些对实时性和精度要求都较高的场景。
从表2可以看出小目标检测方面仍有提升的空间,在后续的研究中将着重考虑提升小目标的检测精度,降低漏检和误检的概率。
基金项目
国家自然科学基金项目(62003292),盐城工学院研究生科研与实践创新计划项目(SJCX22_XY020)。
NOTES
*通讯作者。