1. 引言
局部放电(Partial Discharge, PD)是指绝缘介质在电场作用下发生局部击穿现象,常发生在绝缘材料的气隙、裂纹或表层等位置。绝缘材料的绝缘性能下降会使设备出现故障,进而对电力系统的安全稳定运行产生较大的危害[1]。对于空气开关柜而言,局部放电情况较常见。绝缘材料老化、内部缺陷、表面污染以及外界环境的影响都会在一定程度上降低开关柜的绝缘性能,造成内部电弧故障,引起火灾及停电事故的发生,造成经济财产损失[2]。
随着局部放电检测技术和人工智能算法的发展,现有的局部放电检测方法从单一参量检测向多参量检测转变。在现阶段的应用中,传统局放检测方法如暂态地电压法(Transient Earth Voltage, TEV)、脉冲电流法(Pulse Current, PC)、特高频法(Ultra High Frequency, UHF)等均有一些缺点:TEV法灵敏度高但是不能判定内部缺陷[3];PC法可测幅值和相位,但抗干扰能力差[4];UHF法定位精度高,但在一些恶劣的环境条件下可能会出现误判或者漏判的情况[5]。鉴于上述单一方法检测存在局限性,多参量融合检测方法逐渐受到关注。文献[6]提出了基于超声波和TEV检测的模式识别算法,将BP神经网络(Back Propagation Neural Network, BP)和遗传算法融合在一起,提高了局部放电故障诊断的准确率和速度。文献[7]综合利用了超声波检测和紫外检测的优势,使用小波包降噪和KNN (K-Nearest Neighbor, KNN)判别算法对声光信号进行处理。文献[8]提出一种基于特高频和声学成像联合检测的开关柜局部放电研究方法,用特高频传感器采集信号来支持向量机(Support Vector Machine, SVM)分类放电缺陷,并借助螺旋麦克风阵列和波束形成算法定位放电声源。文献[9]分析开关柜局部放电信号的时域、频域和相位特征,按暂态地电压法、超声波法和特高频法的顺序联合检测,逐步排查放电现象,精确区分故障类型及定位放电位置。尽管多参量融合检测方法能够有效克服单一检测方法的局限性,但仍面临高效提取局部放电的多参量融合特征和适应环境状况变化这些难点。此外,针对开关柜局部放电的多参量检测,深度学习算法的研究仍相对匮乏。
为了解决上述问题,本文基于局部放电产生的特性,提出了一种基于层级多尺度特征提取网络(Hierarchical Multi-Scale Feature Extraction Network, HMFENet)的多参量融合局部放电识别方法。该方法通过融合温湿度、紫外光、超声波、臭氧和二氧化氮气体[10]多种参量,集成多尺度特征提取模块(Multi-Scale Feature Extraction Block, MSFE)和Transformer,实现了对局部放电现象的检测和模式识别。与传统方法相比,该方法能够有效克服单一检测方法的局限性,并提取融合特征,适应柜内环境变化,提高了局部放电检测的准确性和可靠性。为了验证该方法的有效性,本文在10 kV空气开关柜的局部放电实验平台上搭建了悬浮放电、气隙放电、尖端放电和沿面放电四种局放故障模型,采集了相应的局部放电数据用于模型训练与测试,通过与其他模型的性能对比,验证了本文所提模型的优越性。
2. 实验环境与数据采集
本文在真实开关柜环境内进行四种局部放电类型的放电实验。10 kV开关柜局部放电实验平台如图1所示,其由10 kV开关柜柜体、放电缺陷模型电机系统、放电电极、耦合电容器、变压器、检测阻抗、脉冲电流法检测仪、隔离滤波器和调压控制器等组成。
交流电源为试验平台提供220 V电压输入。调压控制器用于调节输入电压,调压后的电压经隔离滤波器输出稳定、纯净的电压之后再送入变压器升压。耦合电容将高压输送到后级放电试验电路,同时为局部放电产生的高频脉冲提供低阻抗的高频通路。检测阻抗是加在耦合电容器之后的,它需与整个测量回路阻抗相匹配,使信号能够有效传输。当局部放电发生时,由于放电回路产生的脉冲电流流经检测阻抗,会在其两端产生电压信号,此时采用脉冲电流法检测仪检测所获得的电压信号即可获取局放信息。
Figure 1. Schematic diagram of the partial discharge test platform for 10 kV switchgear
图1. 10 kV开关柜局部放电实验平台示意图
图2从左到右分别为悬浮放电[11]、气隙放电[12]、沿面放电和尖端放电[13]的放电缺陷模型,方框处表示模型放电部分。悬浮放电模拟的是某导体部件间出现缝隙没有很好接触的放电现象。气隙放电模拟的是绝缘体内部产生缺陷,图中方框处组件为聚甲醛塑料绝缘件,放电在绝缘件内产生。沿面放电模拟绝缘体表面出现了缺陷,从而导致电场集中,方框处为环氧树脂材料绝缘件。尖端放电则是模拟电场强度在尖锐物体表面产生的放电现象。
Figure 2. Discharge defect models for suspended discharge, air gap discharge, surface discharge, and tip discharge
图2. 悬浮放电、气隙放电、沿面放电和尖端放电的放电缺陷模型
如图3所示为多参量传感装置实物图,该传感装置以背部磁吸的方式安置在放电缺陷模型周围,以无线传输方式将芯片打包的数据发送到网关,网关再以MQTT协议(Message Queuing Telemetry Transport)发布主题,后台服务器进行主题订阅,从而将传感器采集到的数据保存至数据库中。实验过程中,控制放电缺陷模型电机系统选择所需的放电类型,通过控制升压旋钮不断进行升压,当观察到脉冲电流法的椭圆时基图出现放电脉冲时,则开关柜内出现了对应的放电现象。每一轮数据采集在选取放电类型后,经历不放电(5分钟)–放电(30分钟)–不放电(5分钟)三个过程,同一时间段采集到的温度、湿度、紫外强度、超声时频信息、臭氧和二氧化氮浓度为一个样本,以一维时序序列格式存储到数据库,每个样本间间隔约5 s。
Figure 3. Physical diagram of the multi-parameter sensing device
图3. 多参量传感装置实物图
3. 层级多尺度特征提取网络
由于局部放电多参量数据为一维时序序列数据,包含多个维度,各维度有不同的尺度特征,所以有效融合这些特征才能更好地发挥其各自作用。为实现上述目标,需考虑每一个参量的数据特点,但不同放电数据集的样本特征各异,导致其对感受野尺寸的需求也不同。感受野表示输出单元可感知的输入数据范围,其大小的选择由数据特性、模型结构和训练策略决定,最优的感受野尺寸将直接影响模型对时间序列中不同尺度特征的捕捉能力[14]。尽管Transformer模型利用自注意力机制可以较好地捕捉序列数据长距离之间的依赖关系,但其在多尺度特征捕捉方面仍有待提高[15]。基于上述问题提出了层级多尺度特征提取网络,采用分层结构设计,各层级专注于提取不同尺度特征,模拟人眼从宏观到细节的扫描过程,并引入多尺度特征提取模块,以增强对多参量数据中不同时间尺度特征的融合,极大地提高了时间序列分类效果。
HMFENet的模型结构由3个stage组成,如图4所示,每个stage由MSFE模块和Transfomer编码器组成。MSFE模块的核心思想是改善1D-CNN在处理时间序列数据时对感受野(Receptive Field, RF)的敏感性,以实现不同尺度特征的高效提取[16]。其设计源于两个关键问题:一是1D-CNN对卷积核配置不敏感,尽管感受野大小对性能影响显著,但模型对如何通过不同卷积核组合达到特定感受野尺寸并不敏感;二是1D-CNN性能取决于最佳感受野大小,两者呈正相关。因此,如果模型能够覆盖所有可能的最佳感受野大小,其性能将接近于具有单一最佳感受野大小的模型。
Figure 4. Hierarchical multi-scale feature extraction network structure
图4. 层级多尺度特征提取网络结构
MSFE模块基于上述问题,通过在1D-CNN中引入三层结构,使其能够自动覆盖所有尺度的感受野,从而使模型能够捕获从全局到局部的多尺度特征。基于哥德巴赫猜想,即任何大于2的偶数都可以表示为两个质数之和,第一层和第二层选取1到pk的质数作为卷积核来覆盖所有偶数尺寸感受野,其中第一层使用较大的质数核组合,第二层使用较小的质数核组合,来捕获不同的尺度特征。第三层则引入尺寸为1和2的卷积核,与前两层的输出进行组合,以覆盖组合范围内的全部整数尺寸的感受野,使得模型能够捕获到更细致的特征。公式(1)为三层质数卷积核的配置,其中,
表示第i层的卷积核配置,
为第一层的核尺寸集合,
为第二层核尺寸集合,需确保
。
(1)
由于MSFE模块每层会使用多个不同大小的卷积核,那么将会有多条路径组成不同的感受野大小,则所有路径感受野的集合如下:
(2)
式中k(1)、k(2)和k(3)分别代表第1层到第3层选择的卷积核尺寸,i为层索引,范围是1到3。
每层输出后,把不同尺度的特征进行拼接,并利用批量归一化和ReLU激活函数以加强模型表达能力和非线性特征学习能力。假设每层的质数卷积核大小集合为
,则该模块每一层可被公式化为:
(3)
(4)
(5)
式中,Conv1D为一维卷积层,x为输入的时间序列数据,k为质数卷积核大小,
为每一层所有一维卷积层拼接的结果,后经过批量归一化和激活函数得到每一层的输出。
经过MSFE模块得到的多尺度特征张量,里面包含了不同尺度提取到的特征,然后利用这些特征分别进行三种线性变换,得到Q、K、V矩阵来进行自注意力计算,公式如下
(6)
其中,QKT表示输入序列各位置之间的关联程度,dk为K矩阵维度大小,因为点积结果过大,所以除以根号dk以进行缩放,防止梯度爆炸。缩放后的点积结果通过Softmax函数转换成概率分布形式,与值矩阵V进行加权求和得到最终的自注意力输出,自注意力输出与输入特征通过残差连接、后接前馈全连接层和层归一化等操作进行输出。
在网络的3个stage设计中,第一个stage的MSFE模块内都使用较大尺度的卷积核去提取时间序列中的宏观特征。随着stage的递进,MSFE模块内所有卷积核尺寸逐渐减小,相应的感受野也从大变小,使得中间及后续stage可以提取更加精细的特征,在这一过程中可获取到时间序列数据从全局到局部的多层次信息。每个stage中的Transformer编码器利用其强大的特征学习能力来捕获时序特征间的联系,并增强时序数据内部结构的学习效果。经过3个stage的特征提取和复杂依赖关系建模后,模型通过全局平均池化来整合所有阶段的特征提取,最后以一个全连接层生成放电类型预测结果。
4. 实验结果和分析
4.1. 算法环境与模型参数设置
本文以PyTorch作为算法模型的构建工具,在配备NVIDIA GeForce GTX 1660 Ti显卡(6 GB显存)和Intel Core i7-2600 GHz处理器的硬件条件下进行训练。训练时使用动态学习率,初始值设定为0.001,批处理大小设置为32,训练周期设置为200。为了评估模型对放电分类任务的性能,使用交叉熵损失函数计算模型在放电分类上预测值与实际值之间的差距。
HMFENet模型参数设置如表1所示。MSFE模块有3层结构,其网络参数分别代表[输入通道数,输出通道数,卷积核大小]。宏观上看,三个stage的同级质数卷积核逐stage递减;微观上看,各stage内部三层核尺寸亦呈阶梯下降趋势。该阶梯式递减设计通过“大→小”质数核组合实现了所需感受野的全覆盖,前层高效捕捉全局特征,后层细化局部特征。每层质数核大小需在全局和局部之间折中,因为过大的核大小会导致感受野冗余,全局信息过载;过小则感受野过窄,会导致特征碎片化。Transformer编码器和全连接层网络参数分别代表[输入通道数,输出通道数],其中每个stage的Transformer编码器主要负责建模不同尺度特征间的全局依赖关系。模块最后的全连接层输出5个神经元,相当于未放电现象和四种典型的放电类型。
Table 1. HMFENet model parameter settings
表1. HMFENet模型参数设置
网络层数 |
模块名称 |
网络参数 |
1 |
MSFE Block |
[7, 16, 11], [7, 16, 13] |
[32, 32, 3], [32, 32, 5] |
[64, 32, 1], [64, 32, 2] |
2 |
Transformer Encoder |
[64, 64] |
1 |
MSFE Block |
[64, 128, 7] |
[128, 64, 5] |
[64, 32, 1], [64, 32, 2] |
2 |
Transformer Encoder |
[64, 64] |
1 |
MSFE Block |
[64, 64, 3] |
[64, 32, 3] |
[32, 32, 1], [32, 32, 2] |
2 |
Transformer Encoder |
[64, 64] |
1 |
FC |
[64, 5] |
4.2. 实验数据集
在10 kV开关柜局部放电实验平台上采集的实验数据,以一维时间序列格式呈现,共7个初始特征:温度、湿度、超声波时域最大值、超声波频域差值(对应频段内放电频率强度与噪声底噪强度相减值)、二氧化氮浓度、臭氧浓度和紫外参数。其中超声频域数据是时域数据经过快速傅里叶变化得到的结果。一维时间序列数据经过处理,共有591个样本,涵盖悬浮放电、气隙放电、尖端放电和沿面放电样本各约100个,其余为未放电数据。为确保数据一致性和可比性,训练前经过最小、最大归一化处理的数据集以7:1:2的比例划分为训练集、验证集和测试集。
4.3. 实验评价指标
为了衡量模型整体性能,本实验主要采用精确度(Precision)、召回率(Recall)、F1分数(F1-Score)和准确率(Accuracy)四个指标。在放电类型中,准确率衡量模型预测为放电的样本中实际为放电的比例,公式如下:
(7)
其中,
为模型正确预测为类别i的样本数,
为模型错误将其他类别预测为类别i的样本数。
召回率衡量所有实际放电样本中被正确预测为放电的比例,公式如下:
(8)
其中,
为模型错误将类别i预测为不放电或其他放电类型。
F1分数是精确度和召回率的调和平均,用于平衡精确度和召回率,公式如下:
(9)
准确率衡量的是模型对所有样本的分类正确性,公式如下:
(10)
其中,TP0、TP1、TP2、TP3、TP4分别是不放电和4种放电类型的真正例数,Total为所有类别的样本总数。
4.4. 时序模型对比与消融实验
本文使用在10 kV开关柜局部放电实验平台上收集的数据进行实验。首先将所提方法与主流的时序模型RNN (Recurrent Neural Network)、LSTM (Long Short-Term Memory)和Transformer进行对比,因为这三种架构分别在建模短期依赖、长期依赖以及全局关系方面最具代表性。
Figure 5. Loss variation graphs of different models
图5. 不同模型的Loss变化图
图5为四种模型训练集和验证集的Loss变化曲线。可以观察到,RNN和LSTM模型的Loss在训练和验证过程中波动起伏较大,在200个训练周期后损失值相对较高,而Transformer模型的Loss下降较为平稳,收敛速度较快。HMFENet模型虽然在初期存在较大波动,但是大约50个周期后Loss趋于稳定,并且最终的损失值低于其他三个模型,显示出更好的收敛性。
图6展示了四种模型的混淆矩阵,用于评价它们在局部放电模式识别任务上的性能。测试集包含120个样本,分为五类,0、1、2、3、4分别代表不放电、悬浮放电、尖端放电、气隙放电和沿面放电。从混淆矩阵可见,HMFENet显示出较低的错误分类概率,特别是在模型识别不放电时将其误分到气隙放电、沿面放电的情况较少。这表明HMFENet模型对于判别出放电故障较为精准,更能区分出不同类型的放电故障。
为进一步验证所提MSFE Block与层级化思想的有效性,如表2所示,在RNN、LSTM和Transformer基准模型上依次加入MSFE Block和3 stages层级思想进行对比。所有实验均在一致的环境设置和训练参数下进行。表中的A、P、R和F1分别表示准确率(Accuracy)、精确度(Precision)、召回率(Recall)和F1分数(F1-Score)四个评价指标。
Figure 6. Confusion matrices of different models
图6. 不同模型混淆矩阵
从表中三个基准模型结果来看,HMFENet在所有评价指标上都优于传统的RNN、LSTM和Transformer模型,在该任务上显示了优势。RNN无法记住时间序列信息,捕捉不到长程依赖;LSTM可以处理序列数据,但在长序列、大数据量上易出现梯度消失、梯度爆炸的现象,导致模型效果不佳;Transformer模型虽然在处理长序列上有优势,但对局部放电多特征的捕捉能力有限。相比之下,HMFENet基于多尺度特征提取,能够更有效地融合多种传感器数据,提高识别的准确性和鲁棒性。
Table 2. Comparison of ablation experiments
表2. 消融实验对比
模型 |
A/% |
P/% |
R/% |
F1/% |
RNN |
90.83 |
90.67 |
94.58 |
91.97 |
RNN + MSFE Block |
93.33 |
95.27 |
93.31 |
94.06 |
续表
RNN + MSFE Block + 2 stages |
94.17 |
94.60 |
95.26 |
94.87 |
RNN + MSFE Block + 3 stages |
95.00 |
96.17 |
94.63 |
95.35 |
RNN + MSFE Block + 4 stages |
91.67 |
91.32 |
94.62 |
92.55 |
LSTM |
91.67 |
91.62 |
94.31 |
92.48 |
LSTM + MSFE Block |
95.00 |
95.06 |
95.72 |
95.26 |
LSTM + MSFE Block + 2 stages |
95.00 |
94.38 |
96.44 |
95.20 |
LSTM + MSFE Block + 3 stages |
95.83 |
96.00 |
96.17 |
95.93 |
LSTM + MSFE Block + 4 stages |
89.17 |
89.96 |
92.53 |
90.56 |
Transformer |
95.83 |
95.32 |
96.89 |
95.87 |
Transformer + MSFE Block |
96.67 |
96.02 |
97.46 |
96.61 |
Transformer + MSFE Block + 2 stages |
93.33 |
92.76 |
95.64 |
93.77 |
Transformer + MSFE Block + 4 stages |
74.17 |
78.45 |
85.07 |
76.97 |
HMFENet |
97.50 |
97.27 |
97.91 |
97.53 |
4.5. 不同模型性能对比
为了进一步评估HMFENet在多参量融合局部放电模式识别任务中的性能,本文选取了当前局部放电识别领域具有代表性,且在多参量信号分析中常使用的机器学习和深度学习模型作为对比方法。机器学习领域,选择了SVM [17]、RF (Random Forest) [18]、XGBoost (Extreme Gradient Boosting) [19]等经典算法,因为这些方法在局部放电信号特征分类中应用广泛,具有较高的可解释性。深度学习领域除了前文所对比的RNN、LSTM和Transformer模型,还选择了VggNet (Visual Geometry Group) [20]、ResNet (Residual Network) [21]、DenseNet (Dense Convolutional Network) [22]和Swin Transformer [23]这些代表不同深度、不同感受野设计以及不同卷积策略的信号特征提取方法。
Table 3. Comparison table of different models
表3. 不同模型对比表
评价指标 |
SVM |
RF |
XGBoost |
VggNet |
ResNet |
Swin-T |
RNN |
LSTM |
Transformer |
HMFENet |
A (%) |
80.49 |
89.43 |
90.24 |
90.24 |
91.87 |
88.62 |
90.83 |
91.67 |
95.83 |
97.50 |
P (%) |
81.22 |
89.86 |
89.38 |
90.41 |
91.06 |
88.49 |
90.67 |
91.62 |
95.32 |
97.27 |
R (%) |
86.70 |
90.85 |
92.01 |
91.89 |
93.36 |
91.83 |
94.58 |
94.31 |
96.89 |
97.91 |
F1 (%) |
81.90 |
90.31 |
90.53 |
90.90 |
91.99 |
89.64 |
91.97 |
92.48 |
95.87 |
97.53 |
如表3列出了HMFENet与不同模型的对比结果,从表格可以看出,传统机器学习模型(如SVM、RF、XGBoost)的性能普遍低于深度学习模型(如Vggnet、ResNet、Swin-T、RNN、LSTM、Transformer和HMFENet)。这主要是因为深度学习模型能够在已有的数据上自动学习与挖掘,捕捉更高层次的数据特征,而传统机器学习模型都是基于输入的低级特征进行学习,因而不能直接学习复杂的模型。尽管Swin Transformer在理论上具有很强的特征提取能力,但在该数据集上的识别率相对较低,可能是因为其对窗口大小和数据分布比较敏感,需要更精细的超参数调整和可能的架构修改来适应本数据集。相比之下,HMFENet模型在四个评价指标上均表现最佳,可以更有效地捕捉融合数据关键特征并提升分类性能。
5. 总结
针对现有空气开关柜中局部放电检测多依赖于单一参量,多参量融合的局放检测方法无法高效融合多特征的问题,本文提出了一种基于层级多尺度特征提取网络的多参量融合局部放电模式识别方法。HMFENet的核心优势在于其独特的分层结构设计和多尺度特征提取模块,提升了模型对复杂信号的处理能力。此外,HMFENet通过引入Transformer编码器,进一步增强了模型对时间序列数据内在结构的理解,使其能够捕捉到更细微的特征变化。实验结果表明,MSFE Block和层级思想可以显著提升模型的整体性能,本文所提方法优于其他多种传统的机器学习方法和深度学习模型,识别局部放电故障准确率达97.50%。
基金项目
国网安徽省电力有限公司科技项目(B312A023000Q)。