1. 引言
随着电力系统结构日益复杂和运行规模持续扩大,设备运行状态的智能监测与故障预测正成为保障电网安全稳定运行的关键环节。传统的电网故障诊断方法主要依赖于人工规则、静态模型或经典机器学习算法(如支持向量机、随机森林等) [1] [2],这些方法虽然在特定条件下具有一定的实用性,但普遍存在以下不足:(1) 无法有效建模电力设备之间复杂的拓扑结构和全局关联性;(2) 缺乏对设备运行状态动态变化过程的时序建模能力;(3) 在面对高维、多源、异构数据时,预测精度和泛化能力有限。
近年来,图神经网络(Graph Neural Network, GNN) [3]因其在建模非欧几里得空间结构数据方面的强大能力,逐渐在交通[4]、社交网络[5]、推荐系统[6]等领域获得广泛应用,并被引入电力系统中以提升故障预测与状态评估的性能。尤其是图卷积网络(Graph Convolutional Network, GCN)能够利用电网的拓扑结构对设备状态进行空间信息聚合[7] [8],而门控循环单元(Gated Recurrent Unit, GRU)等时序建模机制则擅长处理设备运行数据中的时间依赖特征。当前部分研究尝试将GNN与时序模型进行结合[9]-[11],但在特征构造的充分性、模型结构设计的针对性以及实验验证的系统性方面仍存在提升空间。
针对上述问题,本文提出一种基于GCN与GRU联合建模的拓扑感知型故障预测算法,通过构建电网图结构并融合节点静态拓扑属性与动态运行状态,实现空间拓扑依赖与时间演化规律的协同建模。具体而言,GCN模块用于捕捉每一时间步设备间的结构性关联,GRU模块建模各设备节点的时间序列特征,从而提升故障预测的准确性和鲁棒性。实验在IEEE 118节点系统及PowerGraph数据集上开展,结果表明该方法在准确率、F1分数、召回率等指标上均优于现有主流方法,验证其在电网智能运维场景下的实用性和先进性。
2. 相关工作
2.1. 电网设备故障预测的传统方法
电网设备故障预测是电力系统状态感知与智能运维中的核心任务[12]。早期方法多依赖于专家经验和规则库构建的逻辑推理模型,难以适应复杂动态工况。随着数据采集与感知技术的发展,基于机器学习的分类与回归模型逐渐成为主流手段,例如支持向量机(SVM [13])、随机森林(RF [14])、k近邻(k-NN [15])等。这些方法通过对设备运行参数(如电压、电流、有功功率等)进行建模,实现对设备故障的判别与预测。但该类方法普遍忽略设备之间的拓扑关系,缺乏空间结构建模能力,且对输入特征的依赖较强,难以自动提取深层次表示。
2.2. 图神经网络在电力系统中的应用
图神经网络作为一种用于处理图结构数据的深度学习方法,近年来在电力系统中获得广泛关注[16]。典型的图卷积网络通过邻接矩阵对图中节点进行信息聚合,使得每个节点能够融合其邻居的结构信息。在电网建模中[17],GNN可用于对设备之间的电气连接、信息流动路径等进行建模,从而捕捉更为真实的运行关联。已有研究将GNN用于电网负荷预测[18] [19]、电压稳定性评估[20]、配电网节点识别[21]等任务,取得了一定成效。然而,纯GNN模型通常侧重于静态结构感知,难以有效建模节点状态随时间变化的动态特性。
2.3. 时空联合建模方法
为同时考虑空间拓扑结构和时间演化过程,近年来研究者开始探索图神经网络与时间序列模型的融合策略。其中较具代表性的是将GCN与循环神经网络(如LSTM、GRU)结合[22] [23],构建时空图神经网络(Spatio-temporal GNN) [24]。这类方法通常采用“空间先、时间后”的建模范式,先通过GCN提取每个时间步的节点空间特征,再使用GRU等模型对节点序列进行时间建模,实现空间与时间信息的融合。T-GCN (Temporal-GCN) [25]架构就是典型代表之一,广泛应用于交通流预测和电网时序建模等任务。相关研究表明,该类模型在复杂系统中的预测能力显著优于传统时序模型或纯图模型。
2.4. 本文工作的差异与创新点
尽管已有部分研究尝试将图神经网络用于电力系统的状态建模,但多数仅在节点电压预测、负荷估计等任务中开展,针对电网设备故障预测这一关键应用的研究仍较为稀缺,特别是在节点级状态时间序列与结构特征深度融合方面存在不足。此外,已有方法在特征构造、模型适应性及鲁棒性分析方面缺乏系统性实验验证。
为此,本文提出一种基于GCN与GRU联合建模的拓扑感知型故障预测算法,不仅在输入层同时融合静态拓扑特征与动态运行数据,还在模型结构上实现空间依赖与时间演化的联合学习,解决了传统方法空间建模缺失与时序捕捉不足的问题。通过与多种主流模型对比实验,验证了所提方法在准确性、鲁棒性及泛化性方面的显著优势。
3. 问题模型及算法设计
3.1. 问题定义
一个电网系统可表示为有向图
,其中
表示电力设备构成的节点集合(如变压器、母线、断路器等),
表示设备之间的电气连接关系,如导线、支路等。每个节点
具有一个关于时间的状态序列
,表示设备在不同时间步的运行状态(如电压、电流、有/无功功率等)。目标是在给定历史状态序列的基础上,预测节点
在未来某一时刻是否存在故障风险,可建模为一个二分类问题:
(1)
其中,
表示节点
的邻居集合所带来的拓扑信息,
表示其拓扑属性(如度数、中介中心性等),函数
为学习到的预测模型。
3.2. 电网图构建与节点特征设计
为有效利用电网的空间结构信息,本文基于电气连接关系构建邻接矩阵
,其元素
表示节点
与
存在电气连接。节点的输入特征
包括:
(1) 动态状态特征(时间序列):
(2)
别表示节点在时刻t的电压、电流、有功功率与无功功率。
(2) 静态拓扑属性(时间不变):
(3)
分别表示节点的度、聚类系数与中介中心性等。
最终的节点输入特征在每个时间步拼接为:
(4)
3.3. 模型结构:GCN-GRU时空联合建模
为实现对节点状态的空间依赖与时间演化建模,本文采用图卷积网络(GCN)与门控循环单元(GRU)的级联架构:
(1) GCN模块:在每一个时间步t,基于图结构
对节点特征
进行图卷积操作,得到融合邻域信息的表示
:
(5)
其中
,
为
的度矩阵,
为可学习参数,
为激活函数。
(2) GRU模块:将每个节点在多个时间步的图卷积表示作为输入序列,利用GRU提取节点状态的时序动态:
(6)
最终输出为每个节点的高阶时空特征表示
。
(3) 输出层:通过一个全连接层与Sigmoid激活函数将
映射为故障概率
,实现二分类预测。
3.4. 整体算法流程
算法的整体流程图如算法1所示。
算法1:基于GCN-GRU的拓扑感知型电网故障预测算法
输入:
输出:
#节点的故障预测结果
1: 初始化节点嵌入
,
2: for每个时间步 t = 1 to T do
3: #空间建模:图卷积
4:
5: end for
6: for每个节点
do
7: 初始化 GRU 隐状态
8: for 每个时间步 t = 1 to T do
9:
#节点的时间序列输入
10: end for
11: #故障概率输出
12: end for
13: return
设:
表示电网中节点(设备)数量;
为边(连接关系)数量;T为时间序列长度;
为每个节点输入特征维度(包括状态特征与拓扑属性);
表示图卷积输出特征维度/GRU隐藏状态维度;L为GCN层数(默认1层);S是平均每个节点的邻居数量(一般
)。
对于每个时间步
,GCN执行一次图卷积操作。基于Kipf & Welling的简化图卷积形式,其时间复杂度为
。
每个节点的GRU接收长度为T的图卷积特征序列,更新一次隐藏状态的复杂度为
。
将GCN与GRU部分合并,整个算法的总时间复杂度为
。
4. 方法优化与扩展
在上一节中,我们提出了基于图卷积网络(GCN)与门控循环单元(GRU)联合建模的电网设备拓扑感知型故障预测算法,有效融合了电网拓扑结构与节点时间序列状态信息,实现了对设备故障的动态预测。然而,为进一步提升模型在实际复杂电网场景中的表示能力与预测敏感性,本文在基线模型的基础上引入了两项优化机制:其一,通过引入图注意力机制(GAT)增强邻居信息的加权表达能力;其二,通过设计状态差分输入提升对状态突变与故障先兆的响应能力。本节将分别对这两项改进进行详细阐述。
4.1. 基于图注意力网络的邻域加权建模
在标准GCN中,节点邻居的信息聚合采用固定的权重计算方式(基于度矩阵的归一化),未能体现不同邻接节点对中心节点影响程度的差异。在电力系统中,不同设备间的连接关系常常具有非均质性,例如核心变电节点对末端设备状态具有更强影响。因此,本文将图卷积模块替换为图注意力网络,以实现邻域特征的自适应加权聚合。
GAT使用注意力机制学习每对相邻节点i与j之间的权重
,其定义如下:
(7)
其中,
为线性变换权重,
为注意力参数,
表示向量拼接。最终节点嵌入更新为:
(8)
相较于标准GCN,GAT能够自动识别拓扑中关键邻居节点的影响程度,并动态调整其在特征聚合中的贡献。该机制提升了模型对关键传导路径的建模能力,特别适用于电网中高风险区域(如变电主干通道)的故障传播建模。
4.2. 基于状态差分的动态趋势增强建模
传统的时间序列建模方法直接使用原始状态序列作为输入,虽然能够捕捉一定的时序模式,但对于电网设备运行中存在的短时突变、振荡等动态现象响应不敏感,难以实现高精度的故障前预测。为此,本文引入“状态差分”(state difference)机制,将每个节点的时间序列状态变化率作为辅助输入,以增强模型对动态趋势的建模能力。
具体而言,对于节点
的状态序列
,定义其一阶差分序列为:
(9)
然后将原始状态与差分项拼接作为GRU输入:
(10)
GRU模块因此可在每个时间步感知设备状态的瞬时变化趋势,提升对波动异常、临界状态的判断能力。在训练过程中,模型可自动学习正常波动与潜在故障前兆的动态特征差异,提高早期预测能力。
4.3. 改进模型结构总结
结合上述两项优化,本文构建的改进模型在空间建模阶段使用图注意力机制替代传统GCN,在时间建模阶段引入状态差分辅助输入,从而在空间与时间两个维度上均提升了模型的表达能力。整体流程如算法2所示。
算法2:引入注意力与差分机制的电网故障预测模型
输入:
,邻接矩阵
节点状态序列
,拓扑属性
输出:
故障预测结果
1: for每个时间步t = 1 to T do
2:
# 邻域注意力聚合
3: end for
4: for 每个节点
do
5: 初始化 GRU 隐状态
6: for t = 2 to T do
7: delta ←
8: input ← concatenate (
, delta)
9:
← GRU (
, input)
10: end for
11:
← Sigmoid (Linear (
))
12: end for
13: return
通过引入图注意力机制和状态差分输入,分别增强了模型的空间结构辨识能力与时间动态响应能力。改进后的模型在理论上更适用于电网中关键故障链条的建模,实验验证也将在下一节中说明其显著优于基线结构的性能表现。
5. 实验与对比验证
为验证所提出GCN-GRU拓扑感知型故障预测算法的有效性与鲁棒性,本文在多个典型电网数据集上开展实验,并与主流方法进行对比分析。同时,为评估引入图注意力机制与状态差分机制后的改进模型性能变化,设计了多组消融实验。
5.1. 实验环境
本实验模拟典型输电网环境下的节点级故障预测场景,即在电网正常运行过程中,通过连续监测关键设备的运行状态(如电压、电流、有功/无功功率等),结合其在电网拓扑中的结构角色,实现对即将发生故障的设备进行提前判别与风险预警。该场景广泛适用于调度中心、智能变电站以及分布式监控系统中,具有较强的工程应用价值。
为贴近实际环境,实验选取了IEEE 118节点系统和PowerGraph数据集中包含的真实电网拓扑结构,模拟常见故障类型(如线路短路、电压失稳、频率波动等)在设备层面的影响演化过程。每个节点在连续20个时间步内的运行状态构成其输入特征,目标是预测其在下一个时间步内是否进入故障状态,实现短时尺度上的预判性识别。
实验在一台配备Intel Xeon Gold 6226R双路处理器(共32核心)、256 GB内存及NVIDIA RTX A6000 48 GB显卡的高性能工作站上完成,操作系统为Ubuntu 20.04 LTS。软件环境包括Python 3.9、PyTorch 1.13、PyTorch Geometric 2.2等深度学习框架,以及NetworkX用于电网图结构建模,Matplotlib与Seaborn用于实验结果的可视化呈现。
5.2. 负载预测模型的性能评估
数据集说明
本文采用两个典型数据集进行实验。
(1) IEEE 118节点系统[26]:标准输电网测试系统,包括118个节点、186条线路。通过PSCAD仿真生成故障数据(包括三相短路、单相接地、电压失稳等多种故障类型),并附带每个节点的运行状态序列(电压幅值、有功/无功功率等)。
(2) PowerGraph 数据集[27]:开放图数据集,包含多个实际电网拓扑与潮流状态数据,支持故障传播模拟。本文选择其中的118节点与39节点子图部分进行训练与测试。
对于每个样本,输入包括长度为T = 20的节点时间序列,输出为下一时刻节点是否发生故障的标签(二分类)。
5.3. 评价指标
为全面评估所提出故障预测算法的性能,本文选取了多项常用的分类模型评价指标,涵盖准确性、识别能力与模型判别能力三个层面,具体如下:
(1) 准确率(Accuracy)
准确率是最直观的衡量指标,用于表示模型整体预测正确的样本占总样本的比例。其定义为:
(11)
其中,TP为预测为故障且真实为故障的样本数,TN为预测为正常且真实为正常的样本数,FP和FN分别为误报和漏报的样本数。准确率可以反映模型的整体预测水平,但在类别不平衡的场景下,可能存在对多数类偏倚的风险,因此需配合其他指标共同评估。
(2) F1分数(F1-score)
F1分数综合考虑了模型的精确率(Precision)与召回率(Recall),适用于评估故障检测中的分类平衡能力,定义为:
(12)
F1分数的取值越高,表示模型在准确识别故障样本的同时,误报较少,适用于故障类样本相对稀缺或关注早期识别能力的场景。
(3) 召回率(Recall)
召回率用于衡量模型对实际故障样本的识别能力,定义为:
(13)
该指标反映的是模型能识别出多少真实的故障设备,对电网安全场景而言具有重要意义。较高的召回率意味着模型更少漏报潜在风险设备,有助于提升故障预警系统的实用性。
(4) AUC (Area Under Curve)
AUC指的是ROC曲线下的面积,用于衡量模型在不同阈值下的综合判别能力。ROC曲线刻画了TPR (True Positive Rate)与FPR (False Positive Rate)的关系,AUC值越接近1,说明模型越能有效地区分故障与非故障节点。相较于准确率,AUC对类别不均衡数据具有更强的鲁棒性,因此在电网设备预测中具有重要参考价值。
(5) 鲁棒性测试指标
此外,为评估模型在实际测量误差或数据缺失情况下的稳定性,本文还引入了“扰动前后准确率差值”作为鲁棒性评价指标,即在节点输入状态加入高斯噪声或随机缺失部分时间序列后重新评估模型性能。该指标可反映模型对电网运行状态不确定性与感知误差的容忍程度,具有现实意义。
5.4. 对比方法
为验证本文所提出的GCN-GRU拓扑感知型故障预测算法及其优化模型的有效性和先进性,实验设置中选取了多种具有代表性的对比方法,涵盖传统机器学习模型、经典时间序列模型、结构感知模型及现有图神经网络方法。这些对比方法可分为以下四类:
(1) 传统机器学习方法:SVM与随机森林
支持向量机(SVM):是一种经典的监督学习方法,广泛应用于小样本、高维空间下的分类任务。SVM模型在本实验中以节点状态序列的统计特征(如均值、标准差)作为输入,作为不考虑时间动态与拓扑结构的传统基线。
随机森林(Random Forest, RF):作为一种集成学习方法,RF在多数分类问题中表现稳健。实验中RF模型同样以节点状态的统计特征作为输入,评估其对设备状态判别的能力。
(2) 时间序列建模方法:LSTM网络
长短期记忆网络(LSTM):是处理时间序列问题的经典递归神经网络结构,能够捕捉长期依赖关系。LSTM模型以节点的状态序列作为输入,对每个节点单独建模,不考虑拓扑连接信息,作为对比分析中“时间建模但无结构感知”的代表方法。
(3) 图结构建模方法:静态GCN模型
图卷积网络(GCN):是一种基于谱域卷积的图神经网络方法,能够建模节点与邻居之间的结构依赖关系。GCN模型仅在单时间步进行推理,不处理时间序列动态,其输入为每个节点在某一时刻的状态与拓扑属性,是对结构建模效果的基础评估。
(4) 本文提出方法与优化模型:GCN-GRU与GAT + ΔGRU
GCN + GRU (本文基线模型):将GCN和GRU结合,利用GCN提取节点空间特征,再由GRU对节点状态的时间序列进行建模,具备结构感知与时序建模能力,是本文的核心方法。
GAT + ΔGRU (本文优化模型):在GCN-GRU的基础上,引入图注意力机制(GAT)替代传统图卷积,以实现对邻居信息的自适应加权,同时引入状态差分输入,提升对动态变化趋势的感知能力,是本文进一步提出的改进方案。
5.5. 实验结果与分析
5.5.1. 整体性能比较
本实验的目的在于全面评估本文提出的故障预测模型在电网设备节点级别的分类准确性。我们在IEEE 118节点系统与PowerGraph数据集上分别构建训练集与测试集,训练不同模型后在统一测试集上进行性能评估。
所有模型均在相同的时间序列长度(20个时间步)与输入特征设置下进行训练,每种模型重复实验五次,结果取平均值。本文主要对比方法包括传统机器学习模型(SVM、RF)、时间序列建模方法(LSTM)、结构感知模型(GCN),以及本文提出的基线模型(GCN + GRU)与优化模型(GAT + ΔGRU)。实验结果如表1所示。
Table 1. Overall performance comparison of different models in fault prediction tasks
表1. 不同模型在故障预测任务中的整体性能比较
模型名称 |
准确率 |
召回率 |
F1-score |
Auc |
SVM |
83.2 |
0.782 |
0.765 |
0.842 |
随机森林(RF) |
85.6 |
0.803 |
0.781 |
0.861 |
LSTM |
88.1 |
0.825 |
0.807 |
0.882 |
GCN |
89.7 |
0.844 |
0.832 |
0.891 |
GCN + GRU (本文) |
93.8 |
0.889 |
0.872 |
0.928 |
GAT + ΔGRU (优化) |
95.1 |
0.913 |
0.896 |
0.945 |
从表1可看出,整体性能指标看,本文提出的GCN + GRU模型在四项关键指标上均优于传统机器学习与深度学习基线模型,尤其在F1分数与AUC方面的优势显著,说明其在故障样本识别能力与整体分类稳定性方面表现优秀。
进一步引入图注意力机制与状态差分机制后,优化模型GAT + ΔGRU在准确率和F1分数上分别提升1.3%和2.4%,召回率接近90%,AUC提高至0.945,表明模型不仅具备更强的故障检测能力,也更善于捕捉复杂场景中的关键节点与微小波动,具备更强的实际适应性。
5.5.2. 鲁棒性测试
为评估模型在复杂电网运行环境中的实用性与稳定性,本文设计鲁棒性测试实验,用于考察不同模型在面对输入扰动(如测量误差或数据缺失)时的性能保持能力。在真实电力系统中,传感器误差、通信丢包或节点部分数据不可用的情况较为常见,因此模型在非理想输入条件下的鲁棒性对于实际部署具有重要意义。
本实验分别在以下两种扰动条件下重新评估各模型性能:
1) 高斯噪声扰动:在原始节点状态序列中加入均值为0、标准差为0.05的高斯噪声,模拟传感器测量误差;
2) 随机缺失扰动:对20%的节点状态时间步进行随机置零,模拟数据缺失或采样失败的情况。
测试以准确率下降幅度为主要评价指标,具体结果如表2所示。
Table 2. Robustness test results of models under perturbation conditions (Accuracy)
表2. 模型在扰动条件下的鲁棒性测试结果(准确率)
模型名称 |
原始准确率 |
噪声扰动后 |
缺失扰动后 |
最大准确率下降 |
SVM |
83.2 |
76.4 |
74.8 |
−8.40% |
随机森林(RF) |
85.6 |
79.7 |
78.1 |
−7.50% |
LSTM |
88.1 |
82.3 |
80.9 |
−7.20% |
GCN |
89.7 |
84.5 |
82.6 |
−7.10% |
GCN + GRU (本文) |
93.8 |
88.6 |
87.3 |
−6.50% |
GAT + ΔGRU (优化) |
95.1 |
92.9 |
91.8 |
−3.30% |
在高斯噪声与随机缺失扰动下,所有模型性能均有所下降,但下降幅度差异明显。传统机器学习模型(SVM、RF)由于不具备对时序信息或结构冗余的建模能力,表现出更大的性能波动,准确率下降幅度均超过7%。LSTM和GCN等单一维度模型相对抗干扰能力更强,但仍存在明显精度损失。
相比之下,本文提出的GCN + GRU模型由于同时建模拓扑依赖与时间演化规律,在缺失部分输入信息的情况下仍能通过邻域补偿机制进行有效预测,具备较好的鲁棒性。而进一步引入注意力机制与状态差分增强模块的优化模型GAT + ΔGRU表现出最强的容错能力,在两类扰动下准确率分别仅下降2.2%和3.3%,显著优于其他方法,验证了模型对电网运行不确定性的良好适应能力。
5.5.3. 时间窗口敏感性实验
在电网故障预测任务中,模型对节点状态的时间序列建模能力是影响预测精度的关键因素之一。不同的时间窗口长度(即历史观测长度)会影响模型对趋势变化的捕捉效果:窗口太短可能缺乏上下文,窗口太长则可能引入冗余信息或训练困难。因此,为进一步评估所提模型在不同时间窗口长度下的性能表现,本文设计了时间敏感性对比实验。
在保持其余参数一致的前提下,我们选取不同的时间序列长度T ∈ {5, 10, 20, 30, 40},分别训练并测试以下两种模型:GCN + GRU和GAT + ΔGRU。这组实验使用IEEE 118节点系统作为评估平台,采用准确率与F1分数作为性能指标。具体结果如表3所示。
实验结果表明,随着时间窗口长度的增加,模型预测性能在初始阶段(5→20)持续提升,说明适当的历史信息积累有助于模型识别设备运行趋势和潜在故障模式。然而,当窗口长度超过20后,两种模型的性能略有下降,推测可能是由于长序列中包含冗余或干扰信息,增加了模型训练难度,导致过拟合或梯度衰减。
此外,在所有时间窗口下,优化模型GAT + ΔGRU的准确率和F1分数均高于基线模型,说明其在有效利用有限历史信息的同时,对长时序结构也具备更好的建模能力,适应性更强。
Table 3. Performance comparison of models under different time window lengths
表3. 模型在不同时间窗口长度下的性能比较
时间窗口长度T |
GCN + GRU-准确率(%) |
GCN + GRU-F1分数 |
GAT + ΔGRU-准确率(%) |
GAT + ΔGRU-F1分数 |
5 |
89.1 |
0.833 |
90.7 |
0.851 |
10 |
91.8 |
0.862 |
93.4 |
0.881 |
20 |
93.8 |
0.889 |
95.1 |
0.913 |
30 |
93.5 |
0.886 |
94.7 |
0.907 |
40 |
92.7 |
0.874 |
93.5 |
0.892 |
5.5.4. 消融实验
为了深入理解所提出的GAT + ΔGRU模型中各关键组件对故障预测性能的影响,本文设计了消融实验。该实验通过逐步移除或替换模型中的特定模块,评估其对整体性能的贡献程度,从而验证各模块的有效性和必要性。
在保持其他参数不变的前提下,我们分别对以下三个关键模块进行消融处理:
1) 图注意力机制(GAT):将GAT模块替换为传统的图卷积网络(GCN),以评估注意力机制在建模邻居节点重要性方面的作用。
2) 状态差分输入(Δ):移除状态差分输入,仅使用原始状态序列,评估其在捕捉节点状态变化趋势中的作用。
3) 门控循环单元(GRU):将GRU模块替换为标准的循环神经网络(RNN),以评估门控机制在建模时间依赖性方面的优势。
每次仅对一个模块进行修改,其余部分保持不变,确保实验的公平性和可比性。具体结果如表4所示。
Table 4. Ablation study results of key model components
表4. 模型关键模块的消融实验结果
模型变体 |
准确率 |
F1分数 |
召回率 |
AUC |
完整模型(GAT + ΔGRU) |
95.1 |
0.913 |
0.896 |
0.945 |
去除GAT (GCN + ΔGRU) |
93.2 |
0.887 |
0.869 |
0.921 |
去除Δ (GAT + GRU) |
92.6 |
0.879 |
0.861 |
0.915 |
替换GRU (GAT + ΔRNN) |
91.8 |
0.871 |
0.853 |
0.908 |
完整模型(GAT + ΔGRU) |
95.1 |
0.913 |
0.896 |
0.945 |
从消融实验结果可以看出,完整模型GAT + ΔGRU在所有指标上均取得最佳性能,表明图注意力机制、状态差分机制与门控循环结构之间具有良好的协同增强作用。
具体来看,去除GAT模块后(即使用传统的GCN代替图注意力机制),准确率下降了约1.9%,F1分数下降2.6%,这表明GAT在学习邻居节点间的重要性差异方面具有明显优势,尤其在电网复杂拓扑下能够更加准确地捕捉关键路径上的状态变化。
移除状态差分(Δ)输入后,F1分数和召回率下降幅度均超过3%,说明原始状态序列不足以完全表达设备运行趋势信息,而差分特征对捕捉动态波动和异常突变具有重要价值。该结果也验证了电网故障常常伴随“前兆扰动”的特点,差分机制有助于模型提前识别此类模式。
将GRU替换为传统RNN后性能退化最为明显,AUC下降至0.908,说明在时序建模中,GRU的门控机制在捕捉长短期依赖、抑制梯度消失方面起到了关键作用,能够更好地保持设备状态的演化记忆。
三项关键模块均对最终模型性能具有显著提升作用,且彼此之间存在明显的互补协同效应。模型的高性能并非来自单一改进点,而是结构建模、时间建模与动态增强机制的联合优化结果。该结果进一步验证了本文提出的设计策略的合理性与有效性。
6. 结语
本文围绕电网设备运行状态的智能预测问题,针对传统方法在拓扑建模与动态感知方面的不足,提出了一种基于图卷积网络(GCN)与门控循环单元(GRU)联合建模的拓扑感知型故障预测算法。该算法以电网拓扑结构构建图模型,融合节点的静态结构属性与动态运行状态,通过GCN提取空间邻域特征,结合GRU建模时间演化过程,实现了对电网设备潜在故障风险的精准预测。
在此基础上,本文进一步引入图注意力机制(GAT)与状态差分机制,对模型结构进行了双重优化。GAT模块使模型能够识别不同邻居节点对目标设备状态的异质影响,提升结构感知能力;状态差分输入增强了模型对动态变化趋势的响应能力,特别适用于捕捉故障前的微小扰动特征。
通过在IEEE 118节点系统和PowerGraph数据集上的大量实验,本文验证了所提方法在准确率、F1分数、召回率和AUC等多个指标上的显著提升。同时,通过鲁棒性测试与消融实验进一步证明了模型在非理想输入条件下的稳定性以及各子模块的协同有效性。整体上,本文所提出的GAT + ΔGRU模型展现出良好的泛化能力与工程应用前景。
尽管本文已取得初步成果,但仍存在一些值得进一步探索的方向。未来的工作可在以下几个方面展开:
1) 模型可解释性增强:当前模型作为深度结构,缺乏面向调度员或设备管理人员的直观解释机制。可进一步引入图注意力可视化、重要节点溯源等方法,提升模型决策的透明度。
2) 边特征与物理机制融合:当前模型以节点为核心,尚未充分利用边(线路)上的电气参数与流向信息,未来可引入图边属性、阻抗模型或功率潮流方程,实现与电网物理机制的深度耦合。
3) 自适应时间窗口机制:当前模型使用固定长度的时间窗口,未来可引入动态窗口调整策略,使模型能够根据状态变化幅度或节点特性自动调整历史观测深度。
4) 跨区域建模与迁移学习:面对不同区域电网的拓扑差异与数据分布不一致问题,可研究基于图结构的迁移学习策略,实现多区域模型共享与迁移。