1. 引言
最优化算法作为人工智能和统计建模的核心工具,在模型训练与参数估计等过程中扮演着至关重要的角色[1] [2]。随着大数据时代的到来和模型复杂度的不断提升,传统优化方法面临计算效率低、内存需求大、收敛速度慢等挑战[3]。在此背景下,交替最小化(Alternating Minimization, AM)方法因其计算高效性、实现简单性和理论可解释性而受到广泛关注[4] [5]。
交替最小化方法是一种迭代优化算法,用于解决最小化多元函数的问题[6]。其核心思想是将复杂的多变量优化问题分解为一系列简单的单变量或子集变量子问题,通过固定其他变量、优化其中一个变量的方式交替进行,逐步逼近原问题的最优解[7] [8]。该方法通常适用于目标函数具有可分离结构或变量块对角特性的问题。交替最小化方法在计算效率上往往具有优势,因为它将原问题分解为多个更易求解的子问题,减少了单次优化的复杂度,尤其适用于大规模、稀疏或具有特殊结构的问题[9]。然而,其收敛性通常依赖于目标函数的性质(如凸性、光滑性),且可能收敛到局部极小值而非全局最优解,因此初始值选择和收敛性分析在实际应用中需给予关注。该方法与坐标下降法、块坐标下降法等优化策略在思想上一脉相承,但其灵活性和可扩展性使其在诸多领域得到了广泛应用和深入研究[10] [11]。
此外,交替最小化方法的应用范围广泛,例如文献[12]提出一种基于AM结合滑动平均的矩阵补全方法,可在高缺失率条件下有效补全配电网潮流时空数据,无需依赖历史数据训练,具有高效性和强适应性。[13]提出一种基于泰勒展开交替最小化的主成分追求算法,通过推广泰勒展开和收缩算子技术高效分离低秩矩阵与稀疏大噪声,在计算速度和精度上优于现有方法。[14]则将交替最小化框架应用于电力系统状态估计,提出基于二阶锥规划(Second-Order Cone Programming, SOCP)的联合状态估计和坏数据检测方法,并在实验中取得不错的效果。
而基于SOCP的电力系统联合状态估计与坏数据检测是基于文献[15]中半定规划(Semidefinite Programming, SDP)的进阶提升,通过引入
范数建立联合估计模型,利用SDP将非凸优化问题转化为凸优化问题,从而实现在坏数据干扰下的精准状态估计。本文受文献[15]的启发,考虑到SOCP方法虽然在估计精度上展现出显著优势,但其高精度源于将非凸问题转化为凸优化问题的凸松弛原理,而该原理的求解过程本身是计算密集型的,且该方法通过扩大问题规模,即增加变量和复杂的二阶锥约束进行求解,这一系列导致了其在计算效率上存在固有的提升空间。因此,当前的研究方向之一就是在尽可能保持精度的同时提高计算效率。通过阅读文献发现,梯度正则化牛顿法(Gradient Regularized Newton Method, GRNM) [16]在求解二次测量模型时具备超线性收敛特性,实验结果表明其在收敛速度与估计效率方面均优于传统梯度下降算法,为高效、精确的状态估计提供了新的可行路径。因此,根据交替求小的研究特性,进一步利用AM框架进行算法改进,提出一种基于GRNM和
范数相结合的坏数据检测与识别方法,以做到在较短时间内实现较高精度的坏数据识别,同时实现电力系统状态估计。
2. 交替最小化:理论基础
2.1. 基本算法框架
交替最小化方法针对的典型优化问题可以表述为:
(1)
其中
是目标函数,
和
是是约束集合。算法的核心思想是通过交替固定一组变量而优化另一组变量来迭代逼近最优解。对于二元变量问题,AM算法通过以下算法框架实现问题求解:
算法1 基本交替最小化框架 |
初始化:选择初始点
,设置
重复直至收敛: 1:
2:
3:
输出
作为近似解 |
这种基本框架可以自然地推广到多块变量的情况。当变量块超过两个时,算法将依次循环优化每个变量块,而保持其他变量块固定。
2.2. 收敛性
AM算法的收敛性高度依赖目标函数的性质。对于凸且可微的函数,AM算法产生的双稳定点通常是全局最优点[17];对于非凸问题,AM算法可能收敛到局部极小点。若函数满足边缘强凸和边缘强光滑等条件,在一定条件下仍可保证较好的收敛性(例如线性收敛速率) [6]。Kurdyka-Łojasievicz (KL)性质也常用于分析非凸情形下AM算法的收敛性[18] [19]。
3. 交替最小化:实践应用
3.1. 电力系统坏数据检测案例应用
在实际案例应用中,对于电力系统的坏数据检测问题也常应用交替最小化方法,以联合处理状态估计和坏数据检测。本文提出一种新的基于交替最小化的联合处理电力系统问题的方法,利用GRNM解决状态估计问题,并结合ℓ₁范数实现坏数据的检测与识别。对于有M个测量值的交流电力系统的非线性测量函数可以写为:
(2)
其中
是测量向量,包含有功功率、无功功率、电压幅值,
是状态向量,包含各节点的电压幅值和相角,
表示根据交流潮流方程定义的二次关系,
代表假设为高斯分布的测量噪声向量,均值为零,即
,而
则是被引入的稀疏向量以实现坏数据检测与稀疏恢复[15],当
为非零值时,说明存在坏数据,反之则正常。
根据文献[15]中通过稀疏正则化解决坏数据检测的研究思路,研究将复数域问题转化为实数域,并提出要解决的非凸优化问题为:
(3)
其中
是一个正参数,
是由所有节点电压实部与虚部构成的实数状态向量,
则是根据潮流方程对测量
所构造的实对称二次型矩阵。因此,采用交替求小算法来实现迭代求解
和
:
(4)
对
的估计利用GRNM算法,对
的求解利用软阈值操作。
3.1.1. 固定a,迭代x
模型的第一部分通过固定
,对
进行迭代求解。根据算法2,研究采用GRNM对该二次型最小二乘问题进行优化求解,该算法是在正则化牛顿方法的基础上进行的改进,其算法框架包括两个阶段:第一阶段利用梯度下降方法,旨在从任意初始点
生成一个合适的起点(即
)供第二阶段使用;第二阶段针对
采用正则牛顿方法,并使用类似于第一阶段的终止条件。
研究采用的GRNM方法结合了牛顿法的快速收敛特性和梯度正则化的稳定性,使得在高维状态估计问题中,模型能以较快的速度收敛。与传统梯度下降法相比,牛顿法通过二阶导数信息更精确地调整优化方向,可以减少迭代次数,而梯度正则化的引入则可以减小参数更新中的数值波动,使得在复杂数据情况下,估计过程更加稳定。并且文献[16]中已证明GRNM方法可以求解含二次测量模型的优化问题,并能够显著提高收敛速度和求解精度。
算法2 梯度正则化牛顿法(GRNM) |
初始化一个有界的
。设
。 (第一阶段——梯度下降) 当
: 1:计算梯度
。 2:找出最小的非负整数
使得
。 3:设
并且
。 结束 记录
和
。 (第二阶段——正则化牛顿法) 当停止条件未满足: 4:计算海瑟矩阵的近似
。 5:更新正则化牛顿方向
通过
。 6:找出最小的非负整数
使得
。 7:设
并且
。 结束 |
3.1.2. 固定
,更新a
模型的第二部分通过固定
,更新
,根据目标函数的特点,可以利用软阈值迭代方法进行求解,以下是具体步骤:
1) 令
,这样目标函数(3)可以重新写为:
(5)
目标是求解每个
的更新。由于目标函数对每个
是独立的,可以将问题分解为
个独立的单变量问题:
(6)
2) 对于每个
,这是一个典型的带
范数正则项的最小化问题,其解析解为软阈值操作,因此,对于每个
,可以通过以下公式计算
:
(7)
通过以上公式逐步更新
的值,最终得到向量
的值。
通过以上的交替最小化方法,在具有计算高效性的同时,也能在面对大规模电力系统数据时仍能快速收敛。并且,交替优化可以在每步中分别优化状态估计和坏数据检测,减小了两者间的相互干扰,提高了鲁棒性和精度。
GRNM和稀疏性约束的结合在理论上契合了高维优化和稀疏性处理的需求,在实际应用中能够以较低的计算代价提供高质量的状态估计结果,是一种有效的创新尝试。
3.2. 数值试验
本节使用IEEE 14节点、30节点和57节点系统[20]测试了基于交替求小算法的联合状态估计和坏数据检测方法,并与现有的基于SDR和SOCP方法进行了比较。使用软件工具箱MATPOWER [21]生成相关功率流和计量测量。此外,设置最大迭代次数为5000。
引入随机噪声和坏数据,电压和功率的噪声由均值为零、标准差分别为0.01 pu和0.02 pu的随机高斯分布值表示。除高斯噪声外,在有功和无功功率注入及潮流测量值中随机选择10%的数据作为坏数据,通过在所选测量值的基础上额外加1来模拟坏数据,且假设所有测量值都含有噪声。
通过100次蒙特卡洛实验获得平均结果。该方法不仅能在一定精确度下恢复坏数据,还能以较高概率检测出不良数据的具体位置,为后续不良数据的分类与分析研究提供便利。表1基于统计学常用性能评估指标,通过对比估计向量
中非零值的位置与随机选取的不良数据位置,由于基于SDP的方法对坏数据的识别能力较低,因此本文省略SDP的结果,只针对新方法与SOCP方法的实验结果进行对比,实验结果表明,本研究方法在不同规模的测试系统下,在坏数据检测的准确率、精确率、召回率及F1分数上均一致且显著地优于传统SOCP方法,具有较强的坏数据辨识能力,验证了其在提升电力系统状态估计鲁棒性方面的有效性与可靠性,可为电力系统坏数据的相关研究提供参考。
此外,如表2所示,采用交替最小化算法获得的估计结果在四种方法中与真实值的误差最小。均方根误差(RMSE)与平均相对误差(MRE)定义如下:
(8)
(9)
其中
表示Frobenius范数。实验表明,即使在存在不良数据的情况下,本研究方法仍能有效估计电压值,且其估计精度和计算效率方面均优于传统SDP与SOCP方法,尤其在中小规模系统中速度优势显著,尽管在57节点系统中计算时间有细微增加,但其在估计精度上的显著优势使其更适合于对状态估计准确性要求较高的实际应用场景。
Table 1. Comparison of bad data identification results
表1. 坏数据辨识结果对比
方法 |
评估指标 |
14节点 |
30节点 |
57节点 |
本研究 |
准确率 |
98.13% |
98.53% |
96.52% |
精确率 |
98.95% |
90.05% |
97.90% |
召回率 |
92.83% |
96.59% |
86.73% |
F1分数 |
0.95 |
0.93 |
0.91 |
SOCP |
准确率 |
78.75% |
77.47% |
77.06% |
精确率 |
94.30% |
93.61% |
93.90% |
召回率 |
70.94% |
66.36% |
67.32% |
F1分数 |
0.74 |
0.71 |
0.72 |
Table 2. Evaluation metrics
表2. 评价指标表
节点系统 |
评估指标 |
SDP |
SOCP |
AM |
14节点 |
MRE |
0.2890 |
0.0211 |
0.0160 |
RMSE |
0.3026 |
0.0112 |
0.0089 |
平均计算时间 |
2.7538 |
2.6244 |
0.9789 |
30节点 |
MRE |
0.2974 |
0.0397 |
0.0281 |
RMSE |
1.3227 |
0.0426 |
0.0318 |
平均计算时间 |
7.7441 |
2.5833 |
1.2458 |
57节点 |
MRE |
0.3159 |
0.0478 |
0.0399 |
RMSE |
0.2667 |
0.0178 |
0.0174 |
平均计算时间 |
71.6578 |
3.8381 |
3.8872 |
此外,研究还考虑了新方法与SOCP的平均相对误差及均方误差的90%,95%和99%置信区间,利用matlab软件自带的prctile函数计算给定数据的指定百分位来形成置信区间的上下限。根据图1和图2可以看出,基于交替求小的新方法整体表现良好,误差较为稳定。
Figure 1. Comparison of multi-level confidence intervals for mean relative error (MRE)
图1. 平均相对误差的多层次置信区间对比
Figure 2. Comparison of multi-level confidence intervals for root mean square error (RMSE)
图2. 均方根误差的多层次置信区间对比
4. 总结
本文系统研究了交替极小化方法的基本原理、算法框架及其在实际案例中的应用价值,重点提出了一种融合GRNM与稀疏优化技术的交替优化模型,并在电力系统状态估计与坏数据检测等实际问题中进行了验证。理论分析和实验结果表明,所提出的算法在收敛性、估计精度和鲁棒性方面均优于传统优化方法,具有良好的数学研究意义和工程应用前景,为电力系统坏数据检测提供了一种有潜力的高效算法。该方法不仅为多变量复杂优化问题提供了一种可分解、易实施的求解思路,也展示了交替最小化在实际问题中灵活而强大的适应能力。但该方法在非稀疏坏数据的处理上以及在更大规模系统上的性能验证上仍具有一定的局限性,未来将进一步探索该方法与深度学习、分布式计算等技术的结合,拓展其在大规模实时系统与动态环境中的应用潜力,为优化方法的研究创新与科研实践提供更丰富的案例与工具支持。