1. 引言
全球能源结构转型背景下,分布式光伏发电是实现“双碳目标”的关键清洁能源。但其大规模接入导致源荷双侧随机波动,改变配电网线损分布特性。传统线损计算方法难以应对光伏出力、负荷变化及其时空耦合问题,亟需研究能实现高精度多场景处理的预测方法。
当前研究在光伏系统建模以及预测方面已经取得重要进展,文献[1] [2]基于基尔霍夫定律构建了光伏阵列及逆变器的数学模型,但存在模型复杂度高、求解效率低的问题。在线损影响机理方面,研究证实光伏与负荷时空失配将导致潮流逆向流动,文献[3]揭示了光伏渗透率与线损率的非线性关系。文献[4]提出了基于光伏布局优化的降损策略。然而,之前的研究多只针对单一典型场景分析,既难以刻画源荷耦合的动态特性,又依赖人工经验进行场景划分,存在计算效率低、预测精度不足等缺陷。
基于此,本文提出深度学习驱动的多场景线损预测新方法。基于构建多维特征体系,并入动态时间规整算法实现源荷特征曲线的自适应聚类,建立(Bi-LSTM)预测模型。基于某10 kV配电网实测数据,验证该模型在光伏出力多变、负荷模式频繁切换等复杂场景下的预测准确性与泛化能力,为智能电网能效管理提供数据支撑与技术保障。
2. 模型构建与数据生成方法
2.1. 含分布式光伏的配电网模型构建
本模型使用matlab平台,基于实际电网数据的10 kV馈线搭建,利用快速解耦潮流法(Fast Decoupled Load Flow, FDLF)进行潮流计算。具体步骤如下,其中重要一步是在传统的模型中加入光伏发电装置,使电力潮流特性由单向转为双向。
(1) 设置节点与馈线:模型中使用了10 kV的架空线LGJ240/30,电阻0.131 Ω/km,电抗0.35 Ω/km,长度设置有5 km、10 km、15 km三种。考虑到线路参数分布特性,可对导线老化、温度效应造成的电阻变化引入修正系数
。
(1)
(2) 设置节点负荷:根据实际用电情况分配,各节点负荷分别设置为总负荷乘该节点相连变压器容量占所有变压器容量和的比例。
(3) 接入分布式光伏:基于某10 kV配电网实际,为实现最小线损,采取平衡节点就近接入的策略,通过电压灵敏度分析和网络损耗因子联合优化确定,建立选址模型,采用粒子群算法求解得到最优接入点集合。其中15个节点(1、39、50、59、62、73、79、81、83、88、100、111、105、117、123节点)各接入一台光伏发电机组;并设置负荷最大值为6455kw和光伏最大值为12,910kw,依据最值设置光伏逆变器容量为800 kVA,光伏发电功率因数为0.95。
(4) 接入变压器:为模拟电压调节和功率传输过程,共加入了40台变压器,根据实际铭牌数据设置其阻抗参数,并考虑电压水平对铁损的影响。
(2)
(5) 需注意线路尾端有一个水电站,可以为其设置相应的有功和无功功率,最终得到的模型如图1所示。
Figure 1. Final model diagram
图1. 最终模型示意图
2.2. 场景划分与数据集生成
2.2.1. 配电网运行场景的划分
本文基于新型的GMM (Gaussian Mixture Model)模型进行某10 kV有源配电网运行场景划分。
首先,利用NBClust函数确定源荷双侧场景划分的最佳数目,通过遍历预设划分区间并综合30种有效性指标(如KL指数、CH指数等),量化评估确定最优场景数。并在GMM框架下,选择对角协方差矩阵构建模型。
然后,初始化各运行场景的发电与负荷的均值、对角协方差矩阵及运行数据的混合系数,搭建高斯混合模型。利用最大似然根据概率最大化来划分运行场景,计算每个运行场景的响应度,即数据点属于该运行场景的概率。根据响应度更新每个高斯分布的各项参数,不断重复以上步骤进行迭代,直至达到指定迭代次数或收敛条件后停止迭代,划分出10 kV有源配电网的运行场景。
最后依据评价指标判断运行场景划分结果的准确性。
优化后的场景划分方法流程如图2所示。
Figure 2. Improved flow chart
图2. 改进后的流程图
为确保场景划分结果的科学性与合理性,运用平均轮廓系数、Calinski-Harabasz指数、AIC (Akaike Information Criterion)信息准则、BIC (Bayesian Information Criterion)信息规则四项指标进行综合评价,从类内紧密度、类间分离度、模型复杂度等多维度量化聚类质量与划分效果。
2.2.2. 数据集的构建与分析
鉴于深度学习模型对数据量的需求高,本研究在投入模型训练前先将初始30组代表性场景数据通过分类扩展策略扩增至300组:先按线损率排序,然后把16组极端场景数据基于聚类半径,内多外少生成200组补充场景,剩余14组一般场景均匀选取5个数据点作为补充场景。具体步骤思路如图3。
Figure 3. Typical scenario amplification ideas
图3. 典型场景扩增思路
3. 基于BI-LSTM算法的线损预测
3.1. BI-LSTM算法原理和适用化改进
3.1.1. BI-LSTM算法原理
LSTM (Long Short-Term Memory)专精于时序数据建模与长期依赖解析,是循环神经网络(Recurrent Neural Network, RNN)的特殊变体。然而传统单向LSTM受限于时序方向性,其单向信息传播机制导致后文语境无法逆向修正前序特征表征。为此提出的BI-LSTM架构通过双向信息融合机制突破此局限性。
BI-LSTM采用双向并行架构,由前向与反向LSTM网络构成双通道时序处理器。输入序列经前向LSTM生成隐状态向量
,同步通过反向LSTM输出
,其更新公式为:
(3)
二者通过隐状态向量拼接实现特征融合,该复合隐状态作为双向语境感知的特征表达,最终经全连接层映射为输出
,实现上下文敏感的特征解码[5] [6]。
相较于其他深度学习方法,如普通LSTM仅能单向处理序列但无法利用未来时刻信息,CNN通过卷积核局部感知但难以建模长距离依赖等具有较大的优势,BI-LSTM能通过前向层和后向层同时捕捉序列数据的双向依赖关系对数据预测。
利用BI-LSTM可以对电网参数进行预测:如基于BI-LSTM和模态分解进行线损预测[1],以及基于BI-LSTM和多头注意力机制对负荷预测[2],结合上述研究所述搭建BI-LSTM模型。
3.1.2. BI-LSTM模型的适用化改进
Figure 4. BI-LSTM Overall structure of the model
图4. BI-LSTM模型总体构架
模型构架如图4所示,主要由输入层,中间层和输出层组成:首先输入层导入光伏和负荷数据,将数据预处理后传入中间层分析,最后通过输出层输出线损,实现由光伏,负荷得到线损的预测值。
(1) 输入层
输入层对数据划分为GMM1和GMM2两组,即模拟白天正常光伏和夜间光伏为零的输入,分别对数据归一化处理,将测试集和训练集的特征数据转换为三维数组以适应trainNetwork网络。
(2) 中间层
主要由双向长短时记忆BI-LSTM层,ReLU (Rectified Linear Unit)激活层,全连接层,回归层组成。本文采用光伏和负荷两组特征值输入和一组线损特征值输出。
(3) 输出层
主要由参数设置,训练模型,仿真预测,数据反归一化组成。trainNetwork处理序列数据,需要将数据从三维数组转换为细胞数组,仿真预测后数据反归一化并输出线损预测值,并计算线损评估指标。
3.2. 参数设置对模型优化的影响
(1) 优化算法(Optimization Algorithm)
优化算法负责优化模型的训练过程。本模型选用Adam (Adaptive Moment Estimation)算法,其利用梯度的一阶动量(即梯度的指数加权平均)和二阶动量(即梯度平方的指数加权平均)偏差校正动量,并用校正后动量更新参数。对比不使用优化算法和使用优化算法的效果图(图5)可以看出,使用Adam算法后预测精度明显提高。
参数敏感性分析:当一阶矩估计的指数衰减率
接近1时,模型容易陷入局部最优,较小则使参数更新不稳定。当二阶矩估计的指数衰减率
接近1时,学习率调整过于缓慢,较小则使学习率波动过大。
优化策略:通过网格搜索,对范围内的所有参数组合,在验证集上评估性能后选择性能最优的参数组合。
Figure 5. Comparison of the effect of not using Adam algorithm (up) and using Adam algorithm (down)
图5. 不使用Adam算法(上)和使用Adam算法(下)效果对比
(2) 批大小(MiniBatchSize)
批大小决定每次更新模型参数时使用的数据样本数量,设置批大小需要考虑内存容量和计算资源。
参数敏感性分析:批大小设置过小会导致损失函数波动较大,参数更新不稳定;过大则缺乏随机性易趋向局部最优。
优化策略:通过随机搜索,选择不同的批大小并评估其性能。该方法计算效率高且灵活性较强。
(3) 最大迭代次数(MaxEpochs)
最大迭代次数是指算法在停止之前允许执行的最大步数或周期数。迭代需要既确保模型有足够的时间学习数据特征,同时避免过拟合。
参数敏感性分析:最大迭代次数过小会使损失函数仍处于较高水平,模型性能不佳;过大易出现过拟合现象,影响模型泛化能力。
优化策略:通过自适应方法动态调整批大小,动态平衡学习稳定性与更新效率,优化计算速度。
4. 算例分析
4.1. 仿真预测
首先,利用如图1所示的模型和初始数据生成数据集。
然后,对数据进行预处理后分组,分别设置不同的聚类数进行场景划分,划分结果如图6所示。评估场景聚类效果见表1:平均轮廓系数和CH指数较高可知聚类内部紧密且与其他聚类距离较大,聚类效果良好。AIC和BIC值较小,说明模型拟合效果好,复杂度适中。
Figure 6. Typical 10 KV feeder operation scenario division diagram
图6. 典型10 KV馈线运行场景划分图
Table 1. Evaluation indicators of GMM on various time scales
表1. GMM各时间尺度评价指标
评价指标 |
GMM-1 |
GMM-2 |
平均轮廓系数 |
0.171269 |
0.457444 |
CH指数 |
12778.45748 |
39157.32135 |
AIC |
−106652.5626 |
−53595.25465 |
BIC |
−107793.9331 |
−53705.44743 |
接着,根据图3将初始的30组代表性场景数据有效扩增至300组。设置功率因数
为0.95,依据公式(4)计算出各场景下实际负荷的无功功率
。并将各组仿真参数输入计算模型中,得到不同场景下的线损。
(4)
最后汇总数据投入基于BI-LSTM双向长短期记忆神经网络的线损数值预测模型进行模型学习、训练与预测。
4.2. 参数设置
第一步,设置优化算法为Adam;
第二步,设置批大小为64,来平衡稳定性和计算效率,如下图(图7)所示。
Figure 7. Comparison of the effect of setting the batch size to 64 (up) and 300 (down)
图7. 批大小设置为64 (上)和批大小设置为300 (下)效果对比
第三部,选择迭代次数为1200,确保模型有足够的时间学习数据特征,同时避免过拟合,如下图(图8)所示。
Figure 8. Comparison of the effect of setting the maximum iteration count to 1200 (up) and 300 (down)
图8. 最大迭代次数设置为1200 (上)和最大迭代次数设置为300 (下)效果对比
4.3. 预测结果评估
线损数值预测测试集训练结果如图9,经检验,实验结果满足工程需要。
Figure 9. Comparison of prediction results for the training set of line loss value prediction
图9. 线损数值预测训练集预测结果对比图
4.4. 不同方法预测效果的比较分析
对比基于ELM极限学习机的传统模型验证本模型预测精确度:随机抽选不同运行场景下的12组数据作为测试集,投入312组场景数据(其中300组是打乱顺序的训练集;12组是随机设置固定顺序的预测集以验证模型的泛化能力)。分别用基于这两种深度学习网络的模型来预测线损率。基于ELM极限学习机的预测图10,预测的线损率结果及指标对比如表2和表3,可见本模型对线损的预测效果和稳定性显著优于基于ELM极限学习机的传统模型。
Figure 10. Prediction results of ELM line loss rate test set
图10. ELM线损率测试集预测结果
Table 2. Comparison of different model cues prediction
表2. 不同模型线损预测对比
光伏并网功率/MW |
负荷/MW |
线损率 |
BI-LSTM预测线损率 |
ELM预测线损率 |
0 |
0.5 |
0.87% |
1.80% |
−3.61% |
0 |
2 |
0.98% |
1.20% |
1.63% |
0 |
4 |
3.16% |
3.03% |
1.90% |
0.3 |
0.5 |
1.32% |
2.15% |
−3.28% |
0.3 |
2 |
0.67% |
1.11% |
1.75% |
0.3 |
4 |
2.65% |
2.85% |
2.07% |
2 |
0.5 |
8.36% |
6.83% |
−0.90% |
2 |
2 |
0.42% |
0.80% |
2.59% |
2 |
3 |
0.95% |
1.08% |
3.44% |
4 |
0.5 |
11.49% |
13.08% |
3.43% |
4 |
2 |
0.80% |
3.26% |
4.27% |
4 |
4 |
0.43% |
0.99% |
3.07% |
Table 3. Comparison of evaluation indicators for different model line loss prediction
表3. 不同模型线损预测评价指标对比
评价指标 |
|
MAE |
MBE |
BI-LSTM预测 |
0.90454 |
0.0078417 |
0.0050797 |
ELM预测 |
0.62408 |
0.033956 |
0.013113 |
5. 结语
本文提出基于BI-LSTM的含高渗透率分布式光伏配电网的线损预测方法,通过实例分析验证其有效性。主要结论如下:
(1) 基于BI-LSTM的线损预测方法,利用其双向结构和记忆能力,有效捕捉源荷随机性,提升预测精度和稳定性,克服传统方法局限性。
(2) 改进传统GMM模型,通过R语言函数确定最佳场景数目,选择对角协方差矩阵构建模型,提升场景划分的科学性和合理性,为线损预测提供可靠数据基础。
(3) 通过实例分析证明,与传统ELM模型相比,BI-LSTM模型在源荷多运行场景下预测精度及稳定性均更高,适用于分布式光伏接入后更复杂多变的应用场景。