1. 引言
随着全球可再生能源发电在电力系统的占比日益增强,电力系统的负荷的管理与调度变得更加难以控制。尤其是大规模接入了风能、光伏等间歇性能源之后,以往僵硬的负荷调节策略根本不足以应对电力系统较高的不确定性和波动性。目前为了更好地实现电网在峰谷阶段的负荷调节,对负荷进行调度,增强负荷的弹性,主流的解决方法是引入需求侧用户参与电力市场的运营调控[1]。需求响应(Demand Response, DR)技术作为一种能够平衡电力供需的重要手段,目前在电力市场中的运用较为广泛。DR技术通过负荷调节来动态调整用户的用电行为,尤其是在电力需求高峰时段,通过调节用户负荷,从而缓解用电高峰时电网运行压力,优化电网。但是目前国内的电力市场仍处于起步阶段,对于较为分散的各项DR资源的整合能力不足,且如果让DR资源供需方直接交易也无法保证其弹性水平,为单一用户供需提供响应的调度和管理也无法满足电力市场的成本要求[2]。需要负荷聚合商(Load Aggregator, LA)参与需求响应机制当中,将分散的DR资源进行整合,统一调控[3] [4]。在电力系统中,LA作为一种市场参与者,负责整合分散的需求响应资源,并将这些资源进行统一调度以响应电力市场的需求变化。LA通过与大量用户签订需求响应协议,实现对用户负荷的调节[5]。然而,由于电力市场中存在大量的用户数据,这些数据往往涉及敏感信息,如何在保证用户隐私的前提下进行负荷预测和调度,成为了一个亟待解决的挑战[6]。
为了应对这一挑战,本文提出了一种基于动态联邦学习(Dynamic Federated Learning, DFL)和长短期记忆网络(Long Short-Term Memory, LSTM)的短期负荷预测方法。以联邦学习的方式实现分布式训练,避免了数据传输和集中存储,从而有效保护了用户的隐私。
2. 基于LA模式的DR信号模型
在负荷聚合商(LA)模式下,负荷的调节受到多个因素的影响,尤其是用户的需求响应行为,因此,在LA模式下进行负荷预测需要充分考虑LA参与DR的决策行为,而在模型当中则是将DR的数据作为LSTM的输入量的一种。为了更好地在LA模式中对相关的负荷进行预测,充分考虑DR的影响,本文参考LA模式下预测的主流方式,构建了基于LA模式的DR子信号模型,并结合LSTM进行负荷预测[7]。
本文所涉及的LA模式存在3类参与者,分别是DR需求者、LA和DR资源供给者。其中,DR资源需求者包含发电商、电网公司、供电公司等,能够和LA进行双边交易,并构建DR合同,设置激励价格来推动LA参与DR。LA通过与各类用户签订的需求响应(DR)合同,调节用户的负荷,优化整体电网的负荷平衡。根据负荷性质、DR能力、各元件的组合特性,本文考虑三种DR资源:IL (可中断负荷)、TL (可转移负荷)和光伏储能(PES)。这些DR资源的优化目标分别是通过减少高峰负荷、转移负荷到低谷时段,以及利用储能资源的充放电调节负荷,从而实现电网的负荷平衡。立足于这三类DR信号模型,合成DR信号作为数据集当中的一个输入量,输入到LSTM训练网络当中。建立基于LA模式的DR机制,如图1所示:
Figure 1. DR mechanism based on LA mode
图1. 基于LA模式的DR机制
在此基础上,将DR资源的优化模型进行构建,从而得到本文所考虑的3类DR资源的信号值,作为最终的输入值,进行模型训练。
2.1. IL的DR子信号
在LA模式下,各个时段的经济激励价格和用电的行为有关,在负荷曲线中表现为在高峰阶段时,会通过设定较高的合同价格引导用户积极主动对可中断电负荷IL进行削减,降低电力系统在用电高峰时的运行压力。由于本文在LA模式下进行负荷预测,所以以LA为主体,对该LA所管理地区内的IL资源进行用电计划优化,所以优化目标是LA的盈利最大化,IL的DR子信号模型为:
(1)
(2)
(3)
(4)
(5)
其中:
为LA在时段t从DR资源购买者处获得的电价激励;
为IL用户在时段t的负荷削减量,即LA在时段t中断负荷的大小;
为负荷削减的成本;
为IL的DR子信号;
为IL在时段t的DR子信号数值;T为负荷一日内的时间序列,本文取T = 96;
为IL用户数目。
对于LA与IL用户建立的电价合同,需要满足相应的DR规则,同时也要满足电网运行要求,即每个用户在时段t的实时中断负荷数量、一日内总用电减少量不能超出约定的限额。相应的约束条件如下:
(6)
(7)
式中:
表示合同中规定的最大即时削减负荷功率,
表示一日内最大削减电量对于;对于LA模式来说,负荷削减的持续时间需要处于一个合理的区间当中,过长的削减时间会极大降低用户满意度,同时电网DR的要求使得持续时间不能太短。除了持续时间外,负荷削减量的变化也会影响用户的满意度,总体上随负荷削减量增加而下降。具体约束如下:
(8)
(9)
式中:
和
分别为DR的持续时间下限和上限;
表示用户在时刻t的满意度,随负荷削减量增加而下降;
为用户对削减负荷的敏感度;
为用户满意度的最低阈值,防止削减负荷过多导致用户不愿参与DR。
2.2. TL的DR子信号
可转移电负荷TL指的是可以灵活调整使用时间的负荷,例如洗衣机、热水器等。LA可以通过实时电价的指导作用,通过引导用户在电价较低的时段使用这些设备来优化电网负荷曲线,确保一日内负荷总量变化为0。LA模式下,其目标函数与IL资源大致相同,整体的约束条件略有不同,具体列出如下:
(10)
(11)
(12)
(13)
(14)
(15)
(16)
式中:
为第i个TL用户在时段t转移负荷的大小;
表示用户在时刻t的满意度,
为用户偏好的用电时间点所需的负荷,
的偏离程度影响用户满意度;
为用户对时间偏移的敏感度。
为TL在时段t的DR子信号数值,即LA在时段t转移负荷的大小,正值表示转出,负值表示转入;
为TL的DR子信号;
为TL用户数。
2.3. 光伏储能的DR子信号
光伏储能(PES)指的是用户通过太阳能光伏系统及储能设备进行负荷调节,其优化目标是通过合理的充放电调节,最大化LA的收益。对于PES用户来说,其充放电行为一般满足合理的经济准则,即当用户i的光伏出力
大于固定负荷
或t时段电价为低谷电价时储能充电;当用户光伏出力
小于固定负荷
且t时段电价为高峰电价时储能放电。其充放电行为的数学模型如下:
(17)
(18)
(19)
(20)
式中,
为时刻t的放电功率;
为时刻t的从充电功率;
为时刻t的电价;
为0或1,表示储能不能同时进行充电和放电行为,
为PES的DR子信号;
为光伏储能参与用户数。对于电池,其容量也对光伏储能的参与程度产生影响,存在最小限值
和最大限值
,具体公式如下:
(21)
(22)
式中,
为时刻t电池的能量存储量,
和
为该光储系统的充电和放电功率。
2.4. DR信号的合成
为了更好在模型中输入上述3个DR子信号,本文将3类信号进行叠加,形成一个总DR信号,简化输入LSTM的数据量。
(23)
式中:
为LA聚合后的DR信号。
、
、
代表上文中的3类子信号。在本文中,将削减的负荷视为正,增加负荷视为负,选取某月实时电价下的需求响应信号则如下图2所示:
Figure 2. DR mechanism based on LA mode
图2. 实时电价下DR信号的聚合原理图
由图2可以看出:实际电力市场中,LA系统调度员发送DR信号的时间间隔和电价与电力的供需有关,当某日出现较低的电价,或者在峰值的负荷较低,调度员一般不发出DR信号,视为无需进行DR调度即可满足电力市运行,因此实际的需求响应要充分考虑其灵活性与随机性。
3. 基于横向联邦学习的负荷预测模型构建
动态联邦学习算法(DFL)是针对传统联邦学习(FedAvg)算法的一种改进,旨在根据每个客户端的数据量和特征相似度自动调整其聚合权重。传统的联邦学习使用固定的权重进行聚合,这对于数据量差异较大的客户端可能导致模型泛化能力较差[8]。DFL的优势在于,它动态计算每个客户端的聚合权重,以提升整体模型的准确性和稳定性。DFL的核心思想是根据以下两个因素调整权重:数据量权重:客户端的数据量越大,说明其训练数据对于全局模型的贡献越大,应该赋予较高的权重。特征相似度权重:如果某个客户端的数据与全局模型的特征空间更为接近,则该客户端对全局模型的贡献更大,权重应当增加[9]。
3.1. 基于动态联邦学习的负荷预测框架
3.1.1. DFL-LSTM模型结构
由于负荷聚合商(LA)分布在不同的区域,每个LA的数据具有地域性,不同LA的数据分布可能存在较大差异,因此直接在中心服务器上训练LSTM模型可能会导致数据孤岛问题。同时,数据的集中化训练会带来隐私泄露风险[10]。因此,本文提出了一种基于DFL (动态联邦聚合算法) + LSTM的负荷预测方法,在分布式环境下进行模型训练,避免数据共享,同时提升预测精度。该方法的模型结构如下:
1) 输入层:每个LA的本地数据作为LSTM的输入,包括过去T个时刻的负荷数据、需求响应信号R、天气、温度、湿度等外部因素
2) LSTM层:通过LSTM单元捕捉负荷的时间依赖关系,预测未来时刻的负荷。
3) 全连接层:LSTM的输出传入全连接层进行最终预测。
4) 输出层:预测未来时刻的负荷值
。
5) 联邦学习(DFL聚合):各个LA本地训练LSTM后,上传模型参数至服务器,使用DFL算法进行模型聚合。
3.1.2. DFL联邦学习流程
DFL-LSTM在联邦学习的基础上进行优化,基本流程包括模型初始化、客户端本地训练、聚合权重计算、参数聚合和模型更新。DFL具体步骤如下:
1) 初始化:服务器端初始化全局模型参数
,并将其分发至所有客户端。客户端需要根据本地数据集进行训练,得到本地模型参数
。
2) 本地训练:每个客户端使用本地数据集对模型进行训练,更新本地模型参数
,并计算本地训练损失和梯度。每个客户端进行多轮训练,直到本地模型收敛再上传本地模型,以减少全局通信频率,提高后续的联邦训练效率。在本地进行局部训练时,采用动态局部更新的策略,即考虑LA负荷数据的稳定性,对本地训练轮次进行动态调整:
(24)
其中:
是第k个LA的本地训练轮次,
代表该地LA的负荷数据的波动性,
是最大本地训练轮次,也就是针对集中LSTM方法下的训练轮次,
为总训练轮次。
3) 聚合权重计算:计算每个客户端的权重
,权重计算公式为:
(25)
(26)
其中:
是客户端k的数据量;
是客户端k的数据特征与全局模型的相似度,通过计算各LA的需求响应信号
和全局需求响应信号
的余弦相似度。
4) 参数聚合:服务器端将每个客户端的本地模型
和相应的聚合权重
进行加权平均,从而得到新的全局模型
:
(27)
其中,k是参与训练的客户端数量,
是客户端k的本地模型参数,
是相应的权重。为了更好的应对海量数据的通信压力,减少通信开销,在每一轮训练中,DFL仅选择高贡献度的客户端参与模型聚合,而非所有客户端均需上传本地模型。同时由于负荷数据的时序特性,不同时间段的特征重要性不同,本文引入梯度剪枝方法,仅上传重要的梯度信息,减少传输数据量:
(28)
其中,
是最终上传的梯度信息;
是客户端k的本地模型的梯度,
是梯度剪枝的阈值。
5) 更新与迭代:聚合后的全局模型参数
被发送回客户端,客户端使用该参数进行下一轮本地训练,直到模型收敛。
3.2. 预测评价指标
负荷预测效果评价指标采用均方根误差(Root Mean Square Error, RMSE)和平均绝对百分比误差(Mean Absolute Percentage Error, MAPE),以及训练伦次,三类结果的评价指标值越小代表所得结果与真实负荷的误差也就越小,本文方法的预测效果与实用价值更好。指标计算公式分别如下所示:
(29)
(30)
式中:
与
分别表示负荷的实际值与预测值;n为样本数量。
4. 算例仿真
4.1. 预测数据与场景
为了更好地模拟LA模式下各个负荷聚合商参与需求响应的状态,本文采用5台相互独立的计算机代表5个本地负荷运营商,也就是代表5个地区对实际的需求响应模型进行模拟。
本文数据集则选取某地75日内的电网工作日的负荷数据,时间间隔15 min,也就是一天共96个时间节点。训练集和测试集的比例为8:2,为了更好地体现负荷数值变化对于基量的差异,本文还利用min-max归一化处理。同时,基于神经网络的特性,将数据归一化到[0, 1]也能得到更准确的预测值。为验证本文提出的方法的有效性,我们设计了三个不同的预测场景,并对其进行对比分析:
场景1:使用传统方法,即在LA模式下使用集中式LSTM模型进行负荷预测。所有数据都集中到一个中央服务器进行训练,不考虑数据隐私问题。
场景2:使用传统的联邦学习(FedAvg)方法进行模型训练与聚合。FedAvg采用固定的权重来进行参数聚合,不考虑各客户端数据的特征相似度。
场景3:使用本文提出的动态联邦聚合算法(DFL)进行模型训练与聚合。该方法根据每个客户端的数据量和特征相似度动态调整聚合权重,在模型的训练过程中采用动态局部更新和上传梯度剪枝,以期提高训练中的通信效率。
4.2. 预测结果与分析
将用于实验的5个地区全部在3种场景下进行仿真实验,对这5个地区逐个进行以下操作:首先是进行集中式的LSTM模型训练,即每个地区的训练集仅限于本地区所得到的数据,得到训练好的本地模型,作为客户端的服务器模型,并记录集中式LSTM训练下所得到的结果用于后续对比;其次是将该模型下发至处理本地区之外的其他4个地区的服务端,进行模型的联邦操作,也就是更新、上传、接受、聚合、更新流程,在其中,先不考虑动态联邦,使用平均聚合,也就是传统联邦学习方法输出结果,得到结果后,再进行本文方法,使用特征相似度对比以及梯度剪枝方法进行动态联邦学习的模型学习流程;最后记录5个地区3种场景下的负荷预测结果,并对比真实负荷、集中式LSTM方法、传统联邦学习方法及本文方法的预测结果。得到各地区负荷预测结果对比分别如图3~8所示,RMSE对比结果如表1所示,MAPE结果对比如表2所示,三种方法的训练轮次对比如表3所示,两种联邦学习方法的训练轮时间对比如表4所示。
Figure 3. Comparison of load forecast results for region 1
图3. 地区1负荷预测结果对比
Figure 4. Comparison of load forecast results for region 2
图4. 地区2负荷预测结果对比
Figure 5. Comparison of load forecast results for region 3
图5. 地区3负荷预测结果对比
Figure 6. Comparison of load forecast results for region 4
图6. 地区4负荷预测结果对比
Figure 7. Comparison of load forecast results for region 5
图7. 地区5负荷预测结果对比
Table 1. RMSE (kW) comparison
表1. RMSE (kW)对比
地区 |
集中式LSTM |
FedAvg |
DFL |
1 |
351.1813 |
172.9268 |
145.0540 |
2 |
890.2984 |
504.4327 |
306.7956 |
3 |
1133.1096 |
773.6775 |
500.1387 |
4 |
2591.5062 |
1348.7641 |
977.9310 |
5 |
750.1747 |
631.5976 |
434.3824 |
Table 2. MAPE (%) comparison
表2. MAPE (%)对比
地区 |
集中式LSTM |
FedAvg |
DFL |
1 |
4.046 |
2.712 |
2.529 |
2 |
3.774 |
2.567 |
1.472 |
3 |
5.039 |
3.845 |
2.281 |
4 |
6.142 |
3.926 |
2.254 |
5 |
3.263 |
2.361 |
1.315 |
Table 3. Training rounds comparison
表3. 训练轮次对比
地区 |
集中式LSTM |
FedAvg |
DFL |
1 |
25 |
18 |
16 |
2 |
24 |
21 |
16 |
3 |
23 |
20 |
15 |
4 |
23 |
19 |
16 |
5 |
24 |
18 |
15 |
Table 4. Comparison of training times
表4. 训练时间对比
地区 |
FedAvg |
DFL |
1 |
190 s |
145 s |
2 |
218 s |
143 s |
3 |
206 s |
136 s |
4 |
185 s |
147 s |
5 |
178 s |
131 s |
总训练时间 |
997 s |
702 s |
从图4~8可以看出,从集中式LSTM方法到FedAvg方法到本文使用的DFL-LSTM方法,负荷预测曲线中实际负荷与预测结果的差距呈现出明显的变小。而表1、表2的结果表明,在每个地区当中,集中式LSTM预测结果误差普遍较大,在数据量较大的地区4的MAPE甚至超过了6%,而FedAvg方法虽然通过联邦提升了数据的共享训练,但是不考虑特征误差的情况下,如面对地区3和地区4这类负荷数据处理量繁杂的情况下,仍存在较大的误差,这表明仅仅引入联邦学习还不足以解决实际情况中数据量多,特征繁杂的复杂情况,对于误差的控制还有所欠缺。而使用本文所提方法,在负荷波动较大的时段,能够更准确地捕捉趋势。例如,在地区3,使用FedAvg预测的负荷峰值比实际负荷低332.97 kW,而DFL方法的误差减少至112.54 kW,误差降低了66.2%。表3、表4的结果表明,通过引入动态联邦聚合,有效缓解数据异构性,相比于集中式LSTM方法和FedAvg方法,本文方法的模型收敛速度更快,训练损失曲线如下图8所示,收敛速度分别提升34.4%和21.7%,而动态联邦学习中的局部动态更新和梯度信息剪枝上传使得最终的通信效率得到提升,相比于FedAvg方法,本文方法训练时间也减少29.6%,对于实时性较强的LA模式更加具有实际使用价值。
Figure 8. Comparison of training losses
图8. 训练损失对比
5. 结论
本文提出了基于LA模式的动态联邦学习短期负荷预测方法,主要研究成果如下:
1) 考虑用户参与DR的满意度,构建了和负荷转移呈负相关的函数模型反映用户满意度,进而刻画出其在DR实际项目中的参与度对预测结果的影响。
2) 在预测方法方面,在当前负荷聚合商模式下利用LSTM方法构建DR信号的负荷预测模型的基础进一步考虑数据隐私和样本不足的问题,利用联邦学习联合多地区共同进行预测,同时构建动态权重系数,建立了动态联邦学习方法DFL,考虑了数据分布差异,使得高质量数据对全局模型贡献更大。而由于动态权重减少了无效参数更新,训练轮数减少,DFL方法的训练轮次相比FedAvg减少21.7%,训练时间减少29.6%,相比集中式LSTM减少34.4%,DFL方法的收敛速度更快,说明动态权重聚合能够减少无效参数更新,加快模型收敛,计算和数据通信效率更高,更适用于实际电力市场应用。
3) 对比3种场景下的平均值,相比集中式LSTM,本文方法在RMSE误差上减少58.9%,MAPE误差降低55.2%,显著提高预测准确度。相比传统联邦学习(FedAvg),本文方法在RMSE误差上减少31.2%,MAPE误差降低41.2%,表明DFL方法能够更有效地处理数据异构性。
通过实验验证,动态联邦学习算法(DFL)相比传统的集中式LSTM和传统的联邦学习算法,能够有效提高预测精度,减少误差,并保护数据隐私。实验结果表明,DFL能够动态调整聚合权重,提高模型的泛化能力,尤其在多个负荷聚合商协同训练的情况下,能够显著减少误差并提升预测精度,相比传统方法,在预测误差、计算效率、数据异构性适应能力等方面均表现优越,为LA模式下的智能电力调度提供了可靠的技术支撑。
NOTES
*通讯作者。