1. 引言
近年来,能源短缺和全球变暖的问题日益突出,能源生产和消费观念发生了巨大变化,构建以新能源为主的新型电力系统成为实现“碳达峰”和“碳中和”目标的新途径。高比例可再生能源发电并网对系统源荷平衡和源荷发展提出了更高的要求。综合能源系统通过能量转换和存储设备整合了不同类型能源的使用,实现能源的生产、传输和供应,与传统单一能源系统相比,综合能源系统有效提高了能源利用效率和系统可靠运行的能力,因此不同能源独立供应的传统能源利用模式逐渐被综合能源系统所取代 [1]。
负荷预测是电力系统规划和能源调度的重要依据,对电力企业以及社会经济发展都起到了重要的影响 [2]。假如预测需求超出实际需求,会造成能量利用率降低以及温室效应增加等问题;假如预测需求低于实际需求,则会导致供能紧张,严重时会影响社会的正常运转。由此可见,负荷预测具有实际价值和迫切性,为保证电力系统安全稳定运行和对能量的精确管理,构建高精度负荷预测模型是十分必要的 [3]。负荷预测在时间上可分为短期、中长期预测,短期预测(未来数周)可以有效指导多种能源的组合调度、维系电网的安全稳定运行等;中长期预测(未来数月或数年)可以优化能源配给以及当地供能企业的能源系统布局,有效提高能源系统的供能质量。然而,随着负荷使用需求和波动特征不断加剧,不同负荷的用能规律各不相同,影响负荷的因素繁多且难以统计,在综合能源系统中,除了影响负荷的外部因素(如社会因素和天气)外,不同类型负荷内部之间存在着相互影响,这和传统的单一能源系统在能源利用方面有着本质的差异,使得传统负荷预测模型在综合能源系统多元负荷预测中得不到很好的预测效果,因此对综合能源系统多元负荷预测还需进一步研究 [4]。
国内外对于综合能源系统多元负荷预测方法主要分为单一模型预测方法和混合模型预测方法两大类。第一类单一模型预测方法通常先采用灰色关联度分析、小波包分解、Copula理论 [5] 等方法进行非线性相关性进行分析,提取相关影响因素使负荷数据在水平和竖直两个方向具有一定的关联特征,重构出原始特征集。再采用长短期记忆网络(long short-term memory, LSTM)、支持向量机(support vector machines, SVM)等方法进行负荷预测,但面对大规模化和高复杂化负荷数据,单一模型预测方法无法达到满意的预测精度,因此第二类混合模型预测方法逐渐被重视并研究起来 [6]。混合模型预测方法多采用分解算法如小波分解、经验模态分解(empirical mode decomposition, EMD),将综合能源系统多元负荷分解为不同的分量,然后再用不同的方法如循环神经网络(recurrent neural network, RNN)、深度信念网络(deep belief network, DBN)等进行分组预测,并将各分量预测值相加得到最终的预测值 [7]。综上所述,综合能源系统多元负荷预测研究已经有一定的研究成果,其中混合模型预测精度普遍高于单一模型预测方法,但在用户级综合能源系统多元负荷中常研究的是在时间尺度上单一负荷波动的相关性,而很少关注不同负荷之间的耦合关系,从预测过程中的内生变量和共享信息的角度来看,不同负荷之间存在着不可忽视的线性和非线性关系。因此,本文基于以往研究的基础上,提出基于用户画像及变分模态分解的综合能源系统多元负荷预测方法,通过分析多元负荷之间的耦合关系生成用户画像数据,赋予数据权重,再运用变分模态分解(variational mode decomposition, VMD)将数据分解为本征模态函数,之后使用GRU对其进行分别预测,最后基于权重信息将子序列预测结果进行叠加,得到预测结果。从算例分析来看,此模型有效处理了多元负荷数据,对比于其他预测模型有更高的预测精度。
2. 用户画像模型构建
用户画像起源于电商领域,是现实用户的具体代表,是指将每个用户的各个维度具体信息高度抽象为标签 [8]。标签的核心是具有代表性、共性,是对稳定特征的具体表述,通过这些标签可以准确描述了现实用户的各种属性特征,有利于对实际应用场景的开展,从而对用户提供针对性服务。在综合能源系统中,用户的用能特征与周围环境的温度、湿度、气压等密切相关,将用户画像概念用于综合能源系统中,把这些行为特征和属性特征抽象为标签形成综合能源系统的用户画像,具体架构设计见图1所示。
本文通过构建用户画像,将用户用能行为从宏观转换为微观数据分析,用户画像模型主要包括用户数据层、数据融合处理层、用户画像抽取层及用户画像应用层。在用户数据层实现用户用能数据信息采集,在数据融合处理层实现多元多维度数据融合,基于此在用户画像抽取层对数据进行挖掘实现对用户用能行为有效分析,提取出有价值数据,分析结果通过用户画像应用层显示用户用能情况,对用户用能行为进行全方位把控。
基于CRITIC赋权法用户画像方法
CRITIC赋权法是一种客观权重赋权法,其思想主要在于评价指标波动性和指标之间冲突性来衡量指标的客观权重 [9]。波动性又称对比强度,是指的是同一指标下对不同评价方案取值的影响深度,通过标准差进行表达,指标的标准差值越大,说明信息量就越大,权值就越高;冲突性又称相关性,代表不同指标间的关联性,通过指标间得相关系数进行表达,两个指标间相关系数越大,关联性就越强。求取标签权重具体步骤如下:
1) 首先进行数据标准化处理
为消除用户用能在不同物理指标的量纲影响,让数据可以在统一标准下乘凉,因此使用正向指标和逆向指标来对标签数据进行标准化处理。正向指标是指所使用的指标越大越好,逆向指标是指所使用指标的值越小越好。
正向指标如式(1)所示:
(1)

Figure 1. Construction diagram of user portrait model
图1. 用户画像模型架构图
逆向指标如式(2)所示:
(2)
式中:
;
;
表示第i个用户第j项进行标准化的指标值;
表示第i个用户的第j项的指标实际值。
2) 指标的变异性用标准差形式来表示,如式(3)式(4)所示:
(3)
(4)
式(4)中
为指标
的标准差。
3) 指标的冲突性用相关系数来表示,如式(5)式(6)所示:
(5)
(6)
式(5)中
为第i项指标与第j项指标之间的相关系数。
4) 通过前三步求得的Sj和Rj,进一步求出不同指标的信息量,信息量越大的指标,分配得到的权重就越多。指标的信息量和指标权重求取如式(7)式(8)所示:
(7)
(8)
式(7)中
为指标
的信息量;式(8)中
为指标
的权重。
3. 基于变分模态分解的多元负荷预测模型
许多研究表明,单个预测模型很难完全捕捉用户负荷变化趋势特征,并且单个模型可能不适合在任何时刻进行预测。因此,本文采用基于变分模态分解的多元负荷预测模型来构建模型池,并通过对单个分量的预测结果进行加权来获得最终的预测结果。假设每个模型在时刻t的预测结果是
,则最终预测结果可以表示为每个模型的预测结果的加权和。
(9)
式(9)中yn是第n个模型在时刻t的预测结果,y是最终的预测输出,而
是与每个预测模型在时刻t相关的权重。权重值由用户画像模型确定。
3.1. 变分模态分解
VMD是一种自适应分解方法,其通过将一维的输入信号分解为指定数量的各本征模态函数(Intrinsic Mode Functions, IMFs)分量及其对应的带宽和中心频率。通过对K个IMFs分量求和,可以完全再现信号。步骤如下:
(10)
式(10)中H(t)表示原始信号;K分解得到的模态数;
是为所有模态及其中心频率。
VMD方法的时间序列分解过程可以表示为约束变分模型,其函数为:
(11)
(12)
式(11)中
分解得到的本征模态函数分量;
为IMFs的中心频率;
是脉冲函数;*表示卷积。
为求解式(11),通过使用二次惩罚项和拉格朗日乘数将方程转换为非约束优化问题:
(13)
式(13)中
是表示二次惩罚因子;
是拉格朗日乘数。
式(13)的解是通过使用交替方向乘数法(ADMM)方法迭代更新
、
和
,最终获得信号分解的全部模态。
和
的最小值求解方法如式(14)和式(15)所示:
(14)
(15)
式(14)式(15)中
指当前剩余量的维纳滤波,
指的是当前子模态函数中心频率。
拉格朗日乘数更新公式为:
(16)
式(16)中
是更新参数。模型迭代过程的收敛条件定义为:
(17)
式(17)中
是用于判断模型收敛性的预设收敛误差。当达到收敛状态时,其在时域中的结果可以通过逆傅里叶变换来获得:
(18)
其中
表示实部;
表示逆傅里叶变换。
3.2. GRU神经网络
深度学习具有特征学习和训练大规模数据的能力。在各种算法中,递归神经网络(RNN)更适合处理各种类型的时间序列数据 [10]。GRU作为RNN的改进算法,具有更好的预测精度。其可以解决处理较长序列RNN的梯度爆炸或消失问题,因此本文利用GRU对数据分解得到各模态分量分别进行学习进行预测,最终叠加重构预测分量输出最终预测值。
3.2.1. 初始边界条件计算
GRU有两个控制门,更新门(zt)和重置门(rt)。其具体结构如图2所示,更新门负责候选状态ht−1从上一时间步骤t − 1到当前时间步骤t。它决定丢弃或添加新的状态信息,并且更新门的值和引入前一状态信息量呈正相关关系。复位门负责控制在当前候选集合中保留多少先前状态信息,复位门的值越大,保留先前状态的信息就越多,GRU的正向传播过程如下:

Figure 2. GRU specific structure diagram
图2. GRU具体结构图
(19)
(20)
(21)
(21)
其中
、
和
分别是输入序列、候选状态和隐藏层的输出。
、
、
表示从输入层到复位门、更新门和候选状态的权重矩阵。
、
、
表示递归隐藏层之间的连接的权重矩阵。
、
和
分别表示相应的偏置项。
3.2.2. GRU的损失函数和优化器
当训练数据集被输入GRU网络时,正向传播开始,并输出预测值。预测值和实际值之间的差异通过以下损失函数计算:
(22)
其中N是序列长度,
是时间步长t处的预测值,
是实际值。然后GRU执行反向传播过程以更新权重和偏差。在反向传播过程中,优化器可以直接影响神经网络的训练效果,因此选择一个合适的优化器至关重要。在广泛使用的优化器中,如SGD、Adamax、RMSprop、Nadam等,Adam优化器具有更高效的学习性能和更快的收敛速度。它在纠正学习率消失、收敛速度太慢失函数波动较大等问题方面具有优势。因此,采用Adam优化器来更新权重和偏差,更新过程如下:
(23)
(24)
. (25)
(26)
(27)
其中m和q表示一阶和二阶矩估计的梯度。g和j分别表示当前批次上的梯度和迭代次数。m和y是超参数。偏差校正后,期望值变为期望值,而
和
是
和
的偏差校正值。
和
是模型的权重和学习率,e的默认值是10−8,通过反向传播的过程,神经网络能够自学习其权重。
3.3. 模型构建
基于用户画像及变分模态分解的综合能源系统多元负荷预测的整体结构与运算过程主要有以下四个步骤:
1) 从监测系统中获取用户用冷、用热、用电以及周围环境(包括温度、湿度、气压等)的时序数据。
2) 构建用户画像,得到不同时序数据的权重。
3) 基于VMD,将实测数据分解为模态函数的叠加:
(28)
式(28)中F为某随时间变化的实测数据函数,
为第n个IMFs。
4) 对GRU神经网络的超参数进行设定并优化,GRU神经网络对各个分量进行预测,得出预测值,将各预测值叠加重构得出总预测值。
4. 实验验证
实验设置
本文以15分钟为步长,来源于夏日上海某区域上半年的运行数据,共110天,10,560个数据。为了突出本模型在多元负荷预测上的突出优势,将现有GRU模型、VMD-GRU模型与之预测结果对比。GRU模型作为一种机器学习方法用于时间序列的预测研究,其将LSTM输入门和遗忘门融合成一个更新门,并且将输出门更改为重置门,使得将结构简单化,更容易训练,但是其初始化权重是随机选取的,在后续训练中针对性弱;VMD-GRU模型通过VMD对原始信号进行深度分解后形成频率不同的IMF分量,再用GRU模型对IMF分量进行预测,之后进行叠加,结果相较于通过GRU模型直接预测的预测精度更高。上述模型均在TensorFlow深度学习框架下进行,硬件平台采用Intel(R)Core(TM)i7-8700K CPU和一块NVDIA RTX 3090 GPU,其中模型2和本文模型的GRU隐含层神经元数目取8,最大迭代次数为5000次,学习率取0.1,训练目标误差取0.0005。预测夏日上海某小区72小时的电、热、气负荷数据,并考虑了室外温度、相对湿度、风速和日照这四种因素。
首先通过用户画像得出电冷热和室外温度、相对湿度、风速和日照之间的权重见表1所示:

Table 1. Weight table of each influencing factor
表1. 各影响因素权重表
再次通过VMD得出各数据的本征模态函数,见图3所示。
最后通过GRU模型得出三种负荷预测结果,见图4所示。
本文采用平均绝对百分比误差EMAPE、最大相对误差Emax以及平均误差ME以及作为评价预测模型优劣的指标,三种模型的预测性能见表1所示。
由表2所知,本文模型与GRU模型的EMAPE、Emax和ME相比下降了0.48%、0.8、13.68。本文模型和VMD-GRU模型的EMAPE、Emax和ME相比下降了0.23%、0.4%、4.86%。因此,采用本文模型可有效提升多元负荷的预测精度。

Table 2. Predicted performance comparison table
表2. 预测性能对比表
(a) 风速
(b) 日照
(c) 相对湿度
(d) 室外温度
Figure 3. Modal diagram of each component
图3. 各分量模态图
5. 结论
在本研究中,结合构建用户画像方法、变分模态分解方法,提出了一种新的综合能源系统多元负荷预测混合模型。经过算例分析结果和仿真验证,可得以下结论:
1) 所采用的构建用户画像方法可以有效的提取原始数据的价值,提高预测精度。
2) 与采用GRU模型预测的单一模型预测方法相比,本文混合模型预测方法更适用于综合能源系统的多元负荷预测。
3) 与VMD-GRU混合模型预测方法对比,本文方法能有效的解决综合能源系统多元负荷预测问题。



Figure 4. Comparison diagram of electric heating and cooling load
图4. 电热冷负荷对比图