1. 引言
建筑是能源消耗大户。至2021年,建筑物占全球能源消耗量的40%,在匹配发电和需求响应方面可以发挥重要作用。建筑电力需求响应资源灵活性评估对建筑能源系统管理起着重要的作用,对建筑能源系统的在线控制和优化具有重要意义。公共建筑约占中国建筑行业总能耗的40% [1]。写字楼的能源消耗是一个重要组成部分,占行业的30% [2]。为了缓解电力供需双方的不平衡、电网运行不稳定等问题,有研究提出了供应侧和需求侧的能源灵活性措施,以创建一个可靠和高效的电力系统 [3]。在最近的研究中,利用建筑能源的灵活性来缓解供需不平衡引起了越来越多的关注 [4] [5]。
国际能源署(IEA)附件67“能源灵活建筑”所定义的那样,建筑能源灵活性是指建筑管理其需求和发电的能力,并在考虑当地天气条件、用户需求和能源网络的情况下实现需求侧管理要求 [6]。实现能源灵活性的一般方法是需求侧管理(Demand Side Management, DSM)、需求响应(Demand Response, DR)或灵活资源的灵活控制 [7]。然而,在需求响应项目实施初期,负荷响应特征数据缺乏,增加了建筑电力灵活性潜力评估的难度。
在这种情况下,无监督域适应(Unsupervised Domain Adaptation, UDA)是一种有吸引力的解决方案,它通过从标记良好的源域转移知识来减轻未标记目标域的繁琐标记。现有多源无监督自适应的迁移学习研究多集中于图像识别,严重依赖于数据扩充或伪标记,很少有与时间序列兼容的学习模型 [8]。考虑到建筑电力灵活性潜力评估所需为时序数据,所以如何有效地利用多个时间序列域(本文中为多个建筑)的和目标的元域信息,是多源无监督域适应技术应用于建筑电力灵活性潜力评估中的一个研究重点。为了解决上述问题,文献 [9] 提出协同对抗学习的原理,利用对抗式学习来对齐源和目标特征表示,并通过对比学习重塑空间,跨域利用跨源标签信息将同一标签的例子拉近,将不同标签的例子推开。建筑电力灵活性潜力评估中的用电数据为时序数据,因此常用的卷积(Convolutional Neural Network, CNN)方法不能很好的解决数据弥散问题和充分挖掘数据时序特征。
在上述研究的基础上,为了解决在需求响应项目初期数据短缺时的建筑电力灵活性潜力评估问题,本文基于多源域适应及对比对抗学习方法(Domain Adaptation with Contrastive Adversarial Learning, CALDA),改进特征提取器以便更好地实现建筑电力灵活性潜力评估效果 [10]。首先基于Energyplus9.1动态模拟建筑用电情况来量化建筑灵活性并确定典型类型建筑的电力灵活性潜力;其次,针对时间序列设计多源域适应模型,基于神经网络门控循环单元(Gated Recurrent Unit, GRU)的组成的CNN-GRU特征提取器用于提取输入时间序列数据的时间特征,并通过特征提取器和具有softmax输出的域分类器的对抗域自适应来找到源域和目标域之间的域不变特征;最后,通过对比学习重塑空间,更有效地利用源域标签数据,提高模型的灵活性潜力评估性能。
2. 研究方法
2.1. 研究思路
为了评估建筑电力灵活性潜力,本研究使用Energyplus9.1对多个建筑物进行仿真建模,并在24小时内对所考虑的每个能源系统实施独立的灵活性事件(假设有24个不同且独立的DR动作,每个动作持续1小时,且每天仅发生一个灵活性响应动作)。由此产生的能源灵活性数据集可用于量化该时刻建筑电力灵活性潜力。为了验证模型在目标建筑历史数据短缺时对建筑电力灵活性潜力数据评估的有效性,我们采取不同数量的源域建筑和仅具有少量历史响应数据的目标建筑进行实验,使用CNN-GRU网络提取数据集时序特征,并通过模型训练以实现对目标建筑能源灵活性的评估,从而克服了目标建筑历史响应数据不足的限制。
2.2. 灵活性事件下的建筑仿真数据
2.2.1. 建筑用能仿真数据
建立的5栋建筑动态仿真模型,仿真时段为2016~2021年制冷季(7月1日至8月31日),仿真时间步长为0.25 h,以防止瞬态振荡,保证仿真模型的稳定性和收敛性。图1展示了5栋建筑不同的72小时用电功率和建筑暖通系统(Heating, Ventilation and Air Conditioning, HVAC)与其他用电设备的功率占比。
2.2.2. 建筑灵活性事件
本文仿真模拟上调(时间:3:00~7:00,温度设定:23℃)和下调(时间:10:00~18:00,温度设定:28℃)灵活性事件。如图2和图3所示,由于建筑具有热惯性,在能量灵活性控制策略和参考调制下,制冷系统的典型日功率和典型房间的室内空气温度如图2所示(第2天)。与参考调节策略相比,峰值负载从高峰时段转移到非高峰时段。向上调制时,降低室内空气温度至到23℃,制冷系统功率增加;在接下来的11小时(工作时间),温度逐渐升高到28℃,冷却系统的功率低于参考调制的功率。由此表明,利用建筑能源的灵活性可以缓解电力系统供需不平衡问题。

Figure 2. Building power load curve under flexibility event
图2. 灵活性事件下的建筑电力负荷曲线

Figure 3. Environment parameters under flexibility events
图3. 灵活性事件下的环境参数
2.3. 建筑电力灵活性潜力量化
系统灵活性需求包括向上灵活性(flexible ramp-up, FRU)需求和向下灵活性(flexible ramp-down, FRD)需求。本节量化了建筑物在短期灵活事件下增加或减少其电力需求的能力,即建筑能源灵活性。通过使用现有的量化指标,量化方法基于功率的角度来评估冷却系统的能源灵活性,提供了建筑在调制期间可以提供多少电力灵活性潜力的信息 [10]。建筑电力灵活性可表示为:
(1)
(2)
在t时刻,
和
分别是建筑功率灵活性的上限和下限,
是默认控制下的基线功率,
是建筑运行功率,
是建筑设定温度,
是建筑所有可接受温度的集合。当我们得出建筑的基线功率,最大和最小功率时,就可以计算出该时刻建筑的灵活性功率。
3. 模型设计
本文首先基于Energyplus9.1动态模拟建筑用电情况来量化建筑灵活性并确定典型类型建筑的电力灵活性潜力,由此生成的多源时间序列数据作为模型输入数据;其次,针对时间序列设计多源域适应模型,基于CNN-GRU的特征提取器Gf用于提取输入时间序列数据的时间特征,并通过特征提取器和具有softmax输出的域分类器的对抗域自适应来找到源域和目标域之间的域不变特征,以便更有效地利用源域标签数据;再次,基于提取各源域的域不变特征结果,进行模型训练;最后,基于模型训练结果,评估模型性能。如图4所示,模型主要包括多源时序数据生成、数据特征提取、模型训练和建筑电力灵活性潜力评估四个步骤。
3.1. CNN-GRU特征提取器
3.1.1. GRU神经网络
常用的CNN方法由于梯度爆炸和梯度弥散,很难进行深层训练。长短期记忆(LSTM)神经网络主要就是用来解决梯度弥散,至于梯度爆炸可以用梯度截断的方式。而LSTM的改版模型GRU网络解决了梯度弥散的问题,于是循环神经网络就可以变得更加深层,且GRU较于LSTM训练速度更快。
GRU神经网络是LSTM神经网络一种效果很好的变体。GRU将LSTM中的遗忘门和输入门用更新门进行替代,在计算当前时刻信息的方法与LSTM有所不同。GRU的神经元结构见图5。

Figure 5. Schematic diagram of GRU neural network
图5. GRU神经网络原理图
图5中的zt和rt分别代表更新门和重置门,在GRU更新过程中,首先使用公式(3)计算更新门zt,zt用于控制前一时刻的状态信息被带入到当前状态中的程度,更新门的值越大说明前一时刻的状态信息带入越多。
(3)
其中xt为第t个时间步的输入量,经过一个线性变换(与权重矩阵Wz相乘)。
保存的是前一个时间步t − 1的信息。
从本质上来说,重置门rt控制前一状态有多少信息被写入到当前的候选集上,重置门越小,前一状态的信息被写入的越少。rt可用公式(4)进行计算,表达式与zt的表达式一致,仅仅改变了线性变换的参数。
(4)
其次计算候选隐藏层ht,可以看成是当前时刻的新信息,可用公式(5)进行计算。
(5)
最后zt控制需要从前一时刻的隐藏层
中遗忘信息的量以及需要加入当前时刻的量ht,最后直接得到输出的隐藏层信息。如公式(6)所示。
(6)
概括来说,GRU是通过各种门函数来将重要特征保留下来,这样就保证了在long-term传播的时候也不会丢失。GRU在保持了LSTM效果的同时具有更加简单的结构、更少的参数以及更好的收敛性。
3.1.2. 特征提取器
特征提取器是为了最小化源域错误。通过将特征提取器F(·;
)的输出反馈给具有softmax输出的任务分类器C(·;
),可以最小化源域上的分类错误。然后,我们更新参数
和
,以使用一个热编码真标签y和softmax概率p最小化分类交叉熵损失
。为了处理多个源,我们通过从每个源域分布
中提取的小批量示例计算该损失:
(7)
我们采用分类交叉熵损失,其中
和
分别表示y的一个热编码和softmax概率输出向量的第i个分量:
(8)
将历史负荷数据作为输入,搭建由一维卷积层和池化层等组成的CNN架构,提取反映负荷复杂动态变化的高维特征;将所提特征向量构造为时间序列形式作为GRU网络的输入,建模学习特征内部动态变化规律。
数据作为模型的输入,利用卷积操作进行特征提取,挖掘数据之间的相关性;再通过池化操作压缩参数数量,进一步降低数据维度;同时加入Dropout层按照一定概率随机选择网络中的神经元,防止过拟合;然后利用GRU层对降维后的数据进行处理,学习它们之间的时间依从关系;最后由全连接层将数据转换为一维结构,得到最终的输出结果。
3.2. 对抗学习模块
仅依靠特征提取器所选的特征表示可能在源域和目标域之间存在很大差异。因此,只依赖最小化源域误差,很可能不能很好地转移到目标域。而通过对抗学习模块,训练一个领域分类器(即“对手”)来正确预测每个例子的领域标签(即预测每个例子来自哪个领域),同时训练特征提取器使领域分类器预测例子来自不同的领域,可以很好的实现源域和目标域的对齐。
我们定义了一个多类域分类器,其中softmax输出作为对手。域分类器D(·;
)跟随网络中的特征提取器F。然而,我们在F和D之间放置一个梯度反转层(Gradient Reversal Layer, GRL),它将反向传播过程中的梯度乘以一个负常数
,产生对抗训练。给定域标签
,它将目标示例映射为标签dT = 0,将源i示例映射为标签
,我们更新模型参数
和
:
(9)
目标结合了一个分类交叉熵损失
类似于
,它使用域标签而不是类标签。给定真域标签d和域分类器的softmax概率输出向量p的一个热编码表示,可计算损失:
(10)
整体评估模型框架如图6所示。
4. 结果与分析
4.1. 实验设置
目标域的数据样本分别分为训练数据集、验证数据集和测试数据集。验证数据集用于确定近模型最优超参数,测试数据集用于评估所提出的多源迁移学习模型的性能。所有源构建数据集和目标构建的训练数据集都用于训练,源构建的5年(2016~2020)制冷季数据和目标构建的(2021年6~7月)用于模型训练和模型超参数选择。本研究的任务是目标建筑在2021年8月的电力灵活性潜力。
4.1.1. 样本设置
本研究采用多源时间序列域适应学习使用Python3.6和深度学习框架pytorch 1.7实现所有实验。为了评估本文所提出的框架在构建建筑电力灵活性潜力评估方面的有效性,我们对不同数量的源域进行了实验。在本研究中,实验中考虑了不同数量的迁移学习源域,分别包括单源(S1.1, S1.2, S1.3, S1.4)、双源(S2.1, S2.2, S2.3)、四源(S4)迁移学习模型(共8种),每个模型的结果取平均值10次,以减少实验中的随机效应。
4.1.2. 超参数设置
为了通过所提出的迁移学习模型获得最佳预测性能,模型超参数应在数据预处理后确定。表1总结了所提出的迁移学习模型中用于模型选择的候选超参数设置。特征提取器是CNN-GRU神经网络。域分类器和回归预测器和对比头都是三个全连接层。为避免深度学习中的过度拟合,在本研究中Dropout设置为0.5。实验中不同迁移学习模型的剩余超参数配置通过验证数据集进行优化,包括L2正则化权重、学习率、LSTM和回归层的神经单元,以及源域和目标域的批量大小如表1所示。使用Adam优化器将训练epoch设置为100。

Table 1. Model super parameter setting
表1. 模型超参数设置
4.1.3. 模型评估
本研究选取平均绝对误差(MAE)、均方误差(MSE)、平均绝对百分比误差(MAPE)和R-Squared (R2)来评估目标建筑功耗的预测性能。四个模型性能评估指标分别由方程计算。
(11)
(12)
(13)
(14)
4.2. 建筑能源灵活性评估结果
4.2.1. 时序数据特征的分散分布
t-SNE (t-distributed stochastic neighbor embedding) 被广泛用于将原始数据映射到二维空间,以可视化高维数据分布。图7显示了四个源建筑数据和目标建筑数据的原始数据特征的t-SNE可视化,图中不同的颜色表示不同的源域和目标域之间的域不变特征分布。四个源建筑数据和目标建筑数据之间存在明显的数据分布差异。数据分布差异主要是由于能耗设备、个人时间表和建筑围护结构特征。因此,不同的源建筑数据不能直接放入同一预测模型中,应首先通过数据调整进行处理。由图7可以看出,使用CNN-GRU方法与仅使用CNN方法相比,模型提取的域不变特征分布更集中,即本文方法可以很好地克服多源域的数据分布差异。

Figure 7. Decentralized distribution of time series data characteristics
图7. 时序数据特征的分散分布
4.2.2. 建筑灵活性评估结果
图8展示了建筑电力灵活性潜力评估的实际值和预测值的比较。图9和图10分别展示了目标建筑一天内不同灵活性事件下的建筑电力灵活性潜力实际量化值和模型评估值。可以看出相较于单源迁移和双源域数据适应,基于四源迁移学习模型评估结果更接近实际数据,证明模型效果更好。

Figure 8. Comparison of predicted values of building power flexibility potential assessment
图8. 建筑电力灵活性潜力评估预测值对比

Figure 9. Evaluation value comparison of building power flexibility potential (downward)
图9. 建筑电力灵活性潜力评估值比较(向下)
4.2.3. 模型平均性能分析
图11给出了不同数量源域组合(单源、双源和四源)进行多源域适应训练学习模型的平均性能评估指标。可以看出,随着源域的数量从1个增加到4个,性能评估指标逐步增加。

Figure 10. Evaluation value comparison of building power flexibility potential (upward)
图10. 建筑电力灵活性潜力评估值比较(向上)

Figure 11. Average performance evaluation index of the model
图11. 模型的平均性能评估指标
4.2.4. 不同方法评估对比
为了验证模型的科学性和稳定性,基于本文研究数据预测结果,对比不同预测方法所得结果与仿真模型结果的拟合程度(R2)。由表2可知,在目标建筑历史响应数据短缺的情况下,MLP和LSTM等未进行多源域适应的模型评估效果不佳;相较于其他多源域适应的模型,本文方法得到的建筑电力灵活性潜力评估结果与真实值的拟合程度更高,证明本模型具有较高的预测精度。

Table 2. Model precision comparison (R2)
表2. 模型精度对比(R2)
5. 结果与分析
本文针对建筑缺少需求响应历史数据时的建筑电力灵活性潜力分析问题开展研究,为充分利用已参与响应项目建筑的历史数据,提出一种基于多源无监督域适应的建筑电力灵活性潜力评估方法。通过理论分析与仿真验证,可得以下结论:
1) 与基于MLP和CNN的结构相比,CNN-GRU网络更适合提取时序数据特征,提升了建筑电力灵活性潜力评估模型性能;
2) 通过仅依靠目标建筑数据和结合目标建筑数据和多个源域建筑数据的评估结果做对比,验证本文提出的多源无监督域适应模型可以显著提高建筑电力灵活性潜力评估性能;
3) 与其他方法对比,本文方法能有效的解决数据短缺时的的建筑电力灵活性潜力评估问题。