1. 引言
1.1. 研究背景及意义
2023年,国家层面在推动能源发展时,充分考虑了安全充裕、清洁低碳、经济高效等多个方面,并坚持在集中式与分布式两种模式上协同发力,共同推进“光伏+”综合利用,聚焦重点方向开展先行先试,探索出建立适应新型电力系统的新模式新业态新机制。加快落实大型光伏项目建设,有序推动项目建成投产,推动光伏产业高质量跃升发展。中国正致力于达成“双碳”目标,在此之上,国家大力推动绿色清洁能源的发展,不断降低碳排放量,成为了当前发展阶段不可或缺的重要条件[1]。太阳能是清洁能源之一,具有可循环可再生的优点,在当前世界各地能源短缺的现状中,成为了解决当前能源短缺现状的最佳方案之一。但是,太阳能发电存在技术阻碍,光伏预测技术存在随机性、间断性以及不确定的特点是影响电力系统能否稳定运行的因素,甚至可能会引起负载的失调。为了提高电力系统的可靠性和效率,本文通过准确地预测发电功率能够为有效地提升电力系统的电力分配作出贡献,从而减少电站的建设和相关运营费用。
1.2. 国内外研究现状
随着太阳能发电行业对技术的持续创新,光伏发电行业不断取得新的突破和进步,国际学术界已经开发出了多种有效的太阳能预测技术[2]。西方发达国家学者纷纷投身于光伏发电领域[3],在短期预测中又存在超短期预测,超短期预测的最大预测周期仅限于4 h [4] [5],可以帮助企业更好地掌握电网的发展趋势,以及更有效地实施电网的优化与改造[6]。目前大多数学者重点关注短期预测,主要是由于其精准度会影响电力系统的安排[7]。
1.2.1. 物理预测方法
近期,Maciel等[8]构建了太阳辐照度进行预测的简单物理模型,Salah等提出了一种基于具有一个形状参数的显式模型的预测方法[9],简单物理模型方法的显著优势在于,它能够在各种天气条件下实现相对较小的平均预测误差。由于光伏发电站的建设可能会导致电力系统的不稳定,因此电力公司需要加强对光伏电站发电量的监控,以保证电力系统的稳定性。德国奥登堡大学的Lorenz教授等首次提出了一种基于光伏电站的实时监控数据的复合物理模型[10],以便进一步精细化地估算发电量。基于三维模拟技术,有学者构建了能够更加精准地分析和评估气候环境变化对太阳能发电量的影响的复合模型[11]。
1.2.2. 统计和概率预测方法
在光伏预测中,可以采用统计预测和概率预测的方法,主要包括点预测法、时间趋势外推法以及时间序列法等,它们各自具有独特的应用场景和优势。西班牙和美国的研究者也纷纷投身到太阳能、热能发电的研究之中[12],并且在太阳能、热能利用方面取得了巨大的成就。光伏发电功率的预测中,灰色理论与马尔可夫链是较为重要的两个方法。国内外预测也运用SVM支持向量机法、贝叶斯法、随机森林法等方法进行预测[13],随着技术的发展,上述方法已成为当前用于光伏发电站发电量的有效预测手段[14]。20世纪90年代,人们开始利用先进的技术来进行智能预测,包括对温度、日照强度、辐射强度、湿度、风速等多种因素的深入分析,以及利用前向反馈神经网络(FFNN)算法来提高预报准确性[15],此外,还有许多新的、更加先进的神经网络模型可供选择。随着科技的进步,人工智能在许多领域都受到广泛的重视,如利用ARTMAP神经网络算法来进行光伏系统的发电量预测[16]。近年来,国际上又有学者提出了一些神经网络与其他技术结合的预测方法,并取得了一定成果[17]。光伏发电功率数据携带信息较为冗杂,直接运用于预测导致精度较低,本文在数据与模型间进行进一步研究,在数据与模型介尺度中对数据进行进一步的分解,自适应分解方法EWT既具有很好的分解非线性数据的特征并且结合了小波和经验模态分解(EMD)的优点,即能根据需求选择不同的基来进行滤波分析,获得合适的子层状态,从而解决数据的波动性问题。本文基于经验小波分解机制对光伏发电原始功率数据进行预处理,对分解的子序列数据进行特征分析,利用模型进行预测,最后通过对比验证PSOBOA-LSTM混合模型对数据能够更精确地预测。
2. 理论方法
2.1. 不确定性
不确定性涵盖了两个方面:即随机性(或偶然性)和模糊性(或不明确性),它们之间存在着一定差异,体现在产生机制、物理意义等不同[18]。事物本身所拥有的不清楚的概念以及大部分的事物衡量尺度的不清晰共同导致了模糊性,进而导致了预测时的不确定性。实验结果与固定的场景之间,没有一一对应的必然关系,或者固定的场景的特征未展示完全即为随机性。在现如今的低碳环保中,电能的作用举足轻重。随着新能源科技和新兴电力的不断发展,一个朝阳产业(太阳能发电的综合利用)正在成为新的发展契机。不断增长的光伏电站装机,受光伏发电功率的不确定性影响较大,这为配电网的发展制造了一系列的困难[19]。光伏发电数据在时间和空间分布当中,具有间歇性和强烈波动性的特性。它的不确定性、混沌特性远比负荷影响更大。光伏发电不确定性给光伏产业带来了一系列影响。目前光伏发电的功率可以通过参数优化等进行预测来减少其不确定性产生的问题,进而更精准地预测[20]。
2.2. 介尺度特征
介尺度是1976年N.G. van Kampen在文章中首次提及,并在1981年明确定义的一种尺度,该尺度指介于微观和宏观尺度之间[21]。“介尺度”作为一种比较宽泛的概念,它涵盖了从单一尺度到复杂的系统尺度[22]。其中每一个尺度都有其独特的特点,它既能够反映出一个更广阔的世界,又能够反映出一个更加复杂的结构。它的出现,使得我们能够更好地了解自然界,也促进了一个横跨物理性质、化工、生命、建筑材料等多个方面的新兴交叉学科的发展。随着社会的发展,仅仅依靠单个的系统已经无法有效地揭示出复杂的结果,因此,我们应该采用多维的视角来探索,比如将两个不同的系统、它们的上下级别及其相互影响的程度,结合起来,寻求出最佳的解决方案。
2.3. 经验小波变换(EWT)
经验小波变换(EWT)是Gilles在2013年提出的一种独特方法[23],该方法能够高效处理时间序列数据。在构建EWT的过程中,基于自适应时频特性对时间序列进行深入分析,针对非平稳信号利用经验模态分解中的自适应分解的方法,结合小波变换理论的基本框架进行创新,为处理复杂信号提供了新的视角和工具。它成功地将自适应分解思想和小波变换中的理论框架,这两种特性融合起来。
Figure 1. Flowchart of method
图1. 方法流程图
2.4. 长短期记忆算法
长短期记忆网络(LSTM, Long Short-Term Memory)属于神经网络算法之一,为解决常规RNN (循环神经网络)长期依赖问题而设计的[24]。与以往的RNN算法相比,LSTM的隐藏层已大大改变,它拥有一种全新的记忆方法,使其能够更好地捕捉并分析复杂的信息。这种新的设计使得它能够更好地应对那些在时空上变化较大的关键信息,从而更好地完成任务。
2.5. PSOBOA优化算法
粒子群优化(Particle Swarm Optimization)算法,基于模拟鸟类觅食等群体智能行为来对预测模型进行优化。PSOBOA算法包含两个部分,分别为PSO算法和BOA算法。PSO算法起源于对鸟群的捕猎行为的深入分析,它以群体的智慧作出反应,将复杂的数学模型转换成一种可以更加高效地处理复杂情况的算法。粒子群算法则更加强调群体之间的相互影响,通过个体之间的交流和协作,将复杂的数学模型转换成一种可以更加高效地处理复杂情况的算法,以达到更好的结果。BOA算法是蝴蝶优化算法,该算法基于对蝴蝶的研究,以及其对环境条件的反馈,以期望更好地捕捉和识别各种可用的信息,并将其转化成更有效的优化结果。BOA的全局探索是一种特殊的行动,即蝴蝶通过嗅觉获取信息,并以此作出决策。一旦发现没有特定的特定特征,那么它们便可以进入一个更加复杂的环境,从而实现更大范围的信息交流[25]。基于两者优点结合为PSOBOA优化算法。
2.6. EWT-PSOBOA-LSTM混合模型
混合模型EWT-PSOBOALSTM的构建过程如图1所示。
由于光伏发电功率数据常常呈现出波动和不确定的特点,并且存在于模型与数据间的介尺度特征也会对发电功率造成影响,本文致力于深入探究这些不确定性和介尺度特征背后的规律。
3. EWT-PSOBOA-LSTM模型的应用
3.1. 数据来源
本文选取河南省某电力公司的2020年1月光伏发电数据,以半个月为单位,每间隔一小时记录某家庭电力负荷数据,总共372个数据。
3.2. 数据预处理
由于太阳能发电受气象因素的影响,光照呈现随机性和昼夜的周期性。光伏电站发电的波动性和间歇性也造成夜间无光照、白昼不同时间光照不同的情况,从而导致在一定时间内太阳能发电功率为零。在进行预测时,这些功率为0的时刻在一定程度上干扰了预测精度,本文中数据选取的原则是将太阳能发电功率为零的数据剔除,只截取数据不为零的点作为样本数据,再利用样本数据进行预测。因此,本文选取某电力公司一月的太阳能发电功率剔除零过后的数据为样本数据。经过处理得出372个数据。将数据集分为训练集、验证集和测试集,数据量分别为280、46和46。
3.3. 模型评价指标
模型评价指标是衡量预测模型性能的重要工具,能够客观地反映模型在预测精确度和精度方面的表现。本文选择了误差百分比MAPE、平均均方根误差RMSE、拟合优度R2、平均绝对误差MAE来作为光伏发电功率预测误差评估的指标。当RMSE、MAE和MAPE值越小,R2值越大时,这表明模型的预测精度越高。它们的数学表达式分别如公式(1)~(4)所示:
(1)
(2)
(3)
(4)
公式(1)~(4)中,N代表测试集的样本个数;
是预测的功率值;
为真实值;
为
的平均值。而此处数据的预测值与其对应真实值之间的离散程度,则用MSE和RMSE来表示。在此处所选择的自变量对其因变量的解释程度,用拟合优度R2表示。其得到的数值越大,表明模型预测效果越佳。
3.4. 数据特征分析
3.4.1. 不确定性特征
事物本身就存在难以避免的不确定性。在进行光伏发电过程中也会存在不确定性,分析本文数据所呈现的不确定性特征,作出原始功率数据图如图2所示。
Figure 2. Graph of original power data
图2. 原始功率数据图
从图2来看,原始功率数据呈现出很明显的不确定性特征。
在光伏发电过程中,面临着两种主要的不确定性。首先,偶然不确定性:源于观测数据本身固有的噪声,是固有的,无法消除。认知不确定性与所使用的预测模型紧密相关。这种不确定性通常是由于模型训练不充分或模型结构不合理所导致的,与偶然不确定性不同,它在理论上是有可能通过改进模型或优化训练过程来消除的。对模型进行优化能够使认知不确定性降低,从而使预测结果更为精准。
在本文数据采集中存在的偶然不确定性因素大致包含三个方面:
气象因素,晴朗天气和阴雨天气造成发电功率不同;外部环境因素,新设备的光电转换率和老设备的光电转换率不同;设备收集过程中难以避免的误差,如机器本身存在误差。
本文存在的认知不确定性因素主要存在在模型当中:与RNN相比较,LSTM单元结构中的隐藏层引进了更为先进的神经单元,其拥有独特记忆模式。其不确定性主要存在于此,因此本文将LSTM模型和PSOBOA算法相结合,增加迭代次数,减弱LSTM的不确定性,运用PSOBOA优化算法对模型进行深层优化,减弱模型的不确定性。
3.4.2. 介尺度特征
本文研究光伏发电预测,对于总数据本身是具有波动性,直接预测会造成预测精度低,并且光伏数据携带的信息过于冗杂,直接运用也会造成预测精度低。因此,在数据运用到模型之间,存在尺度问题。数据内部存在一些基本特征,例如:容量、种类、速度等。而在模型与数据之间也存在特征,即介尺度特征。要研究尺度特征,需要对总数据进行分解。借助EWT对总数据进行分解,分解为不同的尺度特征的子序列,提取特征,针对数据进行不同研究。图3是原始数据分解的序列图。
EWT分解的最佳分解层次为8。在EWT中通过滤波可得到8组模式分量,由上图中EWT (1, 1)~EWT (8, 1)依次表示出每个模态成分的波形都很清楚,可分辨出每个模态的幅度和频率。对高频信号的噪音成分进行了有效分离,消除了干扰成分。通过观察频域图,我们可以清晰地看到EWT分解的频谱图中,各个模态分量的频率均落在特定的范围内。特别值得一提的是,从EWT (1, 1)到EWT (8, 1)的分解过程中,并未出现虚假分量或频率混叠的现象,这有效地避免了特征信息在分解过程中被淹没。因此,EWT方法展现出了强大的能力,它能够有效地抑制模态混叠现象,精确地确定频带宽度,并确保信号的完整性和准确性。它展现出强大的抗噪声干扰能力,确保信号处理的准确性和稳定性。分解数据相比于原始数据波动性减弱,去除了一些冗杂的数据,对分解数据求和能够总体减弱无关信息对构建模型数据预测的干扰,预测能提高预测精准度。
(a)
(b)
Figure 3. (a) Diagram of signal decomposition by algorithm; (b) Comparison of algorithm signal decomposition
图3. (a) 算法信号分解图;(b) 算法信号分解比较
由图3所示的算法信号分解图(b)的IMF1~IMF8可了解:
1) 观察分解结果,看出EWT是从低频到高频逐步进行分解的。其中,IMF1代表的是趋势项,即经验尺度分量,而IMF2~IMF8则代表不同频率的经验小波分量。通过EWT方法,发电数据时间序列被自适应地分解为8个分量,从而实现了对数据的精细化处理和分析。
2) 光伏设备的低抗扰性和弱支撑性会小幅度地影响光伏发电功率信号波动,这种低程度信号的波动主要集中在0~150 Hz,IMF1~IMF3代表这部分信号的主要成分,IMF4~IMF8为数据分解的低频分量,主要的在[−0.05, 0.05]范围内,波动较小。由图可见通过几个虚线把图3所示的算法信号分解图(b)分解为4个区间。
从时间尺度来看,以波动性来分析分解序列间的介尺度特征,观察结果如表1所示。
Table 1. Analysis table of volatility strength
表1. 波动性强弱分析表
波动性强弱 |
0~50 |
50~160 |
160~320 |
320~250 |
IMF1 |
较强 |
强 |
弱 |
弱 |
IMF2 |
较强 |
强 |
弱 |
弱 |
IMF3 |
较强 |
强 |
弱 |
弱 |
IMF4 |
较强 |
强 |
弱 |
弱 |
IMF5 |
强 |
较强 |
弱 |
弱 |
IMF6 |
强 |
较强 |
弱 |
弱 |
IMF7 |
强 |
较强 |
弱 |
弱 |
IMF8 |
强 |
较强 |
弱 |
弱 |
通过表1发现,在时间尺度与波动性中间介尺度中,波动性较为明显的主要分布于前两个区间尺度,后面两个时间尺度波动性较弱,这代表着后面信息含量较少,可以对后面研究进行适当减少,重点放在前两个时间区间信息含量冗杂的部分,提取更有价值的数据。因此,在后面预测中把数据分为两个部分,对前面信息价值含量高的时间区间增加迭代次数,取更加精准的部分,后面两个区间采用正常迭代次数,最终进行整合。
4. 结果对比及分析
4.1. 模型对比及分析
光伏发电功率数据属于长期时序数据且LSTM模型可通过各种门函数将重要数据特征保留下来,有效减缓长序列中可能具有的梯度消失或爆炸问题。所以本文选用该模型为基础进行光伏发电数据预测。
本文选用以上四种模型,以LSTM模型、ARIMA模型、GRNN模型、BiLSTM模型作为对比模型,通过模型评价指标及模型拟合图,将不同模型进行对比分析,验证所提出的混合模型最优。
Table 2. Comparison of results of photovoltaic prediction models
表2. 光伏预测模型对比结果
模型/评价指标 |
RMSE |
R2 |
MAE |
MAPE |
ARIMA |
0.021 |
0.586 |
0.012 |
153.5% |
GRNN |
0.027 |
0.286 |
0.015 |
241.3% |
BiLSTM |
0.0139 |
0.7788 |
0.0112 |
175.99% |
LSTM |
0.020 |
0.523 |
0.015 |
122.5% |
PSOBOA-LSTM |
0.013 |
0.783 |
0.009 |
3.2% |
EWT-ARIMA |
0.011 |
0.867 |
0.045 |
31.0% |
EWT-GRNN |
0.023 |
0.310 |
0.019 |
178.3% |
EWT-BiLSTM |
0.0153 |
0.7488 |
0.0122 |
368.81% |
EWT-LSTM |
0.025 |
0.502 |
0.021 |
799.2% |
EWT-PSOBOA-LSTM |
0.007 |
0.940 |
0.015 |
3% |
从光伏预测模型结果评价表2可得知,使用EWT分解数据的各模型拟合精确度比使用原始数据的模型拟合精度高。例如:从RMSE角度看,EWT-PSOBOA-LSTM模型数值为0.007,远远小于PSOBOA-LSTM模型的数值0.013;从R2角度看,EWT-PSOBOA-LSTM模型R2数值为0.94,远远高于使用原始数据的PSOBOA-LSTM模型的R2,从该角度看,EWT-PSOBOA-LSTM模型拟合效果很好,能较好地解释光伏数据特征;从MAPE的角度看,EWT-PSOBOA-LSTM模型的数值为3%,从统计学的角度来说,该模型误差较小,具有显著意义,适用于拟合光伏功率数据。当运用光伏功率数据一致时,PSOBOA-LSTM模型精度及拟合效果远高于其他模型。例如:在使用EWT分解数据时,从RMSE角度看,EWT-ARIMA模型、EWT-GRNN模型、EWT-BiLSTM模型、EWT-LSTM模型、EWT-PSOBOA-LSTM模型的数值分别为0.011、0.023、0.0153、0.1353、0.025、0.007,其中EWT-PSOBOA-LSTM模型的数值0.007远远小于其他模型;从R2角度看,EWT-PSOBOA-LSTM模型较为突出;从MAPE的角度看,EWT-ARIMA模型、EWT-GRNN模型、EWT-BiLSTM模型、EWT-LSTM模型、EWT-PSOBOA-LSTM模型的数值分别为31.0%、178.3%、368.81%、799.2%、3%,EWT-PSOBOA-LSTM模型数值最小,误差较小。
4.2. 消融研究
综合分析评价指标可知,PSOBOA-LSTM模型预测精度最好,EWT-ARIMA模型、EWT-BiLSTM模型和EWT-GRNN模型拟合效果一般,EWT-LSTM模型较差。选取未使用分解的五个模型预测的光伏数据以及使用EWT分解的五个模型预测值分别与其真实值作比较,作出数据拟合图4和图5。
通过对各模型的预测结果与实际值的比较,可以看出所提PSOBOA-LSTM模型的预测结果与实际值差异最小,这表明所提模型的预测精度较高。从EWT分解数据模型拟合图右侧的两个局部放大峰图中可以清晰看出,黑线和黄线几乎重合,PSOBOA-LSTM模型的峰点、拐点数据及数据整体趋势都与真实值最为接近,误差非常小。故该模型数据拟合程度最好,预测精度最高,说明PSOBOA-LSTM模型具有比其他模型不可比拟的优势。
Figure 4. Fitting results of the original data model
图4. 原始数据模型拟合效果
Figure 5. Fitting effect of the EWT decomposed data by models
图5. EWT分解数据模型拟合效果
5. 结论
光伏发电功率预测在保障电网稳定运行和优化资源配置方面扮演着至关重要的角色。本文聚焦于光伏发电输出功率的预测问题,特别关注其中的不确定性和介尺度特征,以期提升预测的准确性和可靠性。基于机器学习提出混合预测模型PSOBOA-LSTM预测模型,本文选取了以河南某地区为例的光伏发电功率数据,利用经验小波变换(EWT)将数据进行处理。分解为不同的特征序列,发掘不同特征序列的特性,采取不同的方式从而用更精准的预测性能模型挖掘其中的物理机制。
1) 本文针对基础模型LSTM的局限性和耗时性的缺点,选用粒子群优化算法(PSOBOA)对LSTM进行优化,提出了PSOBOA-LSTM混合预测模型。对数据进行EWT分解,将分解数据代入优化的智能预测模型(PSOBOA-LSTM)中,得出预测数据。利用其他模型与混合模型对比,得出混合模型预测精度最优。
2) 针对不确定性和介尺度分析进行分析。考虑光伏发电存在的偶然不确定性和认知不确定性,进行针对性分析,提出具体解决方法来减弱模型方面的不确定性;进一步考虑数据的介尺度特征,运用EWT分解为不同特征尺度的数据,在时间尺度与不确定性尺度之间,分析数据信息价值,得出研究应专注于信息含量价值高的时间尺度上,多次进行迭代,得出最精准的预测结果,信息含量较低的时间尺度可以减少过度研究,重点关注信息含量高的尺度。
通过本文的研究,相关电网机构可依据模型预测的数据提前进行安排,保证合理分配电能、安排光伏发电提升电网消纳阳光的能力,促进光伏资源的积极消纳,助力可再生能源持续发展。
基金项目
河南省高等学校重点科研项目——机器学习与物理融合模型下的太阳能资源高效利用(24B480012);河南省高等学校重点科研项目——转底炉直接还原炼铁中的介尺度传热传质行为及能量转化耦合机制(25A450004)。
NOTES
*通讯作者。