1. 研究背景与研究现状
随着全球能源结构的转型和可持续发展理念的深入人心,可再生的清洁能源的开发利用正逐渐成为一个迫切的全球性议题。风能因其安全、可再生、取之不尽、用之不竭、环保等显著优势而受到世界各国的重视[1],并且许多科学家和研究人员将其用于发电作为研究重点,风力发电产业也得到了快速发展。与传统发电方式不同,风力发电的效率依赖于风能;但是,风力的随机性和间歇性加剧了风力发电的不可控性[2]。因此,准确的风速预报对确保电力系统的安全稳定运行和促进风力发电行业的进一步发展至关重要[3]。
在风速预测方面,目前主流的方法一般有以下四种,分别为物理方法、人工智能方法、统计方法和混合预测方法。
常用的物理方法为数值天气预报(NWP)方法,这种方法利用物理定律模拟风速变化,可以获得较好的长期风速预报效果[4]。但是,这种方法消耗了大量的计算资源[5];风速预测常用的统计方法为自回归移动平均模型以及自回归积分滑动平均模型,如Radziukynas等人使用ARIMA [6]预报了1小时后的风速;随着人工智能时代的到来,越来越多人使用人工智能模型来预测风速,如P. Jiang等人使用支持向量机模型来预测了风速[7],获得了很好的结果。
随着大数据与人工智能的不断发展,越来越多的学者发现了混合预测模型在时间序列预测中的优势,不断提出新的混合预测模型,比如将混合ANN模型与数据预处理技术相结合,以提高单一ANN方法的性能[8],Chen等人[9] (2007)利用WA-ANN成功地提前一到五年预测了潮汐。
基于此,本文使用宁夏回族自治区麻黄山共17376条风速数据为例,通过构建和验证混合预测模型,进一步探索大数据与人工智能技术在风速预测领域的应用,为人类更好地理解和利用风力资源做出贡献。
2. 主要模型介绍
2.1. 集合经验模态分解(EEMD)
EEMD (集合经验模态分解)是在EMD上发展起来的,它通过向信号中添加噪音来辅助分解。这种方法的核心在于,当多个加入了白噪声的信号被分解,然后计算它们的均值时,附加的噪声会在计算中相互抵消,从而减少不同振荡模式之间的干扰,同时,白噪声的引入使得分解结果对信号中的噪声和起始条件不那么敏感,提高了分解的稳定性。
EEMD的分解步骤见图1。
Figure 1. EEMD decomposition process diagram
图1. EEMD分解流程图
2.2. 长短期记忆神经网络(LSTM)
LSTM(长短期记忆网络)是一种先进的循环神经网络,该网络是在传统RNN (循环神经网络)的基础上进行改进,专门用来克服RNN在处理长序列数据时遇到的梯度消失或爆炸的难题[10]。
LSTM网络的主要进步是增加了存储单元,这使得网络能随着时间的推移选择性地保留或忘记信息。在LSTM的每个记忆单元中,包含有三个关键的组件:输入门、遗忘门和输出门。其中,输入门
决定在当前时间步中应保留多少新的候选信息
,遗忘门
确定需要从之前的状态
中舍弃多少信息,输出门
管理当前时间步的内部状态
,决定其中多少信息将被传递到下一个状态,同时也输出到网络的外部
,LSTM的每个记忆单元示意图如图2所示。
2.3. 鲸鱼优化算法(WOA)
鲸鱼优化算法[11] (WOA),是为了克服传统优化算法在解决复杂优化问题时的不足而提出的。该算法是一种元启发式方法,其灵感来源于座头鲸的捕食行为。WOA通过模拟鲸鱼的捕猎策略和利用螺旋形的泡泡网攻击模式,展现出强大的全局搜索能力和简洁的参数设置,在多个领域如最优控制和经济调度中得到了有效的应用。WOA算法的执行分为三个主要阶段:猎物的包围、利用气泡网捕食、以及对猎物的搜索。在WOA中,每个鲸鱼代表一个可能的解决方案,通过连续地在解空间内调整鲸鱼的位置,算法最终能够收敛至全局最优解。
Figure 2. Schematic diagram of LSTM
图2. LSTM示意图
1. 围捕猎物
WOA的核心目标是寻找全局最优解,这要求首先识别出最优解的大致位置以便进行包围。由于最优解的位置不是预先确定的,算法初始阶段会从当前群体中选择一个最优个体作为最优解的近似。随后,搜索代理会根据这个最优解的位置来更新它们自身的位置,更新位置的计算公式如下[12]。
(1)
(2)
其中,t表示当前迭代次数,
表示目前得到的最佳解的位置,
是当前位置,
是系数矩阵,
是更新后的位置向量,其中系数矩阵
的计算公式为:
(3)
(4)
其中,a在整个迭代过程中由2线性降到0;
是[0, 1]中的随机向量。
2. 气泡网捕食
WOA搜索的下一阶段是捕食过程,分为包围捕食和气泡网捕食,气泡网捕食的位置更新如下:
(5)
(6)
其中,
为鲸鱼与其猎物之间的距离,b为螺旋形状参数,l为[−1, 1]间的随机数。
在自然界中,鲸鱼捕猎时是绕着猎物盘旋,同时不断收缩外壳。因此,WOA被设计成模拟这种行为,模拟鲸鱼收缩包围和螺旋更新机制,用如下公式表达:
(7)
式中,p为捕食机制概率,是[0, 1]之间的随机值。
3. 搜索猎物
对于寻找猎物阶段,当收缩环绕机制产生的A值在[−1, 1]之间时,鲸鱼包围当前最优解,当A不在[−1, 1]时,鲸鱼将放弃接近最佳个体,而是选择随机搜索。其公式为:
(8)
(9)
其中,
表示从当前样本中随机选择的鲸鱼,D为当前搜索个体与随机个体的距离。
WOA算法流程如图3所示。
Figure 3. Whale optimization algorithm logic diagram
图3. 鲸鱼优化算法逻辑图
3. 模型及数据说明
3.1. 模型说明
本文选取的主要模型为EEMD-LSTM-WOA,其主要运行流程如图4所示。
3.2. 数据说明与数据预处理
本文选取的数据为宁夏回族自治区麻黄山2017年1月1日至2017年6月30日的风速数据,数据采样间隔为15分钟,共计17,376条数据,具体数据描述如表1所示。
本文选择的输入步长为10,输出步长为1,原始序列的70%数据划分为训练集、30%数据划分为测试集,针对不同的预测模型,使用了不同的归一化,数据分解后的残差预测Max-Min归一化,其余模型均使用Z-score归一化。
3.3. 超参数设置
本文的主要模型为混合预测模型,具体超参数设置表2所示。
Figure 4. Main prediction models
图4. 主要预测模型
Table 1. Wind speed data description
表1. 风速数据描述
数量 |
均值 |
最小值 |
最大值 |
标准差 |
17376 |
5.47 |
0.40 |
16.50 |
2.29 |
Table 2. Main hyperparameter settings
表2. 主要超参数设置
|
无最优化的BP神经网络 |
无最优化的LSTM |
最优化算法 |
隐藏层1大小 |
32 |
32 |
无 |
隐藏层2大小 |
32 |
无 |
无 |
学习率 |
0.01 |
0.01 |
无 |
训练次数 |
50 |
50 |
无 |
寻优次数 |
无 |
无 |
30 |
种群大小 |
无 |
无 |
10 |
3.4. 评价指标
为了合理评估模型的预测效果,以及更好地进行对比实验以及消融实验,采用了均方根误差(RMSE)、平均绝对百分比误差(MAPE)以及确定系数(R2)对模型进行评估,其中RMSE为衡量预测值和实际值偏差的评价指标,RMSE越大则说明模型稳定性越差,RMSE越小则说明模型稳定性越好;MAPE为衡量模型准确性的评价指标,MAPE越小说明模型预测准确性越好;R2可以反映模型拟合数据的准确度,R2越接近1说明模型拟合能力越好。
4. 实证分析
4.1. 对照实验
1. 预测模型对照实验
直接使用原始序列进行预测,并且不使用任何最优化算法优化超参数。本部分对照模型为BP神经网络,模型的超参数设置见第三部分,预测模型的对照实验结果如图5和表3所示。
Table 3. Comparison experimental results of prediction models
表3. 预测模型对照实验结果
|
RMSE |
MAPE |
R2 |
BP神经网络 |
0.5937 |
0.4441 |
0.9330 |
LSTM |
0.4915 |
0.3661 |
0.9541 |
由图5的拟合曲线以及散点图可知,BP神经网络和LSTM的拟合效果一般,但LSTM的拟合效果略优于BP神经网络的拟合效果,结合表3,LSTM预测模型的RMSE为0.4915,小于BP神经网络的RMSE值0.5937,说明LSTM比BP神经网络拥有更好的稳定性;除此之外LSTM的MAPE也小于BP神经网络的MAPE,这说明LSTM除了拥有更好的稳定性以外还有着更好的准确性,R2也同样印证了LSTM有着更好的预测能力。
2. 分解模型对照实验
本部分为分解模型的对照实验,上一部分的实验表明LSTM比BP神经网络更适合进行风速预测,因此本部分在LSTM的基础上对原始风速序列使用不同的分解模型进行分解,以此来证明本文所选分解模型在风速预测上的优势。
本部分有三个对照模型,第一个为第1部分中直接对原始序列预测的LSTM模型;第二个为将原始风速序列使用EMD分解后使用LSTM预测的EMD-LSTM模型;第三个为将原始风速序列使用完全集合经验模态分解(CEEMDAN)分解后使用LSTM预测的CEEMDAN-LSTM模型,CEEMDAN是EMD进一步改进的模型,CEEMDAN能够有效地消除模态混叠问题,提供更准确和稳定的分解结果。模型的超参数设置见第三部分,分解模型的对照实验结果如图6和表4所示,由图6的拟合曲线可以看出来,增加分解模块的模型拟合效果明显比LSTM的拟合效果好;从散点图来看,三种增加分解模块的模型都围绕在真实值附近并且收敛性较好;结合表4,三个添加了分解模块的预测模型三个指标均优于LSTM预测模型,其中EEMD-LSTM模型的指标值最优标好,这说明本文选择的模型在预测稳定性和准确性上都有较好的表现。
由图6的拟合曲线可以看出来,增加分解模块的模型拟合效果明显比LSTM的拟合效果好;从散点图来看,三种增加分解模块的模型都围绕在真实值附近并且收敛性较好;结合表4,三个添加了分解模块的预测模型三个指标均优于LSTM预测模型,其中EEMD-LSTM模型的指标值最优标好,这说明本文选择的模型在预测稳定性和准确性上都有较好的表现。
3. 最优化方法模型对照实验
本部分为最优化方法的对照实验,本部分在EEMD-LSTM的基础上增加最优化方法模块,通过使用不同的最优化方法来寻找EEMD-LSTM的最优超参数,以此来达到自动调优功能。本部分有三个对照模型,第一个为第2部分中的EEMD-LSTM模型;第二个为使用粒子群优化算法调优的EEMD-LSTM模型(EEMD-LSTM-PSO);第三个为使用霜冰优化算法调优的EEMD-LSTM模型(EEMD-LSTM-RIME),两种算法都是较为常用的最优化算法。最优化方法的超参数设置见第三部分,预测模型的对照实验结果如图7和表5所示。
Figure 5. Comparison experiment results of prediction model
图5. 预测模型对照实验结果图
Figure 6. Decomposition model comparison experimental results
图6. 分解模型对照实验结果图
Table 4. Decomposition model comparison experimental results
表4. 分解模型对照实验结果
|
RMSE |
MAPE |
R2 |
CEEMDAN-LSTM |
0.2619 |
0.2045 |
0.9870 |
EEMD-LSTM |
0.2561 |
0.1982 |
0.9875 |
EMD-LSTM |
0.2598 |
0.2019 |
0.9872 |
LSTM |
0.4915 |
0.3661 |
0.9541 |
Figure 7. Comparison experiment results of optimization method model
图7. 最优化方法模型对照实验结果图
由图7的拟合曲线可以看出来,三个增加了最优化方法模块的EEMD-LSTM模型比没有加最优化方法模块的模型拟合效果更好,从散点图来看,三种模型都围绕在真实值附近,证明了三个进行了最优化寻优的模型在时间序列预测上都有非常好的表现,结合表5可以发现,三个添加了最优化方法的模型的RMSE、MAPE和R2明显优于EEMD-LSTM预测模型,这证明了最优化方法对模型稳定性和准确性都有了提升。在这三种混合预测模型中,使用鲸鱼优化算法调优的模型表现最好,这表明针对风速预测这一问题,WOA调优的表现比RIME和PSO要好,其原因可能是鲸鱼优化算法使用随机个体或者最优个体来模拟了座头鲸的捕猎行为并且用螺旋线来模拟座头鲸泡泡网攻击机制,使得WOA的全局搜索能力极强,并且可以自适应地处理不同类型的优化问题,具有非常好的泛化能力。
Table 5. Results of optimization method model comparison experiment
表5. 最优化方法模型对照实验结果
|
RMSE |
MAPE |
R2 |
EEMD-LSTM-WOA |
0.1436 |
0.1133 |
0.9960 |
EEMD-LSTM-RIME |
0.1489 |
0.1189 |
0.9958 |
EEMD-LSTM-PSO |
0.1478 |
0.1164 |
0.9958 |
EEMD-LSTM |
0.2561 |
0.1982 |
0.9875 |
由图7的拟合曲线可以看出来,三个增加了最优化方法模块的EEMD-LSTM模型比没有加最优化方法模块的模型拟合效果更好,从散点图来看,三种模型都围绕在真实值附近,证明了三个进行了最优化寻优的模型在时间序列预测上都有非常好的表现,结合表5可以发现,三个添加了最优化方法的模型的RMSE、MAPE和R2明显优于EEMD-LSTM预测模型,这证明了最优化方法对模型稳定性和准确性都有了提升。在这三种混合预测模型中,使用鲸鱼优化算法调优的模型表现最好,这表明针对风速预测这一问题,WOA调优的表现比RIME和PSO要好,其原因可能是鲸鱼优化算法使用随机个体或者最优个体来模拟了座头鲸的捕猎行为并且用螺旋线来模拟座头鲸泡泡网攻击机制,使得WOA的全局搜索能力极强,并且可以自适应的处理不同类型的优化问题,具有非常好的泛化能力。
4.2. 消融试验
为了验证混合预测模型各个模块的效果,将去掉分解模块、最优化方法模块后的模型与原模型进行消融试验,消融试验的结果如表6所示。
Table 6. Results of ablation test
表6. 消融试验结果
消融试验 |
RMSE |
MAPE |
R2 |
EEMD-LSTM-WOA |
0.1436 |
0.1133 |
0.9960 |
LSTM-WOA |
0.4365 |
0.3257 |
0.9638 |
EEMD-LSTM |
0.2561 |
0.1982 |
0.9875 |
通过表6,可以明显发现分解模块对模型预测效果影响最大,去掉EEMD分解后,RMSE和MAPE分别增加了203.97%和187.47%,这证明了相比直接对原始序列进行预测,EEMD对原始序列进行分解之后对每个子序列进行预测后加和的方式极大地提升了模型的稳定性和预测准确性。除此之外,去掉鲸鱼优化算法后,模型的RMSE和MAPE分别增加了78.34%和74.93%,这说明最优化方法对整个模型的准确性和稳定性也有促进作用,并且最优化方法可以通过自动寻优来找到最优解,这也有效减少了人为经验调参的干扰,尤其是对于分解后的时间序列,最优化方法可以针对每个子序列进行调优来找到不同的超参数,大大减少了人力资源。
5. 总结
本文提出了一种基于EEMD-LSTM-WOA的混合风速预测模型,通过EEMD分解方法将原始时间序列分解成若干个IMF和一个残差,并对子序列进行训练建立LSTM预测模型,并且使用WOA最优化方法对LSTM的超参数进行调优,最后将各子序列预测结果结合得到最终预测结果。
通过预测、分解和最优化方法三个模型对比实验,发现本文提出的EEMD-LSTM-WOA模型在风速预测任务中有着最好的稳定性和准确性,证明了本模型在风速预测上的优势;通过消融试验,发现去掉EEMD分解后,RMSE和MAPE分别增加了203.97%和187.47%;去掉鲸鱼优化算法后,模型的RMSE和MAPE也分别增加了78.34%和74.93%,这说明本文的分解方法和最优化方法对整个模型的准确性和稳定性有极大的促进作用。
EEMD-LSTM-WOA混合预测模型作为大数据与人工智能时代下的时间序列预测模型,相比常规的物理方法和统计方法,有着更少的资源消耗,更好地捕捉长期依赖关系能力,更强的记忆性能以及更高的准确性和稳定性等优点,不光是时间序列预测领域,人工智能技术现在已经随处可见,相信随着人工智能技术的不断发展,人们的生活会变得越来越便捷。
NOTES
*通讯作者。