1. 引言
随着技术革新和工业发展,人类对于能源的渴求与探求日益增长,新能源技术的研究成为全球各国关注的焦点及核心议题[1]。风能以其可再生和低廉的维护成本而备受青睐,风能发电在可再生能源发电领域的贡献率大约为27% [2]。到2023年底,风力发电总装机将超过300 GW,成为世界上风力发电第一大国[3]。但是,由于风力发电本身所具有的非平稳特性,使得其接入电网面临着严峻的考验,准确地预报其出力是保证电网安全稳定的关键[4]。
目前,风力发电的预测技术根据建模原理主要分为物理模型,经典统计学模型,基于人工智能算法的模型,混合模型[5] [6]。物理方法一般通过数值天气预报(NWP)数据或者气候研究人员预报(WRF)建模,基于物理定律和机制来进行预测。与物理建模不同,统计数据并不依赖于物理规律,而是通过历史数据来建立输入与输出的关系[7]。现在的超短期预测往往基于人工智能模型进行预测,主要模型可以分为机器学习模型[8],如支持向量机(SVM),集成学习模型(XGBoost,LightGBM等),树模型(GBDT等)和深度学习模型[9],如RNN,LSTM,CNN。混合模型不局限于使用单一的模型,而是以上三种模型的组合[10]。
风力发电的输出功率波动显著,单一预测模型通常难以达到预测的高准确度。而采取多种模型的融合策略,能够整合各自模型的优点,从而达到更佳的综合预测表现[11]。Chou [12]等研究者采用了自适应噪声完备经验模态分解(CEEMDAN)、经验小波转换(EWT)与长短期记忆网络(LSTM)的混合策略,以进行超短期内风力发电功率的预测工作。Shao [13]等人创新性地运用奇异频谱分析(SSA)技术,对风电复杂序列进行拆解,提取出新的趋势性特征,进而将这些特征输入到融合时间卷积注意力网络与时序卷积模型(TCN)的混合网络中,以实现短期内风电功率的准确预测。Lu [14]等人则对变分模态分解(IVMD)进行了改进,并与样本熵(SE)联合应用,对风电数据进行了预处理。在此基础上,他们利用长短期记忆网络(LSTM)构建了预测算法,并通过粒子群优化算法优化了模型参数。王[15]等研究者通过采用卷积神经网络(CNN)增强特征提取能力并结合Informer模型完成风电短期预测任务。Sheng [16]等研究者则运用复合经验模态分解(CEEMDAN)将原始风电数据序列分解为多个子序列,使用门控循环单元(GRU)模型对每个子序列进行单独预测,并借助鲸鱼优化算法(WOA)调整模型参数。
基于模态分解的方法能够有效提高预测精度,但现有研究尚未充分考虑模态分解过程中可能引发的特征冗余问题。此外,现有预测模型未充分利用深度学习模块的多样性和协同作用来进一步提升预测性能。针对这些问题,本文提出了一种基于CEEMDAN分解方法和混合深度学习模型的风电功率组合预测模型。该模型首先采用CEEMDAN方法对风电功率数据进行分解,并利用模糊熵(FE)计算分解后各固有模态函数(IMF)序列的复杂度。为了避免过多维度对预测模型造成的干扰,本文进一步应用k-means聚类算法对IMF序列进行聚类重组。此策略有效降低了特征冗余,并提升了特征的代表性。在预测模型设计方面,本文提出了一种基于时序卷积网络(TCN)与门控循环单元(GRU)相结合的混合模型,旨在进行高效的特征提取。通过引入注意力机制,模型能够自动捕捉输出序列间的相关性,进一步增强了预测精度。最终,该模型实现了超短期多步预测的目标,为风电功率预测提供了一种有效的解决方案。
本研究的主要贡献如下:
1) 采用最大信息系数(MIC)和皮尔逊相关系数(PCC)筛选风电功率预测中的关键特征,并使用双重四分位法进行数据预处理,有效去除异常值,提升了输入数据的质量,保证了模型的稳定性和准确性。
2) 通过CEEMDAN分解方法对风电功率数据进行处理,结合模糊熵(FE)指标评估各固有模态函数(IMF)的复杂度,解决了模态分解过程中可能引发的特征冗余问题。此策略减少了冗余特征,增强了特征的代表性,有助于提升预测模型的精度。
3) 提出了基于时序卷积网络(TCN)和门控循环单元(GRU)的混合模型,利用TCN捕捉长短期时序特征,GRU处理非线性关系。两者结合提高了风电功率预测中的特征提取能力和时序建模效果。并通过引入注意力机制,模型能够自动调整对不同时间步的关注权重,提升了关键时刻的预测精度。此机制增强了模型对时间序列的敏感度,有效提升了预测精度。
2. 研究方法
2.1. 完全集合经验模态分解
完全集合经验模态分解(CEEMDAN)是对经验模态分解(EMD)技术的改进版本。它结合了集合经验模态分解(EEMD)的原理,有效解决了EMD在分解过程中出现的模态混淆问题。具体步骤如下:
步骤一:
对原始信号
添加高斯白噪声
(其中
表示添加的第j次的噪声),再对加入噪声后的信号
进行EMD分解,得到第j次分解的k个模态分量(IMF)
(1)
(2)
其中为原
始风电功率信号;
为噪声标准差;
为第j次白噪音信号。
步骤二:
对每个阶次的IMF计算平均值,得到最终的IMFs。同时,从原始信号中减去已提取的IMFs,得到新的残余信号。
(3)
(4)
其中K是分解的阶数,
是最终的残余信号。
步骤三:重复步骤一和步骤二,直到残差信号仅剩一个IMF为止。
(5)
2.2. 模糊熵
为了解决CEEMDAN分解后会产生较多IMF分量的问题,可以通过模糊熵(FE)计算各IMF的复杂度。模糊熵的测量值越大,表示序列的复杂度越高。FE表示为
,其中m
为维数,r为相似容限,N为输入数据长度。
模糊熵具体步骤为:
步骤一:
对分解后的IMF序列
进行m维的向量序列重构
(6)
其中,
步骤二:
计算步骤一重构向量
与
之间的Chebyshev距离,公式如下:
(7)
步骤三:
定义相似容度函数,并应用模糊隶属度函数
将
与
距离转换为相似度。
步骤四:
增加嵌入维度为
,重复步骤一到三,针对每个i,求其平均值,得到
,
(8)
步骤五:
计算FE的值:
(9)
2.3. 门控循环单元
于2014年,Cho [17]等研究者首次引入了门控循环单元(Gated Recurrent Unit,简称GRU)的概念。该模型旨在应对传统RNN在训练过程中易出现的梯度消失或梯度爆炸问题。与LSTM相比,GRU的结构更加简洁,在保持有效时序信息提取能力的同时显著提升了模型的训练效率。GRU的核心组件包括更新门与重置门。其中,更新门的主要功能是捕捉重要信息,并将这些信息从过去时间步有效传递至未来时间步;而重置门则用于筛选和遗忘次要信息。GRU的结构见图1:
Figure 1. GRU model diagram
图1. GRU模型图
(10)
(11)
(12)
(13)
式中
,
为
时刻更新门,遗忘门的输出,
为
时刻的隐藏状态,
为
时刻的输入,
和
为权重矩阵
为sigmod激活函数,
为tanh激活函数。
2.4. 时序卷积网络
时序卷积网络(Temporal Convolutional Network, TCN)是针对时序数据处理对传统卷积神经网络(Convolutional Neural Network, CNN)进行改进的一种架构,其核心设计包括扩张因果卷积层和残差连接模块。因果卷积的设计旨在避免传统卷积可能利用未来数据进行计算的问题,仅依赖当前及历史信息以确保时间序列的因果性[18]。残差模块目的是应对深层神经网络训练过程中常见的梯度弥散和性能退化问题。模型具体结构见图2。
(a)
(b)
Figure 2. (a) Dilated causal convolution; (b) Residual block structure
图2. (a) 膨胀因果卷积;(b) 残差块结构
2.5. 注意力机制
注意力机制由查询(Query),键(Key),值(Value)构成,计算注意力机制(Attention Mechanism, AM)通过对Query和Key相似度进行量化分析,进而筛选出关联性最强的Value进行输出[19]。其基本步骤如下:
步骤一:
计算Query和不同Key的相关性,并使用softmax函数将相关性得分归一化为权重系数,这些系数表示每个Key对Query的重要性。
,其中Q是Query向量,
是第i个Key向量
(14)
其中
是第i个Key的权重系数
步骤二:根据上一步的权重系数对每个Value进行加权求和,从而得到最终的注意力数值
(15)
2.6. 网络模型
1) 数据预处理:首先对原始数据进行预处理,利用四分位法筛选并删除异常值,同时采用后向填充法处理缺失数据。此外,通过PCC (Pearson相关系数)和MIC (最大信息系数)方法完成特征选择,保留关键特征。
2) 特征分解与重组:对历史功率数据进行CEEMDAN分解,并计算分解后每个IMF的模糊熵值(FE)。然后利用K-means算法对IMF特征重组,将其分为高频、中频以及低频三类特征。
3) 归一化处理:对重组后的特征矩阵进行归一化,以消除量纲差异并提高模型训练的效率。
4) 特征提取:将归一化后的特征矩阵输入到TCN模型中进行初步特征提取,随后输入GRU模型进一步挖掘深层的时序特征。
5) 注意力机制与特征映射:通过GRU输出后的特征矩阵,利用注意力机制对各时间步计算权重分布,增强关键时序特征的表达能力。随后,特征经过BatchNorm层以提高训练的稳定性,并通过Flatten层将三维数据展开为二维数据。最终,通过全连接层将多维特征映射到一维空间。
6) 结果反归一化:对模型的输出结果执行反标准化操作,以确保预测值能够反映原始的物理含义。
模型具体架构见图3:
Figure 3. Model architecture
图3. 模型架构
3. 个例研究
3.1. 实验数据集及实验配置
本文的实验数据集来自中国国家电网可再生能源发电预测大赛风能数据里一个风电站的数据集,实验数据选取2019年1月1日到2019年12月31日,时间分辨率为15分钟,包括30 m,50 m,70 m,涡轮机风扇的风速和风向,温度,大气压,相对湿度,功率总共有12个特征,总样本数为30540。本实验数据集的训练集,验证集,测试集划分比例为6:2:2。
实验的配置为Windows 11系统,4050显卡,i5-12核CPU,RAM 16GB,代码均由Python语言编程,Python版本为3.11,Python编译器PyCharm版本为2023.2.1,深度学习框架为pytorch2.2版本。
3.2. 数据预处理
3.2.1. 异常值处理
首先对数据进行合理性筛选,删除功率负值,连续4个时刻以上保持不变的特征值,风速相关特征不在0~40 m/s区间的值,风向相关特征不在0~360˚区间的值。由于风电数据在采集和传输过程中可能受到信号干扰、设备故障或电网限制等因素影响,导致部分数据出现异常[20]。采用双重的四分位筛选法对风电功率及风速范围内的异常数据进行处理,具体操作流程如下:
步骤一:依照风电功率的大小,由小到大排序,并划分成120个小区段,对各个小区段内的风速数值由低至高进行排列,随后应用四分位数法去除每个小区段中的异常值。
步骤二:在移除横向的异常数值之后,将全部数据根据风速由小到大重新排序,并以0.1 m/s的间隔等分,对每个分段的功率数值再次进行由小到大的排序,并采用四分位数法对每个小区段内的离群值进行剔除。
3.2.2. 特征筛选
本实验采用皮尔逊相关系数(PCC)和最大互信息系数法(MIC)对数据的筛选。皮尔逊相关系数为线性相关性分析,见图4,可以分析出风速,风向,温度等特征与功率的线性关系,但是风电功率与特征之间还有非线性的关系,MIC方法可以有效地提取其他特征与功率特征的非线性关系[21]。
公式如下:
(16)
(17)
(18)
其中
为需筛选的变量,为变量的方差,
为变量
之间的联合概率,
为网格分布个数
。
Figure 4. Correlation analysis
图4. 相关性分析
利用皮尔逊,MIC方法对特征进行筛选,由图四可以看出10 m,30 m,50 m,涡轮机风扇风速以及50 m,涡轮机风扇风向和功率具有强相关性,为避免特征冗余,风速和风向相关特征选择涡轮机风扇的风速和风向,将风向特征分为正余弦值,并引入CEEMDAN处理的频率特征和历史功率得到7个特征。
3.2.3. 归一化
为消除不同特征之间的量纲差异,提升模型训练时的稳定性,对数据进行Min-Max归一化处理,将数据的数值范围统一到[0, 1]区间,公式如下:
(19)
3.3. 评估标准
为评估模型的预测精度,采用均方误差MSE,平均绝对误差MAE,RMSE,R2评估方法。
公式如下:
(20)
(21)
(22)
(23)
其中,
为真实值,
为预测值,,,
,
为平均值
3.4. 超参数设置
模型具体超参数设置见表1:
Table 1. Model hyperparameter settings
表1. 模型超参数设置
参数名 |
数值 |
参数名 |
数值 |
优化器 |
adam |
学习率 |
0.005 |
损失函数 |
mse |
输入序列长度 |
16 |
Batchsize |
256 |
输出序列长度 |
16 |
Epochs |
70 |
GRU隐藏层大小 |
32 |
EarlyStopping |
5 |
GRU隐藏层数 |
2 |
Dropout |
0.2 |
TCN kerner_size |
3 |
设备 |
Gpu |
TCN channel |
[128, 64, 32] |
3.5. 实验结果分析
分解方法对比:
CEEMDAN分解图见图5:
Figure 5. CEEMDAN exploded view
图5. CEEMDAN分解图
Table 2. Comparison of decomposition methods
表2. 分解方法对比
模型 |
MSE |
Mae |
Rmse |
R2 |
BP |
0.2812 |
0.3687 |
0.5303 |
0.7552 |
EMD-BP |
0.2397 |
0.3311 |
0.4896 |
0.7913 |
续表
EEMD-BP |
0.2264 |
0.3197 |
0.4759 |
0.8029 |
CEEMDAN-BP |
0.2258 |
0.3162 |
0.4752 |
0.8034 |
LSTM |
0.1402 |
0.2375 |
0.3744 |
0.8780 |
EMD-LSTM |
0.0944 |
0.1893 |
0.3072 |
0.9179 |
EEMD-LSTM |
0.0897 |
0.1866 |
0.2996 |
0.9219 |
CEEMDAN-LSTM |
0.0587 |
0.1492 |
0.2422 |
0.9489 |
TCN |
0.1508 |
0.2364 |
0.3883 |
0.8688 |
EMD-TCN |
0.0912 |
0.1890 |
0.3020 |
0.9206 |
EEMD-TCN |
0.0893 |
0.1816 |
0.2989 |
0.9222 |
CEEMDAN-TCN |
0.0683 |
0.1609 |
0.2614 |
0.9405 |
GRU |
0.1455 |
0.2442 |
0.3814 |
0.8734 |
EMD-GRU |
0.0873 |
0.1801 |
0.2954 |
0.9240 |
EEMD-GRU |
0.0712 |
0.1659 |
0.2669 |
0.9380 |
CEEMDAN-GRU |
0.0597 |
0.1490 |
0.2444 |
0.9480 |
由表2可以看出BP模型相较于LSTM,GRU,TCN模型在所有评教指标上精度最低,这是由于BP模型只是单纯的MLP结构,没有专门用于提取时序信息的模块。对于所有模型,加入信号分解特征都比不加入效果好,其中CEEMDAN分解方法效果最好。CEEMDAN-LSTM相较于单一的LSTM,MSE、MAE、RMSE 指标上分别降低了约58.97%、37.97%、35.37%,相比R2增大了8.06%。与EMD-LSTM相比,CEEMDAN-LSTM在MSE、MAE、RMSE 指标上分别降低了约37.99%、21.17%、21.15%,而R2增大了3.38%。与EEMD-LSTM相比,CEEMDAN-LSTM在MSE、MAE、RMSE指标上分别降低了约 34.67%、20.04%、19.16%,R2增大了2.93%。CEEMDAN-LSTM相较CEEMDAN-TCN,CEEMDAN-LSTM在MSE、MAE、RMSE指标上分别降低了约14.14%,7.34%,7.37%,R2高了约0.89%。相较于CEEMDAN-GRU,CEEMDAN-LSTM在MSE、MAE、RMSE指标上分别降低了约1.68%,0.13%,0.9%,R2高了约0.95%。说明了单一模型中LSTM相较于单一的GRU,TCN,可以更有效地提取特征,预测精度更高。
组合模型对比:
Table 3. Comparison of combined models
表3. 组合模型对比
模型 |
MSE |
MAE |
RMSE |
R2 |
CEEMDAN-GRU-AM |
0.0563 |
0.1457 |
0.2373 |
0.9510 |
CEEMDAN-LSTM-AM |
0.0574 |
0.1507 |
0.2397 |
0.9499 |
CEEMDAN-TCN-LSTM |
0.0594 |
0.1486 |
0.2437 |
0.9483 |
CEEMDAN-TCN-GRU |
0.0579 |
0.1457 |
0.2373 |
0.9510 |
CEEMDAN-TCN-LSTM-AM |
0.0558 |
0.1455 |
0.2361 |
0.9514 |
CEEMDAN-TCN-GRU-AM |
0.0546 |
0.1438 |
0.2337 |
0.9524 |
由表3可以看出,组合模型中,可以看出注意力机制可以有效的提高精度,并且TCN-GRU-AM的组合方式比TCN-LSTM-AM的组合方式精度更高。TCN-GRU-AM相较于TCN-GRU在MSE、MAE、RMSE指标上分别降低了约5.73%,1.30%,1.51%,R2高了0.15%。TCN-GRU-AM相较于TCN-LSTM-AM,在MSE、MAE、RMSE指标上分别降低了约4.88%,4.59%,2.51%,R2高了0.26%。风功率预测图像我们随机选取了160个样本,从图6可以看出,本文所提出的模型的预测值相较于其他模型更贴近真实值">。
Figure 6. Wind power prediction curve
图6. 风电功率预测曲线
4. 总结
本文针对风电数据的非平稳性,提出了一种基于CEEMDAN信号分解方法与TCN-GRU-AM模型相结合的超短期风电功率预测方法,并通过与基准模型的对比分析得出以下结论:
1) 信号分解能够显著改善风电数据的非平稳性问题。本文所采用的三种分解方法均优于未分解方法,在预测效果上表现更佳。其中,CEEMDAN分解方法的性能最优,能够更有效地提取风电数据中的关键特征。
2) 在单一模型中,引入时序特征提取模块的深度学习模型(LSTM、GRU和TCN)在超短期风电功率预测中表现优于传统的BP神经网络模型。其中,LSTM因其独特的特征提取机制,获得了最佳的预测效果。
3) 组合模型相比单一模型在预测效果上有明显提升。TCN-GRU-AM组合模型能够更有效地融合时序特征与关键模式信息,其预测性能显著优于单一模型与其他组合模型,为超短期风电功率预测提供了更优解。
NOTES
*通讯作者。