1. 引言
2023年的统计数据显示,中国风力发电累计并网装机容量约为4.4亿千瓦,较上年同期增长20.7% [1]。风电作为一种低碳环保的可再生能源,其发展一直备受关注。由于风能的时空随机性导致风力发电稳定性差、波动明显,大规模风电并网增加了电网维持安全稳定运行的难度[2]。准确的风电功率预测对于降低风电不确定性、保障电网调度和运行的安全稳定具有至关重要的作用。然而,新建风电场因为运行时间较短,初始运行阶段的数据积累不足,难以建立高精度的预测模型,导致其短期功率预测精度无法满足实际调度需求。因此,针对小样本条件下的风电功率预测方法研究,对于提升新建风电场的预测精度、优化电网调度和确保电网可靠运行具有重要意义。
风电功率预测方法可分为物理方法、统计方法和人工智能的方法。物理方法侧重于建立功率输出与风速等气象信息之间的数学模型,通过数值天气预报(Numerical Weather Prediction, NWP)作为物理模型的输入,尽管物理建模方法不依赖于历史数据,但它们缺乏准确性。此外,由于风功率的影响因素众多,物理建模方法在求解高维模型或用简化模型实现高精度方面面临挑战[3]。统计方法主要通过建立风力发电机输出功率与历史数据之间的映射关系构建预测模型。常用的方法包括自回归移动平均(Auto Regressive Moving Average, ARMA) [4]、自回归积分移动平均(Auto Regressive Integrated Moving Average Model, ARIMA) [5]、卡尔曼滤波[6]等。人工智能的方法在处理非线性和非平稳数据时具有良好的预测精度,因此在风电功率预测中得以广泛应用。考虑到卷积神经网络(Convolutional Neural Network, CNN)在提取局部相关特征方面的优势,文献[7]通过使用重新设计的CNN模型,成功预测了短期风电功率,并取得了良好的结果。长短期记忆网络(Long Short-Term Memory, LSTM)作为循环神经网络的变体,独特的门控机制使其在建模时间序列的长期依赖关系方面表现出色,尤其适用于风电功率预测中的时序建模。文献[8]针对海上风电数据的强波动性和随机性,提出了一种基于数据分解重构与贝叶斯优化LSTM的混合预测框架,通过降低输入数据的波动性干扰来提升预测性能。随后,为了实现时间序列信息的双向建模,引入了双向长短期记忆网络(Bi-directional LSTM, Bi-LSTM)和双向门控循环单元(Bi-directional GRU, Bi-GRU),该模型能够同时捕捉时间序列的前向和后向依赖关系,文献[9]使用Bi-GRU来实现风电场的功率预测。该研究引入了主成分分析提取风力机功率的关键特征,并结合广义极值分布和K-means++算法对风力机进行聚类,以更好地捕捉局部条件因素的影响,从而提高预测精度。上述方法在数据完备的风电场表现良好,对于新建风电场,由于缺乏足够的历史监测数据,这些方法的直接应用可能受到限制。
为了解决数据稀缺这一问题,已有研究尝试利用生成对抗网络(Generative Adversarial Network, GAN)等生成技术来生成数据。文献[10]提出了一种基于二级进化生成对抗网络的数据生成模型,旨在通过学习真实数据的边际分布生成高质量数据,以增强训练数据集,从而解决小样本条件下的风电功率预测问题。然而,生成数据的质量高度依赖于生成模型与判别模型之间的博弈,其可信度直接影响预测结果的准确性。
迁移学习可以利用源域中丰富的训练数据,将学习到的知识迁移到与之具有相似统计特性的目标域,以解决数据稀缺的问题。文献[11]通过对源风机模型的迁移应用,降低了目标风机对本地历史数据的依赖程度;文献[12]采用联邦学习在不损害数据隐私的情况下实现源域风机的知识共享并利用迁移学习传递共享知识以更新预先训练的全局模型,个性化拟合目标风机;文献[13]采用“预训练–微调”策略,利用正常天气下的充足样本对预测模型预训练,再针对极端天气下有限样本数据进行微调,大幅度提升极端天气下的风电功率预测精度。在上述文献中,预训练–微调的方法用于实现迁移学习过程,该方法在深度神经网络中能有效缩短模型训练周期。但是当目标域风电数据样本量有限且源域与目标域数据分布存在差异时,经过微调得到的模型难以获得理想的泛化效果。
针对以上问题,本文提出了基于特征迁移学习和数据分解重构的风电功率超短期预测方法。该方法利用变分模态分解(Variational Mode Decomposition, VMD)和样本熵(Sample Entropy, SE)对历史风电功率数据进行分解重构,并结合风速、风向气象数据构建输入特征;建立双向长短期记忆–卷积神经网络迁移学习模型,结合最大平均差异(Maximum Mean Discrepancy, MMD)和相关对齐(Correlation Alignment, CORAL)作为新的分布差异度量,最小化源域与目标域之间的特征分布差异;引入对抗训练思想,促使特征提取器生成域不变的特征,实现跨域知识迁移,提升小样本条件下风电场功率预测的准确性。通过与传统深度学习预测方法进行比较,验证了本文方法的有效性。
2. 问题描述
具有丰富历史数据的风电场可被视为源域
,表示为
。其中
是源域的特征空间,包括风速、风向序列以及经过分解重构后的历史风电功率子序列等特征,这些特征构成了多维特征空间,反映了风电场的运行状态和环境条件。
表示源域中特征向量的边缘概率分布。源域的任务
是通过学习特征
与标签
(即待预测的风电功率)之间的映射关系
,构建一个能够准确预测风电功率的模型。
目标域
是新建风电场,表示为
。其特征空间
包含与源域相似的特征,由于地理位置、设备型号等差异,目标域特征向量的分布
与源域存在较大的不同。目标域的任务与源域的任务一致,但由于数据量有限,直接训练模型的效果可能不理想。因此采用迁移学习的方法,通过特征迁移学习对齐源域和目标域的特征分布,实现知识迁移,以提升目标域预测模型的性能。
3. 原始数据的分解与重构
3.1. 基于VMD的数据分解
变分模态分解作为一种自适应非平稳信号处理方法,能够有效克服经验模态分解中的端点效应与模态混叠问题。该方法通过预设本征模态函数数量及其中心频率约束,可将源域与目标域的风电功率数据一致性地分解为具有明确物理意义的模态分量。VMD的分解过程可通过求解如式(1)所示的约束变分问题实现。
(1)
式中:
是狄拉克函数;
表示偏导数算子。通过引入拉格朗日乘子
,方程(1)转化为无约束变分问题,可表示为方程(2):
(2)
式中:
表示拉格朗日乘子;
为二次惩罚因子。通过ADMM交替更新
,
和
,如式(3)~(5)所示:
(3)
(4)
(5)
式中:
,
,
,和
分别是
,
,
和
的傅里叶变换。
3.2. 基于SE的子序列重构
样本熵是一种基于近似熵的时间序列复杂度量化方法。样本熵的大小代表了时间序列的复杂性,样本熵值越高,表示时间序列的复杂性越大,反之亦然,样本熵值越低,表示时间序列的规律性越强。对于时间序列
,其样本熵的计算方式如下:
(6)
式中:
表示数据长度,
表示阈值大小,
为嵌入维度,
和
分别表示在嵌入维度
和
下满足匹配条件的向量对数量,其表达式为:
(7)
(8)
样本熵值与
和
的值有关,在实际应用中,
通常设置为2或3,且
,
为非线性数据序列的标准差。本文中取
,
。这种特定设置在应对非线性时间序列数据的复杂性方面已被证明非常有效[14]。
4. 基于迁移学习的风电功率预测模型构建
本文提出了一种基于VMD-SE-BiLSTM-CNN-TL模型的风电场功率预测方法,通过利用数据丰富的源域风电场学习特征,将知识有效迁移至目标域小样本风电场,增强目标域风电场预测模型的性能。预测模型的整体框架如图1所示。
Figure 1. BiLSTM-CNN-TL prediction model architecture
图1. BiLSTM-CNN-TL预测模型结构
BiLSTM-CNN-TL模型由两部分组成:一是BiLSTM-CNN基础模型,用于完成风电功率预测的基础任务,包括特征提取和功率预测;二是域分类器,作为对抗组件用于区分数据样本的域来源。在训练过程中,采用领域自适应方法,通过分布差异度量(Distribution Discrepancy Metric, DDM)最小化源域和目标域之间的特征分布差异,同时引入对抗训练思想,利用域分类器区分源域和目标域特征,促使特征提取器生成域不变的特征,在特征空间中实现源域和目标域的分布对齐,完成跨域知识迁移。
4.1. BiLSTM-CNN基础模型
在采用VMD-SE方法分解重构得到风电功率的高频、低频和趋势三个分量后,将其与风速、风向序列共同组合,构建输入特征X。该特征构建方式通过将功率序列中不同时间尺度的波动特性,与风速、风向等直接影响风电出力的外部环境变量相结合,共同构成了一个融合内部波动规律与外部驱动因素的多维特征空间,使预测模型能够更有效地挖掘风电功率与风速、风向之间的深层隐含关系,进一步增强对未来功率变化的捕捉能力与预测准确性。基础模型旨在从输入X中提取特征,并将其映射到风电功率预测值y中。该模型采用了混合架构,结合了CNN和BiLSTM的优势。
LSTM是一种具有门控机制的特殊循环神经网络,三个门控单元用于控制信息的输入、输出和遗忘。基本结构如图2所示。
Figure 2. LSTM network architecture diagram
图2. BiLSTM-CNN-TL预测模型结构
相较于传统RNN,LSTM的多门控与细胞状态协同运作,有效克服了梯度消失和爆炸问题。各“门”单元的计算如式(9)~式(14)所示。
(9)
(10)
(11)
(12)
(13)
(14)
式中:
、
和
表示遗忘门、输入门和输出门的输出;
表示权重;
表示偏置;
表示Sigmoid激活函数;tanh是激活函数。
在单向神经网络结构中,信息始终沿从前向后的方向传递。然而,由于时间因素对预测效果具有重要影响,本文采用BiLSTM模型捕捉正向与反向时间依赖关系,以实现更深层次的特征提取。
CNN具有很强的非线性特征提取能力,可以有效提取时序数据的局部特征。其核心结构包括卷积层和池化层,通过多层交替堆叠实现对原始序列数据的深度特征提取。为进一步优化网络性能,模型中引入了批量归一化(Batch Normalization, BN)层和全局平均池化(Global Average Pooling, GAP)层,用于加速网络收敛并缓解过拟合问题,这种多层次、多模块的设计使得CNN在时序数据处理中能够高效提取局部特征并保持较低的算法复杂度。
BiLSTM-CNN基础模型的特征提取器包含一个BiLSTM模块、三个“Conv1D”模块、一个GAP层和一个全连接(Fully Connected, FC)层。每个“Cov1D”模块由卷积层、BN层和最大池化层组成。功率预测器是一个FC层,将特征提取器的输出映射到预测的风电功率。
在模型训练过程中,采用均方误差(Mean Squared Error, MSE)作为损失函数来满足预测任务,其表达式为:
(15)
式中:
表示源域样本的数量;
表示源域第i个样本的预测值;
表示对应的真实值。通过最小化源域预测损失,模型能够学习到源域数据中的有效模式,从而为迁移学习提供基础。
4.2. 域分类器
为了促使特征提取器生成域不变的特征并增强模型在跨域任务中的泛化能力,设计一个域分类器来区分输入特征的来源域,即是来自源域还是目标域。通过对抗训练的方式,模型能够学习到更具域不变性的特征表示。域分类器的结构包括一个BN层、一个Dropout层和一个FC层。域分类器的损失函数为二分类交叉熵损失函数,其表达式为:
(16)
式中:
表示目标域样本的数量;
表示第i个样本的真实标签;
表示第i个样本的预测值。
4.3. 领域自适应
在风电功率预测任务中,源域和目标域的数据分布差异往往会导致模型在目标域上的泛化性能下降。针对这一问题,本文采用域自适应(Domain Adaptation, DA)方法,通过特征对齐和对抗训练两种机制,最小化域间的特征分布差异,提高模型的跨域预测能力。
将源域与目标域的特征矩阵
和
分别输入到BiLSTM-CNN-TL模型的特征提取器
中,提取到的特征分别为源域特征
和目标域特征
。
(17)
(18)
在风电功率预测任务中,源域和目标域的数据分布差异往往会导致模型在目标域上的泛化性能下降。针对这一问题,本文采用域自适应(Domain Adaptation, DA)方法,通过特征对齐和对抗训练两种机制,最小化域间的特征分布差异,提高模型的跨域预测能力。
特征提取器的作用是将输入数据映射为能够有效支持功率预测的特征表示,这些特征表示不仅需要捕捉输入数据与功率输出之间的内在关系,更重要的是在源域和目标域之间实现特征分布的一致性。为了实现这一目标,特征提取器通过学习一个域不变的特征空间,使得在该空间中源域和目标域的特征分布差异最小。采用DDM对特征空间
中源域和目标域特征分布相似性进行量化,并将其作为衡量所提取特征的分布距离的损失函数:
(19)
(20)
DDM由两部分组成:MMD和CORAL。MMD是最常用的分布距离度量,计算特征在再生核希尔伯特空间(Reproducing Kernel Hilbert Space, RKHS)中的均值差异,其数学表达式为:
(21)
式中:
表示再生核希尔伯特空间;
表示RKHS中的映射函数;i表示源域特征索引编号;j表示目标域特征的索引编号。
CORAL通过匹配源域和目标域的二阶协方差统计量来减少两个域之间的分布差异,使模型能够学习到在两个域中都有相似统计特性的特征表示:
(22)
(23)
式中:
、
表示源域、目标域的协方差矩阵;
表示所有元素都为1的行向量。
DDM通过结合MMD和CORAL两种度量方法,能够从均值和协方差两个方面综合评估源域和目标域之间的分布差异,为后续的特征对齐和模型训练提供可靠的量化依据。这种综合性的度量方法不仅能够准确反映域间分布差异,还能指导模型学习到更具泛化能力的特征表示。
为了进一步增强模型的域自适应能力,本文引入了对抗训练机制,并通过梯度反转层(Gradient Reversal Layer, GRL)实现。在训练阶段,GRL连接了特征提取器和域分类器,在正向传播时对特征不做任何改变,但是在反向传播时会将梯度的方向反转,并乘以一个缩放因子。这种机制使得特征提取器收到的梯度信号与域分类器的目标相反,特征提取器致力于生成域不变特征以混淆域分类器,而域分类器则尽可能准确地区分输入特征的来源,以实现对抗训练的效果。通过GRL的引入,特征提取器能够学习生成更鲁棒的特征表示,提升模型的跨域泛化能力。
在BiLSTM-CNN-TL预测模型的训练过程中,为了同时优化特征提取器和功率预测器的性能,模型的总损失函数可以表示为:
(24)
4.4. 模型评估指标
本文采用了平均绝对误差(MAE)、均方根误差(RMSE)和决定系数(R2)作为指标,来对所提出的方法进行评价。
(25)
(26)
(27)
式中:
表示i时刻实际风电功率值;
表示i时刻预测的风电功率值。其中MAE、RMSE越小,说明预测精度越高;R2越接近1,模型拟合效果越好。
5. 算例分析
本文采用两个风电场WF1和WF2的实际运行数据对模型进行验证,数据采集分辨率为15分钟。WF1的数据涵盖了2021年3月至6月,WF2的数据涵盖了2021年6月,在本研究中,成熟风电场WF1作为源域,WF2则被设定为目标域。数据集划分方面,训练集包含全部源域数据及目标域数据的前90%。目标域剩余10%数据构成测试集。模型训练与预测均采用长度为7的输入序列。
5.1. 数据分解与重构结果
为提升数据质量,首先对源域历史风电功率序列进行分解,采用沙猫群优化算法(SCSO)对VMD的参数进行优化。算法参数设置如下:沙猫种群数量为10,最大迭代次数为30,变量数为2,惩罚因子
区间设为[100, 2000],模态分量数K的取值范围为[3, 10]内的整数。从图3(a)可以看出,SCSO在进化四代后逐渐趋于收敛。图3(b)所示的惩罚因子优化曲线表明,在进化至第四代时获得最优惩罚参数为100。同时,图3(c)显示IMF的最优个数为4。对目标域训练集数据采用相同的K和
进行分解。源域的IMF分量如图4所示。
(a) (b)
(c)
Figure 3. Schematic diagram of the VMD optimization process based on SCSO
图3. 基于SCSO的VMD优化过程图
Figure 4. Decomposition results of historical wind power VMD (source domain)
图4. 历史风电功率VMD分解结果(源域)
通过计算所有IMF的SE对历史功率子序列进行重构,以便更好地量化时间序列的复杂度。表1列出了各IMF的样本熵。
Table 1. Entropy of subsequence samples
表1. 各子序列样本熵
源域 |
IMF |
IMF1 |
IMF2 |
IMF3 |
IMF4 |
SE |
0.0386 |
0.2084 |
0.3532 |
0.0679 |
目标域 |
IMF |
IMF1 |
IMF2 |
IMF3 |
IMF4 |
SE |
0.0424 |
0.2541 |
0.4645 |
0.5077 |
根据表1所示,对于源域数据,IMF1和IMF4的样本熵值显著低于其他IMF分量,说明其复杂性和波动性较小,表现出明显的趋势特征,将其重构为趋势序列;IMF2为低频序列,IMF3为高频序列。对于目标域数据,IMF1样本熵值较低,可视为趋势序列,IMF2为低频序列,IMF3和IMF4的样本熵值远高于其它IMF分量,这表明其具有较高的复杂性和波动性,但未呈现出明显的规律性模式,因此将其重构为高频序列。
5.2. 分解有效性验证
为验证分解的有效性,本研究对三种预测模型分别应用了VMD-SE算法进行数据预处理。表2展示了各模型在数据分解重构前后的单步预测结果。
Table 2. Comparison of decomposed and undecomposed prediction performance across models
表2. 各模型分解与未分解预测性能的比较
预测模型 |
MAE/KW |
RMSE/KW |
R2 |
CNN-TL |
4499.49 |
5536.94 |
0.9178 |
VMD-SE-CNN-TL |
3681.38 |
4766.41 |
0.9395 |
BiLSTM-TL |
4590.43 |
5330.34 |
0.9244 |
VMD-SE-BiLSTM-TL |
3337.94 |
4318.38 |
0.9489 |
BiLSTM-CNN-TL |
3264.54 |
4184.39 |
0.9534 |
VMD-SE-BiLSTM-CNN-TL |
2148.02 |
2793.13 |
0.9792 |
为验证分解的有效性,本研究对三种预测模型分别应用了VMD-SE算法进行数据预处理。表2展示了各模型在数据分解重构前后的单步预测结果。结果表明,CNN-TL模型的MAE和RMSE分别降低了818.11 KW和770.53 KW;BiLSTM-TL模型分别降低了1252.49 KW和1011.96 KW;BiLSTM-CNN-TL模型分别降低了1116.52 KW和1391.26 KW。上述结果表明,VMD分解算法能够有效降低原始风电功率序列的非平稳性和复杂性,提高各模型的预测精度。
5.3. 不同预测模型性能对比
为进一步验证所提出方法的有效性,将其与四种主流深度学习预测模型和基于模型的迁移学习方法(源域预训练 + 目标域微调)进行对比分析。其中,基于模型的迁移学习方法采用与本文方法相同的模型结构,将其命名为VMD-SE-BiLSTM-CNN-Model-based TL。同时还建立了VMD-SE-CNN-TL、VMD-SE-LSTM-TL、VMD-SE-BiLSTM-TL、VMD-SE-LSTM-CNN-TL等一系列对比模型,以全面评估所提方法在风电功率预测任务中的优越性。
由表3可知:在与四种主流深度学习预测模型的对比中,VMD-SE-BiLSTM-CNN-TL在MAE、RMSE和R2三项指标上均表现最佳,其预测误差最小、稳定性最强、拟合度最高。与表现次优的VMD-SE-LSTM-CNN-TL模型相比,该模型在单步、两步及三步预测中,MAE分别降低了464.96 KW、345.62 KW和1264.86 KW;RMSE分别降低了1031.26 KW、570.43 KW和1257.03 KW;R2则分别提升了0.0181、0.139和0.0383。上述结果说明,双向结构相较于单向结构能够更充分地提取序列中的深层信息。相较于基于模型的迁移学习方法,本文提出的基于特征的迁移学习方法在单步、两步及三步预测中,MAE分别降低了250.57 KW、232.73 KW和801.48 KW;RMSE分别降低了301.17 KW、689.11 KW和689.11 KW;R2则分别提升了0.0047、0.0089和0.0195。原因可能在于源域与目标域之间存在显著的分布差异,基于模型的方法因其浅层网络参数被固化,限制了模型对目标域特有模式的适应能力;而基于特征的方法,通过显式的特征空间对齐,有效缩小了域间分布差异,使模型能够学习到更具泛化性的特征表示,从而在目标域上表现出更优越的预测性能。
Table 3. Comparison of evaluation metrics across different models
表3. 不同模型评价指标对比
模型 |
MAE |
RMSE |
R2 |
1步 |
2步 |
3步 |
1步 |
2步 |
3步 |
1步 |
2步 |
3步 |
VMD-SE-CNN-TL |
3681.38 |
4922.17 |
5276.06 |
4766.41 |
6238.00 |
6417.24 |
0.9395 |
0.8945 |
0.8893 |
VMD-SE- LSTM-TL |
3396.75 |
4610.38 |
5374.63 |
4630.35 |
5602.55 |
6567.12 |
0.9429 |
0.9140 |
0.8840 |
VMD-SE-BiLSTM-TL |
3337.94 |
4034.14 |
4840.56 |
4318.38 |
5024.54 |
5840.28 |
0.9489 |
0.9320 |
0.9078 |
VMD-SE-LSTM-CNN-TL |
2612.98 |
3658.63 |
5072.53 |
3824.39 |
4789.03 |
6273.84 |
0.9611 |
0.9377 |
0.8938 |
VMD-SE-BiLSTM-CNN-Model-based TL |
2398.59 |
3545.74 |
4609.15 |
3094.30 |
4592.34 |
5705.92 |
0.9745 |
0.9427 |
0.9126 |
VMD-SE-BiLSTM-CNN-TL |
2148.02 |
3313.01 |
3807.67 |
2793.13 |
4218.60 |
5016.81 |
0.9792 |
0.9516 |
0.9321 |
Figure 5. Prediction results of different models
图5. 不同模型的预测结果
为更直观地展示各模型的性能差异,图5绘制了各模型的预测曲线。综合分析表明,该模型不仅作为预测模型发挥作用,更承担了关键的特征提取任务:BiLSTM模块能够有效捕捉时间序列中的长期依赖关系,而CNN模块则增强了对局部特征与高维模式的识别能力。两者的结合充分发挥了混合模型在多层次特征学习方面的优势,为整体预测性能的提升奠定了坚实基础。预测误差结果表明,混合神经网络模型在预测精度方面均优于单一神经网络模型。
6. 结论
针对新建风电场小样本条件下功率预测精度不足的问题,本文基于迁移学习和原始数据的分解重构提出一种风电功率超短期预测方法,根据仿真实验结果,验证了模型的有效性并得到以下结论:
1) 通过对历史风电数据进行分解与重建,可降低原始数据固有的波动性和随机性,为风电预测模型提供更平滑、更规律的输入,从而提升预测模型的准确性和稳定性。
2) 相比较于单一的预测模型,合理组合不同的模型可以实现优势互补,提高模型的鲁棒性与可解释性,减小预测误差,提高整体预测性能。
基金项目
国家自然科学基金(62473151)、中央高校基本科研业务费专项资金(2025JC003)资助项目。