1. 引言
全球的气候变化和环境污染问题正日益加剧,世界各国和地区纷纷着手大力推动清洁能源的发展。海上风电作为一种可再生、无污染的能源,成为了能源转型的重要方向之一[1]。海上风能资源丰富,风电场开发规模通常比陆上更大,这有利于提高清洁能源的自给率[2]。我国海上风电靠近东部负荷中心,能够减轻西电东送通道建设压力,输电距离小,输电成本低,就地消纳方便。然而由于风能具有波动性,风电场并网功率的波动会对电网带来不利影响,如威胁电网的功率平衡和运行安全[3]。因此,为了保证电网的稳定、经济、可靠运行,针对风电机组有功功率开展超短期预测与分析,准确描述调度周期内机组出力情况显得尤为重要。
为了应对上述问题,众多学者在风电功率预测方面开展了大量研究工作。根据研究所用数据的来源,大致可分为基于风电场区域数值气象预报的预测和基于风电机组海量历史运行数据的预测。功率预测方法主要有物理模型方法、统计学方法、机器学习方法以及组合预测方法[4]。物理模型方法通过机理方程对风电场区域地理信息和机组信息进行建模,结合数值天气预报系统的气象数据,综合得到轮毂高度的风速和风向,代入功率曲线插值得到预测功率。该方法无需大量的历史观测数据,更适用于中长期和短期功率预测[5]。常见统计学方法主要有时间序列法、回归分析法和卡尔曼滤波法等,其通过建立机组历史运行记录数据和风电功率之间的映射关系,捕捉数据间的时空信息,构建预测方法的函数形式。机器学习方法则通过对海量历史运行数据的学习获得数据之间的非线性模型,进而根据实时数据预测功率。近年来,随着大数据和机器学习技术的飞速进步,以机器学习为基础的风电功率预测研究已经成为备受关注的热门领域[6]。师洪涛等[7]利用数值天气预报数据,构建了反向传播神经网络模型用于风电功率预测,并在某个特定风电场的数据上分析了影响预测准确度的因素。叶林等[8]针对风速序列的非平稳性特征,提出了一种基于经验模态分解和支持向量机的短期风电功率组合预测方法。周松林等[9]则提出了主成分分析与前馈神经网络相结合的风电功率预测模型,通过预处理实现原始多维输入变量降维,简化了网络结构,提高了模型的收敛性和稳定性。杨锡运等[10]针对短期风电功率概率区间预测的问题,利用粒子群算法对核极限学习机模型进行了优化。朱抗等[11]基于极限学习机(extreme learning machine, ELM)实现了短期风速的预测。朱乔木等[12]提出一种基于长短期记忆(long short-term memory, LSTM)网络的多变量风电场超短期发电功率预测方法,利用多数据源中的有效信息,在时间序列预测方面表现出良好的性能。然而上述研究在建立功率预测模型时,未充分考虑风电机组运行状态参数和风速的综合影响。
针对上述情况,本文提出一种基于LSTM-ELM的风电机组超短期功率预测模型。首先利用风电机组数据采集与监视控制系统(supervisory control and data acquisition, SCADA)的历史风速序列数据构建风速预测LSTM模型,然后利用叶轮、主轴、齿轮箱、发电机等设备测点历史数据和预测风速构建基于ELM的超短期功率预测模型。通过国内某风电场的实测数据进一步分析,多指标验证所提方法。
2. 风电机组超短期功率预测模型
2.1. 长短期记忆网络
LSTM作为一种适用于序列数据预测的深度学习模型,可以有效地捕捉序列数据中的长期依赖关系。对于风速数据这种具有时序性的数据,LSTM模型能够高效地学习其特征和变化规律,同时避免传统循环神经网络所存在的梯度消失和梯度爆炸问题,从而实现对未来风速的预测。LSTM网络单个神经元结构如图1所示,通过遗忘门ft、输入门it、记忆单元Ct和输出门ot增强神经网络的预测能力。ht−1、ht分别为t − 1时刻和t时刻隐藏层向量,Ct−1、Ct分别为t − 1时刻和t时刻的元胞状态,xt为t时刻的输入,x为值域为[0,1]的Sigmoid激活函数,tanh为值域为[−1,1]的双曲正切激活函数。
Figure 1. LSTM neural network
图1. LSTM神经网络
2.2. 极限学习机
ELM是一种单隐层前馈神经网络,具有快速训练和良好泛化能力的特点,适合于处理较大规模的SCADA数据集和实时性要求较高的任务。其主要思想是将神经网络的训练过程简化为一个单次的随机初始化权重和偏置的问题,而不需要迭代优化。这些权重和偏置是从一个随机分布中抽取的,如均匀分布或高斯分布。在随机初始化隐藏层后,ELM将数据输入隐藏层,然后通过一个线性输出层来计算输出。这一步骤涉及到将输入数据与随机初始化的隐藏层权重相乘,然后通过一个激活函数来得到隐藏层的激活值。最后,通过线性组合这些隐藏层的激活值,得到输出。ELM通过解线性方程组来输出权重,不需要迭代优化算法,从而实现了高效的训练。ELM在初始化阶段随机选择输入层权重和隐藏层偏置后,根据穆尔-彭罗斯广义逆矩阵,通过最小化均方误差(MSE)损失函数来优化模型参数,对输出层权重进行解析计算。通过将新的输入数据输入到已经训练好的模型中,可以进行目标参数的预测计算。ELM网络结构如图2所示,给定N个任意不同的训练样本
,其中
、
分别为输入向量和输出向量。标准ELM包含n个输入神经元、L个隐藏神经元和m个输出神经元,激活函数表示为g (x)。
Figure 2. ELM neural network
图2. ELM神经网络
2.3. 风电机组超短期功率预测模型
基于LSTM-ELM的风电机组超短期功率预测模型流程如图3所示。首先对SCADA系统中历史风速序列数据进行异常值清洗和缺失值处理,进而利用LSTM神经网络建立风速预测模型。然后从SCADA中筛选出环境温度、叶轮转速、齿轮箱油温等作为表征风电机组运行状态的参数变量,结合参数历史数据和预测风速建立超短期功率预测ELM模型。ELM作为单隐藏层的前馈神经网络,目的是解决反向传播算法学习效率低、参数设定繁琐等问题。在实时预测时,则以当前时刻的运行状态参数和预测风速作为输入变量,输出下一时间点的功率预测值。
Figure 3. Predictive modeling overall process
图3. 预测模型整体流程
考虑到风电机组的额定功率,使用归一化均方根误差(normalized root mean squared error, NRMSE)和归一化平均绝对误差(normalized mean absolute error, NMAE)指标来衡量预测效果,表达式如下所示,其中
为实际功率,
为预测功率,Y为风电机组额定功率,n为预测样本个数。
(1)
(2)
3. 算例分析
3.1. 数据来源
为验证所提模型的预测效果,选用中国广东省某风电场的SCADA历史数据进行算例分析。该风电场选用机组的额定功率为6450 kW,其切入风速为3 m/s,切出风速为25 m/s,额定风速为10.5 m/s。该风电机组SCADA数据记录于2023年3月17日至5月31日,采样间隔为15 min,记录数据为采样间隔内的平均值。算例分析目标为实现机组超前一个电网调度周期(15 min)的超短期功率预测。
3.2. 风速预测模型
从SCADA数据中提取出风速历史信息,并对其进行缺失值填充、异常值处理等数据预处理。设定当前风速为目标值,以前m个风速为特征值,构建一个风速预测数据集。以60%、20%和20%的比例划分训练集、验证集和测试集。采用均方根误差(root mean squared error, RMSE)和平均绝对误差(mean absolute error, MAE)来评价风速预测模型的性能。当设置特征输入序列长度m为8时,预测效果如图4所示,RMSE和MAE分别为0.6067 m/s和0.4683 m/s。尽管风速是影响风电机组功率输出的重要因素之一,但功率输出还受到多种其他因素的影响,如机组状态参数。因此下一步将风速预测结果作为功率预测模型的特征值之一,结合其它相关测点数据建模实现功率预测。
Figure 4. Wind speed prediction results
图4. 风速预测结果
3.3. 功率预测模型与预测结果
在完成LSTM风速预测模型之后,开展ELM模型训练。以SCADA历史数据中t时刻的环境温度、叶轮转速、齿轮箱油温等状态参数和t + 1时刻(时间间隔为15 min)的预测风速共同组成特征值,以t + 1时刻的有功功率为目标值,建立超短期功率预测ELM模型,实现对下一调度周期的功率预测。LSTM-ELM模型在测试集上的功率预测结果如图5所示,预测功率与真实值之间存在良好拟合,且二者呈现一致趋势。
Figure 5. Power prediction results
图5. 功率预测结果
同时与仅使用功率数据建立的LSTM预测模型和预测风速–功率曲线插值方法比较,其中功率曲线取机组出厂参数。不同模型预测效果如表1所示,LSTM-ELM在两个指标上均更优。LSTM功率预测模型表现较差的原因主要是没有考虑风速信息和机组运行状态参数。出厂功率曲线根据机组设计特性和额定工况制定,插值预测效果差的原因是其并没有考虑到实际运行中机组的动态响应和特性。
Table 1. Predictive effectiveness of different models
表1. 不同模型的预测效果
模型 |
NRMSE/% |
NMAE/% |
LSTM-ELM |
4.95 |
3.65 |
LSTM |
6.52 |
4.65 |
风速–功率插值 |
8.50 |
5.96 |
4. 结论
本文针对风电机组的超短期功率预测问题展开研究,提出了一种LSTM-ELM预测模型。该模型首先利用LSTM对风速历史序列数据进行学习,预测下一个调度周期的风速。随后,结合风电机组的运行状态参数,通过ELM模型开展超短期功率预测。通过对实测SCADA数据的分析,验证了所提模型的有效性和优越性。对比分析结果显示,LSTM-ELM模型在NRMSE和NMAE两个指标上均优于仅使用功率数据的LSTM模型和基于出厂功率曲线的插值方法。这表明,考虑风速信息和机组运行状态参数对于提高超短期功率预测的精度至关重要。其中LSTM能够有效捕捉风速序列的时序特性,而ELM则能够快速准确地学习并预测风电机组的功率输出,两者的结合为风电功率预测提供了一种新思路。该模型有助于优化电力调度和规划,缓解风电并网过程中产生的波动性问题,进而提高电网的稳定性和可靠性。同时,对风电场的智能化管理和优化运行也有着积极的推动作用。未来的研究可探索更多的影响因素,如天气条件、机组维护状态等,以进一步提升预测模型性能。
基金项目
2022年广东能源集团科技创新“揭榜挂帅”项目“海上风电运维关键技术研究与应用(机组可靠性研究)”。
NOTES
*通讯作者。