1. 引言
随着全球能源需求的不断增长和环境污染问题的日益突出,清洁能源已成为全球各国发展的热门领域。太阳能光伏发电作为清洁、可再生的能源之一,因其储量大、分布广、获取方式简单等特点,在各国日益普及。随着全球光伏装机容量的逐渐增加和光伏产业规模的不断扩大,光伏发电形式逐渐从早期的分布式离网向集中式并网模式演变。光伏发电已成为现代电力行业减少碳排放的主要组成部分。然而,由于光伏发电的输出功率受到天气、环境、地形等多种因素的影响,会导致输出电压和功率不稳定,加大了电网调度的难度,限制了光伏技术的大规模应用。因此,对光伏功率进行精确预测对于光伏发电的运行、调度、管理等方面具有重要意义 [1] 。
光伏发电量预测的模型方法包括物理模型、统计模型和机器学习模型等多种方法。这些方法通过数学模型和数据分析,预测光伏电站的输出功率,并提高预测的准确性和可靠性,以支持光伏发电系统的运行管理和市场化应用。其中,人工神经网络和深度学习模型因其较强的非线性建模能力和泛化能力,在光伏发电量预测中得到了广泛应用。Li等 [2] 分别利用反向传播(Back Propagation, BP)神经网络、遗传算法(Genetic Algorithm, GA)优化的BP神经网络和粒子群算法(Particle Swarm Optimization, PSO)优化的BP神经网络构建了三种短期光伏发电功率输出预测模型。Zhang等 [3] 通过分析影响光伏电站输出功率的因素,建立了基于相似日和LM-BP神经网络的短期光伏功率模型,并以嘉兴光伏电站为例进行了仿真验证,结果表明该方法在突发天气条件下能够实现高精度的光伏功率预测。Wang等 [4] 提出了一种不依赖数值天气预报的光伏发电系统输出功率预测的新方法,该方法基于优化的混沌相空间重构,结合遗传算法–反向传播(GA-BP)神经网络,具有较好的预测精度。Zhang等 [5] 通过基于神经网络算法的光伏功率预测研究,建立了BP神经网络预测模型和小波神经网络预测模型,研究了影响光伏功率预测精度的多种因素,并进行了模型性能比较和统计分析,有效地实现光伏功率的准确预测。邓斌等 [6] 构建了一种基于液体时间常数的递归神经网络(Recurrent Neural Network, RNN),用于中长期电力负荷的预测。Eseye等 [7] 针对实际微电网光伏系统的短期发电功率预测,提出了一种混合预测模型,该模型将小波变换、PSO和支持向量机(Support Vector Machine, SVM)技术相结合,提高了预测精度。需要注意的是,GA和PSO等优化算法容易陷入局部最优问题,BP、SVM和RNN神经网络模型在预测时容易陷入局部最优解,预测精度不高,同时需要耗费大量的训练时间和计算资源,当输入数据维度过高时,模型训练时间和计算资源的消耗较大,对数据分布的假设较强,对于非线性可分的数据,模型的预测效果会受到一定影响。
综上,为进一步提高光伏功率预测模型的易陷入局部最优解和非线性适用性较差的问题,本文提出一种基于北方苍鹰算法(Northern Goshawk Optimization, NGO)优化长短期记忆神经网络(Long Short-Term Memory, LSTM)的短期光伏功率预测模型NGO-LSTM模型。此预测模型针对LSTM网络的超参数难以确定的问题,采用NGO对LSTM网络的超参数自动寻优,并将优化后的LSTM模型用于光伏功率点预测,最后通过算例对比分析,验证所提出模型的有效性。
2. NGO-LSTM预测模型
2.1. 北方苍鹰优化算法(NGO)
Dehghani等 [8] 在2021年提出的NGO模拟了北方苍鹰在猎物狩猎过程中的行为。NGO具有收敛速度快、稳定性高等优点,与GA、PSO等算法相比,NGO具有一定的优势。如今,NGO已被应用于多种领域,并在解决光伏模型参数辨识、神经网络优化、车辆调度等问题上具有良好的性能。北方苍鹰有两个主要行为,一是猎物识别与攻击,二是追逐与逃跑。行为示意图如图1所示。
(a) 识别与攻击
(b) 追逐与逃跑
Figure 1. The main behavior of northern goshawk
图1. 北方苍鹰的主要行为
2.1.1. 算法初始化
北方苍鹰算法是一种基于种群的算法,其中使用北方苍鹰作为搜索成员。在算法开始时,种群成员会在搜索空间中随机初始化。算法中的种群矩阵方程为 [8] [9] :
(1)
式中,
为北方苍鹰的数量,
为第i只苍鹰的初始解;
为第i只苍鹰在第j维度的值;N为种群数量,m为问题空间的维度。
2.1.2. 阶段一:猎物识别(勘探阶段)
北方苍鹰在狩猎的第一阶段,随机选择一个猎物,然后迅速攻击它。该阶段由于猎物在搜索空间是随机选择的,增加了NGO的探索动力,并对搜索空间进行全局搜索,以确定最优区域。第一阶段表达的数学建模如下:
(2)
(3)
(4)
式中,
为第i只北方苍鹰的猎物位置,
为其目标函数值;k为区间[1, N]中的随机自然数,
为第i只苍鹰的新解在第j维度的值,
为新解对应的目标函数值;随机参数q和E用于生成随机的NGO行为,设定
,E = 1或2。
2.1.3. 阶段二:追逐和逃跑(开发阶段)
在北方苍鹰攻击猎物后,猎物试图逃脱。模拟这种行为可以增加算法对搜索空间局部搜索的开发能力。在北方苍鹰算法中,假设这种猎捕行为可以在攻击半径R内完成。第二阶段表达的数学建模如下:
(5)
(6)
(7)
式中,t为迭代计数器,T为最大迭代次数;R为攻击半径,随迭代次数增加而缩小;
为第i只苍鹰在新位置的解在第j维度的值;
为其基于NGO第二阶段的目标函数值。
2.2. 长短期记忆网络(LSTM)
LSTM是一种常用的循环神经网络模型,它可以解决传统RNN面临的“梯度消失”和“梯度爆炸”问题,从而可以有效地处理长序列数据 [10] 。LSTM模型最重要的特点是引入了三个门:遗忘门、输入门和输出门,用于控制信息的遗忘、输入和输出。LSTM的构造如图2所示 [11] 。
在LSTM结构中,遗忘门通过将当前输入
和过去的隐藏层值
乘以每个权重
和
后并应用sigmoid函数来决定遗忘或记住多少先前信息。Ft则可用下列方程描述:
(8)
式中,
为遗忘门,
和
为权重矩阵,
为b − 1时刻的状态,
为神经元的偏置量,
为激活函数。
输入门是第二个组件,其过程可用下面的方程来描述:
(9)
式中,
、
、
和
未权重矩阵,
和
为神经元的偏置量,
为储存单元,
为输入门,
为激活函数。
单元状态是记忆单元存储过程中使用遗忘门输出值和输入门输出值的一个阶段。用来计算当前存储单元状态的方程为:
(10)
式中,
和
分别表示t和t − 1时刻存储单元的状态。
输出门是指定当前存储单元状态值有多少受到遗忘门影响的步骤,输入门将被删除并传输到下一层。此时表征LSTM输出值的公式如下:
(11)
(12)
式中,
表示t时刻的状态,
表示输出门,
表示逐点操作,
和
为权重矩阵,
为神经元的偏置量。
LSTM是深度学习系统中的一个层。因此,相应的层具有权重和偏置。可以看出,LSTM层中的权重和偏置与输出层中的权重和偏置一样,都是需要通过学习调整的参数。
2.3. NGO-LSTM预测模型
光伏发电量预测中,需要处理的数据量大、复杂度高。利用NGO算法优化LSTM模型的参数可以帮助我们改善模型的预测精度和泛化能力,提高模型的效率和鲁棒性,具有良好的全局搜索能力和适应性,同时也能够更加直观地了解到优化过程和结果,因此有着广泛的应用价值。
在LSTM网络中,学习率、训练次数和神经元个数等是影响预测精度的关键参数。这些参数直接决定LSTM模型网络结构,不同参数训练出的模型预测能力相差较大。因此,提出NGO-LSTM模型,通过NGO对LSTM隐含层神经元个数、学习率和训练次数进行寻优。在利用NGO算法优化LSTM模型参数时,需要进行种群初始化、LSTM模型构建、适应度函数的定义、北方苍鹰位置更新、参数更新、适应度评估、迭代优化和最优解输出等步骤。通过这些步骤的处理和优化,可以得到更好的参数组合,提高LSTM模型的预测精度和泛化能力,从而更好地应对光伏发电量预测这种时间序列预测问题。NGO-LSTM模型流程图如图3所示。
2.4. 评价指标
采用均方根误差(Root Mean Square Error, RMSE)、平均绝对误差(Mean Absolute Error, MAE)和决定系数
作为性能指标,计算式为:
(13)
(14)
(15)
式中,
、
和
分别为功率实际值、平均值和预测值,n为预测的数量。

Figure 3. Process of NGO-LSTM model
图3. NGO-LSTM模型流程
3. 算例分析
本文光伏发电功率数据来源于印度安得拉邦Ponnampall镇的光伏发电厂,采样间隔为15 min,时间范围为2020年6月1日至六月15日,总共1440个样本数据,包含时间、环境温度、模块温度、辐照和功率,该光伏发电厂功率数据如图4所示。

Figure 4. Power data of photovoltaic power plant
图4. 光伏发电厂功率数据
NGO-LSTM的神经元数量、学习率、迭代次数有NGO确定。数据样本中前14天的80%作为训练集,20%为测试集,通过MATLAB进行计算。NGO-LSTM神经网络测试集的预测结果如图5所示,从中可以看出NGO-LSTM神经网络模型的预测结果具有较高准确性。然后该算法训练的网络模型预测1天后的光伏发电功率,光伏发电功率预测结果对比如图6所示,从图7可以看出NGO-LSTM预测结果与真实值的趋势走向基本一致,较为准确地波峰波谷出现的时间,表明了该模型优越的预测性能。

Figure 5. Prediction results of the NGO-LSTM neural network test set
图5. NGO-LSTM神经网络测试集的预测结果

Figure 6. Prediction results of photovoltaic power generation
图6. 光伏发电功率预测结果
图7为NGO-LSTM预测结果的相关性图,可以看到,相关性点均匀分布在了45˚线两侧,而且分布较为集中,说明预测值与真实值的高度相关性,预测结果精度较高。

Figure 7. Correlation graph of prediction results
图7. 预测结果相关性图
为了对比NGO-LSTM模型的预测性能,本文也采用了BP、GA-BP和LSTM这三种神经网络进行了综合对比分析,所有模型的预测结果如图8所示。从图8可以看出,BP模型在前30个时间点预测值整体上高于实际值;在30~50和最后十几个时间点中,预测值低于实际值。GA-BP模型预测值整体上优于BP模型,但与实际值的贴合度不高,误差也比较大。LSTM有出色的时间序列预测能力,其预测结果优于BP和GA-BP模型,预测曲线更加贴合实际值。NGO-LSTM与LSTM整体上趋势相同,但在60点左右,NGO-LSTM预测结果与实际值更加贴近,精度较高。这四种预测模型的各评价指标如表1所示。

Figure 8. Photovoltaic power prediction results of each model
图8. 各模型光伏发电功率预测结果

Table 1. Each evaluation index of four predictive types
表1. 四种预测型的各评价指标
从表1中可以得知,NGO-LSTM精度最高,与BP、GA-BP和LSTM相比,RMSE误差分别降低了751.4 kW、404.3 kW和203.1 kW,MAE误差分别减少了628.2 kW、325.5 kW和152.4 kW,R2分别提高了0.29、0.12和0.05。NGO和GA优化算法都提高了原始模型的预测能力,但受于网络结构性能的差异性,BP网络性能总体低于LSTM,即使经过GA优化,也与LSTM有一定的差距。NGO-LSTM能够胜任光伏发电功率预测精度较高的要求,有着较好的预测稳定性。
4. 结论
本文提出NGO-LSTM预测模型对光伏发电功率进行短期预测。利用NGO对LSTM网络的超参数进行寻优,得到NGO-LSTM模型。通过NGO-LSTM模型对光伏发电厂功率进行预测,并对比了BP、GA-BP和LSTM的预测结果。与BP、GA-BP和LSTM相比,NGO-LSTM RMSE误差分别降低了48.5%、33.6%和25.5%,MAE误差分别减少了53.4%、37.3%和21.8%,R2分别提高了45.3%、14.8%和5.7%。结果表明,将NGO-LSTM预测模型应用于光伏发电功率预测,可有效提升光伏功率的预测精度。在后续工作中,将考虑对光伏功率的输入数据进行预处理,探索输入数据质量对预测精度的影响及如何通过提高数据质量来提高光伏功率预测的精度。