1. 引言
随着全球对可再生能源需求的持续增长,风能作为一种清洁的可再生能源成为近年来的热点。依据国际能源署(IEA)发布的统计数据,2023年全球风电装机容量已突破743吉瓦(GW),其中中国、美国和欧洲构成了主要市场[1]。在中国,风电已经成为第二大电力来源,2023年新增风电装机容量达到55.8吉瓦,累计装机容量超过380吉瓦[2]。然而,鉴于风能的波动性和不可预测性,风电功率输出表现出显著的随机性特征,这为电力系统的平衡和稳定运行带来了重大挑战。
早期的风电预测研究主要集中在基于物理和统计的方法上。基于物理的方法是综合的工具,它利用详细的气象测量、地形信息和风力发电转换的动态来估计风力发电输出。传统的统计方法,利用传统的机器学习算法如支持向量机回归(Support vector regression, SVR)和极端梯度提升(Extreme gradient boosting, XGBoost)能够提取数据特征[3],但易受噪声影响。相比之下,卷积神经网络(Convolutional neural networks, CNN)、长短期记忆网络(Long short-term memory, LSTM)和门控循环单元(Gated recurrent unit, GRU)等深度学习算法在风电功率预测的应用中表现出色[4]。这些深度学习模型通过挖掘数据的时间特征,提高了预测的准确性。然而,尽管这些方法在捕捉时间相关性方面取得了显著进展,它们对空间相关性的利用仍然有限,影响了预测结果的准确性。
为了进一步提升风电功率预测(WPF)的精度,近年来的研究开始利用图神经网络(GNN)来捕捉风力发电机组的空间特征。图神经网络在从时空WPF中使用的图数据中提取特征方面显示出有希望的功效。表示风电场之间关系的图形的构建在GNN模型中起着至关重要的作用。文献[5]中的研究使用风力涡轮机地理数据开发了一个图卷积网络长短期记忆(GCN-LSTM)模型,用于增强风电功率预测。此模型独特地集成了GCN和LSTM网络,其中GCN模块用于捕获风力发电的空间特征,而LSTM模块用于捕获时间特征。尽管这些混合模型结合了空间和时间模块,但在处理复杂空间关系方面仍有提升空间。
在此背景下,量子计算作为一种革命性的计算技术[6],正逐渐展现出其在解决复杂问题上的巨大潜力。量子计算利用量子比特的叠加和纠缠特性,能够在短时间内处理大量数据,并实现并行计算,这对于处理风电功率预测中涉及的大量时空数据和复杂空间关系具有重要意义。量子计算的高效性和并行性,使其在处理大规模数据集和优化问题时具有显著优势,这为提升风电功率预测的准确性和效率提供了新的可能。
本文正是基于这一背景,尝试利用量子技术构建基于注意力机制的量子时空图卷积神经网络模型(Quantum Spatio-Temporal Graph Convolutional Network Attention Mechanism, Q-ST-GCN-AM)。该模型旨在结合量子计算的强大计算能力和图神经网络的空间特征提取能力,实现对风电功率的更准确预测。通过深入挖掘风电场之间的空间相关性,并结合时间序列分析,本文提出的Q-ST-GCN-AM模型有望为风电功率预测领域带来突破性的进展。本文的贡献具有以下两个方面:
(1) 本文将量子计算引入风电功率预测领域,构建了Q-ST-GCN-AM,通过量子计算的并行处理能力,显著提升了大规模数据的处理效率,有效捕捉了风电场中风速、风向、温度等多维度因素的时空关联性,提升了模型的预测精度和稳定性,为电网调度提供更快速的响应能力。
(2) 通过在python包上利用pennylane验证了该方法的可行性,表明了该模型在风电功率预测问题中的有效性和可行性。
本文的其余部分组织如下:第二部分回顾了相关的基础知识;第三部分详细阐述了基于注意力机制的量子图时空神经网络的构建过程;第四部分展示了实验结果,并提供了相应的分析;第五部分总结了本文的核心工作,并指出了未来研究的可能方向。
2. 理论内容
2.1. 量子神经网络
随着量子技术的快速发展,近年来,量子机器学习(QML)方法,特别是量子神经网络(QNN)已经成为一种强大的数据处理工具[7]。
QNN最初是由Ricks和文图拉提出的,使用量子电路门。然后各种QNN被陆续提出。量子神经网络主要由可学习的变分量子电路建模。首先,经典输入
转化为量子态
,然后构造了一系列参数化量子门
,然后构造了一系列参数化量子门。最后进行测量运算,得到量子电路的输出。
近年来,QNN的提出极大地促进了量子机器学习的发展。量子卷积层和池化层可以通过量子酉运算实现。Henderson等人[8]通过在经典CNN中引入量子卷积层,提出了一种混合量子——经典CNN。
RNN的量子变体也引起了一些关注。Hopfield神经网络是RNN的早期形式。另一个量子RNN是由Hibat Allah等人[9]提出的。该算法利用变分波函数来学习量子哈密顿量的近似基态。尽管如此,量子神经网络的发展仍处于起步阶段。因此,在本文中,我们提出了一种量子模型来预测风电功率。
2.2. 基于GCN和TCN的时空特征提取
2.2.1. 图卷积
风电场的相互关系可以通过一个称为权重图(或加权图)的数学结构来描述,其表达式为
,其中V表示N个图形节点的集合,E表示图形边的集合,A是邻接矩阵。在这种情况下,每个风电场都对应一个节点,边表示任意两个风电场之间的相关性,邻接矩阵A描述了N个风电场之间的相关性,表示为:
。
GCN因其良好的预测性能而成为主流的GNN结构之一,它是通过谱图理论将卷积运算推广到GNN构建的[10]。在光谱分析中,拉普拉斯矩阵及其特征值可用于获得图形的结构属性。图的拉普拉斯矩阵定义为
,其归一化形式为
,其中:
是单位矩阵,
是度矩阵,它是对角线矩阵,由图形节点的度数组成。拉普拉斯矩阵的特征值分解表示为
,其中
是对角矩阵,α是傅里叶级数。
风速和功率输入的傅里叶变换
(表示为
)在时间t为由于
是一个正交矩阵,因此其对应的逆傅里叶变换为
,根据拉普拉斯矩阵的性质。图卷积是一种通过使用对角化线性运算符而不是经典卷积运算符实现的卷积操作。基于此,
通过内核g进行过滤
,其中
是图卷积内核,
表示图卷积运算符。
然而,当图的大小很大时,拉普拉斯矩阵的直接特征值分解会受到计算复杂性和卷积核太多学习参
数的影响。因此,在谱域中使用切比雪夫多项式可以简化计算。
,其
中
是多项式的系数向量,
和
是拉普拉斯矩阵的最大特征值。切比雪夫多项式递归定义为:
其中
,
。
最后,将修正线性单元(ReLU)用作图卷积模块的激活函数,即ReLU (
)获取输出
的GCN模块。使用的GCN结构如图1所示。
Figure 1. Structural framework of GCN
图1. GCN的结构框架
2.2.2. 时间卷积
TCN用于结构设计,从风力发电时间序列中提取时间信息[11]。与递归神经网络(RNN)相比,TCN能够以非循环形式处理数据,这赋予了它强大的并行计算能力,同时避免了梯度消失和爆炸等问题。TCN的结构可以根据学习问题的形式灵活设计,以提取特定于目标的时间特征。
膨胀的因果卷积可以用图2表示。对于大小为J的卷积核,在输入x中时间t的膨胀因果卷积函数f
及其对应的滤波器
的表达式为:
,其中J是卷积核的长
度,
表示卷积算子,d是膨胀系数,
是指某个信息在历史记录中的位置。从上式中可以看出,卷积的输出仅取决于具有严格因果关系的先前时间数据。
如图2所示,TCN利用扩张卷积灵活控制历史数据的长度,采样分辨率由d控制。扩张因果卷积的第一层通常使用d = 1,表示逐点采样,第二层使用d = 2,表示每两个点采样一次,作为下一层的输入,依此类推。
此外,TCN还采用了残差连接机制。残差连接有助于缓解多层网络中的梯度消失问题。该机制包含两个分支:一个分支通过一系列堆叠层(包括两个空洞因果卷积层)对输入x进行转换;另一个分支则是输入x的直接连接。然而,由于原始输入x与残差块的输出在宽度上可能存在差异,因此无法直接进行加法运算。为解决这一问题,在直接连接分支上使用了1 × 1卷积层进行调整,以确保两者宽度一致。
Figure 2. Structural framework of TCN
图2. TCN结构框架
2.2.3. 注意力机制
注意力机制(Attention Mechanism, AM)是一种模仿人类注意力选择性聚焦的模型[12],通过计算输入序列的概率分布,突出输入序列中重要信息的影响,有助于扩展神经网络模型的表达能力,提高模型的准确性。见图3。设输入注意层的隐藏状态为
,注意机制的权重分配过程如下。
Figure 3. Structural framework of AM
图3. AM结构框架
首先,将当前时刻t的隐藏状态h转换为注意力权重,则第k时刻输出数据对预测结果的相关性得分:
其中,
是相关性得分,W是权重矩阵,c是偏置,
。
其次,使用softmax函数对相关性得分进行归一化处理,从而得到第k时刻输出的注意力权重系数
:
最后,将时间从1到t时刻所有注意力权重系数与对应的隐藏状态相乘并求和,得到注意力机制下t时刻的最终加权:
将注意力机制引入模型可以TCN模型更有效地加权序列中的参数,见图从而动态调整模型对每个输入特征的关注。注意力机制能够为每个时间步生成不同的注意力权重,自适应地获取不同特征的重要性,使模型能够更灵活地关注当前更关键的特征,突出关键方面,优化特征提取过程,从而增强模型处理长期依赖的能力,增强可解释性。
2.2.4. 多阶段特征融合策略
通过融合多阶段,将不同层或不同模块的特征信息进行整合,从而模型能够捕捉到更丰富的信息[12]。
首先,通过跳跃连接获取不同阶段的时间特征
,以获得包含全局信息的特征
,计算式如下:
其次,进行全局平均化操作(Global Average Pooling, GAP)并卷积操作得到全局特征Z,得到全局特征,计算式如下:
然后,利用I次卷积生成与不同阶段特征对应的权重
,计算式如下:
最后,将权重与相应的阶段特征相乘求和,从而实现多阶段特征融合。计算式如下:
3. 方法
3.1. 所提模型
为综合考虑时间和空间多维度因素的影响,提出基于Q-ST-GCN-AM的风电功率时空预测方法,其整体架构如图4所示。图4所示预测方法的计算原理如下:
(1) 对风电数据进行预处理,实施数据归一化操作,以确保数据处于统一尺度;通过在不同量子位初始态上施加特定的量子旋转门,完成量子态的制备。
(2) 将预处理后的数据被输入至Q-ST-GCN-AM模型中,采用量子卷积块训练数据,以其并行优势提升预测效率。
(3) 利用图卷积和时间卷积模块分别提取数据的空间特征和时间特征,以捕捉不同地理间的相互影响,注意力机制来强化重要信息对预测结果的影响。
(4) 利用残差连接和多阶段特征融合结构,增强模型的学习能力,促进信息在不同模块之间的流动,将这些模块整合在一起。
(5) 通过全连接层将提取的特征映射为风电功率值,实现了风电功率的精准预测。
Figure 4. Overall framework of Q-ST-GCN-AM
图4. Q-ST-GCN-AM的整体框架图
3.2. 量子模块
量子编码技术是实现经典数据与量子态映射的关键步骤,其核心在于通过特定量子操作将经典信息嵌入量子系统的状态空间[13]。常见编码有振幅和角度编码,振幅编码是利用量子态的概率幅对经典数据进行编码和操作,尽管具有极高的信息存储密度,但其对量子态制备精度要求苛刻,目前量子设备还不具备如此硬件条件。角度编码则通过旋转门操作将经典数据映射至量子态的相位空间。
在QCN算法模型的量子编码阶段,关键在于将输入数据集X进行特征映射,记作
,其中
代表希尔伯特空间。对于风电功率数据,选取特定时刻t的序列
作为输入数据,将其编码到n个量子比特中,其公式定义为:
其中,
表示输入数据的第i个元素。
输入特征编码以绕x、y轴旋转的方式实现。状态准备酉算子为
所示:
将旋转门
和
作用于对应时刻的输入特征的特征向量,得到即通过希尔伯特空间的x、y轴旋转变换进行量子态编码。每个输入变量对应一个独立的量子比特,
和
则分别代表单个量子位绕空间x和y轴旋转的角度
。具体公式如下:
Figure 5. Parameterized quantum circuit diagram of Q-ST-GCN-AM
图5. Q-ST-GCN-AM的参数化量子电路图
3.3. 量子卷积层
根据风电场的数量,构建一系列初始量子态
[14]。参数量子电路构成包括通用单量子比特门、CNOT门以及测量操作。任意单量子比特门表示为:
其中,
表示相角,
,
,
是旋转角。
在Q-ST-GCN-AM中,测量操作扮演着非线性转换的角色。从量子复杂性的视角分析,引入此类非线性操作(得益于其超越二次的潜力)会生成非高斯态,进而在经典计算设备上难以高效模拟。
图5展示了Q-ST-GCN-AM的参数化量子电路架构。具体而言,图卷积层由卷积单元(如图5中红色电路所示)与顶点间的图拓扑结构共同构成。而池化层则对应于图5中描绘的绿色电路部分[15]。
在图6中,
,
表示上式中的任意酉操作。绿色电路中的另一个操作表示测量操作。用
和
表示观测到的交通拥堵信息和预测到的交通拥堵信息。损失函数用于量化预测与实际观测之间的差异具体定义如下为:
Figure 6. Two sub-circuits of the parameterized quantum circuit
图6. 参数量子电路的两种子电路
4. 实验结果及性能分析
4.1. 数据集来源及参数设置
针对实际问题,本文选择美国某风电场数据集作为原始经典数据集,也为了确保仿真实验的准确性,进行了多次重复的实验来表明实验的可靠性。实验在Intel(R) Xeon(R) Platinum 8352V CPU@2.10GHz的服务器上实现。软件环境为windows 11系统中的Python 3.9,使用的CUDA版本是12.4,pytorch作为深度学习框架,pennylane作为量子机器学习框架。
4.2. 评价指标
本文采用均方误差、平均绝对误差和决定系数作为评价预测性能的指标,其计算公式分别为:
其中:MSE为均方误差;MAE为平均绝对误差;R2为决定系数;N为样本数目;
为实际功率值;
为预测功率值;
为平均功率值。MSE和MAE越小,模型越准确。更接近R2为1,则模型的拟合度越好,预测性能越好。
4.3. 实验结果和比较分析
本文将前80%的数据用来训练模型,使用后20%的数据作为验证集对模型的预测精度进行检验。此外,在实验中,为了防止模型过拟合,采用early stopping策略,对学习率、epoch、激活函数和模型结构等超参数进行了微调。图7展示了本文所提模型和其他对照组模型的预测结果,表1显示了基于数据集各模型的预测误差。
Figure 7. Prediction results of all models
图7. 所有模型预测结果
Table 1. Comparison of 30-minute prediction results among different models
表1. 各个模型在三十分钟预测结果的对比
Methods |
MAE |
RMSE |
R2 |
Q-ST-GCN-AM |
3.1988 |
3.9535 |
0.9896 |
ST-GCN-AM |
3.2035 |
3.9622 |
0.9877 |
GCN |
10.7927 |
12.0237 |
0.8473 |
STCN |
4.4850 |
5.9194 |
0.9622 |
BiGRU |
5.0146 |
6.0081 |
0.9610 |
LSSVR |
14.8400 |
16.3079 |
0.7129 |
RF |
6.0676 |
7.7115 |
0.9358 |
从图7中观察预测曲线走向发现,橙色曲线的趋势走向与蓝色曲线基本吻合,上下波动范围略微存在偏差,Q-ST-GCN-AM和ST-GCN-AM模型表现拟合效果较好。但单从图形上并不能准确地判断模型的好坏,还得根据模型的评价指标,结合预测图进行分析。
结合表1和图7,文中提出的模型的MAE值和RMSE值均为最小值,相关系数最接近1,即文中提出的模型要优于传统的预测模型。
5. 结论
为充分挖掘有限风电数据集中的有效预测信息,并深入考虑风电气象因素的时空相关性。本文提出了一种基于注意力机制的量子时空图卷积神经网络,通过运用图卷积技术,能够高效地捕捉风电气象因素之间的空间相关性,进而增强了预测模型的可解释性。同时,融入了注意力机制,以精确提取各节点的多维时空特征,极大地提升了模型对数据中长距离依赖关系的捕获能力。此外,还采用了多阶段特征融合策略,对模型的表达能力进行了进一步优化,有效减小了预测误差。
实验表明,Q-ST-GCN-AM模型在风电功率预测任务中展现出卓越的预测性能及强大的抗干扰能力。尽管当前预测精度仍有提升空间,但该方法为风电功率预测领域提供了思路。该算法的核心优势在于突破了量子算法的应用限制,成功将量子计算应用于实际预测场景。
致 谢
感谢甘肃省计算中心提供的计算资源和技术支持。本研究中的大量计算工作均在该中心进行,这对于本论文的顺利完成起到了至关重要的作用。
基金项目
感谢甘肃省科技计划项目(24YFFA055, 22JR5RA797),甘肃省云计算重点实验室开放课题(2023KFKT-005)与甘肃省重点人才项目(“东数西算”场景下的后量子数据加密传输机制研究)的资助。
NOTES
*通讯作者。