基于GTO优化CNN-LSTM的短期电力负荷预测

doi:10.12677/mos.2025.146480

期刊菜单

基于GTO优化CNN-LSTM的短期电力负荷预测
Short-Term Power Load Forecasting Using CNN-LSTM Network Optimized by GTO Algorithm

DOI: 10.12677/mos.2025.146480, PDF, HTML, XML,
作者: 陈霄阳：上海理工大学机械工程学院，上海
关键词: 电力负荷预测；GTO-CNN-LSTM模型；空间特征提取；超参数；Power Load Forecasting； GTO-CNN-LSTM Model； Spatial Feature Extraction； Hyperparameters

摘要: 短期电力负荷预测对电力系统调度至关重要，其预测精度直接影响电网运行的经济性和安全性。针对传统预测方法在处理非线性、非平稳负荷数据时存在的局限性，本文提出一种基于人工大猩猩部队优化算法(GTO)优化的CNN-LSTM混合模型(GTO-CNN-LSTM)，通过结合CNN的空间特征提取能力和LSTM的时序建模优势，并利用GTO算法优化关键超参数，显著提升预测精度。基于中国某地2014~2015年的实际负荷数据实验表明，该模型的RMSE (427.8)较单一LSTM和CNN-LSTM分别降低25.5%和14.5%，MAPE降至4.905%，且R²达0.931，验证了其优越性。该模型为电力负荷预测提供了高精度解决方案，可推广至其他时序预测任务。

Abstract: Short-term power load forecasting is crucial for power system dispatching, as its accuracy directly impacts the economic efficiency and security of grid operations. To address the limitations of traditional forecasting methods in handling nonlinear and non-stationary load data, this paper proposes a hybrid CNN-LSTM model optimized by the artificial Gorilla Troops Optimizer (GTO) algorithm (GTO-CNN-LSTM). By integrating the spatial feature extraction capability of CNN and the temporal modeling advantages of LSTM, and leveraging the GTO algorithm to optimize key hyperparameters, the model significantly improves forecasting accuracy. Experimental results based on actual load data from a region in China during 2014~2015 demonstrate that the proposed model achieves an RMSE of 427.8, representing reductions of 25.5% and 14.5% compared to standalone LSTM and CNN-LSTM models, respectively. Additionally, the MAPE drops to 4.905%, while the R² reaches 0.931, confirming its superiority. This model provides a high-accuracy solution for power load forecasting and can be extended to other time-series forecasting tasks.

文章引用：陈霄阳. 基于GTO优化CNN-LSTM的短期电力负荷预测[J]. 建模与仿真, 2025, 14(6): 110-119. https://doi.org/10.12677/mos.2025.146480

1. 引言

随着经济社会的发展和能源结构的转型，电力系统面临着日益增长的负荷需求与运行优化挑战。电力负荷短期预测(通常指未来数小时至一周内的预测)作为电力系统调度、市场交易和风险管理的重要基础，其精度和可靠性直接影响电网的经济性与安全性。然而，负荷变化受气象条件、节假日效应、用户行为等多因素耦合影响，具有显著的时序非线性、随机性和时变性特征。传统统计方法(如ARIMA、指数平滑)和经典机器学习模型(如支持向量机、人工神经网络)虽有一定应用，但在处理高维特征和复杂非线性关系时仍存在局限性。近年来，深度学习(如LSTM、Transformer)与混合优化算法的兴起为提升预测精度提供了新思路。本研究旨在结合多源数据(历史负荷、气象、日历信息等)和先进算法，构建适应性强、鲁棒性高的短期负荷预测模型，为智能电网的精准调度与能源高效利用提供理论支撑和技术解决方案。

当前，短期电力负荷预测方法主要可分为传统预测方法与智能预测方法两大类。传统预测方法如多元回归分析、时间序列模型等，虽然具有原理清晰、计算简便的特点，但在电力系统智能化发展的背景下，其局限性日益显现。随着电力系统结构日益复杂，负荷影响因素更加多元化，数据监测精度不断提升，传统方法已难以满足现代电力系统对预测精度的要求。近年来，随着人工智能技术的快速发展，机器学习算法在电力负荷预测领域展现出显著优势。这类智能预测方法能够有效处理高维、非线性数据特征，在当前数据驱动的电力系统环境中取得了良好的应用效果。崔和瑞等人基于协整理论构建了ARIMAX模型，通过整合温度等外部变量有效提升了夏季短期电力负荷预测精度，相比传统ARMA模型显著降低了预测误差[1]。雷绍兰等基于多变量时间序列相空间重构理论，提出融合温度因素的局域线性预测模型，通过优化嵌入维数和延迟时间参数，实现了较单变量方法更高的短期负荷预测精度(平均误差1.016%)，验证了多因素耦合建模在提升预测效果中的有效性[2]。戴璐平等提出融合模糊熵与灰色理论的GM (1, 1)-ARMA组合预测模型，通过模糊熵优化数据预处理并利用灰色系统消除残差，实验显示其平均相对误差低于2%，显著提升了短期电力需求预测精度[3]。陈亮等人基于TensorFlow框架构建LSTM神经网络模型，通过捕捉电力负荷时序数据的长期依赖性，实现了高精度短期负荷预测，验证了深度学习在电力负荷预测中的有效性[4]。周莽等提出融合栈式自编码器(SAE)与GRU神经网络的混合模型，通过特征压缩和时序建模将预测误差较传统SVM和LSTM分别降低32%和18%，验证了深度学习方法在复杂环境因素下的短期负荷预测优势[5]。张雲钦等提出EMD-PCA-LSTM混合预测模型，通过经验模态分解和主成分分析处理环境因素序列，结合LSTM动态建模，使光伏功率预测的RMSE较单一LSTM模型降低14.1% [6]。穆晨宇等提出VMD-LSTM-Attention混合模型，通过变分模态分解和注意力机制增强时序特征提取，使短期负荷预测的MAPE较传统LSTM降低18.6%，验证了多模态分解与深度学习融合的有效性[7]。

针对电力负荷数据存在的非线性波动特征和不确定性，传统单一预测模型难以实现精准的短期负荷预测。为此，本研究创新性地提出一种融合人工大猩猩部队优化算法(GTO)、卷积神经网络(CNN)和长短期记忆网络(LSTM)的混合预测模型。GTO-CNN-LSTM模型的预测精度受LSTM网络的隐藏层单元数、学习率和Dropout率等关键参数影响显著，传统网格搜索方法参数寻优效率较低。人工大猩猩部队优化算法(GTO)模拟大猩猩群体智能协作机制，具有全局搜索能力强、收敛速度快的特点，可高效优化LSTM网络超参数。为提升电力负荷预测精度，本文融合GTO的智能优化能力、CNN的空间特征提取优势以及LSTM的时序建模能力，构建了GTO-CNN-LSTM组合预测模型。基于中国某地级市2014年1月1日至2015年1月10日的实际负荷数据进行实证研究，通过模型的对比实验，验证所提模型在预测精度上的优越性。

2. 理论与方法

2.1. 卷积神经网络

卷积神经网络(CNN)是由LeCun等人于1998年提出的深度神经网络架构，其核心优势在于强大的特征提取能力，能够有效解决传统神经网络在特征表征方面的局限性。作为影响预测精度的关键环节，特征提取的准确性在很大程度上决定了模型的最终性能。典型的CNN模型包含五个功能层次：输入层接收原始数据输入；卷积层通过卷积核运算实现局部特征提取，这是模型最具创新性的核心组件；池化层采用下采样操作降低特征维度；全连接层完成高级特征的综合与分类；最终输出层将处理结果传递至后续网络模块。这种层次化结构设计使CNN在图像识别、时序分析等领域展现出卓越的性能[8] [9]。卷积神经网络(CNN)的网络模型如图1所示。

Figure 1. Schematic diagram of CNN network structure

图1. CNN网络结构示意图

2.2. 长短期记忆网络

长短期记忆网络(Long Short-Term Memory, LSTM)是一种特殊的循环神经网络(RNN)，由Hochreiter和Schmidhuber于1997年提出，专门用于解决传统RNN在处理长序列数据时的梯度消失问题[10]。其核心创新在于引入了精心设计的门控机制和细胞状态，通过遗忘门、输入门和输出门三个关键组件来控制信息的流动：遗忘门决定哪些信息需要被丢弃，输入门控制新信息的加入，输出门则决定当前时刻的输出[11]。这种结构使LSTM能够选择性地记住或遗忘信息，有效捕捉长期依赖关系。相比传统RNN，LSTM通过细胞状态的恒定传播和门控单元的调节，显著改善了梯度流动的稳定性，使其能够处理长达数百甚至数千个时间步的序列依赖。该网络在时间序列预测、自然语言处理、语音识别等领域表现出色，特别是在需要建模复杂时间动态的电力负荷预测任务中，能够有效学习负荷数据的非线性时序特征和长期变化规律[12]。LSTM的内部单元结构图如图2所示。

Figure 2. Schematic diagram of LSTM network structure

图2. LSTM网络结构示意图

输入门：输入门是LSTM网络的核心组件之一，它通过Sigmoid函数决定当前输入信息的重要性，并控制这些新信息更新到细胞状态中的比例。具体来说，输入门会先计算一个0到1之间的权重值(1表示完全保留，0表示完全忽略)，同时生成包含新特征的候选值，最后将二者相乘后添加到细胞状态中。

${\begin{cases} {\tilde{C}}_{t} = \tanh (W_{C} \cdot [h_{t - 1}, x_{t}] + b_{C}) \\ i_{t} = σ (W_{i} \cdot [h_{t - 1}, x_{t}] + b_{i}) \\ C_{t} = f_{t} \times C_{t - 1} + i_{t} \times {\tilde{C}}_{t} \end{cases}$ (1)

式中， $W_{C}$ 、 $W_{i}$ 代表输入门的权重矩阵， $b_{C}$ 、 $b_{i}$ 代表输入门偏置， $\tanh$ 是激活函数。

遗忘门：遗忘门是LSTM中负责选择性遗忘信息的核心组件，它通过sigmoid函数输出0到1之间的值来决定细胞状态中哪些历史信息需要保留或丢弃。具体来说，遗忘门会分析当前输入和前一时刻的隐藏状态，计算出一个遗忘系数矩阵(值越接近0表示遗忘越多，越接近1则保留越多)，然后用这个系数与上一时刻的细胞状态进行逐元素相乘，从而实现对历史信息的动态筛选。

$f_{t} = σ (W_{f} \cdot [h_{t - 1}, x_{t}] + b_{f})$ (2)

式中， $f_{t}$ 代表 $t$ 时刻的遗忘门状态， $x_{t}$ 代表当前时刻输入， $h_{t - 1}$ 代表上一时刻隐藏状态， $W_{f}$ 、 $b_{f}$ 分别代表遗忘门的权重矩阵、偏置量， $σ$ 代表激活函数sigmoid。

输出门：输出门通过sigmoid函数决定当前细胞状态中哪些信息需要输出到隐藏状态，并使用tanh函数对细胞状态进行缩放，最终生成LSTM的当前时刻输出。

${\begin{cases} o_{t} = σ (W_{o} \cdot [h_{t - 1}, x_{t}] + b_{o}) \\ h_{t} = o_{t} \times \tanh (c_{t}) \end{cases}$ (3)

2.3. 人工大猩猩部队优化算法

人工大猩猩优化算法(Artificial Gorilla Troops Optimizer, GTO)是一种新型的群体智能优化算法，其灵感来源于大猩猩种群的社交行为和觅食策略。该算法通过模拟大猩猩群体的迁移机制、领导跟随行为以及协作觅食过程，构建了全局探索和局部开发两个主要阶段[13] [14]。在探索阶段，算法模拟大猩猩群体向未知区域迁移的过程，增强全局搜索能力；在开发阶段，则借鉴大猩猩围绕银背首领的协作模式，实现解的精细优化。相较于传统优化算法，GTO具有收敛速度快、跳出局部最优能力强的特点，已成功应用于神经网络参数优化、工程设计等多个领域，特别适合解决高维非线性优化问题。该算法通过平衡探索与开发的能力，在保持种群多样性的同时确保收敛精度，展现出良好的优化性能。

3. GTO-CNN-LSTM预测模型

GTO-CNN-LSTM网络的预测性能受LSTM层节点数、初始学习率、CNN部分关键参数的影响。为提高预测精度，本文采用GTO对上述参数进行自适应优化，构建了基于GTO优化的CNN-LSTM组合预测模型(GTO-CNN-LSTM)，其预测步骤如下：

步骤1. 数据处理。采用中国某地级市2014~2015年度的实际用电负荷数据进行实证分析，数据采集时间跨度为2014年1月1日至2015年1月10日，采样间隔为1小时。在数据预处理阶段，将80%的观测数据作为训练样本，剩余20%的数据划分为验证集和测试集。特征工程方面，选取了包括前一小时累计负荷值、日最高/最低气温、相对湿度、降水总量以及日均温度在内的多维度特征变量。为确保各特征量纲统一，采用最大最小值归一化方法对原始数据进行标准化处理，归一化公式如下：

$\tilde{X} = \frac{X - X_{\min}}{X_{\max} - X_{\min}}$ (4)

步骤2. 采用卷积神经网络进行特征提取，其网络架构由二维卷积层、RELU非线性激活层、二维池化层、序列展开层和展平层依次堆叠组成。该结构通过逐层处理训练数据集中的输入信号，有效挖掘电力负荷时序数据中隐含的空间相关性特征，最终输出表征负荷变化规律的特征向量。

步骤3. LSTM预测。构建包括一个LSTM层、一个全连接层和一个输出层的LSTM网络回归结构。首先，将步骤2中预处理得到的关系特征向量输入LSTM层，通过其特有的门控机制捕获电力负荷数据中的时序依赖关系。随后，LSTM层输出的时序特征被送入全连接层进行高阶特征融合与非线性变换。最后，通过输出层将综合后的特征映射为初步的负荷预测值。

步骤4. GTO寻优。采用GTO优化算法对模型关键参数进行自动寻优，包括学习率、卷积核的尺寸与数量以及全连接层的神经元数量等超参数。优化过程中，以电力负荷实测数据与模型预测结果的均方误差(MSE)作为适应度评价指标，通过GTO算法的智能搜索机制，最终构建出性能最优的GTO-CNN-LSTM组合预测模型。

步骤5. 预测。将测试集数据输入经优化的CNN-LSTM预测模型，通过反归一化处理获得电力负荷预测值。为评估模型性能，采用多种误差评价指标进行量化分析，包括[15]：

(1) RMSE (均方根误差)

$RMSE = \sqrt{\frac{\sum_{i = 1}^{M} {(y_{r e a l (i)} - y_{p r e (i)})}^{2}}{M}}$ (5)

(2) MAE (平均绝对误差)

$MAE = \frac{1}{M} \sum_{i = 1}^{M} | y_{r e a l (i)} - y_{p r e (i)} |$ (6)

(3) MAPE (平方绝对百分比误差)

$MAPE = \frac{1}{M} \sum_{i = 1}^{M} | \frac{y_{r e a l (i)} - y_{p r e (i)}}{y_{r e a l (i)}} |$ (7)

(4) R² (决定系数)

$R^{2} = 1 - \frac{\sum_{i = 1}^{M} {(y_{r e a l (i)} - y_{p r e (i)})}^{2}}{\sum_{i = 1}^{M} {(y_{r e a l (i)} - y_{a v e r a g e (i)})}^{2}}$ (8)

式中： $y_{r e a l (i)}$ 为真实值； $y_{p r e (i)}$ 为预测值； $y_{a v e r a g e (i)}$ 为平均值； $M$ 为样本数量。

4. 实例分析

4.1. 数据来源

选取中国某地级市2014年1月1日至2015年1月10日的实际电力负荷数据以及温度、湿度等数据进行研究，负荷数据的采样频率设置为一小时，每天二十四个时刻，每个时刻代表这一小时的累积负荷量，并进行数据归一化处理。其时间序列曲线如图3所示。

Figure 3. Electricity load time series graph

图3. 电力负荷时间序列曲线图

4.2. 预测结果分析

为了验证本文提出模型的有效性，以MATALB R2021a作为仿真环境将本文提出的模型GTO-CNN-LSTM与LSTM、CNN-LSTM模型进行对比实验。本文提出模型采用GTO算法优化CNN-LSTM模型的参数，包括学习率、训练次数、小批量大小、卷积层1的卷积核数量和大小、池化层1的大小、卷积层2的卷积核数量和大小、池化层2的大小、LSTM层的节点数以及全连接层的节点数，寻优区间如表1所示。模型选择均方误差(MSE)作为适应度函数，把适应度函数最优的参数作为最后的寻优结果。其结果如表2所示。

Table 1. Optimal interval of model parameters

表1. 模型参数寻优区间

预测模型

模型参数

学习率

小批量大小

卷积核数量(1)

卷积核大小(1)

池化层大小(1)

卷积核数量(2)

卷积核大小(2)

池化层大小(2)

训练次数

LSTM节点数

全连接层节点数

GTO-CNN-LSTM

[0.0001, 0.01]

[8, 24]

[1, 20]

[1, 10]

[1, 5]

[1, 20]

[1, 10]

[1, 5]

[10, 100]

[1, 50]

[1, 200]

Table 2. Model parameter optimization results

表2. 模型参数寻优结果

预测模型	模型参数
预测模型	学习率	小批量大小	卷积核数量(1)	卷积核大小(1)	池化层大小(1)	卷积核数量(2)	卷积核大小(2)	池化层大小(2)	训练次数	LSTM节点数	全连接层节点数
GTO-CNN-LSTM	0.0041	14	20	6	2	12	3	2	75	7	125

LSTM模型、CNN-LSTM模型、GTO-CNN-LSTM模型预测曲线如图4~6所示。模型对比曲线图如图7所示。

Figure 4. LSTM prediction results

图4. LSTM预测结果

Figure 5. CNN-LSTM prediction results

图5. CNN-LSTM预测结果

Figure 6. GTO-CNN-LSTM prediction results

图6. GTO-CNN-LSTM预测结果

从图7可以明显看出三种模型的变化趋势在整体上与真实值的变化曲线趋势相同。LSTM独立预测模型精度最低，CNN-LSTM其次，本文提出的GTO-CNN-LSTM模型精度最高。三种模型的均方根误差(RMSE)、平均绝对误差(MAE)、平均绝对百分比误差(MAPE)、决定系数(R²)如表3所示。

Figure 7. Different models predict outcomes

图7. 不同模型预测结果

Table 3. Evaluation indicators for each model

表3. 各模型的评价指标

指标	RMSE	MAE	MAPE	R²
LSTM	574.6	360.5	6.089%	0.876
CNN-LSTM	500.3	287.1	5.195%	0.906
GTO-CNN-LSTM	427.8	275.1	4.905%	0.931

由表3可以看出：

1. 本文所提模型GTO-CNN-LSTM的RMSE值最低，相较于最高的LSTM模型降低了25.5%，相较于CNN-LSTM模型降低了14.5%，表明本文模型的预测误差小，预测能力强。

2. 本文所提模型GTO-CNN-LSTM的MAE值最低，相较于最高的LSTM模型降低了23.7%，相较于CNN-LSTM模型降低了4.2%，说明本文模型预测的值更接近真实值。

3. 本文所提模型GTO-CNN-LSTM的MAPE值最小，相较于最高的LSTM模型降低了19.4%。

4. 本文所提模型GTO-CNN-LSTM的决定系数最大更接近于1，说明该模型的回归拟合效果更优越。

综合对比三种模型的误差指标(如均方根误差RMSE、平均绝对误差MAE和平均绝对百分比误差MAPE)可以得出，组合了CNN (卷积神经网络)的LSTM (长短期记忆网络)模型在时间序列预测任务中的表现显著优于单一的LSTM模型。具体而言，CNN-LSTM混合模型比单一的LSTM模型预测误差更低，稳定性更强，能够更准确地捕捉数据中的时空特征。而本文采用的GTO算法寻优CNN-LSTM模型超参数比CNN-LSTM组合模型具有更好的精度，更能适应当地的负荷预测需求。

5. 结论

本文提出了一种基于GTO优化的CNN-LSTM混合模型(GTO-CNN-LSTM)，用于短期电力负荷预测。通过结合CNN的空间特征提取能力和LSTM的时序建模优势，并利用GTO算法优化关键超参数，显著提升了预测精度。实验结果表明，该模型的RMSE (427.8)较单一LSTM和CNN-LSTM分别降低25.5%和14.5%，MAPE降至4.905%，且R²达0.931，验证了其优越性。此外，GTO算法在参数优化中表现出高效性和鲁棒性，为模型性能提升提供了重要支撑。本研究为电力系统调度提供了高精度预测工具，并可推广至其他复杂时序预测任务。未来研究将进一步探索多源数据融合和动态优化策略，以增强模型的泛化能力和适应性。

尽管GTO-CNN-LSTM模型在短期电力负荷预测中表现出较高的精度，但仍存在以下局限性：

(1) 数据依赖性较强。模型的预测性能高度依赖于历史数据的质量和完整性。若训练数据存在缺失、噪声或非代表性(如未涵盖极端天气或特殊事件)，预测精度可能显著下降。

(2) 计算复杂度较高。GTO算法需要多次迭代优化超参数，导致训练时间较长，相比传统参数优化方法(如网格搜索)计算成本更高，可能不适用于实时性要求极高的场景。

未来改进方向：

(1) 增强数据鲁棒性。引入数据增强技术(如生成对抗网络GAN或扩散模型)合成极端事件数据，提升模型对罕见情况的适应能力。

(2) 提升实时性与适应性。开发在线学习机制，使模型能够动态更新参数，适应负荷模式的长期漂移(如季节变化或经济发展影响)。引入不确定性量化方法(如蒙特卡洛Dropout或贝叶斯神经网络)，输出预测结果的置信区间，辅助风险决策。

参考文献

[1]	崔和瑞, 彭旭. 基于ARIMAX模型的夏季短期电力负荷预测[J]. 电力系统保护与控制, 2015, 43(4): 108-114.
[2]	雷绍兰, 孙才新, 周湶, 等. 电力短期负荷的多变量时间序列线性回归预测方法研究[J]. 中国电机工程学报, 2006(2): 25-29.
[3]	戴璐平, 沈嘉怡, 张飞飞. 基于时间序列算法的能源电力需求自动预测模型[J]. 自动化技术与应用, 2024, 43(1): 49-51, 65.
[4]	陈亮, 王震, 王刚. 深度学习框架下LSTM网络在短期电力负荷预测中的应用[J]. 电力信息与通信技术, 2017, 15(5): 8-11.
[5]	周莽, 高僮, 李晨光, 等. GRU神经网络短期电力负荷预测研究[J]. 科技创新与应用, 2018(33): 52-53, 57.
[6]	张雲钦, 程起泽, 蒋文杰, 等. 基于EMD-PCA-LSTM的光伏功率预测模型[J]. 太阳能学报, 2021, 42(9): 62-69.
[7]	穆晨宇, 薛文斌, 穆羡瑛, 等. 基于VMD-LSTM-Attention模型的短期负荷预测研究[J]. 现代电子技术, 2023, 46(17): 174-178.
[8]	Guo, Y., Li, Y., Qiao, X., Zhang, Z., Zhou, W., Mei, Y., et al. (2022) Bilstm Multitask Learning-Based Combined Load Forecasting Considering the Loads Coupling Relationship for Multienergy System. IEEE Transactions on Smart Grid, 13, 3481-3492. [Google Scholar] [CrossRef]
[9]	Guo, Z., Hu, L., Wang, J. and Hou, M. (2021) Short-Term Load Forecasting Based on SSA-LSSVM Model. 2021 4th International Conference on Energy, Electrical and Power Engineering (CEEPE), Chongqing, 23-25 April 2021, 1215-1219. [Google Scholar] [CrossRef]
[10]	李豪磊, 赵升, 谢喜龙, 等. 基于GWO-LSTM-TCN混合模型的锂电池荷电状态估计研究[J]. 电源技术, 2024, 48(11): 2195-2200.
[11]	朱子敬, 何利文. 基于ABC-LSTM-GRU的时间序列分解与预测模型[J]. 软件工程, 2024, 27(3): 58-62.
[12]	荆昱阳, 张利强. 基于Pytorch的长短期记忆网络实现及应用[J]. 制造业自动化, 2021, 43(12): 167-169, 177.
[13]	陈丽芳, 曹柯欣, 张思鹏, 等. 群智能优化算法最新进展[J]. 计算机工程与应用, 2024, 60(19): 46-67.
[14]	杨模, 刘紫燕, 梁静, 等. 基于Pareto支配的改进人工大猩猩部队多目标优化[J]. 传感技学报, 2023, 36(4): 590-601.
[15]	霍娟, 孙晓伟, 张明杰. 电力负荷预测算法比较-随机森林与支持向量机[J]. 电力系统及其自动化学报, 2019, 31(7): 129-134.

为你推荐

友情链接