基于SSA-VMD-CNN-LSTM的水库月径流预测方法研究
Research on Monthly Runoff Prediction Method for Reservoirs Based on SSA-VMD-CNN-LSTM
DOI: 10.12677/jwrr.2025.146068, PDF, HTML, XML,   
作者: 王 含, 汪青静:长江水利委员会水文局,湖北 武汉
关键词: 径流预测深度学习混合模型Runoff Forecasting Deep Learning Hybrid Model
摘要: 为提高月径流预测精度,降低由径流序列非线性、非平稳及高噪声引起的预测误差,本文提出一种基于变分模态分解与深度学习、优化搜索算法相结合(SSA-VMD-CNN-LSTM)的月径流预测方法。该方法首先利用VMD将原始径流序列分解为若干本征模态函数(IMF),并将各子模态分量重构为二维特征矩阵;随后,将其输入经麻雀搜索算法(SSA)优化的卷积神经网络与长短时记忆网络(CNN-LSTM)进行预测;最终,通过叠加各子模态的预测结果,获得完整的月径流预测序列。研究结果表明,经SSA优化的VMD-CNN-LSTM模型在月径流预测中具有更高的精度,其预测效果优于LSTM、CNN-LSTM及VMD-CNN-LSTM模型。该模型可为水库的月径流预测提供有效参考。
Abstract: In order to improve the accuracy of monthly runoff prediction and reduce the error caused by the nonlinearity, non-stationarity and high noise of series, this paper proposes a monthly runoff prediction method based on variational mode decomposition and deep learning, optimized search algorithm (SSA-VMD-CNN-LSTM). The method first decomposes the original runoff series into several intrinsic mode functions (IMF) by VMD, and each sub-modal component is reconstructed into a two-dimensional feature. Subsequently, it is input into the convolutional neural network and long-short term memory network (CNN-LSTM) optimized by sparrow search algorithm (SSA). Finally, the complete monthly runoff prediction sequence is obtained by superimposing the prediction results of each sub-modal. The results of the study show that the SSA-MD-CNN-LSTM model has higher accuracy in monthly runoff prediction, and its prediction effect is better than LSTM, CNN-LSTM and VMD-CNN-LSTM models. The model can provide effective reference for the monthly runoff prediction of reservoirs.
文章引用:王含, 汪青静. 基于SSA-VMD-CNN-LSTM的水库月径流预测方法研究[J]. 水资源研究, 2025, 14(6): 632-639. https://doi.org/10.12677/jwrr.2025.146068

1. 引言

月径流预测是水库中长期调度与水资源管理的基础,对于流域水资源规划、防洪抗旱及水库优化调度具有至关重要的现实意义。径流序列兼具趋势、季节与随机成分,单一模型难以同时刻画其非平稳、非线性及多尺度特征,导致峰值与低水段预测误差偏大。

传统的中长期径流预测多采用时间序列统计模型。随着计算机技术的发展,基于数据驱动的非线性智能算法逐渐成为研究热点,例如长短期记忆神经网络(LSTM) [1] [2]、人工神经网络(ANN) [3] [4]和支持向量机模型(SVM) [5] [6]等。其中,LSTM因其能够有效捕捉时间序列中的长期依赖关系,在处理径流序列的自相关性方面表现出显著优势,已被广泛应用于径流预测研究[7]

径流过程具有非线性、非平稳及高噪声的特性,单一模型往往难以充分刻画其复杂的非线性特征,从而限制了预测精度的进一步提升。因此,揭示径流序列的时变规律是提升预测精度的关键前提。结合信号处理技术,通过模态分解与重构方法挖掘径流序列的内在特征,已成为一种有效途径。常用方法包括小波分解(WD)、经验模态分解(EMD)和变分模态分解(VMD)等,已有诸多研究验证了这些方法的有效性[8] [9]。例如,葛朝霞等[10]将小波分解与BP神经网络结合,实现了洪家渡水电站入库径流的预测;胡顺强等[11]构建了EMD-LSTM模型,对云南省龙潭站的年径流过程进行了预测;朱非林等[12]耦合VMD与LSTM,构建了适用于中长期径流预测的VMD-LSTM模型。相较于其他分解方法,VMD能够有效抑制端点发散和模态混叠现象,并具备较强的噪声鲁棒性。

尽管上述模型在径流预测中已展现出良好的适用性,但大多未充分考虑不同输入属性下子模态分量之间的相关性。卷积神经网络(CNN)具有强大的特征提取能力,将其与LSTM结合,有望更全面地捕捉径流序列的时空特征。然而,组合模型通常对超参数设置更为敏感。为此,本文引入麻雀搜索算法(SSA),构建了SSA-VMD-CNN-LSTM组合预测模型,旨在提升水库中长期径流的预测精度。

2. 研究方法

2.1. 变分模态分解

变分模态分解(VMD)是一种自适应信号处理方法,通过构造并求解约束变分问题,将原始信号f分解为K个具有稀疏特性的本征模态函数(IMF) u k ( t ) ( k=1,2,3,,K )。该方法能有效克服模态混叠与端点效应,分解后的各子模态分量噪声鲁棒性更好,物理意义明确[13] [14]。VMD的约束变分问题可表述为:

{ min { u k },{ ω k } { k=1 K t [ ( δ( t )+ j πt u k ( t ) ) ] e j ω k t 2 2 } s.t. k=1 K u k =f (1)

其中 { u k }={ u 1 , u 2 ,, u K } 为子模态函数集; { ω k }={ ω 1 , ω 2 ,, ω K } 为子模态的中心频率集; 是卷积运算;K是原始序列分解的子模态分量数目; δ( t ) 为各子模态与中心频率的函数关系。

2.2. 长短时记忆神经网络

长短时记忆神经网络(LSTM)是循环神经网络(RNN)的改进模型,通过引入门控机制(遗忘门、输入门、输出门)和记忆单元,有效解决了RNN的梯度消失或爆炸问题,适用于处理具有长期依赖关系的径流序列[15]。LSTM单元在t时刻的状态更新公式如下:

f t =σ[ W f ( h t1 , x t )+ b f ] (2)

i t =σ[ W i ( h t1 , x t )+ b i ] (3)

c ˜ t =tanh[ W c ( h t1 , x t )+ b c ] (4)

c t = f t c t1 + i t c ˜ t (5)

o t =σ[ W o ( h t1 , x t )+ b o ] (6)

h t = o t tanh( c t ) (7)

式中:htxt分别为t时刻隐含层与输入层的输入向量;ftitot分别表示遗忘门、输入门和输出门的状态;ct为记忆单元状态; c ˜ t 为候选记忆向量; σ 和tanh分别为sigmoid和双曲正切激活函数;Wb为LSTM网络中待训练的参数矩阵。

2.3. 卷积神经网络

卷积神经网络(CNN)通过局部连接和权值共享机制,在特征提取方面表现优异。其典型结构包括卷积层、池化层和全连接层。卷积层通过卷积核提取输入数据的局部特征;池化层对特征图进行下采样,在保留主要特征的同时降低数据维度;全连接层整合所有特征并输出最终结果。

2.4. 基于SSA优化的VMD-CNN-LSTM模型

SSA-VMD-CNN-LSTM径流预测模型采用“分解–特征重构–参数优化–预测重构”的闭环技术框架。其核心流程如下:首先,利用变分模态分解(VMD)将非平稳的原始月径流序列自适应地分解为7个具有不同频率特征的本征模态函数(IMFs),分别对应高频噪声、中频季节项和低频趋势项,从而实现数据降噪与降维。随后,将这些模态分量构建为二维特征矩阵,并通过滑动时间窗口转换为适用于深度学习模型的三维输入张量。接着,采用麻雀搜索算法(SSA)对CNN-LSTM模型的关键超参数(包括卷积核参数、LSTM隐藏单元数量和学习率等)进行全局寻优,以验证集的均方根误差(RMSE)作为优化目标,确定最优参数配置并完成模型训练。最后,通过多输出预测得到各模态分量的未来值,并通过线性叠加重构出最终的径流预测序列。

该模型的核心创新在于实现了多技术模块的深度耦合与功能互补:VMD从源头解决了原始序列的非平稳性问题,为建模提供高质量输入;CNN-LSTM融合架构实现了“跨模态特征提取–长时序依赖建模”的协同作用,其中CNN负责捕捉各模态间的潜在关联,LSTM则用于挖掘时间维度上的长期记忆效应,从而突破了单一模型的学习局限;SSA的引入有效解决了深度学习模型超参数选择中的盲目性与组合爆炸问题,相较于传统优化算法,其收敛速度更快、寻优精度更高,显著提升了模型的泛化能力与预测精度。

本模型在理论与实践层面均具备较高的可行性:VMD的模态分离优势与CNN-LSTM的互补性已在复杂时间序列预测领域得到广泛验证,SSA的全局寻优机制也符合参数优化的科学逻辑;在工程应用层面,数据格式仅需简单转换即可适配模型输入,常规硬件环境下即可完成训练与预测任务,具备良好的实用性。尤其对于径流特性较为复杂地区,VMD的降噪能力与SSA的优化机制使模型表现出更强的抗数据稀缺性与抗噪声干扰能力,其高精度的预测结果可为该类地区的水资源调度与管理提供可靠的决策支持。

2.5. 数据评价指标

为评估模型性能,采用纳什效率系数(NSE)、均方根误差(RMSE)以及均方根误差与观测值标准差之比(RSR)作为评价指标。NSE反映模型模拟效果,其值越接近1,表明模型性能越优;RMSE衡量预测值与实测值的偏离程度;RSR表征相对误差水平,其值越小,模型性能越好。

NSE=1 ( E e E o ) 2 ( E e E om ) 2 (8)

RMSE= ( E e E o ) 2 N (9)

RSR= i=1 n ( E o E s ) 2 i=1 n ( E o E om ) 2 (10)

式中:Re为水库月径流估算值;Ro为水库月径流实测值;RomRo的平均值;N为样本数。

3. 研究区及其数据概况

本文以重庆市A水库为研究对象,该水库位于亚热带湿润季风气候区,气候温和,降水充沛,承担下游村镇的防洪任务。流域内山峦起伏,沟壑纵横,主河道穿梭于崇山峻岭中,植被覆盖条件较好,人类活动不频繁。水库坝址集水面积为242 km2,流域内无实测水文气象资料。

A水库的逐月径流序列系通过水文比拟法,结合邻近YJ站的实测数据及面平均降水量修正得到。根据YJ站1970年1月~2020年12月共51年的径流实测径流资料分析,多年平均流量为7.67 m3/s,多年平均径流深为668 mm,径流模数为21.2 L/(s·km2)。径流年际变化较大,最丰水年(1982年)平均流量为14.7 m3/s,最枯水年(2001年)平均流量为2.93 m3/s,最丰水年是最枯水年的5.02倍。YJ站径流年内分配特征如图1所示。本次研究采用1970~2020年共51年的逐月径流数据,其中前36年用于模型率定,后15年用于模型验证。

1. YJ站径流年内分配图

4. 研究结果与分析

4.1. 月径流VMD分解

VMD的分解效果受模态数K、惩罚因子α、保真度系数ι及收敛容差ε等参数影响。ιε通常取默认值,而Kα的设定尤为关键。K值过大会导致模态混叠,K值过小则会造成欠分解;α值与分量的带宽成反比。通过分析不同K值下中心频率的分布,确定A水库月径流的模态数K = 7,α = 1000,ι = 0.3。

与原始单一径流序列(图2)相比,A水库月径流经VMD分解后各序列不仅减少了噪声(图3),而且挖掘出原

2. A水库流量序列

3. A水库月径流VMD分量

径流序列隐藏的周期、趋势等的变化趋势,同时增加了数据量,有利于模型更好识别径流序列的复杂变化规律,提高预测精度。

4.2. 模型效果评价

为验证本文所提方法的有效性,对比了LSTM、CNN-LSTM、VMD-CNN-LSTM和SSA-VMD-CNN-LSTM四种模型的预测性能,结果如图4所示。

(a) 月径流实测与预测变化过程

(b) 月径流实测与预测散点图

4. 月径流预测值与实测值对比

图4可知,与单一LSTM模型相比,CNN-LSTM组合模型的预测精度有所提升,表明CNN在特征提取方面具有优势。进一步将VMD分解后的模态分量输入优化后的组合模型,VMD-CNN-LSTM与SSA-VMD-CNN-LSTM模型的预测结果均优于未分解模型。各模态预测结果的叠加有效改善了原始序列波峰与波谷的预测误差,说明VMD能够有效处理径流序列的非平稳性与随机性,通过构建相对平稳的子序列提升预测性能。此外,SSA算法通过自动寻优确定最佳超参数组合,减少了人工调参的不确定性,进一步提升了模型的预测能力。

为进一步对SSA-VMD-LSTM-CNN组合模型的有效性进行定量评估。本文选取NSE、RMSE、RSR三种评价指标对LSTM的相关模型预测结果进行对比(见表1),与LSTM-CNN模型相比,VMD分解能显著降低LSTM-CNN模型的预测误差,VMD-LSTM-CNN在率定期、验证期和整个时期的NSE为0.94、0.95和0.94,误差指标降低幅度分别为66.67%、75.87%和69.23%左右。同样相比于LSTM-CNN模型,SSA-VMD-LSTM-CNN模型在率定期、整个时期的NSE均为0.94,误差指标降低幅度分别为66.38%、69.54%左右。由此可见,变分模态分解后的VMD-LSTM-CNN模型在预测精度上明显提高,优化后的SSA-VMD-LSTM-CNN模型的整体预测精度最高。表明本文提出的SSA-VMD-LSTM-CNN模型在处理水库径流非平稳数据较多的情况下,利用变分模态分解径流序列,可以学习序列中隐藏变化趋势,同时利用SSA优化算法设置最佳超参数,其预测精度较其余模型有所提升。

1. A水库月径流模型预测精度评估表

模型

率定期

检验期

整个时期

NSE

RMSE

RSR

NSE

RMSE

RSR

NSE

RMSE

RSR

LSTM

0.30

6.95

0.84

0.26

6.61

0.86

0.29

6.85

0.84

LSTM-CNN

0.43

6.23

0.75

0.25

6.68

0.87

0.38

6.37

0.78

VMD-LSTM-CNN

0.94

2.09

0.25

0.95

1.64

0.21

0.94

1.97

0.24

SSA-VMD-LSTM-CNN

0.94

1.97

0.24

0.94

1.87

0.24

0.94

1.94

0.24

5. 结论

针对A水库月径流序列随机性强、平稳性低及非线性特征显著的问题,本文构建了SSA-VMD-CNN-LSTM组合预测模型,并通过实例验证了其有效性。主要结论如下:

1) 本次构建的SSA-VMD-CNN-LSTM模型通过信号处理(SSA, VMD)和深度学习(CNN, LSTM)的结合,实现了对非线性、非平稳及高噪声的时间序列更深层次、更鲁棒、更精确的建模,其中VMD能够将原始径流序列分解为多个相对平稳的子模态,有效降低了序列的复杂度;CNN模型可深入挖掘前期数据的变化特征,并将提取的信息作为LSTM的输入,从而实现径流序列的精准预测;进一步结合SSA算法优化模型超参数,可提升预测精度。

2) 相较于单一LSTM模型,基于VMD的深度学习组合模型显著提高了预测精度,尤其在波峰与波谷的预测中误差大幅降低,NSE提升幅度达0.51,RMSE降低约70%。该模型可为A水库的中长期调度与水资源的科学管理提供技术支撑。

NOTES

作者简介:王含,出生于1992年12月,江苏灌南县人,硕士研究生,工程师,研究方向:水文与水资源,Email: 2277010435@qq.com

参考文献

[1] 胡庆芳, 曹士圯, 杨辉斌, 等. 汉江流域安康站日径流预测的LSTM模型初步研究[J]. 地理科学进展, 2020, 39(4): 636-642.
[2] 田烨, 谭伟丽, 王国庆, 等. LSTM变体模型在径流预测中的性能及其可解释性[J]. 水资源保护, 2023, 39(3): 188-194.
[3] 王佳, 王旭, 王浩, 等. 基于EEMD与ANN混合方法的水库月径流预测[J]. 人民黄河, 2019, 41(5): 43-46.
[4] 傅新忠, 冯利华, 陈闻晨. ARIMA与ANN组合预测模型在中长期径流预报中的应用[J]. 水资源与水工程学报, 2009, 20(5): 105-109.
[5] 杨易华, 罗伟伟. 基于KPCA-PSO-SVM的径流预测研究[J]. 人民长江, 2017, 48(3): 44-47.
[6] 胡作龙, 高鹏. 基于EEMD-SVM模型的北洛河上游径流预测[J]. 水土保持研究, 2023, 30(4): 98-102+109.
[7] 蔡文静, 陈伏龙, 何朝飞, 等. 基于时频分析的LSTM组合模型径流预测[J]. 干旱区地理, 2021, 44(6): 1696-1706.
[8] 李辉, 练继建, 王秀杰. 基于小波分解的日径流逐步回归预测模型[J]. 水利学报, 2008, 39(12): 1334-1339.
[9] 周婷, 夏萍, 胡宏祥, 等. 基于小波分解的优化支持向量机模型在水库年径流预测中的应用[J]. 华北水利水电大学学报(自然科学版), 2018, 39(3): 24-30.
[10] 葛朝霞, 顾月红, 曹丽青. 基于小波分解的逐月入库径流量预报方案的建立[C]//中国自然资源学会水资源专业委员会, 中国地理学会水文地理专业委员会, 中国水利学会水文专业委员会, 中国水利学会水资源专业委员会, 中国可持续发展研究会水问题专业委员会. 环境变化与水安全——第五届中国水论坛论文集. 北京: 中国水利水电出版社, 2007: 145-148.
[11] 胡顺强, 崔东文. 基于EMD-LSTM-ANFIS模型的年径流预测研究[J]. 人民珠江, 2021, 42(3): 46-52.
[12] 朱非林, 侯添甜, 梁一帆, 等. 基于VMD-LSTM的水库中长期径流预测模型[J]. 水力发电, 2023, 49(9): 16-22.
[13] 张子华, 李琰, 徐天奇, 等. 基于VMD-CNN-LSTM的短期风电功率预测研究[J]. 云南民族大学学报(自然科学版), 2023, 32(3): 359-365.
[14] 杨胡萍, 余阳, 汪超, 等. 基于VMD-CNN-BIGRU的电力系统短期负荷预测[J]. 中国电力, 2022, 55(10): 71-76.
[15] 吕晗芳, 赵雪花, 桑宇婷, 等. 基于VMD-LSSVM的月径流预测方法研究[J]. 中国农村水利水电, 2020(8): 166-170+176.