1. 引言
月径流预测是水库中长期调度与水资源管理的基础,对于流域水资源规划、防洪抗旱及水库优化调度具有至关重要的现实意义。径流序列兼具趋势、季节与随机成分,单一模型难以同时刻画其非平稳、非线性及多尺度特征,导致峰值与低水段预测误差偏大。
传统的中长期径流预测多采用时间序列统计模型。随着计算机技术的发展,基于数据驱动的非线性智能算法逐渐成为研究热点,例如长短期记忆神经网络(LSTM) [1] [2]、人工神经网络(ANN) [3] [4]和支持向量机模型(SVM) [5] [6]等。其中,LSTM因其能够有效捕捉时间序列中的长期依赖关系,在处理径流序列的自相关性方面表现出显著优势,已被广泛应用于径流预测研究[7]。
径流过程具有非线性、非平稳及高噪声的特性,单一模型往往难以充分刻画其复杂的非线性特征,从而限制了预测精度的进一步提升。因此,揭示径流序列的时变规律是提升预测精度的关键前提。结合信号处理技术,通过模态分解与重构方法挖掘径流序列的内在特征,已成为一种有效途径。常用方法包括小波分解(WD)、经验模态分解(EMD)和变分模态分解(VMD)等,已有诸多研究验证了这些方法的有效性[8] [9]。例如,葛朝霞等[10]将小波分解与BP神经网络结合,实现了洪家渡水电站入库径流的预测;胡顺强等[11]构建了EMD-LSTM模型,对云南省龙潭站的年径流过程进行了预测;朱非林等[12]耦合VMD与LSTM,构建了适用于中长期径流预测的VMD-LSTM模型。相较于其他分解方法,VMD能够有效抑制端点发散和模态混叠现象,并具备较强的噪声鲁棒性。
尽管上述模型在径流预测中已展现出良好的适用性,但大多未充分考虑不同输入属性下子模态分量之间的相关性。卷积神经网络(CNN)具有强大的特征提取能力,将其与LSTM结合,有望更全面地捕捉径流序列的时空特征。然而,组合模型通常对超参数设置更为敏感。为此,本文引入麻雀搜索算法(SSA),构建了SSA-VMD-CNN-LSTM组合预测模型,旨在提升水库中长期径流的预测精度。
2. 研究方法
2.1. 变分模态分解
变分模态分解(VMD)是一种自适应信号处理方法,通过构造并求解约束变分问题,将原始信号f分解为K个具有稀疏特性的本征模态函数(IMF)
(
)。该方法能有效克服模态混叠与端点效应,分解后的各子模态分量噪声鲁棒性更好,物理意义明确[13] [14]。VMD的约束变分问题可表述为:
(1)
其中
为子模态函数集;
为子模态的中心频率集;
是卷积运算;K是原始序列分解的子模态分量数目;
为各子模态与中心频率的函数关系。
2.2. 长短时记忆神经网络
长短时记忆神经网络(LSTM)是循环神经网络(RNN)的改进模型,通过引入门控机制(遗忘门、输入门、输出门)和记忆单元,有效解决了RNN的梯度消失或爆炸问题,适用于处理具有长期依赖关系的径流序列[15]。LSTM单元在t时刻的状态更新公式如下:
(2)
(3)
(4)
(5)
(6)
(7)
式中:ht、xt分别为t时刻隐含层与输入层的输入向量;ft、it、ot分别表示遗忘门、输入门和输出门的状态;ct为记忆单元状态;
为候选记忆向量;
和tanh分别为sigmoid和双曲正切激活函数;W和b为LSTM网络中待训练的参数矩阵。
2.3. 卷积神经网络
卷积神经网络(CNN)通过局部连接和权值共享机制,在特征提取方面表现优异。其典型结构包括卷积层、池化层和全连接层。卷积层通过卷积核提取输入数据的局部特征;池化层对特征图进行下采样,在保留主要特征的同时降低数据维度;全连接层整合所有特征并输出最终结果。
2.4. 基于SSA优化的VMD-CNN-LSTM模型
SSA-VMD-CNN-LSTM径流预测模型采用“分解–特征重构–参数优化–预测重构”的闭环技术框架。其核心流程如下:首先,利用变分模态分解(VMD)将非平稳的原始月径流序列自适应地分解为7个具有不同频率特征的本征模态函数(IMFs),分别对应高频噪声、中频季节项和低频趋势项,从而实现数据降噪与降维。随后,将这些模态分量构建为二维特征矩阵,并通过滑动时间窗口转换为适用于深度学习模型的三维输入张量。接着,采用麻雀搜索算法(SSA)对CNN-LSTM模型的关键超参数(包括卷积核参数、LSTM隐藏单元数量和学习率等)进行全局寻优,以验证集的均方根误差(RMSE)作为优化目标,确定最优参数配置并完成模型训练。最后,通过多输出预测得到各模态分量的未来值,并通过线性叠加重构出最终的径流预测序列。
该模型的核心创新在于实现了多技术模块的深度耦合与功能互补:VMD从源头解决了原始序列的非平稳性问题,为建模提供高质量输入;CNN-LSTM融合架构实现了“跨模态特征提取–长时序依赖建模”的协同作用,其中CNN负责捕捉各模态间的潜在关联,LSTM则用于挖掘时间维度上的长期记忆效应,从而突破了单一模型的学习局限;SSA的引入有效解决了深度学习模型超参数选择中的盲目性与组合爆炸问题,相较于传统优化算法,其收敛速度更快、寻优精度更高,显著提升了模型的泛化能力与预测精度。
本模型在理论与实践层面均具备较高的可行性:VMD的模态分离优势与CNN-LSTM的互补性已在复杂时间序列预测领域得到广泛验证,SSA的全局寻优机制也符合参数优化的科学逻辑;在工程应用层面,数据格式仅需简单转换即可适配模型输入,常规硬件环境下即可完成训练与预测任务,具备良好的实用性。尤其对于径流特性较为复杂地区,VMD的降噪能力与SSA的优化机制使模型表现出更强的抗数据稀缺性与抗噪声干扰能力,其高精度的预测结果可为该类地区的水资源调度与管理提供可靠的决策支持。
2.5. 数据评价指标
为评估模型性能,采用纳什效率系数(NSE)、均方根误差(RMSE)以及均方根误差与观测值标准差之比(RSR)作为评价指标。NSE反映模型模拟效果,其值越接近1,表明模型性能越优;RMSE衡量预测值与实测值的偏离程度;RSR表征相对误差水平,其值越小,模型性能越好。
(8)
(9)
(10)
式中:Re为水库月径流估算值;Ro为水库月径流实测值;Rom为Ro的平均值;N为样本数。
3. 研究区及其数据概况
本文以重庆市A水库为研究对象,该水库位于亚热带湿润季风气候区,气候温和,降水充沛,承担下游村镇的防洪任务。流域内山峦起伏,沟壑纵横,主河道穿梭于崇山峻岭中,植被覆盖条件较好,人类活动不频繁。水库坝址集水面积为242 km2,流域内无实测水文气象资料。
A水库的逐月径流序列系通过水文比拟法,结合邻近YJ站的实测数据及面平均降水量修正得到。根据YJ站1970年1月~2020年12月共51年的径流实测径流资料分析,多年平均流量为7.67 m3/s,多年平均径流深为668 mm,径流模数为21.2 L/(s·km2)。径流年际变化较大,最丰水年(1982年)平均流量为14.7 m3/s,最枯水年(2001年)平均流量为2.93 m3/s,最丰水年是最枯水年的5.02倍。YJ站径流年内分配特征如图1所示。本次研究采用1970~2020年共51年的逐月径流数据,其中前36年用于模型率定,后15年用于模型验证。
图1. YJ站径流年内分配图
4. 研究结果与分析
4.1. 月径流VMD分解
VMD的分解效果受模态数K、惩罚因子α、保真度系数ι及收敛容差ε等参数影响。ι与ε通常取默认值,而K与α的设定尤为关键。K值过大会导致模态混叠,K值过小则会造成欠分解;α值与分量的带宽成反比。通过分析不同K值下中心频率的分布,确定A水库月径流的模态数K = 7,α = 1000,ι = 0.3。
与原始单一径流序列(图2)相比,A水库月径流经VMD分解后各序列不仅减少了噪声(图3),而且挖掘出原
图2. A水库流量序列
图3. A水库月径流VMD分量
径流序列隐藏的周期、趋势等的变化趋势,同时增加了数据量,有利于模型更好识别径流序列的复杂变化规律,提高预测精度。
4.2. 模型效果评价
为验证本文所提方法的有效性,对比了LSTM、CNN-LSTM、VMD-CNN-LSTM和SSA-VMD-CNN-LSTM四种模型的预测性能,结果如图4所示。
(a) 月径流实测与预测变化过程
(b) 月径流实测与预测散点图
图4. 月径流预测值与实测值对比
由图4可知,与单一LSTM模型相比,CNN-LSTM组合模型的预测精度有所提升,表明CNN在特征提取方面具有优势。进一步将VMD分解后的模态分量输入优化后的组合模型,VMD-CNN-LSTM与SSA-VMD-CNN-LSTM模型的预测结果均优于未分解模型。各模态预测结果的叠加有效改善了原始序列波峰与波谷的预测误差,说明VMD能够有效处理径流序列的非平稳性与随机性,通过构建相对平稳的子序列提升预测性能。此外,SSA算法通过自动寻优确定最佳超参数组合,减少了人工调参的不确定性,进一步提升了模型的预测能力。
为进一步对SSA-VMD-LSTM-CNN组合模型的有效性进行定量评估。本文选取NSE、RMSE、RSR三种评价指标对LSTM的相关模型预测结果进行对比(见表1),与LSTM-CNN模型相比,VMD分解能显著降低LSTM-CNN模型的预测误差,VMD-LSTM-CNN在率定期、验证期和整个时期的NSE为0.94、0.95和0.94,误差指标降低幅度分别为66.67%、75.87%和69.23%左右。同样相比于LSTM-CNN模型,SSA-VMD-LSTM-CNN模型在率定期、整个时期的NSE均为0.94,误差指标降低幅度分别为66.38%、69.54%左右。由此可见,变分模态分解后的VMD-LSTM-CNN模型在预测精度上明显提高,优化后的SSA-VMD-LSTM-CNN模型的整体预测精度最高。表明本文提出的SSA-VMD-LSTM-CNN模型在处理水库径流非平稳数据较多的情况下,利用变分模态分解径流序列,可以学习序列中隐藏变化趋势,同时利用SSA优化算法设置最佳超参数,其预测精度较其余模型有所提升。
表1. A水库月径流模型预测精度评估表
模型 |
率定期 |
检验期 |
整个时期 |
NSE |
RMSE |
RSR |
NSE |
RMSE |
RSR |
NSE |
RMSE |
RSR |
LSTM |
0.30 |
6.95 |
0.84 |
0.26 |
6.61 |
0.86 |
0.29 |
6.85 |
0.84 |
LSTM-CNN |
0.43 |
6.23 |
0.75 |
0.25 |
6.68 |
0.87 |
0.38 |
6.37 |
0.78 |
VMD-LSTM-CNN |
0.94 |
2.09 |
0.25 |
0.95 |
1.64 |
0.21 |
0.94 |
1.97 |
0.24 |
SSA-VMD-LSTM-CNN |
0.94 |
1.97 |
0.24 |
0.94 |
1.87 |
0.24 |
0.94 |
1.94 |
0.24 |
5. 结论
针对A水库月径流序列随机性强、平稳性低及非线性特征显著的问题,本文构建了SSA-VMD-CNN-LSTM组合预测模型,并通过实例验证了其有效性。主要结论如下:
1) 本次构建的SSA-VMD-CNN-LSTM模型通过信号处理(SSA, VMD)和深度学习(CNN, LSTM)的结合,实现了对非线性、非平稳及高噪声的时间序列更深层次、更鲁棒、更精确的建模,其中VMD能够将原始径流序列分解为多个相对平稳的子模态,有效降低了序列的复杂度;CNN模型可深入挖掘前期数据的变化特征,并将提取的信息作为LSTM的输入,从而实现径流序列的精准预测;进一步结合SSA算法优化模型超参数,可提升预测精度。
2) 相较于单一LSTM模型,基于VMD的深度学习组合模型显著提高了预测精度,尤其在波峰与波谷的预测中误差大幅降低,NSE提升幅度达0.51,RMSE降低约70%。该模型可为A水库的中长期调度与水资源的科学管理提供技术支撑。
NOTES
作者简介:王含,出生于1992年12月,江苏灌南县人,硕士研究生,工程师,研究方向:水文与水资源,Email: 2277010435@qq.com