1. 引言
湄公河作为东南亚最大的跨境河流,其流域覆盖中国、缅甸、老挝、泰国、柬埔寨和越南六国,支撑着区域粮食安全与生态系统平衡[1]。湄公河作为亚洲最重要的跨国水系之一,不仅承载着流域内6500万人口的生计与粮食安全,同时更是研究全球气候变化背景下“水–能源–粮食”纽带关系的典型缩影[2]。自20世纪20年代系统性水文观测以来,湄公河流域历经殖民经济开发、热带雨林砍伐、跨国水电开发等历史经历,受到过多重扰动,其流量序列呈现出显著的非稳态特征[3]。近百年来,气候变化与人类活动的双重压力导致水文极端事件频发。2015年,湄公河下游三角洲遭遇百年一遇干旱,经济和生态遭到破坏,引发国际社会对流域可持续管理的深度关注。
当前研究多聚焦于1990年后水利工程密集建设期的水文变化[4],但对自然基准态下的河流行为缺乏系统认知。这一知识空缺导致两个关键问题:(1) 难以量化自然气候振荡与人类干预(如水坝建设)的贡献比例;(2) 历史极端事件(如1925年大旱)的形成机制仍存争议,限制了现代预警系统的构建。法国地理学家Garnier 1932年的观测记录指出,尽管殖民时期流域森林覆盖率显著下降,部分水文站旱季流量却出现反常上升[5],传统水文模型,如SCS-CN模型[5]、马斯京根法[6],是基于线性假设与参数敏感性,在处理此类非线性、非高斯过程时表现出显著局限性,这是传统水文模型无法解释的理论盲区。
在此背景下,构建一种流量预测框架成为破解湄公河水文波动规律的关键突破口。在选择数据时,应注重自然环境下的选取,即人类对河流的干扰尽量降低,需要保证数据具有:(1) 监测连续性;(2) 自然主导性;(3) 地缘政治完整性的特点。因此,本研究选取具备独特时空代表性的1924~1987年湄公河流域逐月流量数据。
针对多时间尺度耦合的流量变异特性,本研究引入集合经验模态分解[7] (EEMD),将原始序列解耦为从季节波动到年代际趋势的8个本征模态函数(IMF)。这一处理突破传统统计模型对固定周期的依赖,用于分离ENSO事件(2~7年周期)与太阳活动(~11年周期)的差异化驱动信号。结合Transformer的全局注意力机制与GRU的门控时序记忆,构建跨尺度水文动力学解析框架,旨在揭示自然状态下流域系统对气候强迫的响应路径。
通过重建20世纪湄公河流域的自然基准态,本研究可以为以下几个方面提供理论参考:
(1) 极端旱涝事件归因的参照基线,可以为气候自然变异或者人类工程的造成影响进行对照参考;
(2) 验证气候模式对历史事件的再现能力,改进未来情景预估的可信度;
(3) 支撑水资源公平分配谈判,促进区域可持续发展[8]。
2. 研究方法
2.1. 数据来源与预处理
本研究采用湄公河1924~1987年逐月流量数据(单位:m3/s),本研究使用了来自SAGE (Surface Water Hydrology Group at the University of Wisconsin-Madison)维护的Global River Discharge Database的数据[9],数据集涵盖了选定流域多年间的逐日河流流量记录,这些数据对于分析特定区域水文特征、验证模型预测准确性具有重要意义。由于数据部分有缺失,考虑到湄公河流域发展中国家地区在计算资源和数据基础设施方面的限制,需要一种能够有效减少对高性能计算设备依赖的数据处理方法,相比于复杂的机器学习和深度学习算法,线性插值方法因其高效且易于计算,显著减少了对高性能设备的依赖,因此本研究采用线性插值方法对缺失的河流流量数据进行预处理。
2.2. EEMD分解
为增强流量序列的可预测性,采用改进的集合经验模态分解(EEMD)算法对处理后的流量数据进行多尺度分解。EEMD通过添加高斯白噪声和多次分解的平均,有效解决了传统经验模态分解(EMD)的端点效应问题。
EEMD首先在原始河流流量数据
上添加一系列不同实现的白噪声
,生成一个新的河流流量序列
。经过这样处理的数据有助于减少模式混叠现象,并且通过多次平均处理稳定了结果。其中,
表示第
次为河流流量数据进行加噪。
对每一个加噪后的信号
使用标准的EMD分解,将其分解为若干个本征模态函数(
)和一个残余项。
由于每次加入的白噪声都不同,因此对于每一个
都有多种情况。通过对所有加噪信号的
求平均,获得最终的
集合,从而有效地减少了模式混叠并提高了分解结果的一致性。
式中,
,表示第
个
分量的最终结果,
是加噪次数,
是第
次加噪后得到的第
个
。
2.3. Transformer
在Transformer中,模型利用自注意力机制通过计算不同时间的流量值之间的相关性权重,捕捉长期依赖关系,模型通过正弦函数注入时间序列的周期性特征[10]。
其中,
为模型维度,
为时间步位置。该公式可量化建流量的周期性变化。
2.4. GRU
GRU利用门控机制进行工作,通过重置门和更新门控制历史信息的传递,有效过滤噪声并保留关键短期波动。其状态更新方程如下:
在河流流量研究中,
代表隐状态,它能捕捉当前时刻河流流量的特征信息。通过这一状态,模型能够灵活且动态地应对河流流量的剧烈变化,比如洪水暴发或干旱出现时流量的突变情况。
2.5. 模型训练与验证
将模型划分为80%训练集,10%验证集,10%测试集。并使用决定系数(R2)和均方根误差(RMSE)指标评估水文预测模型的精度。R2衡量模型对流量变化的解释能力,RMSE量化预测值与实测,Transformer-GRU模型架构见图1。
3. 结果与讨论
3.1. EEMD分解
将1924~1987年原始河流流量数据(单位:m3/s)进行EEMD分解得到8个IMF序列和1个残差项,共同构成了流量序列的多时间尺度表达体系。图2展示了该流域水文过程的多元尺度特征。
IMF1~IMF2代表了流量变动的高频分量,具有低烈度但高频次的特征,反映了极端天气事件的瞬时冲击特征。变动均以月与季为单位。根据频谱图,其1937年出现的峰值8500 m3/s与历史记录的特大洪水事件完全吻合。iMF2的周期约6~12个月的震荡与热带气旋活动密切相关。
IMF3~IMF5的振荡周期以年为单位(2~8年),展示了河水流量变化的年度、多年水文循环规律。IMF3的相位突变与ENSO冷暖位相转换存在一定关系,印证了全球变暖背景下海洋–大气耦合系统的稳定性变化。IMF4前期稳定而后期波动的震荡形态,展示了在1950~1970年,东南亚受国际局势影响而大规模毁林开荒导致的水源涵养能力下降直接相关。
Figure 1. Architecture of the Transformer-GRU model
图1. Transformer-GRU模型架构
IMF6-IMF8长达10~30年的长周期波动展示了自然环境下年代际气候振荡特征。IMF6的准12年周期与太平洋年代际振荡(PDO)的正负相位交替同步变换。三组分量的缓慢变化直接导致了1978~1982年湄公河下游持续三年的丰水期。IMF8呈现的持续上升趋势,而在70年代后迅速下降,与湄公河流域梯级水坝建设有密切的关系,在这一阶段,人类可以有能力影响长周期序列的水流量,暗示了区域气候模式从ENSO主导演变为人类活动主导的转折。长周期波动的变化标志着人类活动对自然气候主导权的转折,为区分自然变异与人为干预提供了关键判据。
残差项的持续降低的趋势则警示需建立人类活动影响的水文效应分离算法。残差项的持续下降趋势进一步警示人类工程对长周期水文过程具有的叠加效应。
3.2. Transformer-GRU模型训练结果
将EEMD分解后的数据输入进Transformer-GRU混合框架中对数据进行学习,将数据分为80%训练集,10%验证集,10%测试集。结果显示,模型在湄公河1924~1987年逐月流量预测任务中展现出优异的泛化能力,预测结果均呈现高度一致性,三组数据的决定系数R2均超过0.9,其中测试集的R2达到0.95,如图3,表明模型对长周期水文序列的复杂波动具有显著解析能力;训练集的回归方程斜率为0.933,表明模型可以捕捉真实世界物理意义,这与湄公河流域季风–人类活动耦合作用的典型特征吻合,模型既学习到了短时高频洪水波动又注意到了河流流量变化的长期趋势规律。验证集的斜率略微升高至1.13,如图4,虽导致R2小幅下降,但其误差波动范围仍处于可接受的范围内。这种偏差可能源于验证集中数据缺失而使用插值法导致的扰动有关。测试集的回归线斜率与截距在三者中表现最好,如图5。其R2值较训练集提升0.011,反映出模型在独立数据上的预测鲁棒性,尤其是测试集的数据均在1980年代后,此时由于经济发展,人类活动主导的流量变异对模型的干扰增强,但模型仍然对于这部分数据保持了较高的性能,如图6。
3.3. 对比实验
为探究不同模型在湄公河流量预测任务中的性能差异,对常见的五种模型进行了性能对比试验,如图7。结果显示,本文所提出的EEMD-Transformer-GRU模型在所有评价指标上均展现出显著优势。RMSE (均方根误差)和MAE (平均绝对误差)这两个核心误差指标中,EEMD-Transformer-GRU分别以2239.8 m3/s和1638 m3/s的数值优于其他模型,较次优模型Transformer-GRU分别降低了4.4%和0.03%。尤其在MAPE (平均绝对百分比误差)指标上,其0.326%的误差率较第二低的Transformer-GRU进一步优化了性能,体现了模型对流量变化的高精度拟合能力。此外,决定系数R2达到0.953,显著高于单LSTM的0.887、BP神经网络的0.829和GRU的0.863,表明该模型能够解释超过95%的流量变化方差,展现出超过其他模型的全局拟合能力。
Figure 2. EEMD decomposition
图2. EEMD分解
Figure 3. Density plot of observed vs. predicted values in the training set
图3. 训练集真实值与预测值密度图
Figure 4. Density plot of observed versus predicted values in the validation set
图4. 验证集真实值与预测值密度图
Figure 5. Density plot of observed versus predicted values in the test set
图5. 测试集真实值与预测值密度图
Figure 6. Line plot of observed versus predicted values
图6. 真实值与预测值折线图
Figure 7. Performance metrics comparison of five models
图7. 五种模型各项性能指标对比
EEMD-Transformer-GRU模型通过结合经验模态分解(EEMD)与Transformer-GRU耦合的深度学习架构,有效捕捉了河流流量数据的多尺度特征。在这一过程中,EEMD的预处理步骤,将原始流量信号分解为高频洪水脉冲与低频趋势成分,显著降低了数据的非平稳性。Transformer-GRU耦合机制则通过自注意力机制与长短期记忆能力,实现了对复杂时空依赖关系的精准建模。相较于传统单GRU (RMSE = 2580.3 m3/s)和BP神经网络(RMSE = 2721.6 m3/s),该模型在误差指标上分别降低了13.2%和17.7%,验证了混合架构在处理非线性水文过程中的有效性。与Transformer-GRU的模型相比,EEMD的引入进一步提升了模型对极端事件(如洪水脉冲)的敏感性,使R2指标提升了2.2个百分点,凸显了多尺度分解对模型的增强作用。
3.4. 模型的适用性
在河流流量预测任务中,针对老挝、越南等发展中国家水文监测站点硬件条件受限的现实问题,对五种模型所需要的硬件条件进行了测试,测试结果见表1。根据测试结果,本研究提出的EEMD-Transformer-GRU模型,在测试中显示出其轻量化且计算高效的优点。该模型通过经验模态分解(EEMD)与Transformer-GRU深度学习架构的结合,在保持高预测精度的同时,显著降低了对硬件资源的依赖。在训练阶段的内存占用较Transformer-GRU降低38.2%,主要得益于EEMD预分解减少序列维度。实验数据显示,相较于传统Transformer-GRU模型,EEMD-Transformer-GRU在推理阶段仅需600 MB内存,较其减少对内存的需求量超50%,且浮点运算量(FLOPs)由4.8 GFLOPs降至2.2 GFLOPs,使其能够稳定运行在处理器为i5-4200U且内存仅2GB无显卡的低端设备上,扩展了该模型的应用范围,而同类复杂模型如Transformer-GRU、LSTM在相同硬件上常因内存溢出或计算延迟过高而无法部署。研究提出的模型不仅解决了发展中国家水文站硬件条件薄弱的痛点,还通过参数量控制8.3 M和推理耗时优化1.2 ms/sample实现了预测精度与资源消耗的平衡,为实时监测场景提供了可靠的技术支撑。
Table 1. Comparison of computational resources required by five models
表1. 五种模型所需要的计算资源对比
模型类型 |
训练内存占用(GB) |
推理内存(MB) |
推理耗时(ms/sample) |
参数量(M) |
FLOPs (GFLOPs) |
单GRU |
2.1 |
600 |
0.45 |
1.2 |
0.3 |
Transformer-GRU |
6.8 |
1300 |
2.1 |
15.6 |
4.8 |
BP神经网络 |
3.5 |
600 |
1.8 |
0.8 |
0.6 |
单LSTM |
2.4 |
800 |
0.67 |
1.8 |
0.5 |
EEMD-Transformer-GRU |
4.2 |
600 |
1.2 |
8.3 |
2.2 |
在实际应用中,EEMD-Transformer-GRU体现在其对非平稳水文数据的适应性与部署灵活性,具有较高的工程价值。模型通过EEMD模块对原始流量信号进行多尺度分解,有效降低了数据的非平稳性,从而提升了对极端水文事件如突发洪水的预测能力。利用I7-13620H的处理器训练数据表明,其训练阶段需4.2 GB内存,但训练完成后的推理模型可在低端设备上实现稳定运行,这一特点特别适用于湄公河流域国家的中小型水文站。相较于BP神经网络或传统GRU模型的参数量不足导致泛化能力受限,该模型在保证预测精度的同时,通过计算复杂度的优化,让发展中国家无需升级硬件即可实现流量预测的自动化,显著降低了更新设备的成本。同时该模型在训练阶段需要的计算量也较小,因此可以将训练过程部署在云端,利用实时更新的数据对模型进行训练后即可部署在各个水文监测站。这种“云端训练–终端轻量化部署”的模式,为资源有限地区的水文监测提供了可持续的技术路径。
4. 结论
本研究通过构建EEMD-Transformer-GRU混合模型,解析了湄公河1924~1987年逐月流量序列的多尺度耦合特征,为流域水文研究提供了新的分析框架。研究表明,湄公河流域流量序列的复杂性源于自然气候振荡与人类活动的多尺度耦合作用:高频分量(IMF1~2)精准捕捉了特大洪水和干旱的波动,揭示了极端水文事件的物理触发机制;中频分量(IMF3~5)通过解析ENSO事件与季风相位的相位锁定关系,量化了气候自然振荡对洪枯转换的贡献率,为区分自然变异与人为干扰提供了关键判据;低频分量(IMF6~8)则分离出1970年后人类活动主导的流量变异,建立了自然气候变异与人为干预的贡献分离模型。这一多尺度解析框架突破了传统统计模型对固定周期的依赖,为极端旱涝事件的归因研究提供了可量化的科学基线。在应用层面,模型的轻量化设计与高精度预测能力为湄公河流域治理提供了双重支撑,为解决发展中国家基层水文站硬件条件受限的技术瓶颈提供了方法。