基于CNN-BiLSTM的广西月降水量预测模型研究
Research on Monthly Precipitation Prediction Model of Guangxi Based on CNN-BiLSTM
DOI: 10.12677/mos.2024.136600, PDF, HTML, XML,    国家自然科学基金支持
作者: 李铁金, 施业琼*:广西科技大学,理学院,广西 柳州;张 星:广西科技师范学院,人工智能学院,广西 来宾;李文新:广西科技师范学院,智慧农业学院,广西 来宾
关键词: 卷积神经网络双向长短期记忆网络线性回归月降水量预测Convolutional Neural Network Bi-Directional Long-Short-Term Memory Network Linear Regression Monthly Precipitation Prediction
摘要: 深入研究短期气候预测新技术,提高月降水的预测准确率对国民经济健康发展具有重要意义。针对卷积神经网络(Convolutional Neural Networks, CNN)在降水预报中难以有效提取数据时序特征,而长短期记忆网络(Long-Short-Term Memory, LSTM)难以提取数据空间特征的问题,本文建立卷积神经网络和双向长短期记忆网络组合月降水模型(CNN-BiLSTM),该模型充分结合CNN提取月降水数据在空间结构上的特征,以及BiLSTM提取月降水数据时序特征的优势,从而实现对月降水数据空间特征的提取,以及非线性长期和短期时间序列依赖关系的有效动态建模。以广西柳州月降水进行实例验证,实验结果表明,CNN-BiLSTM模型可同时有效提取数据空间特征和时序特征,预测精度高,泛化性能高,稳定性好,为降水预报提供了一种可靠、有效的方法。
Abstract: It is of great significance for the healthy development of the national economy to conduct in-depth research on the new technology of short-term climate prediction and to enhance the accuracy of monthly precipitation prediction. This paper addresses the challenge of effectively extracting temporal and spatial features of precipitation data using Convolutional Neural Networks (CNNs) and Long-Short-Term Memory (LSTM) networks, respectively. To this end, a CNN and a Bidirectional Long-Short-Term Memory Network (Bi-LSTM) are established. This paper establishes a Convolutional Neural Network (CNN) and a Bidirectional Long-Short-Term Memory Network (Bi-LSTM), which fully combine the advantages of CNN in extracting spatial features of monthly precipitation data and Bi-LSTM in extracting temporal features of monthly precipitation data. This enables the extraction of spatial features of monthly precipitation data and effective dynamic modeling of the dependence of nonlinear long-term and short-term time series. To illustrate the efficacy of the proposed methodology, we conducted a case study on monthly precipitation data from Liuzhou, Guangxi. The experimental results demonstrated that the CNN-Bi-LSTM model is capable of extracting both spatial and temporal features with high precision, accuracy, and stability. This suggests that the proposed approach can serve as a reliable and effective tool for precipitation forecasting.
文章引用:李铁金, 施业琼, 张星, 李文新. 基于CNN-BiLSTM的广西月降水量预测模型研究[J]. 建模与仿真, 2024, 13(6): 6584-6601. https://doi.org/10.12677/mos.2024.136600

1. 引言

降水是水资源补给的主要来源,也是水循环的重要组成部分。广西是我国大陆东南部的季风活动中心地区,受来自太平洋夏季风和印度洋西南季风的影响,许多天气系统十分活跃[1]。柳江流域进入汛期后,雨季持续时间长、强度大、降水集中,汛期降水量约占全年降水量的67%~87%,有时甚至几十个站同时下暴雨,造成严重的洪涝灾害,这给农业、工业、人们生命财产和正常生活带来不同程度的影响[2]。因此,深入研究短期气候预测新技术,不断探索短期气候预测技术,成为热点研究课题,进一步做好汛期降水趋势预测、提高汛期降水的预测准确率仍是一个巨大的挑战,增强对广西气候灾害监测预测能力,对于防灾减灾、推动我国的经济快速健康发展,促进社会经济的可持续发展具有重要意义[3]

月降水量是最有影响力的气象参数,其预测建模通常依赖于传统的参数回归技术来建立模型评估月降水量。通过分析地理坐标(如纬度和经度)与其他气象特征(如气温、气压、风和湿度)之间的相关性,构建多元回归模型、广义线性模型、逻辑回归和Lasso回归等参数模型[4]-[6]。然而,天气系统演变特征十分复杂,各种影响天气的物理因素之间存在明显的非线性动态变化。使用传统的统计模型和动力学模型建模来准确描绘这种复杂的非线性过程非常困难,即使动力学模型可以建立但是模型在复杂性、数据需求和不确定性方面存在巨大的挑战和限制[7]-[10]

近年来,具有较强的数据特征提取和拟合能力的机器学习算法,深度学习技术与时间序列数据结合方法得到迅速发展,如BP神经网络(Back Propagation, BP)、支持向量机(Support Vector Machine, SVM)、循环神经网络(Recurrent Neural Network, RNN)、长短期记忆网络(Long Short-Term Memory Neural Networks, LSTM)、卷积神经网络(Convolutional Neural Networks, CNN)等[11]-[14]。与传统回归方法相比,机器学习方法具有更好的表达能力、预测性能和灵活性,通常能够取得更好的预测效果[15]。其中刘莉等人考虑到BP神经网络具有较强的非线性拟合能力,建立了BP神经网络模型对降水量进行预测[16]。贺玉琪等人将SVR模型应用于月降水预测,结果表明,SVR模型在预测精度和训练速度上都明显优于BP神经网络[17]。而Andrew P. Barnes等人通过实例分析证明了卷积神经网络在预测汛期降水时优于其他方法[18]。Vishal Kumar Verma等人利用双向长短期记忆神经网络对降水进行了预测,验证了BiLSTM模型在水文建模方面的潜力[19]。然而,当时间信息过多时,BiLSTM网络容易出现梯度爆炸和梯度消失问题。同时,单一预测模型在预测复杂降水数据时容易出现过拟合和欠拟合问题从而导致预测精度差,所以需要构建组合模型来提高其特征挖掘和预测水平[20]

由于CNN网络可以通过卷积操作提取降水数据的空间特征,而BiLSTM网络可充分提取降水数据的时序特征和内在联系[21] [22],为了提高月降水预报水平,解决单一模型特征提取不足的问题,本文拟建立一个新的月降水量预测模型。为此,本文将基于传统的多元回归模型,机器学习和深度学习架构,建立卷积神经网络(CNN)和双向长短期记忆网络(BiLSTM)广西月降水量组合模型(CNN-BiLSTM),使用广西柳州1951年至2021年的月降水数据,比较CNN模型、双向LSTM网络模型和CNN-BiLSTM组合模型,使用决定系数、均方根误差、平均绝对误差、预测区间覆盖率和预测区间平均宽度五个评估指标来评估模型的性能。结果表明,CNN-BiLSTM模型对传统的月降水预测时,CNN-BiLSTM模型稍优于其他对比模型;而对汛期月降水数据进行预测时,CNN-BiLSTM模型要明显优于其他对比模型。这表明,基于CNN-BiLSTM的月降水预报模型预测效果更好,可为提高月降水预报水平提供新的思路和方法。

2. 基于CNN-BiLSTM的广西月降水预报模型

2.1. 卷积神经网络

卷积神经网络是由多层感知机发展而来的具有高效特征识别的网络模型,可有效提取数据的空间特征。CNN由输入层、卷积层、池化层、全连接层和输出层构成,有局部连接和权值共享的优点,可有效减少参数量和计算量。主要部分为卷积层和池化层,卷积层通过卷积核进行卷积运算来提取数据在空间结构上的特征,而后使用激活函数对特征映射进行非线性变换;池化层通过定义池化窗口来进行池化操作,降低提取特征的维数和过滤不重要的信息;全连接层起着“分类器”的作用,将池化后特征图转化为最终的输出结果[23] [24]

卷积神经网络主要分为三种,一维卷积用于处理时间序列数据,二维卷积用于处理图像数据、三维卷积用于处理视频数据。以一维卷积为例,假设第v层是卷积层,其计算公式为:

J u v =f( i=1 N J u v W iu v + b u v ) (1)

式中, J u v 表示u层第v次卷积映射;N为输入做卷积映射的数量; 表示卷积操作; W iu v 表示u层第v个卷积核做第i次运算的权值;f为激活函数; b u v 为偏置项。

其主要结构如图1所示。

2.2. 长短期记忆网络

CNN无法分析数据之间的时间相关性以及提取数据的时序特征[22]。而传统的循环神经网络在处理时间序列数据表现出巨大的潜力,但在训练过程中难以捕获数据长期依赖关系,容易出现梯度爆炸和梯度消失问题[25] [26]。为解决这一问题,在RNN的基础上引入门控机制来控制神经网络中信息的传递,

Figure 1. CNN structure diagram

1. CNN结构图

可以有效捕获数据的长期依赖关系,目前主要应用于文本分类、语音识别、图像处理、自然语言处理、回归预测等方面[27] [28]

长短期记忆网络主要结构为遗忘门、输入门和输出门,借助门控单元对存储单元添加和删除信息。其主要结构如图2所示:

Figure 2. LSTM structure diagram

2. LSTM结构图

其中, x t x t1 表示当前时刻和前一时刻的输入值, y t y t1 表示当前时刻和前一时刻的输出值, c t c t1 表示当前时刻和前一时刻的细胞状态, f t 为遗忘门, i t 为输入门, o t 为输出门,神经网络计算过程如下:

遗忘门主要对前一时刻隐藏层的输出和当前时刻的输入信息进行选择性保留和遗忘,其计算公式如下:

f t =σ( w f [ y t1 , x t ]+ b f ) (2)

输入门负责决定保留多少当前时刻的输入信息到当前时刻的单元状态,sigmoid层负责把重要输入信息更新到记忆细胞中去,其计算公式如下:

i t =σ( w t [ y t1 , x t ]+ b i ) (3)

通过tanh层更新输入信息生成候选细胞状态 c ˜ t ,其计算公式如下:

c ˜ t =tanh( w c [ y t1 , x t ]+ b c ) (4)

c t = f t c t1 + i t c ˜ t (5)

输出门负责决定当前时刻的单元状态输出多少重要信息,用sigmoid层来决定当前时刻细胞状态的输出信息,其计算公式如下:

o t =σ( w o [ y t1 , x t ]+ b o ) (6)

通过tanh层对 c t 进行处理,与 o t 进行点乘得到当前时刻的输出,其计算公式如下:

y t = o t tanh( c t ) (7)

其中, w f w i w o w c 分别表示遗忘门、输入门、输出门和候选细胞状态对应的权重, b f b i b o b c 分别表示遗忘门、输入门、输出门和候选细胞状态对应的偏置项。

2.3. 双向长短期记忆网络

由于RNN和LSTM都未充分考虑未来序列信息对预测结果的影响,无法最大限度地提取数据的内在联系。在此基础上,衍生出了双向长短期记忆网络(BiLSTM) [29]。BiLSTM是一种结合了双向模型和长短期记忆(LSTM)的递归神经网络架构,前向LSTM层提取历史信息,反向LSTM层提取未来信息,在每个时间步同时考虑了历史信息和未来信息,可充分提取数据的时序特征和内在联系。其结构如图3所示:

Figure 3. BiLSTM structure diagram

3. BiLSTM结构图

在模型中, x t1 x t x t+1 表示输入值, y t1 y t y t+1 表示输出值, f h t1 f h t f h t+1 b h t1 b h t b h t+1 分别表示前向LSTM层和后向LSTM层的权重;输入值 x t 经过前向LSTM层和后向LSTM层,两个LSTM层共同决定传入隐藏层的值,得到最后的输出 y t 。其更新公式为:

h t =LSTM( x t , h t1 ) (8)

h t =LSTM( x t , h t+1 ) (9)

y t =f h t h t +b h t h t + b y (10)

2.4. 广西月降水预报建模过程

本文构建的基于CNN-BiLSTM广西月降水量预测模型结构如图4所示。首先,输入m条降水数据,每条数据对应n个特征,则输入特征矩阵为 m×n 维,第i条数据为 x i = m i ×n( i=1,2,3,,m ) ;然后对数据进行归一化处理并划分为训练集和测试集,将训练数据输入CNN网络提取月降水数据在空间结构上的特征,将提取空间特征后的数据平铺成一维数据用来训练BiLSTM网络,进一步提取隐藏在空间特征信息中的时序特征,并采用均方误差作为损失函数确定最优CNN-BiLSTM组合模型;最后将测试数据输入训练好的模型中分别利用点预测和区间预测来测试模型性能。

Figure 4. CNN-BiLSTM network structure diagram

4. CNN-BiLSTM网络结构图

本文构建的基于CNN-BiLSTM广西月降水量预测模型流程如图5所示,具体步骤如下:

1) 将处理后的月降水数据进行归一化,这样可以消除不同特征的量纲差异在模型训练过程中带来的对特征权重分配不均以及避免异常值对模型的影响,其计算公式如式(11)所示:

X= x i x mean σ = x i=1 n x i n i=1 n ( x i x mean ) 2 n (11)

式中, σ 表示标准差, x mean 表示均值,X表示降水数据归一化的结果。

2) 将归一化后的数据分为训练集和测试集,构建网络模型,随机初始化模型权重和偏置,设置隐含层神经元个数、训练次数、遗忘率和学习率,运用Adam算法优化CNN-BiLSTM模型的权重和偏置;

3) 将划分好的训练数据用来训练模型。CNN层提取月降水数据在空间结构上的特征,BiLSTM层进一步提取隐藏在空间特征信息中的时序特征,在训练过程中,使用均方误差(Mean Squared Error, MSE)作为损失函数来衡量CNN-BiLSTM模型预测值与真实值之间的差异;

4) 判断模型训练误差是否达到最小值,如果达到,进行下一步,否则重复第三步;

5) 将测试数据代入CNN-BiLSTM模型进行点预测和区间预测来测试模型的性能,得到最终的预测结果。

Figure 5. Flow diagram of CNN-BiLSTM algorithm

5. CNN-BiLSTM算法流程图

3. 应用实例及其结果分析

3.1. 建模数据

本文建立模型的数据选取1950~2021年广西柳州月降水资料进行应用实例分析,总的数据为1951年1月~2021年12月共852个实测月降水数据。将前804个月降水数据作为训练数据建立CNN-BiLSTM拟合模型,剩余的48个月降水数据作为测试数据检验模型的预测效果。根据1950~2021年柳州月降水数据,降水量最大值为685.6 mm,最小值为0 mm,极差为685.6 mm,平均值为122.69 mm,标准差为110.05 mm,如表1所示。本文将每年月降水量大于122.69 mm的月份视为汛期降水,表2是训练数据和测试数据样本统计情况,将1951年1月~2017年12月的月降水数据作为训练数据,共有804个月降水数据,其中包含306个汛期降水样本;将2018年1月~2021年12月的月降水数据作为测试数据,共有48个月降水数据,其中包含17个汛期降水样本。图6为柳州1950~2021年月平均降水的实际情况,从图中可以看出,柳州降水主要集中在4~9月,即进入汛期,其他月份降水相对较少,其中6月降水最多,月平均降水超过250 mm。图7是1950~2021年汛期月降水实际情况,从图中可以看出,柳州汛期月降水分布不均,波动较大,大部分月份降水量大于200 mm,也有少数月份降水量超过400 mm,极个别月份降水超过600 mm。

Table 1. Statistical indicators of monthly precipitation data

1. 月降水数据统计指标统计情况

统计指标

最大值

最小值

极差

平均值

标准差

数值(mm)

685.6

0

685.6

122.69

110.05

Table 2. Sample statistics of training data and test data

2. 训练数据和测试数据样本统计情况

数据

数据起止时间

样本数

汛期降水样本数

训练数据

1951年1月~2017年12月

804

306

测试数据

2018年1月~2021年12月

48

17

Figure 6. Actual observations of monthly mean precipitation from 1951 to 2021

6. 1951~2021年月平均降水实际观测值

3.2. 建模因子数据

合理的选择建模因子对降水预报非常重要。本文所选用的数值预报产品均为48小时预报场,包括:1) 中国气象局的T213数值,及其标准层17个常规气象要素及物理量要素场(100˚~120˚E,15˚~30˚N,1˚ × 1˚,共336个格点);2) 日本细网格降水预报场(100˚~120˚E,15˚~30˚N,1.25˚ × 1.25˚,共221个格点)。对1951~2021年数值预报产品场与预报对象进行场相关普查,找成片的高于 0.05显著性水平的格点区,在该区内选相关系数绝对平均值最大的2个相邻格点,并将其物理量平均值作为待选因子。进一步对待选因子进行处理,把相关符号相反的两个邻近区域的待选因子值相减得到因子。计算表明因子比待选因

Figure 7. Actual observations of monthly precipitation during the flood season from 1951 to 2021

7. 1951~2021年汛期月降水实际观测值

子含有更多的有用信息。最终选择达到或超过0.01显著性水平的因子,得到的预报因子12个(T213因子9个,日本降水预报格点因子3个)作为建模因子数据建立月降水预报模型。

3.3. 模型参数设置

本文建立了基于CNN-BiLSTM广西月降水量预测模型,并利用MATLAB R2023b对模型进行进一步训练。CNN-BiLSTM模型第一层为CNN层,首先将与月降水数据相关的12个特征因子作为输入,添加卷积层提取月降水数据在空间结构上的特征,其第一层卷积核大小为4,卷积核个数为64个,第二层卷积核大小为2,卷积核个数为32个,而后添加批归一化层来加快网络的训练速度,激活函数采用ReLU函数,用于保持输出的非线性并缓解梯度消失问题,加入最大池化层,池化窗口大小为3*1,用来降低提取特征的维数,卷积层和池化层交替进行;然后将CNN层的输出平铺成一维数据作为BiLSTM层的输入来训练BiLSTM网络;最后添加全连接层和回归层得到CNN-BiLSTM模型的输出结果。

3.4. 模型性能评价指标

为了验证CNN-BiLSTM模型的预测效果,分别建立线性回归模型、CNN模型和BiLSTM模型进行对比分析,本文采用决定系数、均方根误差、平均绝对误差、预测区间覆盖率和预测区间平均宽度5种评估指标:

决定系数(R-squared, R2):

R 2 =1 i=1 n ( y ^ i y i ) 2 i=1 n ( y ¯ y i ) 2 (12)

平均绝对误差(Mean Absolute Error, MAE):

MAE= 1 n i=1 n | y ^ i y i | (13)

均方根误差(Root Mean Square Error, RMSE):

RMSE= 1 n i=1 n ( y i y ^ i ) 2 (14)

预测区间覆盖率(Prediction Interval Coverage Probability, PICP):

PICP= 1 n i=1 n m i , m i ={ 1, y i [ y ^ l , y ^ u ] 0, y i [ y ^ l , y ^ u ] (15)

预测区间平均宽度(Prediction Interval Average Width, PIAW):

PIAW= 1 n i=1 n ( y ^ u y ^ l ) (16)

式中 y i y ^ i y ¯ y ^ l y ^ u 分别代表月降水数据的实际值、预测值、平均值、区间预测下限和上限,n为样本总数。性能指标(12)为决定系数,用于评估回归模型的拟合优度;性能指标(13) (14)用于衡量月降水量实际观测值与预测值的差异程度,其中RMSE值和MAE值越小,决定系数越接近1,表示模型的预测效果越好;性能指标(15)用于衡量月降水预测区间的准确度,其值越大表示模型的预测效果越好;性能指标(16)用于衡量月降水预测精度和不确定性,其值越小表示模型的预测效果越好。

3.5 结果分析

3.5.1. 点预测

本文建立的CNN-BiLSTM模型对广西柳州的月降水预测结果如下。表3是四个模型对1951年~2017年期间804个月降水数据拟合和对2018年~2021年期间48个月降水数据预测的性能统计表,图8为四个模型对柳州1951年~2017年期间月降水数据的拟合效果图,红色曲线表示模型R2为1,黑色曲线分别代表四个模型对训练数据的最佳拟合效果,图9为四个模型对2018年~2021年期间月降水数据的预测效果图,图10为四个模型对1951年~2017年期间804个月降水数据拟合和对2018年~2021年期间48个月降水数据预测的误差对比分析。

R2是检验模型对训练数据拟合和测试数据预测效果的重要度量指标,其值越接近1,说明建立的模型对月降水数据趋势预测越准确。从表3结果可以看出,在训练数据中,四个模型的R2都达到0.95以上,其中CNN模型的R2最大,线性回归模型的R2最小,对于RMSE指标和MAE指标,CNN模型的RMSE值和MAE值最小,线性回归的RMSE值和MAE值最大;而在测试数据中,CNN-BiLSTM模型的R2最大达到0.92,而CNN模型的R2最小为0.87,对于RMSE指标和指标RMSE值和MAE,CNN-BiLSTM模型MAE的RMSE值和MAE值最小,CNN模型的值最大。结果表明CNN模型拟合和预测结果不稳定,CNN-BiLSTM模型拟合和预测结果稳定,趋势预测准确率高,并且拟合值和真实值,预测值

Table 3. Statistical table of monthly precipitation fitting and prediction performance from 1951 to 2021

3. 1951~2021年月降水拟合和预测性能统计表

拟合(19511~201712)

模型

R2

RMSE

MAE

线性回归

0.96

21.21

15.47

CNN

0.99

7.44

5.68

BiLSTM

0.99

17.00

12.76

CNN-BiLSTM

0.98

18.71

14.51

预测(20181~202112)

模型

R2

RMSE

MAE

线性回归

0.90

30.40

21.99

CNN

0.87

36.62

27.60

BiLSTM

0.91

30.90

21.26

CNN-BiLSTM

0.92

27.54

20.38

Figure 8. Fitting effect of monthly precipitation data from 1951 to 2017

8. 1951年~2017年月降水数据拟合效果

Figure 9. Prediction effect of monthly precipitation data from 2018 to 2021

9. 2018年~2021年月降水数据预测效果

Figure 10. Error comparison and analysis of training data and test data

10. 训练数据和测试数据的误差对比分析

和真实值之间的偏离程度小,预测效果要好于线性回归模型、CNN模型和BiLSTM模型。

图8中可以看出,各模型对训练数据中月降水的拟合效果相当,进一步从图9看出,CNN-BiLSTM模型的拟合趋势线R2最趋向1,说明CNN-BiLSTM模型预测效果好,而CNN模型的拟合趋势线R2偏离程度较大,说明CNN模型预测效果较差。图10为各模型训练数据和测试数据的误差(R2)对比分析,从图10可以直观看出,CNN模型对月降水训练数据的拟合R2值和测试数据的预测R2值相差较大,说明CNN模型的预测效果较差,CNN-BiLSTM模型对月降水训练数据的拟合R2值和测试数据的预测R2值误差相差较小,说明CNN-BiLSTM模型的预测效果较优。结果表明,CNN-BiLSTM模型对月降水数据的预测效果好,说明模型精度高,稳定性好。

在大量数据中,对离群点的检测、辨识和预测是机器学习深挖数据隐藏特性的关键环节,其主要目标是找出预测值与真实值之间的重大偏差,对这些异常记录的检测、辨识和解释具有重大价值。在一年的大多数时间,柳江的降水都处于平稳状态,进入汛期后,降水会出现较大波动,降水过多会引发洪水。为了进一步验证模型的性能,将月降水量大于122.69 mm的月份视为汛期降水,对汛期降水进行分析。分析结果如下,表4是四个模型对1951年~2017年期间306个汛期月降水数据拟合和对2018年~2021年期间17个汛期月降水数据预测的性能统计表,从表4可以看出,各模型对汛期降水的预测性能存在差异,其中CNN-BiLSTM模型相较于其他三个对比模型,其R2最大,RMSE值和MAE值最小,说明CNN-BiLSTM模型预测效果最优,而CNN模型预测效果较差。图11为四个模型对1951年~2017年期间汛期月降水数据的拟合效果图,图12为四个模型对2018年~2021年期间汛期月降水数据的预测效果图,图13为四个模型对1951年~2017年期间306个汛期月降水数据拟合和对2018年~2021年期间17个汛期月降水数据预测的误差对比分析。

表4结果可以看出,在汛期月降水训练数据中,四个模型的R2都达到0.90以上,其中CNN模型的R2最大,线性回归模型的R2最小,对于RMSE指标和MAE指标,CNN模型的RMSE值和MAE值最小,线性回归的RMSE值和MAE值最大;而在汛期月降水测试数据中,CNN-BiLSTM模型的R2最大达到0.84,而 CNN模型的R2最小仅有0.65,对于RMSE指标和MAE指标,CNN-BiLSTM模型的RMSE值和MAE值最小,相比于线性回归模型、CNN模型和BiLSTM模型,其RMSE值分别降低了7.22%、30.84%和16.26%,MAE值分别降低了7.73%、37.35%和3.97%。结果表明线性回归模型、CNN模型和BiLSTM模型在实际应用中不能很好的对汛期月降水数据进行预测,而CNN-BiLSTM模型可以对汛期月降水数据做出精准的预测。从图11可以看出,各模型对柳州月降水的拟合效果相当,进一步从图12看出,CNN-BiLSTM模型的拟合趋势线R2最趋向1,说明CNN-BiLSTM模型预测效果最优,CNN模型拟

Table 4. Statistical table of fitting and prediction performance of monthly precipitation data in the flood season from 1951 to 2021

4. 1951-2021年汛期月降水数据拟合和预测性能统计表

拟合(19511~201712)

模型

R2

RMSE

MAE

线性回归

0.92

27.96

20.51

CNN

0.99

6.12

4.62

BiLSTM

0.95

21.55

16.21

CNN-BiLSTM

0.95

23.02

18.23

预测(20181~202112)

模型

R2

RMSE

MAE

线性回归

0.80

36.96

28.56

CNN

0.65

49.58

42.06

BiLSTM

0.76

40.95

27.44

CNN-BiLSTM

0.84

34.29

26.35

Figure 11. Fitting effect of monthly precipitation data in flood season from 1951 to 2017

11. 1951年~2017年汛期月降水数据拟合效果

Figure 12. Prediction effect of monthly precipitation data in the flood season from 2018 to 2021

12. 2018年~2021年汛期月降水数据预测效果

Figure 13. Comparative analysis of the error of monthly precipitation training data and test data in flood season

13. 汛期月降水训练数据和测试数据的误差对比分析

合趋势线R2偏离程度较大,说明CNN模型预测效果较差。图13为各模型训练数据和测试数据的误差对比分析,从图13可以直观看出,CNN模型对月降水训练数据的拟合R2值和测试数据的预测R2值相差最大,说明CNN模型的对汛期月降水预测效果不好,而CNN-BiLSTM模型对月降水训练数据的拟合R2值和测试数据的预测R2值相差较小,说明CNN-BiLSTM模型对汛期月降水预测效果较优,结果表明,CNN-BiLSTM模型对汛期月降水数据进行预测时,可信度高,而且结果稳定。

3.5.2. 区间预测

根据本文CNN-BiLSTM模型的点预测结果,本文对测试集中48个月降水数据以及17个汛期月降水数据进行区间预测。将预测误差作为研究对象,在置信水平为90%、95%、99%的情况下,得到降水预测误差波动区间。区间预测结果如下,表5为CNN-BiLSTM模型在不同置信水平下的性能对比分析,从表5可以看出,随着置信水平的提高,CNN-BiLSTM模型对应的PICP值和PIAW值也随之变大,说明CNN-BiLSTM模型对汛期月降水预测的准确度较高。图14为CNN-BiLSTM模型在不同置信水平下月降水的预测结果,图15为CNN-BiLSTM模型在不同置信水平下汛期月降水的预测结果。

PICP用于衡量月降水预测区间的准确度,其值越大表示模型的预测效果越好。从表5结果可以看出,CNN-BiLSTM模型在90%、95%和99%的置信水平下,对传统月降水进行预测时,区间覆盖率分别为79.16%、81.25%和87.50%;而对汛期月降水进行预测时,区间覆盖率分别为76.47%、76.47%和94.12%,可以看出区间预测不仅能准确预测月降水的波动趋势,还能给出月降水量的波动范围,验证了区间估计

Table 5. Performance of the CNN-BiLSTM model at different confidence levels

5. CNN-BiLSTM模型在不同置信水平下的性能

测试样本

置信水平

PICP

PIAW

2018年~2021年月降水

90%

79.16%

44.58

95%

81.25%

52.96

99%

87.50%

69.71

2018年~2021年汛期月降水

90%

76.47%

63.57

95%

76.47%

75.52

99%

94.12%

99.41

Figure 14. Predictions of monthly precipitation at different confidence levels

14. 不同置信水平下月降水的预测结果

Figure 15. Prediction results of monthly precipitation during the flood season at different confidence levels

15. 不同置信水平下汛期月降水的预测结果

在降水预报中的有效性。同时随着置信度的提高,包含的实测值越多,在保证覆盖率的条件下,得到的预测区间平均宽度较窄,预测区间质量较高,能够较为准确地获得预测结果。从图14图15可以看出,区间预测可以精确地估计月降水预测的不确定性,准确地预测月降水的波动趋势,并在较大范围内覆盖预测值,进一步说明本文提出的CNN-BiLSTM月降水预报模型是可行的,并且能较好地反映月降水的波动变化,特别是在汛期月降水波动较大的时候。

4. 结论

为解决传统预测方法和单一模型在月降水预报中精度较低的问题,本文提出了基于CNN-BiLSTM的月降水预报模型,该模型充分结合CNN提取月降水数据在空间结构上的特征,以及BiLSTM提取月降水数据时序特征的优势,实现了月降水的精准预测。通过研究得到了以下结论:

1) 本文主要构建了多元线性回归模型、CNN模型、BiLSTM模型和CNN-BiLSTM模型对广西月降水进行预报,采用“理论 + 实验 + 计算”模式,从点预测和区间预测两方面进行具体分析,并采用均方误差函数量化各模型的预测效果,验证表明CNN-BiLSTM模型预测精度高,稳定性好,适合建立月降水预报模型。

2) CNN-BiLSTM模型相较于多元线性回归模型、CNN模型和BiLSTM模型,预测精度最高,其RMSE值分别降低了7.22%、30.84%和16.26%,MAE值分别降低了7.73%、37.35%和3.97%,能更好地对汛期月降水数据进行预测。因此,考虑到汛期降水事件,CNN-BiLSTM模型可能是一个更好的选择。

3) 区间预测可量化月降水预报的不确定性,相较于多元线性回归模型、CNN模型和BiLSTM模型,CNN-BiLSTM模型能较好地反映月降水的波动变化,给出月降水的波动范围,特别是在汛期月降水波动较大的时候。

当前降水预测方法正从单一模型转向组合深度学习模型,本文在深度学习领域为月降水预测提供了新思路,为相关气象预报部门提供了理论指导。但本文还未对全年的时降水数据和日降水数据进行研究,这也是本研究后续可能的推进,同时,该模型也可以考虑在其他领域的应用。

基金项目

国家自然科学基金项目《月降水量的深度学习–协同进化支持向量机短期气候混合预测模型研究》(42065004),广西科技厅自然科学基金面上项目《某些非线性复微分方程的孤波解的构造及动力学行为研究》(2023GXNSFAA026028)。

NOTES

*通讯作者。

参考文献

[1] Xu, X.C., Zhang, X.Z., Dai, E.F., et al. (2014) Research of Trend Variability of Precipitation Intensity and Their Contribution to Precipitation in China from 1961 to 2010. Geographical Research, 33, 1335-1347.
[2] Rashid, M., Bari, B.S., Yusup, Y., Kamaruddin, M.A. and Khan, N. (2021) A Comprehensive Review of Crop Yield Prediction Using Machine Learning Approaches with Special Emphasis on Palm Oil Yield Prediction. IEEE Access, 9, 63406-63439.
https://doi.org/10.1109/access.2021.3075159
[3] Sun, J. and Guo, W. (2023) Time Series Prediction Based on Time Attention Mechanism and LSTM Neural Network. 2023 IEEE International Conference on Integrated Circuits and Communication Systems (ICICACS), Raichur, 24-25 February 2023, 1-5.
https://doi.org/10.1109/icicacs57338.2023.10099498
[4] Moishin, M., Deo, R.C., Prasad, R., Raj, N. and Abdulla, S. (2021) Designing Deep-Based Learning Flood Forecast Model with Convlstm Hybrid Algorithm. IEEE Access, 9, 50982-50993.
https://doi.org/10.1109/access.2021.3065939
[5] 马志峰, 张浩, 刘劼. 基于深度学习的短临降水预报综述[J]. 计算机工程与科学, 2023, 45(10): 1731-1753.
[6] 叶宇辰, 陈海山, 朱司光, 等. 基于机器学习的中国夏季降水延伸期预报及土壤湿度的可能贡献[J]. 高原气象, 2024, 43(1): 184-198.
[7] Tang, T., Jiao, D., Chen, T. and Gui, G. (2022) Medium-and Long-Term Precipitation Forecasting Method Based on Data Augmentation and Machine Learning Algorithms. IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, 15, 1000-1011.
https://doi.org/10.1109/jstars.2022.3140442
[8] Nguyen, T., Vu, D., Mai, S.T. and Dang, T.D. (2023) Streamflow Prediction in the Mekong River Basin Using Deep Neural Networks. IEEE Access, 11, 97930-97943.
https://doi.org/10.1109/access.2023.3301153
[9] Dastorani, M.T., Afkhami, H., Sharifidar, H. and Dastorani, M. (2010) Application of ANN and ANFIS Models on Dryland Precipitation Prediction (Case Study: Yazd in Central Iran). Journal of Applied Sciences, 10, 2387-2394.
https://doi.org/10.3923/jas.2010.2387.2394
[10] Park, B.K. and Kim, C. (2023) Short-Term Prediction for Indoor Temperature Control Using Artificial Neural Network. Energies, 16, Article 7724.
https://doi.org/10.3390/en16237724
[11] 蔡金圻, 谭桂容, 牛若芸. 基于迁移CNN的江淮持续性强降水环流分型[J]. 应用气象学报, 2021, 32(2): 233-244.
[12] 郑超昊, 尹志伟, 曾钢锋, 等. 基于时空深度学习模型的数值降水预报后处理[J]. 浙江大学学报(工学版), 2023, 57(9): 1756-1765.
[13] Ma, Z., Zhang, H. and Liu, J. (2024) DB-RNN: An RNN for Precipitation Nowcasting Deblurring. IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, 17, 5026-5041.
https://doi.org/10.1109/jstars.2024.3365612
[14] Bruni, M.E., Lazzaroli, V., Perboli, G. and Vandoni, C. (2023) Machine Learning to Forecast Rainfall Intensity. 2023 IEEE 47th Annual Computers, Software, and Applications Conference (COMPSAC), Torino, 26-30 June 2023, 1762-1767.
https://doi.org/10.1109/compsac57700.2023.00272
[15] Rama, V.S.B., Hur, S. and Yang, J. (2024) Short-Term Fault Prediction of Wind Turbines Based on Integrated RNN-LSTM. IEEE Access, 12, 22465-22478.
https://doi.org/10.1109/access.2024.3364395
[16] 刘莉, 叶文. 基于BP神经网络时间序列模型的降水量预测[J]. 水资源与水工程学报, 2010, 21(5): 156-159.
[17] 贺玉琪, 王栋, 王远坤. BRR-SVR月降水量预测优化模型[J]. 水利学报, 2019, 50(12): 1529-1537.
[18] Barnes, A.P., Kjeldsen, T.R. and McCullen, N. (2022) Video-Based Convolutional Neural Networks Forecasting for Rainfall Forecasting. IEEE Geoscience and Remote Sensing Letters, 19, 1-5.
https://doi.org/10.1109/lgrs.2022.3167456
[19] Verma, V.K., Janagama, H.S. and Patil, N. (2023) An Efficient Rainfall Prediction Model Using Deep Learning Method. 2023 Third International Conference on Secure Cyber Computing and Communication (ICSCCC), Jalandhar, 26-28 May 2023, 566-572.
https://doi.org/10.1109/icsccc58608.2023.10176598
[20] Wen, X. and Li, W. (2023) Time Series Prediction Based on LSTM-Attention-LSTM Model. IEEE Access, 11, 48322-48331.
https://doi.org/10.1109/access.2023.3276628
[21] Nguyen, T., Vu, D., Mai, S.T. and Dang, T.D. (2023) Streamflow Prediction in the Mekong River Basin Using Deep Neural Networks. IEEE Access, 11, 97930-97943.
https://doi.org/10.1109/access.2023.3301153
[22] Nirmala, K., Saruladha, K. and Dekeba, K. (2022) Investigations of CNN for Medical Image Analysis for Illness Prediction. Computational Intelligence and Neuroscience, 2022, 1-13.
https://doi.org/10.1155/2022/7968200
[23] Li, W., Zhou, X. and Mou, X. (2024) A Spatial-Temporal Dual Discriminator Precipitation Nowcasting Method Using SNGAN with Inceptiongru. IEEE Access, 12, 59037-59048.
https://doi.org/10.1109/access.2024.3392894
[24] Liu, H., Lang, B., Liu, M. and Yan, H. (2019) CNN and RNN Based Payload Classification Methods for Attack Detection. Knowledge-Based Systems, 163, 332-341.
https://doi.org/10.1016/j.knosys.2018.08.036
[25] Gao, J., Ye, X., Lei, X., Huang, B., Wang, X. and Wang, L. (2023) A Multichannel-Based CNN and GRU Method for Short-Term Wind Power Prediction. Electronics, 12, Article 4479.
https://doi.org/10.3390/electronics12214479
[26] Abumohsen, M., Owda, A.Y. and Owda, M. (2023) Electrical Load Forecasting Using LSTM, GRU, and RNN Algorithms. Energies, 16, Article 2283.
https://doi.org/10.3390/en16052283
[27] Jia, X., Ji, Q., Han, L., Liu, Y., Han, G. and Lin, X. (2022) Prediction of Sea Surface Temperature in the East China Sea Based on LSTM Neural Network. Remote Sensing, 14, Article 3300.
https://doi.org/10.3390/rs14143300
[28] Bandara, K., Bergmeir, C. and Smyl, S. (2020) Forecasting across Time Series Databases Using Recurrent Neural Networks on Groups of Similar Series: A Clustering Approach. Expert Systems with Applications, 140, Article 112896.
https://doi.org/10.1016/j.eswa.2019.112896
[29] Peng, H., Wang, W., Zhu, Y., et al. (2021) An Intelligent Single-Phase Grounding Fault Location for a Wind Farm Collection Line Based on an LSTM Neural Network. Power System Protection and Control, 49, 60-66.