1. 引言
全球气候变暖已成为当下人类社会与自然环境面临的重大危机。IPCC第六次报告指出,2001~2020年全球平均地表温度较1850~1900年升高了约0.99℃ [1]。以显著变暖为特征的全球气候变化已深刻影响了人类的生存和发展[2],全球变暖现象已成为为21世纪各国政府及社会公众聚焦的重要议题。因此,科学认识全球气温变化情况,对全球气温进行精准的预测,对于维护生态环境的长期可持续性以及保障人类的生存发展具有深远的意义。
近年来,许多学者对全球及我国的气温变化进行了深入研究,但在研究方法上存在差异。魏凤英等人[3]采用均值差异假设检验对中国、北半球和全球气温时间序列的突变现象进行了研究。研究表明,采用均生函数累加延拓的时序建模方案,对气温序列进行了比较准确的预测。薛宇峰等人[4]利用墨西哥帽小波函数分析了近百年来全球气温的变化特征,发现不同的时间尺度上气温变化具有不同的特点及突变点。侯惠清[5]利用BP神经网络对全球平均气温进行了预测,结果显示全球平均气温呈现缓慢上升趋势。寇露彦等人[6]对加拿大平均气温进行平稳性检验、脉冲响应和方差分析,并建立了预测模型对加拿大平均气温和降水量进行了预测。Sen等人[7]结合Shapley方法与机器学习方法建立了气温预测模型,对六种不同的情景下的气温异常进行了预测。该研究发现,机器学习方法可以有效地预测气温变化。王源昊[8]运用ARIMA模型、LSTM模型等方法对全球平均气温、海洋表面温度、全球二氧化碳排放量进行了预测。该研究表明,全球平均气温从2021年来整体呈上升趋势,并将于2040年达到该预测区间的最大值。
目前,全球气温的研究大多集中在趋势的预测和突变研究,对于气温进行精确预测的相关研究还比较缺乏。全球平均气温虽然具有一定的周期性与季节性,但存在显著的非稳定性波动,而这些波动对模型的预测能力造成了巨大挑战。随着深度学习方法的推广,已有多种网络模型被运用到气温预测当中,如BP、LSTM、CNN [9]等。尽管它们都具有一定的预测能力,但在面对具有非平稳性波动的预测序列测上表现一般。VMD是一种非递归、自适应的信息处理方法,它能削弱序列中的非稳态波动,充分提取其中的长序列变化规律,可有效提升序列的预测精度[10]。因此,本文利用VMD分解方法削弱气温序列中的非平稳性波动影响,结合LSTM模型预测能力,以实现对气温的精确预测。
2. 研究方法
2.1. VMD分解原理
VMD是一种自适应、非递归的模态分解和信号处理方法。将全球气温序列分解成多个模态,每个模态代表了不同的时间气温尺度,通过分析不同模态的特征来预测未来全球气温的趋势和变化趋势。通过VMD分解,有利于降低建模复杂度,不移受到噪声干扰,提供预测精度。
VMD方法的优化问题如下所示:
(1)
其中,
,
分别表示分解后第k个本征模态函数与对应的中心频率;K表示提前设置的本征模函数总数;
表示对t进行微分处理;
为冲激函数,该函数在零点附近无限大,在除零点外的其他点的值都为0;
代表原始信号经过局部加权回归后得到的信号。
为求得上述问题的最优解,引入增广拉格朗日函数L将约束变分分解问题转换为无约束变分分解问题,得到无约束变分分解问题表达式:
(2)
其中,α为二次惩罚因子,
为Lagrange乘数因子。为得到Lagrange函数的极值点,使用交替方向乘子算法进行迭代搜索,从而得到各本征模态函数及其中心频率:
(3)
(4)
具体迭代步骤如下:
1) 初始化
,
,并选取适当的本征模函数总数K;
2) 通过公式(3)和(4)更新
和
;
3) 频率在非负范围内时更新λ的值:
(5)
4) 给定精度
,若满足:
(6)
则停止迭代,否则返回步骤2。
通过以上步骤可以得到VMD分解后的各本征模态函数IMFS以及残差项R。
2.2. LSTM模型
LSTM是一种具有长期依赖捕捉能力强[11]、灵活性和适应性好、稳定性高等优势的神经网络模型。在LSTM每个单元结构中共包含3个门:遗忘门
、输入门
和输出门
。遗忘门通过学习得到合适的遗忘比例,使得模型能够根据当前的输入和上一时刻的单元动态地决定遗忘或保留哪些信息,丢弃非关键信息;输入门控制本时刻输入和上一时刻隐藏状态中哪些信息会添加进单元中;输出门控制单元中哪些信息会输出给隐藏状态。
设当前时刻为t,输入为
,
为上一时刻的记忆单元状态,
为上一时刻网络输出,
和
共同完成对历史信息的传递。LSTM各单元计算公式如下所示。
(7)
(8)
(9)
(10)
(11)
(12)
其中,W为各个门的权重向量,b为偏置向量,σ为sigmoid函数,tanh为双曲正切函数。
2.3. 气温预测评价指标
为了衡量模型的预测效果,本文选用拟合系数R2、平均绝对百分比误差(Mean Absolute Percentage Error, MAPE)和均方根误差(Root Mean Square Error, RMSE)对模型的预测效果进评估,具体计算如式(13)、式(14)、式(15)所示:
(13)
(14)
(15)
式中,n为样本量;
、
和
分别表现时刻数据的真实值、平均值与预测值。
3. 实证分析
本文所采用的全球气温数据来自伯克利地球数据库中的1850~2024年全球平均气温,其中共2091条数据。全球平均气温变化趋势如图1所示:
由图1可知,20世纪前的全球平均气温的变化主要体现在周期性与季节性上,这一时期全球平均气温并没有出现上升的趋势。20世纪初至20世纪60年代,全球平均气温开始逐渐上升,但这一时期气温升高的速率较慢。20世纪60年代以后,全球平均气温快速增长,21世纪以来全球平均气温较20世纪前的全球平均气温升高了1℃左右,全球气温增加的趋势进一步加剧。全球平均气温的变化主要表现在周期性、季节性、发展趋势与非稳定性波动上,而利用VMD分解则能够很好的将以上要素剥离出来。
3.1. 全球平均气温的VMD分解
首先采用VMD对全球月平均气温进行分解,其中将分解层数
,二次惩罚因子
,初始中心频率
,收敛判据
。分解结构如图2所示。
Figure 1. Global land temperature trends
图1. 全球平均气温趋势图
Figure 2. Original sequence and VMD decomposition results
图2. 原始序列与VMD分解序列图
由图2可知,本文通过VMD分解将全球平均气温分离成了7个分量。IMF1与全球平均气温的变化趋势保持一致,它是VMD分解出的全球平均气温的发展趋势;IMF2、IMF3与IMF4包含全球平均气温的周期性与季节性信息,它们在0.25到−0.25间呈现一定规律性变化。而IMF5、IMF6与IMF7只是在较小数值间波动,它们是VMD分解出的非稳定性波动。将影响全球平均气温变化的分量进行剥离成7个分量后,利用LSTM对每个分量进行一步预测。
3.2. 基于LSTM的全球气温预测
本研究以前一年的全球月平均气温(共12个采样点)作为输入,预测未来一个月的全球月平均气温值,将前70%的数据作为训练集,后30%的数据作为测试集。现对全球月平均气温原始序列与7个VMD分量建立LSTM预测模型。得全球平均气温与部分VMD分量预测效果图与全球平均气温与部分VMD分量预测误差表。
Figure 3. Graphs of projections of global land temperature and selected VMD components: (a) graph of global land temperature projections; (b) graph of IMF1 projections; (c) graph of IMF4 projections; (d) graph of IMF7 projections
图3. 全球平均气温和部分VMD分量的预测结果图:(a)全球平均气温预测结果图;(b) IMF1预测结果图;(c) IMF4预测结果图;(d) IMF7预测结果图
从图3中可知,子图a中LSTM能较好地预测出全球平均气温的发展趋势,但在气温变化的突变上仍存在一定差异,说明LSTM对于全球平均气温的精度仍存在不足。子图b、c、d分别是VMD分量1、VMD分量4与VMD分量7的预测效果图,从效果图中可知,分量的预测效果能较好地把握住VMD分量的变化趋势。
Table1. Table of global mean monthly land temperature and VMD component prediction errors
表1. 全球平均气温与VMD分量预测误差表
预测集 |
R2 |
MAPE |
RMSE |
原序列 |
0.838 |
0.750% |
0.138 |
IMF1 |
0.999 |
0.04% |
0.010 |
IMF2 |
0.995 |
109.54% |
0.006 |
IMF3 |
0.989 |
77.23% |
0.006 |
IMF4 |
0.874 |
143.81% |
0.013 |
IMF5 |
0.903 |
201.78% |
0.010 |
IMF6 |
0.966 |
192.78% |
0.006 |
IMF7 |
0.995 |
30.12% |
0.003 |
由表1可知原序列与各VMD分量的预测误差,从预测误差来看,原序列的拟合系数与RMSE要低于VMD各分量的拟合系数,原序列的MAPE却比VMD各分量的MAPE要小很多,这是由于原序列经过VMD分解后分量的数值要远小于原序列,所以将导致分量的MAPE偏大。结合三种评价指标结果分析,分量的预测效果优于原序列的预测效果。
将VMD分类预测结果重组,后得到LSTM与VMD-LSTM的全球气温预测对比图。
Figure 4. Comparison of LSTM and VMD-LSTM model predictions
图4. LSTM和VMD-LSTM模型预测对比图
由图4可知,VMD-LSTM预测气温十分接近真实的全球平均气温,而LSTM预测气温与真实气温则有真实气温高预测气温低的情况,相较于VMD-LSTM的预测结果LSTM的预测还存在较大偏差。因此,VMD-LSTM组合的预测效果要优于单LSTM的预测结果。以上两种预测算法的误差如表2所示。
Table 2. Comparison of prediction errors between LSTM and VMD-LSTM models
表2. LSTM和VMD-LSTM模型预测误差对比表
预测算法 |
R2 |
MAPE |
RMSE |
LSTM |
0.838 |
0.750% |
0.138 |
VMD-LSTM |
0.872 |
0.664% |
0.121 |
从表2可知,VMD-LSTM预测模型的R2比LSTM的R2高0.034,且MAPE与RMSE都要小于单LSTM预测模型,说明VMD-LSTM的预测效果更好。
3.3. 不同算法对比分析
现将LSTM、VMD-LSTM、GRU与LSTM-GRU4种预测算法进行比较,验证VMD在面对序列中存在非稳态因子具有一定优越性。上述4中算法的预测曲线如图5所示,误差评价指标结果如表3所示。
Figure 5. Comparison of forecasts from different forecasting models
图5. 不同预测模型预测对比图
Table 3. Comparison of errors of different prediction models
表3. 不同预测模型误差对比表
预测算法 |
R2 |
MAPE |
RMSE |
LSTM |
0.838 |
0.750% |
0.138 |
VMD-LSTM |
0.872 |
0.664% |
0.121 |
GRU |
0.829 |
0.767% |
0.141 |
VMD-GRU |
0.865 |
0.683% |
0.124 |
图5可知,经过VMD处理后的气温预测模型的拟合效果更佳,它们更贴合真实值。结合了VMD的预测模型的误差指标都得到了降低,其中,结合VMD的LSTM模型R2提升0.034,MAPE降低了11.2%,RMSE降低了12.3%,结合VMD的GRU模型R2提升了0.036,MAPE降低了11.0%,RMSE降低了12.1%。说明,在全球气温预测上VMD分解后的预测结果精度更高,基于VMD分解后的深度学习组合预测模型能更好地学习到序列中非稳态性波动。预测结果表明,VMD-LSTM的预测效果最好,其R2为0.872,MAPE为0.664%,RMSE为0.121。VMD-LSTM预测效果与VMD-GRU差距不大,总体上VMD与神经网络的组合预测模型要由于其单神经网络预测模型。
4. 结语
本文针对全球气温预测问题,提出了一种基于VMD分解与LSTM模型的全球气温预测方法。在LSTM、VMD-LSTM、GRU与VMD-GRU四组预测模型的对比实验,预测结果显示,VMD-LSTM的预测效果最好,其拟合优度为0.872,MAPE为0.664%,RMSE为0.121。在不同的预测模型预测结果中,本文提出的方法要优于其他模型。实验结果表明,经过VMD分解处理后的气温预测模型的预测结果要优于未经过VMD分解处理后的预测模型的预测结果。相较于神经网络预测模型,基于VMD与神经网络模型的预测模型可以捕捉到非稳态性波动的变化趋势,有效提升了全球气温的预测精度。这种方法的结合不仅提高了全球平均气温预测的准确性,也为全球气温预测提供了新的研究思路。
基金项目
重庆市教育委员会科学技术研究项目(项目编号:KJQN202101125)、重庆理工大学研究生教育高等质量发展项目(gzlal202301)、重庆理工大学研究生创新项目(项目编号:gzlcx20233317)。
NOTES
*通讯作者。