1. 引言
依托于计算机运算速度和储存能力的快速发展,人们深入研究大气运动状态所取得的结果得以更好的展示和实现。基于计算机技术发展和深入研究结果的数值预报方法已经在气象预报领域处于越来越重要的位置,气象预报对数值预报结果的依赖程度不断加深,数值预报已经成为气象预报业务的核心组成部分。数值预报结果随着预报方法的不断发展,预报要素的数量、时间和空间分辨率不断提高,时效不断延长,预报准确率也不断加强。但各个气象要素的数值预报结果仍然和实际状况存在差距,并且差距会随着时效延长而增加 [1] - [6] 。
结合误差产生的原因,提升数值模式预报结果准确率的方法有以下两种。一是通过修改各个物理过程的参数改善数值预报模式自身的性能,二是根据预报结果和实际数据之间的差异对数值模式结果进行一定的订正处理。第一种方法需要对模式本身进行一定的改动,对大气运动状态研究的深入程度要求极高。第二种方法根据统计学对模式预报结果进行分析订正,更便于使用,应用也更加广泛 [6] [7] [8] [9] [10] 。
随着计算机技术和人工智能的发展,机器学习的方法也开始逐渐更多的应用到模式预报数据的订正中,特别是BP神经网络,在预报订正领域已经有了一定的应用 [11] [12] [13] 。但BP神经网络所需的训练时间较长,输入每个神经元的数据需要处理为一维数据,输出的每个神经元的数据也为一维数据。除BP神经网络外,机器学习中还有卷积神经网络等深度学习方法。深度学习目前主要用于机器识别、图像分类领域,在自动驾驶、人脸检测、视觉搜索、目标跟踪和检测等领域也得到了广泛的应用 [14] [15] [16] 。其中,卷积神经网络因其结构可以直接将二维数据输入进行网络训练。杨文佳等人将卷积神经网络应用于天气现象识别方面,通过网络训练能有效识别图片中的晴、阴、雨、雪四种天气 [17] 。齐永锋和李占华将多尺度卷积神经网络结合分类统计方法应用到了去除雾霾对图像的影响方面,能较好的去除合成图和真实图像中雾霾的影响 [18] 。徐少平等人论证了深度卷积神经网络算法在图像降噪领域的技术优势,并梳理、总结、讨论了深度卷积神经网络算法降噪模型未来的发展限制和解决方案 [19] 。李传朋等人构建了深度卷积神经网络应用于图像去噪,能更有效的去除图像中的噪声,获得更好的视觉效果 [20] 。
2 m气温在气象预报中是最重要的气象要素之一,准确预报该要素对人们的日常生活、生产活动有着极其重要的影响,是天气预报业务中一项重要的工作 [10] [21] 。本文利用2020年至2022年欧洲中心数值模式预报数据,基于深度卷积神经网络方法,对陕西地区2 m气温预报进行订正,研究其订正效果。
2. 资料与方法
2.1. 依据资料
本次研究所采用的模式温度预报资料为欧洲中心ERA5数据集中的每日6时(世界时)起报8小时2 m处温度预报数据,其水平分辨率为,区域范围为陕西及周边地区(北纬31˚~40˚和东经105˚~112˚)。温度实际资料采用的是欧洲中心ERA5数据集中的再分析数据。
2.2. 研究方法
卷积神经网络(Convolutional neural network, CNN)是近年发展起来、受高度重视的一种前馈式人工神经网络。最早针对二维图形识别问题提出,其二维拓扑结构可以处理具有类似网络结构的数据,多维图像数据可直接输入网络。其非全连接、权值共享和局部感受野这些特征可以极大减少网络训练所需参数、大幅降低网络复杂性、避免过拟合风险。这些特征还能在二维图像发生位移、比例扩大或缩小、倾斜、旋转或者其他形式的形变时具有高度的不变性。因此,卷积神经网络在图像处理中应用十分广泛 [20] [22] 。
深度卷积神经网络(Deep convolutional neural network, DCNN)广泛应用于图像去噪领域,通过构建对称式的卷积神经网络、调节卷积核的大小、深度,充分学习含噪图像具有的特征。李传朋等人还在网络构造中添加了反卷积层(如图1所示),构成含噪图像到去噪图像之间的非线性映射关系。其在构建时每层输出、输入图像尺寸一致,避免后续拼接工作和人工边界现象,并通过激活函数添加了映射关系之间的非线性因素,输出图像也不需要经过降维处理,所以在网络中没有添加池化层。该方法在卷积神经网络的基础上,可以通过网络训练,将输入数据中的噪声进行过滤,把过滤后的去噪数据作为输出数据输出 [20] [23] 。
Figure 1. Deep convolutional neural network structure for denoising [20]
图1. 用于去噪的深度卷积神经网络结构 [20]
在本文中,以模式预报数据作为输入数据,再分析数据作为输出数据,模式预报数据与再分析数据之间的误差看作影响模式预报结果的“噪声”,对深度卷积神经网络进行训练,使用训练结果订正模式预报数据。
3. 试验结果分析
3.1. DCNN订正结果分析
本文以2020~2021年为订正期,将订正期内欧洲中心ERA5数据集的预报数据和再分析数据作为输入和输出数据,使用深度卷积神经网络对其进行网络训练次数(epoch)为200次的训练,得到训练后的模型。之后,使用训练后得到的网络模型对2022年1~12月份的欧洲中心ERA5数据集预报数据进行订正,计算订正后的误差并进行分析。
将订正后的预报误差绝对值记为d1、实际的预报误差绝对值记为d2。对图2进行分析可知,240时次之前,大部分时次d1在d2之下,d1小于d2,两者之差即d1~d2大部分小于0℃,特别是一些原始预报误差较大的时次,订正后的预报误差明显缩小。240时次之后,两者之差在0℃附近震荡。这表明深度卷积神经网络订正方法在前期即距离训练期较近的时次能有效降低预报误差,特别是原始预报误差偏大的时次,改善效果明显。
Figure 2. The spatial average changes of d1, d2 and d1~d2 in 2022 using the revised DCNN method
图2. 使用DCNN订正方法d1、d2以及d1~d2的空间平均在2022年的变化
Figure 3. Spatial distribution of d1~d2 mean values in 2022 using the revised DCNN method
图3. 使用DCNN订正方法d1~d2 2022年平均值的空间分布
从2022年d1~d2的时间平均数的空间分布(图3)可以看出,陕西绝大部分区域该值为负,只有西北方向一小片区域该值在0℃左右,该值为正的区域主要在陕西西北方向的宁夏、内蒙古地区,不在陕西区域内。这表明在陕西绝大部分区域,订正后预报误差变小。根据图4可知,陕西及周边地区55%的区域d1~d2的2022年平均值减少了0.4℃以上,仅有19%的区域该值大于0℃,且结合对图3的分析,这些区域主要集中在陕西地区之外。总体而言,深度卷积神经网络订正方法对陕西地区预报误差有明显的订正效果,能够提高预报准确率。
Figure 4. The size distribution of d1~d2 2022 mean (d) using the revised DCNN method
图4. 使用DCNN订正方法d1~d2 2022年平均值(d)的大小分布
陕西及周边地区d2~d1即订正后预报误差绝对值减少量的时间平均如表1所示,1月份增加约0.24℃、2月份增加约0.70℃、3月份增加约1.06℃、4月份增加约0.98℃、5月份增加约0.65℃、6月份增加约0.48℃、7月份增加约0.68℃、8月份增加约0.01℃、9月份增加约0.06℃、10月份减少约0.20℃、11月份减少约0.12℃、12月份增加约0.27℃、1月份至12月份增加0.40℃。这表示,深度卷积神经网络订正方法的订正效果受到时次延长的影响,在前期能有效减少陕西及周边地区预报误差的绝对值,提高预报准确率。
Table 1. The time average of the reduction in the absolute value of the forecast error using DCNN correction
表1. 使用DCNN订正后预报误差绝对值减少量的时间平均值
3.2. 不同epoch对DCNN订正结果的影响
在构造深度卷积神经网络模型时,需要设定参数epoch的数值,该参数是指在网络训练过程中训练集的所有输入数据全部输入模型进行一次完整网络训练的次数,上文中epoch为200的训练结果即为将全部数据集进行200次完整网络训练的结果。参数epoch的大小决定了搭建的网络模型在训练时的完整训练次数,进而影响了输入和输出数据之间映射关系的建立,最终影响训练后网络模型的效果。在本节中分别将epoch设置为100、150和250进行网络训练并和前文epoch为200的训练结果进行比较,分析不同epoch对训练结果的影响。
使用不同epoch训练出的DCNN分别对预报数据进行订正,陕西及周边地区订正后预报误差绝对值减少量(d2~d1)的时间平均如表2所示。参数epoch为100时除在个别月份外,在大部分月份其预报效果均没有epoch为其他数值时预报效果好,在6~8月订正效果为负,其2022年1~12月平均预报误差绝对值减少量约为0.21℃。参数epoch为150时,在3月订正效果表现最优,其他大部分月份订正效果相似或略逊于epoch为200和250时的结果,在8~11月订正效果为负,其2022年1~12月平均预报误差绝对值减少量约为0.28℃。参数epoch为200时,在3月订正最优,在2月相较于epoch为其他值时的订正结果订正效果明显提升,但其在10~11月订正效果为负,2022年1~12月平均预报误差绝对值减少量约为0.40℃。参数epoch为250时,3月订正效果最优,大部分月份订正效果优于或近似于epoch为其他值订正效果,且全年订正效果无负值,8月份之前订正效果好于之后,2022年1~12月平均预报误差绝对值减少量约为0.47℃。总体而言,epoch为250时,DCNN的订正效果更好,且8月之前订正效果更好。
Table 2. The time average of the reduction in the absolute value of the forecast error after correction by DCNN trained with different epochs
表2. 使用不同epoch训练出的DCNN订正后预报误差绝对值减少量的时间平均值
陕西及周边地区d1~d2 2022年平均值的大小分布统计如表3所示。参数epoch为100时,有256个格点订正后d1的年平均大于d2的年平均,订正后预报误差增加,其在区域内占比24%。其余格点均为经过DCNN订正预报误差减少,其中343个格点减少了0.4℃以上,占比32%。参数epoch为150时,d1的年平均大于d2的年平均的格点数量变化不大,有254个,占比24%。经过订正后预报误差减少的格点中有419个格点减少了0.4℃以上,占比39%。参数epoch为200时,d1的年平均大于d2的年平均的格点减少为202个,占比19%。经过订正后预报误差减少的格点中,减少超过0.4℃的格点增加为594个,占比55%。参数epoch为250时,d1的年平均大于d2的年平均的格点进一步减少为146个,占比降低为14%。670个格点经过订正后预报误差减少了0.4℃以上,占比达到62%。综上所述,DCNN的订正效果随着epoch的增加而提升,epoch为250时订正效果最好。
Table 3. Size distribution statistics of d1~d2 mean (d) in 2022 of DCNN model trained with different epochs
表3. 使用不同epoch训练出的DCNN模型d1~d2 2022年平均值(d)的大小分布统计
4. 结论
对于本文提出的深度卷积神经网络方法对陕西地区2 m气温预报订正效果研究,通过上述统计分析可得出以下几点结论:
1) 深度卷积神经网络对陕西地区2 m气温预报订正效果明显,在一定程度上能有效提高预报准确率。
2) 深度卷积神经网络在预报误差大、预报准确率低的时次订正效果更加明显,能够显著降低预报误差。
3) 深度卷积神经网络的订正效果受到参数epoch和订正时次的影响。在一定范围内,epoch越大订正效果越好。距离训练期近的时次整体订正效果更好一些,距离训练期远的时次订正效果较差。
该结论是基于欧洲中心2 m温度预报数据在陕西地区的订正研究得出,该方法在其他地区、应用其他数值预报数据的订正效果仍需进一步研究。