1. 引言
大气温度变化和人类的活动密切相关,精确的大气温度预测是天气预报的一个重要参考指标 [1] ,对人们的日常生产生活具有重要意义。高分辨率数值预报技术的快速发展带动了中小尺度天气预报能力的提高,为我们提供了越来越精确的客观预报产品。但是大气是一个混沌系统,由于模拟大气的数值模式初值场的不确定性、模式自身存在的缺陷,造成了模式预报产品的不确定性和不准确性,存在着无法避免的系统误差。即使数值模式发展至今,系统误差依然存在 [2] 。
为了减小各种因素带来的误差以及提高数值预报的准确率,国内外的学者已做了很多研究。一方面可以通过资料同化来改善初始场,优化模式的辐射过程、微物理过程、边界层方案、积云对流过程、陆面过程等物理过程参数化方案等途径来提高数值模式的准确度;另一方面可以利用误差订正技术对数值预报产品进行解释应用,以降低高分辨率模式中的相对误差可能导致的模式低命中率和高虚假预警率 [3] 。随着计算能力的飞速发展以及数据的急速膨胀,人工智能技术孕育而出,在各个领域大放光彩。有些学者开始尝试将其应用于温度订正中。在一些研究中(如Chattopadhyay等 [4] ,Ustaoglu等 [5] ),根据历史气温数据,再通过考虑时间的滞后性来预测气温是单变量模型方法 [6] ;另一种常见的方法是使用其他相关的气象要素变量。不同的输入变量会显著影响模型的性能,如降雨量、空气湿度、风速、气压等作为预测气温的输入,也就是多元模型 [7] 。因此,人工神经网络模型可以分为两组:第一组仅使用历史气温测量数据作为输入,第二组使用气温和其他相关的气象要素变量。近年来,人工智能迎来第3次发展浪潮并在多个领域大数据分析中取得巨大成功,这为人工智能技术与数值天气预报结合提供了契机 [8] 。在过去的十几年里,很多学者提出了几种深度学习的技术来预测或者订正气温数值预报,如多层感知机MLP (Multi-Layer Perception) [9] 、卷积神经网络CNN (Convolutional Neural Network) [10] 、循环神经网络RNN (Recurrent Neural Network) [11] 、长短期记忆神经网络LSTM (Long short-term Memory Network) [12] 、对抗神经网络(Generative adversarial network) [13] 等。每种深度学习的技术都有其独特的结构,以更好的学习气温规律并进行预测或者订正。卷积神经网络可以与大气物理模式一起进行高分辨格点模型的构建,并将模型用于气象要素预报 [14] ;循环神经网络的变体LSTM和GRU,已被广泛的应用于处理时空序列的问题上,例如降水临近预报和温度预测 [15] 。由此可见,深度学习可挖掘气象要素之间的非线性关系,并进行预测或者预报订正,具有广阔的前景。
2. 数据及处理
2.1. 数据准备
本文使用的模式预报资料为ECMWF高分辨数值模式2 m温度数据。模式2 m温度预报为网格数据,格距为0.125˚ × 0.125˚。起报时刻为每日08:00、20:00 (北京时,下同),预报时效72 h以内间隔3 h,72~240 h间隔6 h。采用福建省台提供的中国气象局陆面数据同化系统(CLDAS-V2.0)近实时产品数据集中2 m气温融合产品作为参考真值 [16] ,时间分辨率为1小时,空间分辨率为0.05˚ × 0.05˚。
检验及订正的时间范围选取2018年1月~2021年12月,空间范围选取115˚E~121˚E、23˚N~29˚N的中国东南部福建地区(图1)。福建地处我国东南沿海,山地、丘陵占据总面积的90%,西部是武夷山脉,东部濒临台湾海峡,自西到东地形起伏较大。考虑到不同海拔高度的气温差异,所以将海拔高度加入到数据集中。

Figure 1. Research area for convolutional neural network model revision
图1. 卷积神经网络模型订正的研究区域
为了使网格预报与实况资料在空间上一致,采用双线性插值法,将2 m温度的模式预报资料插值到空间分辨率为0.05˚ × 0.05˚的网格。
2.2. 数据集划分
试验选用2018年~2020年数据制作训练数据集,其中选取2021年的独立样本制作验证集和测试集。在单个训练数据集合中,输入数据为起报时刻的ECMWF模式未来240 h内的预报格点值以及ECMWF模式过去72 h温度预报与CLDAS实况温度的误差值,训练标签为未来240 h内的CLDAS实况温度值。ECMWF数值预报数据每天起报两次,分别为08时与20时,采用上述方法制作数据集,共可以获得集合数目约为2190个。
3. 订正算法
3.1. 卷积神经网络
卷积神经网络算法是为了提高图像识别效率而发展起来的,一旦经过训练,该算法可以从输入的图像中提取所需的特征来识别信息。卷积神经网络由卷积层、下采样层、全连接层等结构组成。它在结构上具有局部连接、权值共享、时间或空间上的下采样等特点。卷积层通过卷积核对像素进行加权求和,得到原始图像的特征映射,实现特征提取。为了更充分地提取不同的特征,可以在同一个网络中使用多个不同的卷积核。同一特征图中的每个神经元在与卷积核计算时共享权重,这大大减少了参数的数量和过拟合的风险。与传统的神经网络相比,使用卷积神经网络进行图像识别任务的最大优势是在参数较少的情况下,数据处理效率高。然而,卷积神经网络算法的应用并不局限于图像识别。如果可以将任何数据排列成二维或三维的数据数组,并且数组具有一定的信息意义,那么卷积神经网络就可以从特征提取意义上提取出有意义的信息。
3.2. 建立订正模型
本文搭建了多个卷积层的卷积神经网络的结构,如图2所示。网络主体分为两个部分:首先将input 1进行图像降维和特征提取,再入input 2数据进行复制拼接,实现特征融合。核心处理为卷积层和池化层。卷积层采用二维卷积来提取输入的特征信息,例如输入大小为24 × 121 × 121的气象要素图片,经过128 × 3 × 3大小的卷积核,图像大小变为128 × 121 × 121,为保持图片前后的长和宽不变,需要进行边界填充。池化层在模型中的作用为增强模型的泛化能力,在尽可能地保留输入气象要素主要特征的同时,减少模型的参数。

Figure 2. The network structure of CNN
图2. 卷积神经网络结构
模型的订正流程如图3所示:首先将起报时刻前三天,每天3 h、6 h、9 h、12 h、15 h、18 h、21 h、24 h温度预报与CLDAS实况温度偏差输入到模型中,输入数据共24层,每层数据大小为121 × 121。经过三层卷积、池化,提取出前3天温度预报偏差的特征图;第二步将提取出的特征图与时报时刻温度预报和地形信息进行拼接,最后经过一层卷积层,进行特征融合得到数值预报订正结果。

Figure 3. Process diagram for revision using a convolutional neural network
图3. 使用卷积神经网络进行订正的流程示意图
4. 模型订正结果及分析
4.1. 模型评价指标
本文采用气温预报的业务评价指标作为检验指标,包括平均绝对误差MAE (Mean Absolute Error)、均方根误差RMSE (Root Mean Squared Error)以及预报准确率PC (Prediction Chance),各指标计算方法如下:
a) 平均绝对误差
(1)
式(1)中,n为预报气温的站(格)点个数,
为第i个站(格)点的预报气温,
为第i个站(格)点的CLDAS气温。
b) 均方根误差
(2)
式(2)中,
为站(格)点个数,
为第i个站(格)点的预报气温,
为第i个站(格)点的CLDAS气温。
c) 预报准确率
(3)
式(3)中,
为预报气温与CLDAS气温相差在±2℃以内的站(格)点个数,
为预报气温总站(格)点个数。
4.2. 模型订正结果及分析
使用2018~2021年ECMWF模式的2 m气温预报数据与CLDAS地面温度数据集对卷积神经网络订正模型进行训练,用验证集对模型检验。图4展示了订正结果的月均统计。总体来讲,ECMWF模式2 m气温预报产品准确率较高,在70%左右,0~192 h预报时效的平均绝对误差在2℃以内,19~240 h预报时效的平均绝对误差在2.2℃上下波动,均方根误差基本都在3℃以内。预报误差随着预报时效的增加而逐渐加大。经过模型订正后预报准确率都有明显的提升,平均绝对误差和均方根误差都显著减小,订正后ECMWF的2 m气温240预报时效内的预报精度均高于订正前精度。对比图4可以看出ECMWF的2 m气温预报在订正后预报准确率提升了5%左右,144 h预报时效前预报准确率均保持在75%以上。平均绝对误差下降了0.3℃左右,均方根误差下降0.5℃左右。
(a)
(b)
(c)
Figure 4. Comparison before and after ECMWF model temperature forecast revision: (a) PC; (b) MAE; (c) RMSE
图4. ECMWF模式温度预报订正前后对比:(a) 预报准确率;(b) 平均绝对误差;(c) 均方根误差
福建位于亚热带季风气候带,夏季高温而又多雨,冬季温和而又少雨,夏季与冬季的温度差异较大。为了分析模型对于不同季节的订正效果是否存在明显的差异,选取6月与11月两个月的月平均数据作为高温季节和低温季节的代表进行个例分析。图5和图6为2021年6月与11月ECMWF模式2 m温度订正结果的预报准确率、平均绝对误差、均方根误差与订正前的对比。可以看出订正前的温度模式预报产品6月精度高于11月,分析6月份处于炎热季节,气温变化不大,所以预报的精度稍好,而11月份处于秋冬交替,常有转折性低温天气,模式预报不能很好地预见此类事件发生,因而预报精度稍低。经过卷积神经网络模型的订正后,两个月份均取得了一定的订正效果。6月份温度的预报准确率提高了10%左右,平均绝对误差降低约0.35℃,均方根误差降低约0.5℃。11月份温度的预报准确率提升了3%左右,平均绝对误差降低了约0.25℃,均方根误差降低了约0.4℃,但是随着预报时效的增加,模型订正的效果逐渐减弱。
结合验证集的检验结果和2021年6月、11月的月均统计结果,经过卷积神经网络模型订正后,无论模式初始的预报精度是否较高,都会较原来精度有所提升。降低了模式预报误差,提升温度预报的准确率,这对实现福建精细化网格预报具有重要作用。

Figure 5. Revised ECMWF model 2 m temperature forecast in June 2021 compared to pre-revision
图5. 2021年6月ECMWF模式2 m温度预报订正后与订正前的对比

Figure 6. Revised ECMWF model 2 m temperature forecast in November 2021 compared to pre-revision
图6. 2021年11月ECMWF模式2 m温度预报订正后与订正前的对比
5. 结论与展望
本文结合CLDAS近实时产品地面温度数据集,使用卷积神经网络的方法对ECMWF模式温度预报格点产品进行了误差分析和订正研究。通过建立模型、选取输入要素、调整模型结构等步骤,得出的订正模型可以较好地订正模式的系统偏差,从而提高ECMWF模式2 m温度预报的预报精度。同时研究结果发现模式预报对于转折性天气的预报能力较弱,此时的订正模型可以提高模式预报的预报精度。主要结论如下:
1) ECMWF模式2 m温度预报产品具有低海拔地区偏低,高海拔区域偏高的系统性偏差,并且夏季预报精度高于冬季。整体预报准确率在70%左右。使用卷积神经网络模型订正后,ECMWF模式2 m温度预报产品的精度得到改善,预报准确率提升约5%,平均绝对误差和均方根误差均降低了0.5℃~0.8℃。
2) 在整个模型订正的试验中,气温的预报准确率随着预报时效的延长而逐渐下降,绝大部分的大值误差出现在转折性天气阶段,而模型的订正可以稳定地提高模式预报的精度。对比传统使用历史长期资料的订正方式,模型可以使用更少的数据,达到较好的订正效果,减少统计工作量。
综上所述,卷积神经网络模型在温度预报上有很好的订正能力,可以稳定地提高ECMWF模式2 m温度预报的预报精度。但是本研究还有需要改进的地方,CLDAS近实时产品地面温度数据集并不能完全地代替观测数据,与温度的真实值还有些许出入;同时,本次试验仅使用了温度这单一要素作为输入,是单变量模型。因而在接下来的工作中会继续开展使用与温度相关性高的气象要素作为输入,构建多元变量模型来对温度进行订正,进一步探索提高模式温度预报数据精度的方法。
致谢
感谢福建省气象台提供的ECMWF预报数据及CLDAS近实时产品地面温度数据集。
基金项目
江苏省研究生科研实践项目(SJCX21_0374)。