1. 引言
在当前全球气候变化和区域天气模式日趋复杂的背景下,准确的气象数据已成为天气预报、气候研究以及新兴的神经网络和深度学习等前沿技术领域不可或缺的基础。欧洲中期天气预报中心(ECMWF)生产的第五代全球气候再分析数据集ERA5,与前一代ERA-Interim相比,ERA5在数值模式、同化系统和观测数据处理方面进行了改进,减少了系统性偏差,提高了数据的准确性和可靠性,更以其高时空分辨率和丰富的气象变量受到广泛关注[1]-[3]。已有研究指出,各家再分析资料在高原地区的适用性均不及平原地区,而对于不同的气象要素和物理量,不同资料在青藏高原的适用性也各有优劣。刘佳等[4]指出,在中国西南复杂地形区,ERA5再分析数据对地面各要素(2 m气温、降水、10 m风速、10 m风向)的适用性均优于ERA-Interim;温婷婷等[5]利用1979~2017年青藏高原131个气象台站实测降水资料,评估了CRU、ERA5和CMFD三种再分析降水资料在青藏高原的适用性,结果显示ERA5数据对青藏高原年降水的模拟能力较强,与观测值的相关系数均超过了0.9;麦哲宁等[6]在对高原低涡客观识别方法的研究中也是基于ERA5高分辨率资料。
高空气象要素,包括风场、温度、湿度和气压场等,对于气象研究和预报尤为重要。对于地处低纬高原的贵阳机场,由于地理位置、地形地貌等因素的复杂性,全球再分析数据在山地地区的适用性可能会受到一定的影响。因此,对ERA5再分析数据在贵阳机场高空气象要素的适用性进行深入分析,对于提高机场气象服务的准确性和可靠性具有重要意义,亦能为今后人工智能在贵阳机场气象预报模型中的应用提供坚实的数据基础。
2. 资料介绍
本文使用的数据包括:(1) 来自欧洲中期天气预报中心(ECMWF)ERA5提供的再分析数据;(2) 贵阳机场Airda-HGT4型微波辐射计资料;(3) 贵阳机场CFL-03型大气边界层风廓线雷达资料。
ERA5再分析数据时间分辨率为1 h,空间分辨率为0.25˚ × 0.25˚,选取的高空气象要素有风向、风速(风向和风速由纬向风和经向风计算得出)、温度、相对湿度,选用23个标准层(1000, 975, 950, 925, 900, 875, 850, 825, 800, 775, 750, 700, 650, 600, 550, 500, 450, 400, 350, 300, 250, 225, 200 hPa),时间为2022年1月~2023年2月。
对于传统探空资料,其主要依赖于每天两次(08时和20时左右)定时释放的探空气球来获取大气的温度、湿度、风向和风速等参数,这种探测方式在时间分辨率上存在一定的不足,两次探测之间存在较长的数据空白期,无法连续捕捉大气中天气要素快速变化的过程,进而导致对大气状况的把握和预报的准确性出现偏差。因此本文选用的实况温度和湿度数据由贵阳机场微波辐射计提供,风向和风速资料由风廓线提供,它们能提供逐时的数据,实现对大气状况的连续监测。
贵阳机场安装的Airda-HGT4型微波辐射计和CFL-03边界层风廓线雷达均安装在机场跑道南端入口处(106.79˚E,26.54˚N,海拔1150m),全天24 h不间断连续运行。其中微波辐射计配置了两个探测频段,14个信号通道,7个通道滤波器用来获取湿度廓线,频率范围在22~31 GHz,7个通道滤波器用来获取温度廓线,频率范围在51~58 GHz,获得的亮温数据可反演得到的大气温度、水汽密度、相对湿度和液态水密度廓线等多种物理量,垂直探测高度为10,000 m。风廓线雷达采集数据的频率为6分钟一次,最小探测高度小于60米,最大探测高度为3000~6000米;有两种观测模式,1500米以下采用低模式探测,垂直分辨率为60米,1500米采用高模式探测,垂直分辨率为120米。
对于贵阳机场微波辐射计和风廓线雷达的可用性,已有学者将其与探空资料进行过对比分析[7]。通过对比2022年6~8月每日08时和20时贵阳站探空和贵阳机场微波辐射计对应的温度和露点资料,可得两种资料温度和露点的相关系数分别高达0.997和0.972,气温差值基本在1.5℃以下,而露点差值多在5.0℃以下;对于风廓线资料,通过读取2019年1月~2022年6月每日08时和20时850 hPa、700 hPa、500 hPa贵阳站探空风资料及对应的贵阳机场风廓线风向、风速资料,计算两种资料对应时次和高度上的风向和风速差,可知贵阳机场风廓线资料与探空资料的风向差基本小于20˚,而风速差基本小于2 m/s。总的来看,贵阳机场风廓线资料和微波辐射计资料具有较高的可信度。
3. 方法
选取样本数据的时间段为2021年12月~2023年2月,ERA5选择距离贵阳机场微波辐射计和风廓线雷达位置最近的格点(106.5˚E, 26.5˚N)。对于微波辐射计资料,先挑选出对应时间段内的整点数据,再对数据进行质控处理,具体方式参照赵美艳等[8]:对温度廓线做逐层极值检查,若有1层及以上的数据超过40℃,则剔除该时次;湿度廓线则剔除整层湿度变化极小(<1%)和相邻高度层湿度变化极大(>85%)的廓线。对于风廓线资料,其资料本身包含每日逐小时产品数据OOBS文件,无需挑选,但同样需要进行质控处理,首先对各个高度超过气象值最大限度的极端值剔除[9],如低于1500米时风速超过46.3 m/s、1500~3000 m超过61.73m/s等,将这些高度层中超过阈值的风速数据点剔除,再对风场数据进行垂直性的一致性检验,如果某高度层的垂直变化值同时大于其上下2层的垂直变化值的3倍,则视为异常值并剔除。
时间匹配上,ERA5数据完整,而微波辐射计和风廓线资料存在不同程度的缺测或异常,因此以微波辐射计和风廓线资料的可用时次为准,用ERA5资料分别与之统一;高度匹配上,以ERA5资料的高度层为基准,将微波辐射计资料和风廓线资料使用线性插值的方式将数据插值到ERA5的高度层上,其中,微波辐射计的探测高度为0~10,000 m,仪器安装高度为1150 m,因此可以插值到18个标准层(875~200 hPa);风廓线雷达的探测高度受降水、大气湿度的影响,500 hPa以上的数据缺测较多,因此插值到11个标准层(875~500 hPa)。
为定量地评估ERA5再分析资料在贵阳机场的适用性,选用相关系数、均方根误差、平均偏差以及标准差来检验再分析资料对实际探测资料的偏离程度,计算公式如下:
相关系数 (1)
均方根误差
(2)
平均偏差
(3)
标准差 (4)
其中,式(1)~(3)中N为样本数量,i为每一个样本,XERA5为ERA5再分析资料,Xobs为微波辐射计或风廓线探测资料;式(4)中N为样本数量,i为每一个样本,
为第i个样本的值,
为样本值的平均值。
4. 适用性分析
4.1. 微波辐射计与ERA5误差分析
选取850 hPa、700 hPa、500 hPa三个标准层,分别绘制微波辐射计和ERA5对应温度和相对湿度的散点图,见图1,对于温度(图1(a)~(c)),850 hPa上两种资料的相关系数高达0.94,散点分布比较集中,说明两种温度资料差异较小;700 hPa上的散点分布则比较分散,数据的一致性较差,相关系数为0.80;500hPa上微波辐射计和ERA5的温度散点较为集中,且截距为负值,说明ERA5的温度相较微波辐射计测得的温度偏低,两者相关系数为0.85。
对于相对湿度(图1(d)~(f)),850 hPa上两种资料的相对湿度多分布在80%以上,散点分布相较700 hPa和500 hPa集中,相关系数达0.87;700 hPa和500 hPa上的散点分布则比较散乱,相关系数分别为0.77和0.72,其中700 hPa上相对湿度在70%以上的点分布相对集中,而500 hPa上则是小于20%的值集中,三个标准层上ERA5的相对湿度比微波辐射计测得的值偏大,甚至出现了大于100%和小于0%的相对湿度值,说明在使用ERA5的相对湿度资料进行其他物理量的计算前需要先订正超过100%和小于0%的资料。总的来看,微波辐射计和ERA5对应的温度资料和相对湿度资料在低层850 hPa上的一致性较高,ERA5的值比微波辐射计测得的值偏大。
计算875~500 hPa上微波辐射计和ERA5对应温度和相对湿度的均方根误差、平均偏差和误差的标准差,如图2所示,其中均方根误差是一个衡量两种资料偏差的统计指标,它通过平方误差的平均值的平方根来量化误差的大小,其值越小表示两种资料的吻合度越高;平均偏差提供了数据离散程度的直观度量,其值越小,表示数据点越紧密地围绕平均值分布;误差的标准差是评估数据一致性和可靠性的重要指标,它提供了数据点偏离平均值的波动范围,较小的误差标准差值意味着两种资料更加一致。从图2(a)可见,两种资料对应温度的均方根误差、平均偏差和误差的标准差均呈现先减小后增加再减小的趋势,均方根误差和平均偏差拐点出现在750 hPa和550 hPa的高度层上,而误差的标准差拐点为825 hPa和650 hPa。温度均方根误差范围在1.8℃~3.2℃,差异最大的高度层出现875 hPa,差异最小出现775 hPa上,850~650 hPa均方根误差较小,均值为2.0℃,说明微波辐射计和ERA5的温度资料吻合度较高;平均偏差的分布特征与均方根误差类似,均值为1.9℃,最小值为1.5℃,而850~650 hPa平均偏差在1.6℃左右;误差的标准差显示,在750 hPa及以下的高度层上,微波辐射计和ERA5的温度资料一致性较强,误差的标准差1.5℃左右,700 hPa及以上误差的标准差相对较高,均值为2.3℃,最大达2.3℃。
Figure 1. Scatter plots of temperature (a)~(c) and relative humidity (d)~(f) from microwave radiometer and ERA5 at 850 hPa, 700 hPa, and 500 hPa (red lines are the fitting lines)
图1. 850 hPa、700 hPa、500 hPa上微波辐射计和ERA5温度(a)~(c)、相对湿度散点图(d)~(f) (红线为拟合线)
Figure 2. Error distribution of temperature (a) and relative humidity (b) between the microwave radiometer and ERA5 at different height levels
图2. 各层高度微波辐射计和ERA5温度(a)、相对湿度(b)的误差分布
从相对湿度对应的统计误差来看(图2(b)),两种资料相对湿度的均方根误差、平均偏差和误差的标准差随高度的变化趋势基本一致,主要呈单峰型分布,峰值出现在650 hPa,与温度差异出现拐点的高度层相同,但是总体上看,随着高度的增加相对湿度的差异越大,其中三种误差的最小值均出现在850 hPa上。其中相对湿度的均方根误差分布在9%~18%,平均值为13%,775 hPa以下的差异较小,均方根误差在10%左右,750~600 hPa相对湿度相对较大,均方根误差均值达17%;平均偏差均值为10%,750 hPa以下的偏差均在10%以下,说明两种资料的相对湿度值在低层差异较小;误差的标准差在各层的值与对应的均方根误差值比较相近,只是略微偏低,但平均仅偏低0.5%。
相关系数可以用来量化两个变量之间线性关系强度和方向,取值范围为−1~1,其中1表示完全正相关,−1表示完全负相关,越接近0则表示相关性越小,从表1可见,微波辐射计和ERA5对应的温度数据相比相对湿度数据有更好的相关性,并且两种数据在低层的相关性高于高层。其中温度在700 hPa及以下的相关系数均在0.90以上,平均值为0.93,最高达0.94,700 hPa以上的相关系数则在0.84左右;相对湿度的相关系数平均值为0.80,最大值出现在850 hPa,为0.87,最小值仅有0.72。
Table 1. Correlation coefficients of temperature and relative humidity between the microwave radiometer and ERA5 at different height levels
表1. 各层高度微波辐射计和ERA5温度、相对湿度的相关系数
气压/hPa |
875 |
850 |
825 |
800 |
775 |
750 |
700 |
650 |
600 |
550 |
500 |
温度 |
0.93 |
0.94 |
0.94 |
0.93 |
0.92 |
0.90 |
0.80 |
0.79 |
0.84 |
0.86 |
0.85 |
相对湿度 |
0.84 |
0.87 |
0.84 |
0.81 |
0.78 |
0.77 |
0.77 |
0.81 |
0.79 |
0.78 |
0.72 |
箱线图可以展示一组数据的统计特征及其异常值,从图3可以看到,温度差整体上看在0.9℃~2.7℃左右,中位数平均值为1.7℃,中低层的温度差分布的集中程度高于高层,825~750 hPa的温度差相对较小,在0.7℃~2.2℃左右,而650~500 hPa的温度差相对较大,为0.8℃~3.0℃左右;从中位数的大小来看,750 hPa和700 hPa温度差异较小,均为1.3℃。从相对湿度的差异来看,取值范围主要分布在4%~14%,其中750~600 hPa的相对湿度差值分布范围较广,最高为21%,最低为5%,其余层次相对集中,其中850 hPa最为集中,范围为2%~9%。
Figure 3. Box plots of the differences in temperature (a) and relative humidity (b) between the microwave radiometer and ERA5 at different height levels
图3. 各层高度微波辐射计和ERA5温度差值(a)、相对湿度差值(b)箱线图
4.2. 风廓线雷达与ERA5误差分析
从风廓线雷达和ERA5对应风向和风速的散点图可以看到,见图4,风速在各层的散点分布相比风向更加集中,从风速分布上看,850 hPa上风廓线雷达对应的风速多在7.5 m/s以下,而ERA5的风速数据在7.5~12 m/s区间内还有较多散点分布;700 hPa上的散点分布更加集中,数据的一致性较好,两种资料的风速散点均在0~25 m/s广泛分布;500 hPa上风速散点分布也比较集中,并且总体上看,ERA5的风速比风廓线雷达的测风偏小。从风向上看(图4(d)~(f)),850 hPa上风廓线雷达的风向主要分布在0~200˚,多集中在0~50˚ (东北风),而ERA5风向资料则主要分布在25˚~150˚,而25˚~100˚的风向偏多(东北至偏东风),两种资料的风向度数虽有差异,但主要的风向基本是一致的;700 hPa上风廓线雷达风向主要集中在200˚~300˚,以西南风为主,而ERA5的风向则以180˚~280˚的西南风和300˚~360˚的西北风为主;500 hPa上两种资料的风向一致性则较好,散点分布比较集中。
Figure 4. Scatter plots of wind speed (a)~(c) and wind direction (d)~(f) between the wind profiler radar and ERA5 at 850 hPa, 700 hPa, and 500 hPa (red lines are the fitting lines)
图4. 850 hPa、700 hPa、500 hPa上风廓线雷达和ERA5风速(a)~(c)、风向散点图(d)~(f)(红线为拟合线)
Figure 5. Error distribution of wind speed (a) and wind direction (b) between the wind profiler radar and ERA5 at different height levels
图5. 各层高度风廓线雷达和ERA5风速(a)、风向(b)的误差分布
从各层高度风廓线雷达和ERA5风速、风向的误差分布来看,见图5,风速的均方根误差、平均偏差和误差的标准差呈现先增后减再增的趋势,其中风速均方根误差范围在2.2~3.8 m/s,均值为3.1 m/s;各层平均偏差的平均值为1.3 m/s,775 hPa和700 hPa上的平均偏差较小,分别为0.4 m/s和0.5 m/s,850 hPa上的差异较大,达2.3 m/s;误差的标准差分布在2.2~3.2 m/s之间,总体分布在2.8 m/s左右。对于风向,三种误差随着高度总体呈减小的趋势,说明越到高层两种资料的风向数据越一致,其中风向的均方根误差和误差的标准差在各层的数值接近,在775 hPa及以下两者的平均值分别为27˚和26˚,而775 hPa以上的均值则都减小至20˚;风向的平均偏差整体上差异较小,范围为7˚~14˚,平均值为10˚,尤其是775 hPa及以上高度的平均偏差变化在3˚以内。
从表2给出的相关系数来看,微波辐射计和ERA5的风速数据比风向数据的相关性更高,并且两种数据在高层的相关性更好。其中两种资料的风向数据在750 hPa及以下的相关系数均在0.80以下,最大值也仅有0.84,出现在500 hPa;风速在各层的相关系数均大于风向,平均值高达0.93,750 hPa及以上的相关系数均在0.90以上,最高值为0.99,而风速相关系数的最小值0.86也大于风向的最大值。
Table 2. Correlation coefficients of wind speed and wind direction between the wind profiler radar and ERA5 at different height levels
表2. 各层高度风廓线雷达和ERA5风速、风向的相关系数
气压/hPa |
875 |
850 |
825 |
800 |
775 |
750 |
700 |
650 |
600 |
550 |
500 |
风向 |
0.59 |
0.61 |
0.71 |
0.71 |
0.72 |
0.77 |
0.83 |
0.80 |
0.82 |
0.81 |
0.84 |
风速 |
0.86 |
0.89 |
0.89 |
0.87 |
0.88 |
0.92 |
0.98 |
0.98 |
0.98 |
0.98 |
0.99 |
从各层高度风廓线雷达和ERA5风速差值和方向差值的箱线图可以看到,见图6,风速差的变化范围整体上看小于风向差,风向差在低层的差异明显大于高层。对于风速差值,每层高度上的风速差中位数在0~2 m/s之间,风速差分布的集中区域由低层到高层依次为−1.1~1.6 m/s、0.6~3.8 m/s、−0.1~3.7 m/s、−1.1~2.6 m/s、−1.5~2.0 m/s、−0.1~3.7 m/s、−1.2~1.7 m/s、−1.1~2.2 m/s、−1.0~2.6 m/s、−0.9~3.3 m/s、−0.6~3.7 m/s。对于风向差值,750 hPa及以下差值的集中程度明显低于750 hPa以上的高度层,中位数平均值为49˚,875 hPa和800 hPa风向差的差异较大,主要分布在18˚~50˚和22˚~53˚,700 hPa及以上的风向差比较集中,主要分布在47˚~58˚。
Figure 6. Box plots of the differences in wind speed (a) and wind direction (b) between the wind profiler radar and ERA5 at different height levels
图6. 各层高度风廓线雷达和ERA5风速差值(a)、方向差值(b)箱线图
5. 结论
(1) ERA5的温度资料与微波辐射计的温度在低层的一致性较高,ERA5的值比微波辐射计测得的值偏大,在750 hPa及以下的高度层上两者误差的标准差为1.5℃左右,总的平均偏差为1.9℃,相关系数均值达0.88;
(2) ERA5的温度资料与微波辐射计的相对湿度随着高度的增加差异越大,均方根误差和平均偏差平均值分别为13%和10%,相关系数均值为0.79;
(3) ERA5的风速资料比风廓线雷达的风速偏小,在各层的差异较小,均方根误差和平均偏差的平均值分别为3.1m/s和1.3 m/s,相关性高达0.93;
(4) ERA5的风向资料与风廓线雷达的风向越到高层差异越小,相关系数均值为0.75,虽然风向度数存在差异(中位数平均值为49˚)但反应的主要方位角(东、南、西、北)基本一致。