摘要: CLDAS提供了高时空分辨率的陆面融合数据集,为湖北精细化气象服务提供了重要的数据支撑,而数据的适用性评估及其订正是开展数据应用的重要基础。本文以湖北省82个国家级自动气象站逐日温度为基准,采用偏差、平均误差、平均绝对误差、均方根误差和相关系数等指标,分析2018~2022年CLDAS气温产品在湖北区域的适用性,并用一元线性回归模型对CLDAS温度产品开展订正研究,且用2023年资料对模型进行回代检验。结果表明:(1) CLDAS温度产品在1月、3月、5月、10月、11月和12月的空间分布与实况差距较大,在2月的空间分布与实况匹配度较高;汛期(5月、6月、7月、8月、9月)为暖偏差,1月、2月、3月、11月、12月为冷偏差。(2) CLDAS温度产品插值和站点观测值相关性不强,但4月和10月的质量优于其他时间。相关系数以正相关为主,中度相关的站点数比例为21%~40%,高度相关的站点数比例7%~17%。(3) CLDAS温度插值在4月、10月分别降低0.5℃、3℃后,与站点实况基本相同,可作为站点稀疏地区的参考。
Abstract: CLDAS provides a high spatiotemporal resolution land surface merged dataset, offering crucial data support for refined meteorological services in Hubei. The applicability assessment and correction of this data serve as an important foundation for its application. Using the daily temperature data from 82 national-level automatic weather stations in Hubei Province as a benchmark, this study employed indicators such as BIAS, ME, MAE, RMSE, and R to analyze the applicability of the CLDAS temperature product in the Hubei region from 2018 to 2022. A univariate linear regression model was used to conduct correction research on the CLDAS temperature product, and data from 2023 were used for back-substitution testing of the model. The results indicate that: (1) The spatial distribution of the CLDAS temperature product showed significant discrepancies with observations in January, March, May, October, November, and December, while the spatial distribution in February matched observations relatively well. A warm bias was observed during the flood season (May, June, July, August, September), and a cold bias was observed in January, February, March, November, and December. (2) The correlation between the interpolated CLDAS temperature product and station observations was not strong, but the quality in April and October was better than in other periods. The correlation coefficients were predominantly positive, with the proportion of stations showing moderate correlation ranging from 21% to 40%, and the proportion showing high correlation ranging from 7% to 17%. (3) After reducing the interpolated CLDAS temperature by 0.5˚C in April and 3˚C in October, it became essentially the same as the station observations and can be used as a reference for areas with sparse stations.
1. 研究目的及意义
随着现代气象事业的发展及观测手段的更新,精准的气象服务给我国气象事业的发展提出了更高的要求[1]。复杂的地形造成湖北观测站点空间分布的非均匀性显著,难以准确表征气象要素空间变化,因此多使用再分析数据或陆面同化资料作为真值进行相关应用研究[2]。中国气象局陆面数据同化系统(CMA Land Data Assimilation System, CLDAS)产品是中国局下发的基于观测、雷达、卫星的融合产品[3]-[8]。国家信息中心2018年完成了13气象要素28个气象变量的融合实况分析产品实现业务准入,CLDAS1.0是陆面数据同化系统第一版产品;2020年4月底,CLDAS2.1为省级信息中心气象资料业务系统MDOS提供实况产品的数据支撑。
近年来,学者们在气象网格实况产品的适用性研究方面开展了大量工作,但因缺乏均匀分布且周密的站点观测资料,高分辨率格点产品的检验及评估存在一定的困难,基于观测站点的温度检验一般采用双线性插值将格点产品插值到站点[1]。潘留杰等[9]提出利用站点误差传递到格点的思路对陕西省的模式温度产品实现了精细化格点预报订正。俞剑蔚等[10]采用误差分析和准确率方法,评估了网格实况产品在江苏地区的适用性。齐铎等[11]对中国东北部的预报能力进行初步检验与偏差订正,结果表明气温预报准确率有较明显的季节性误差,与海拔高度呈负相关。龙柯吉等[12]、吴薇等[13]、郭旭等[14]分别研究了CLDAS和CMPAS产品在四川地区的适用性,发现逐小时产品与站点实况基本一致,具有较高的参考性。
为弥补湖北复杂地形下站点观测稀疏的问题,利用CLDAS产品代替观测站点进行精细化应用是一个重要途径。本文应用2018~2022年CLDAS产品中的逐日2 m气温,评估其在湖北各区域的适用性,最后用线性回归方法对温度产品进行订正检验。
2. 资料与方法
观测数据来自湖北省气象信息与技术保障中心,选取82个国家站逐日观测数据作为研究真值(图1),时间为2018年1月1日至2023年12月31日。CLDAS温度数据下载自国家气象科学数据中心(http://data.cma.cn/)。
(来源:Arcgis制图)。
Figure 1. Spatial distribution of national-level surface meteorological observation stations in Hubei province
图1. 湖北省国家级地面气象观测站空间分布
本文以经过质控的观测站点资料作为真值,将CLDAS温度产品插值到观测站点,统计比较一段时间内两者的误差。插值法是采用双线性插值,就是通过实况站点周围的4个格点值及相对位置进行插值[15]。采用偏差(BIAS)、平均误差(ME)、平均绝对误差(MAE)、均方根误差(RMSE)、相关系数(R)等指标进行适用性分析[16] [17]。以2018~2022年月插值为滑动训练期,使用训练期站点的观测数据y和CLDAS插值x的资料序列做一元线性回归分析,在每个站点上建立回归方程。
3. 月平均气温对比分析
提取湖北省82个国家站经纬度信息,根据位置信息将CLDAS格点温度插值到对应的站点上,得到插值后的温度序列后,与站点实况进行对比分析。
从月平均气温的时间变化趋势来看(图2),CLDAS月平均气温随时间呈单峰型分布,最大值出现在8月,最小值出现在1月;而实况显示,月平均气温随时间波动不大,稳定在16.0℃至19.0℃,峰值不明显。与实况对比,CLDAS月平均气温的时间变化趋势与实况相差较大。分月来看,5月、6月、7月、8月、9月为暖偏差,1月、2月、3月、11月、12月为冷偏差。4月和10月偏差最小,1月和8月偏差最大。
Figure 2. Monthly average temperature comparison in Hubei province
图2. 湖北逐月平均气温对比
经对比分析,CLDAS月平均气温的空间分布基本无变化,均表现出自东南向西北逐渐递减的分布特征,其中最低温度区域始终出现在鄂西南山区。与观测实况对比,CLDAS在大部分月份的空间分布与实况差距较大,如1月、3月、5月、10月、11月和12月。特别在季节转换和秋季表现较差,如实况显示1月、10月、11月全省气温西部高于东部,3月和9月北部高于南部,CLDAS在这5个月的空间分布特征与实况相反。但在2月的空间分布与实况匹配度较高。
4. 误差的时空分布特征
计算插值数据与实况数据的偏差(BIAS)、平均误差(ME)、平均绝对误差(MAE)、均方根误差(RMSE)、相关系数(R),公式参考《气象统计分析与预报方法》[18] [19]。
从表1统计来看,1月的偏差最小,为0.28℃,8月最大,为1.79℃。从平均误差的统计来看,正误差出现在4月、5月、6与、7月、8月、9月、10月,说明在4~10月,CLDAS温度插值高于站点观测值;负误差出现在1月、2月、3月、11月、12月,说明在这些月份CLDAS温度低于站点观测。平均误差最小出现在4月,为0.77℃;误差最大出现在1月,为−13.22℃。4月和10月的平均绝对误差和均方根误差最小;1月和8月的平均绝对误差和均方根误差最大。从相关系数来看,正相关的月份出现在3月、4月、6月、9月、12月,负相关出现在1月、2月、5月、7月、8月、10月、11月。最大相关系数出现在6月,为0.1697。综合所有的误差统计,CLDAS温度产品插值和站点观测值相关性不强,但4月和10月较其他月份偏差最小。
综合考虑4月和10月插值与实况拟合度优于其他时段,结合四季变化,选取1月、4月、7月、10月分别代表冬、春、夏和秋季,并对这四个月份误差的空间分布进行详细分析。以相关系数为例,从其空间分布来看(图3),1月CLDAS温度差值与实况观测在湖北大部区域为正相关。负相关的站点数为26个,占总站点数的31.7%。相关系数最大为0.99,出现在广水。相关系数小于0.8且大于0.5的站点数为23个,占总站点数的28%;相关系数小于0.95且大于0.8的站点数为11个,占总站点数的13.4%;大于0.95的站点数为2个。4月插值与实况观测在湖北中北部和东南部为正相关,其他区域以负相关为主。负相关的站点数为38个,占总站点数的46.3%。相关系数最大为0.96 (负值),出现在应城。相关系数小于0.8且大于0.5的站点数为17个,占总站点数的20.7%;相关系数小于0.95且大于0.8的站点数为6个,占总站点数的7.3%;大于0.95的站点数为1个。7月插值与实况观测在湖北分布较匀称,以负相关为主。负相关的站点数为70个,占总站点数的85.4%。相关系数最大为0.92 (负值),出现在恩施。相关系数小于0.8且大于0.5的站点数为33个,占总站点数的40.2%;相关系数小于0.95且大于0.8的站点数为8个,占总站点数的9.8%。10月插值与实况观测在湖北大部区域为正相关,湖北西部部分地区有负相关。负相关的站点数为8个,占总站点数的9.8%。相关系数最大为0.94,出现在竹溪。相关系数小于0.8且大于0.5的站点数为30个,占总站点数的40.2%;相关系数小于0.95且大于0.8的站点数为14个,占总站点数的17.1%。综上分析,CLDAS温度插值与实况观测的相关系数除7月以负相关为主,其他时间月份正相关站点数比例均超过50%,以正相关为主。CLDAS温度插值与实况观测数据中度相关的站点数比例为21%~40%,高度相关的站点数比例7%~17%。7月、10月的相关性整体高于另外两个月。
Table 1. Error statistics for interpolated versus observed temperatures
表1. 温度插值与观测值误差统计
时段 |
BIAS |
ME |
MAE |
RMSE |
R |
1月 |
0.2899 |
−13.2185 |
13.2185 |
13.4323 |
−0.0142 |
2月 |
0.4169 |
−11.0787 |
11.0787 |
11.3008 |
−0.0204 |
3月 |
0.8009 |
−3.4356 |
3.5124 |
4.0326 |
0.0392 |
4月 |
1.0442 |
0.7702 |
2.1526 |
2.6410 |
0.0188 |
5月 |
1.4176 |
6.6720 |
6.7033 |
7.0675 |
−0.0388 |
6月 |
1.5609 |
9.6915 |
9.6915 |
9.9650 |
0.1697 |
7月 |
1.5365 |
10.0682 |
10.0682 |
10.4346 |
−0.1179 |
8月 |
1.7872 |
13.0328 |
13.0328 |
13.2907 |
−0.1314 |
9月 |
1.3921 |
7.0948 |
7.1077 |
7.6645 |
0.0843 |
10月 |
1.0828 |
1.4141 |
2.1048 |
2.6931 |
−0.1353 |
11月 |
0.8261 |
−2.9685 |
3.0936 |
3.6924 |
−0.0198 |
12月 |
0.4443 |
−8.8748 |
8.8748 |
9.0659 |
0.0865 |
(来源:Arcgis制图)。
Figure 3. Spatial distribution of correlation coefficients for CLDAS temperature interpolation in January, April, July, and October
图3. CLDAS温度插值在1月、4月、7月、10月的相关系数空间分布
5. 订正及检验
选取了1月、4月、7月和10月相关系数最大的站点分别建立CLDAS温度插值与观测实况的一元线性回归方程,并用2023年温度实况资料进行检验。
1月相关系数最大的站点出现在广水,处在湖北东北部,其相关系数为0.99。回归方程为y = 2.715x + 8.962,R2 = 0.973。将2023年CLDAS温度插值代入x,求出y为24.96℃,比2023年1月广水站实况13.92℃显著偏高。因此,温度插值在该站点不可用。
4月相关系数最大的站点出现在应城,处在江汉平原北部,其相关系数为−0.96。回归方程为y = −3.420x + 82.88,R2 = 0.920。计算结果比实况偏高0.5℃,差距非常小。说明4月温度插值经过订正后与实况匹配度高。
7月相关系数最大的站点出现在恩施,处在鄂西南,其相关系数为−0.92。方程为y = −5.199x + 165.1,R2 = 0.849。计算结果比实况显著偏差。因此CLDAS温度插值在该站点参考性不大。
10月相关系数最大的站点出现在竹溪,处在鄂西北,其相关系数为0.94。方程为y = 28.05x − 432.8,R2 = 0.881。计算结果比实况偏高3.02℃,说明CLDAS的10月温度插值经过订正后与实况匹配度还可以。
综上分析,CLDAS温度插值在4月、10月分别降低0.5℃、3℃后,与站点实况基本相同,可作为站点稀疏地区的参考。
6. 结论
基于湖北82个国家气象站观测资料,对CLDAS产品数据集的2 m平均气温在湖北地区的适用性进行检验评估,同时选取相关性最强的站点进行订正分析,得到如下结论:
(1) CLDAS温度产品在湖北区域的空间分布过于一致,月季年三个时间尺度均表现出一致的从东南向西北逐渐递减的分布特征,导致CLDAS在1月、3月、5月、10月、11月和12月的空间分布与实况差距较大,但在2月的空间分布与实况匹配度较高。时间变化趋势与实况相差也较大,汛期(5月、6月、7月、8月、9月)为暖偏差,1月、2月、3月、11月、12月为冷偏差。
(2) CLDAS温度产品插值和站点观测值相关性不强,但4月和10月的质量优于其他时间。CLDAS温度插值与实况观测的相关系数以正相关为主,中度相关的站点数比例为21%~40%,高度相关的站点数比例7%~17%。
(3) CLDAS温度插值在4月、10月分别降低0.5℃、3℃后,与站点实况基本相同,可作为站点稀疏地区的参考;但1月和7月的CLDAS温度插值较实况差距明显,参考性不强。