1. 引言
1.1. 本文研究目的和意义
到现在为止,国内外已有的多种统计降维技术在气候预测中的运用,但在短期气候预测中的应用还很缺乏。在我国,对数据的处理多是利用了诸如双线性插值、Kriging插值、反距离权重插值等空间插值的方式来进行 [1] 。除此之外,也有学者利用了几种比较简单的转化函数 [2] ,但是这些方式都存在着很大的限制 [3] 。目前,国际上关于天气因子的数据降维,多利用Kalman滤波 [4] 、滑动窗口等误差估算的方法来进行 [5] 。Bo Cui利用卡曼滤波器式的误差修正,将北美地区的数据进行处理后,得到精确的预测结果,并在实际应用中得到了显著成效 [6] 。目前,我们的T213集合预测结果已经在全球进行了交流,并获得了全球对其预测结果的肯定。本项目的研究成果将为发展基于数据降尺度的高精度天气因子预测提供理论依据和技术支撑。
1.2. 本文主要内容和工作
应用T213集合预报资料和ERA-Interim的资料,结合2152个地面站点12时(世界时)的地表温度资料,对中国地区开展了一个精确的预报实验。针对模型结果本身存在的模型误差,如果将其用于精确预测,则会带来很大的预测误差,通过修正模型结果中格点数据的偏差,实现对模型结果的降维,从而达到改进预测精度的目的。首先,将ERA-Interim数据内插得到的解析场作格点“真值”,采用降均值方法修正T213中每个组份的偏差,从而减小了模型中的模型误差;首先,采用克里金插值、双线性插值、反距离二次加权插值以及Cressman等多种插值算法对T213格点预测场值进行时空插值,得到精度更高的初始值,再采用基于递减平均的初始值算法对初始值进行修正,最后得到精度更高的初始值。在此基础上,探讨在中国开展地面温度精细预测实验的可能性,并对其预测结果进行分析。
2. 资料和方法
2.1. 资料
格点预测数据:由中国中央气象台的T213集群预测数据,以0.5625度 × 0.5625度)获得。本项目拟选择2011年5~8月份每天12时(世界时)的地面2米气温资料,进行24~168小时的预测,每个预测周期24小时。
格点分析数据:采用欧洲气象预测中心(ECMWF)提供的1.0℃ × 1.0℃的ERA-Interim卫星再分析数据,并选择2011年5~9月12时(世界时)的地表2米气温观测值。
站点的观测:中国2745个地基台址的地面2米气温,在2011年5~9月份期间,选择了缺少测量的2152个台址,每天北京时间20时。
2.2. 技术方法
本文分别使用递减平均法,是一种与卡曼滤波器相似的具有较强适应性的误差修正算法,采用减量均值方法,对T213集预测数据和ERA-Interim数据进行误差修正,对格点预测数据进行修正;对数值试验数据进行修正,然后对初估场进行递减平均预报。
2.3. 检验评价方法
对于各种预测指标存在着各种差异,其中,对确定性预测指标的检测就是对预测结果与实际结果的相似性进行检测。通常,预测体系的评估包括两项:预测体系的可信度与判别力。要对预测结果进行整体评估,就必须采用各种预测指标对预测结果进行综合评估。为了更好更全面地对本文降尺度预测方法的预测效果进行分析和评价,本文针对地表温度本身的特征,采取绝对误差(AE)、相对误差(RE)、距平相关系数(ACC)具有差异性的测试打分标准。
用递减平均订正技术对T213集合预报资料偏差订正,以减小数值产品本身所带有的模式误差,首先获取偏差订正中自适应参数w。结合本文实验情况,w = 0.1更加理想(图略),精度更高,所以本文在使用递减平均订正技术偏差订正时取w = 0.1作为递减平均的自适应参数。
3. 精细化预报方案设计
统计降尺度预报中的插值结果带有误差,所以使用递减平均降尺度技术进行误差订正,消除插值误差,将地面2152观测站2 m的气温数据作为“分析场(
)”,将插值结果作为“初估场(
)”。
传统的气象台站分布呈离散的不规则性,使得各站点的各气象因子在同一时刻的变化也呈现出离散的不规则性。本文通过选用双线性插值(文中以BI表示,下同)、距离平方反比权重插值(IDS)、Cressman客观分析(Cressman)和Kriging插值(Kriging)四种方法和2152站点的实测数据的对比,总体上来说,各种插值方式都是随着预报时效预报误差均方差也会变得更大。IDS插值的7个时效的均方差的平均值是3.8℃,IDS内插法的精度显著高于其他三种内插法(图略)。因此我们选用距离平方反比加权插值(IDS)来进行空间内插,以获得在统计降尺度预测中递减平均修正的初估场(
)。
使用递减平均降尺度技术进行误差订正,以减小降尺度预报中的插值误差,首先获取递减平均订正中的自适应参数w。对w进行敏感性试验后,可得在不同的自适应参数w情况下降尺度预报结果的距平相关系都是随着预报时效的增加在不断减小。在24小时到168小时的递减平均订正中w为0.2更优于0.1,所以本文使用递减平均降尺度技术进行统计降尺度预报时,为减小插值误差取w = 0.2作为递减平均的自适应参数。
本文中,将经过偏差订正后直接IDS插值,而没有用递减平均订正的方案,称为插值方案(BC_IDS);经过偏差订正,然后降尺度预报的方案,称为递减平均方案(BC_DF)。
4. 精细化预报效果分析
4.1. 数值产品偏差订正效果分析
4.1.1. 偏差订正前后绝对误差比较
对比T213集合平均偏差订正前(Raw)与订正后(BC)不同时效绝对误差空间分布图(图略)发现,偏差订正前的原始资料(Raw)和偏差订正后的资料(BC)的绝对误差都随着预报时效的增加预报误差在不断的增加。偏差订正前的误差较大,24小时预报和168小时预报在西藏南部和东部,新疆东南部为绝对误差大值区,其数值可达5℃以上,存在着比较明显的误差。全国其他地区的绝对误差在的4℃以内。比较可以发现,经过递减平均订正技术偏差订正后的订正资料(BC)的绝对误差显著减小,绝对误差高值中心消失。24小时预报的绝对误差基本能稳定在2℃以内,只有在极少数的地区达到了2℃以上(如西藏的北部极小部分地区和内蒙中部小部分地区),168小时预报的绝对误差也基本维持在3℃以内,除了极少数地区超过了3℃(如内蒙中部和陕西地区),但其绝对误差数值也没有超过4℃。所以递减平均订正技术对T213集合平均资料偏差订正后有效地降低了地面气温模式预报误差。
T213集合平均偏差订正前(Raw)与订正后(BC)不同时效绝对误差趋势图(图略)可看出偏差订正前的原始资料(Raw)和偏差订正后的资料(BC)的绝对误差都随着预报时效的增加在不断的增加。偏差订正前24小时、168小时预报的绝对误差分别为2.01℃、2.52℃。偏差订正后24小时、168小时预报的绝对误差分别由原来的2.01℃降到1.23℃,2.52℃降到2.03℃。偏差订正后7个时效的绝对误差的平均值分别为1.65℃,比偏差订正前的原始资料的平均值减少了0.6℃。所以自适应的递减平均订正技术对格点资料偏差订正是明显有效的。
4.1.2. 偏差订正前后系统性偏差比较
对比T213集合平均偏差订正前(Raw)与订正后(BC)不同实效的系统性偏差空间分布图(图略)发现,偏差订正前原始资料(Raw)与偏差订正后的订正资料(BC)的系统性偏差都随着预报时效的增加呈现略微的减少。由图可得,偏差订正前的系统性偏差数值较大,大值区较多。24小时预报和168小时预报在新疆,四川东部地区的系统性偏差可达1℃以上,在西藏大部分地区、青海南部、甘肃、宁夏、内蒙中部、东北东部、云南、贵州、湖南、江西和福建等地的系统性偏差超过−2℃,其中西藏南部和东部有最大系统性偏差存在,其数值超过−3℃,我国其他地区的系统性偏差在−1℃~1℃间。经过偏差订正后的订正资料(BC)的系统性偏差显著减小,24小时预报和168小时预报的系统性偏差基本都稳定在−1℃~1℃之间。所以可得在经过递减平均订正技术对数值预报产品偏差订正后有效地降低了T213集合平均资料的地面气温模式预报的系统性偏差,不仅系统性偏差的高值中心消失,并且对偏差订正前预报误差相对较小地区的预报状况也有很好的改善,使全国范围内的24小时到168小时的系统性偏差都基本稳定在−1℃~1℃之间。
T213集合平均偏差订正前(Raw)与订正后(BC)不同时效平均系统性偏差趋势图(图略)可得偏差订正后的系统性偏差明显减小,并且随着预报时效的增加在不断减小。偏差订正前24小时、168小时预报的系统性偏差分别为−1.04℃、−1.16℃。经过偏差订正后24小时、168小时预报的系统性偏差分别由原来的−1.04℃降到−0.08℃、−1.16℃降到−0.04℃。偏差订正后7个时效的系统性偏差的平均值为−0.06℃,比偏差订正前的平均值减少了0.99℃。整体而言,递减平均订正技术对数值预报产品的系统性偏差订正是相当有效的,明显减小了系统性偏差数值大小。
4.2. 统计降尺度预报
4.2.1. 降尺度预报结果与插值结果绝对误差比较
Figure 1. Downscaling forecast results (BC_DF) and interpolation result (BC_IDS) spatial distribution of absolute error at different ages (Unit: ˚C) ((a) BC_IDS Absolute error of 24 hour forecast; (b) BC_IDS Absolute error of 168 hour forecast; (c) BC_DF Absolute error of 24 hour forecast; (d) BC_DF Absolute error of 168 hour forecast)
图1. 降尺度预报结果(BC_DF)与插值结果(BC_IDS)不同时效绝对误差空间分布图(单位:摄氏度/℃) ((a) BC_IDS 24小时预报的绝对误差;(b) BC_IDS 168小时预报的绝对误差;(c) BC_DF 24小时预报的绝对误差;(d) BC_DF 168小时预报的绝对误差)
对比图1(a)~(d)发现,降尺度预报结果(BC_DF)与插值结果(BC_IDS)的绝对误差都随着预报时效的增加预报误差在不断的增加,且预报误差的基本趋势是从东南地区向西北地区逐渐变大。图1(a),图1(b)中,插值结果绝对误差普遍较大,在24小时预报中全国的绝对误差普遍高于2℃,西藏大部分地区、四川西部、新疆西部和北部等地区为绝对误差大值区,其数值超过了4℃;168小时预报中全国的绝对误差普遍高于3℃,西藏大部分地区、四川西部、新疆西部等甚至超过了5℃。绝对误差在西南和西北的山区为一个明显的大值区,而我国东部沿海部分地区和东北部分地区则是一个绝对误差小值区,其绝对误差小于2℃。这主要是由于北方边疆和西部地区相对复杂的地形和稀疏的站点分布,使得预报过程中产生了较大的误差。将图1(c)、图1(d)与图1(a)、图1(b)比较可以发现,降尺度预报结果在24小时预报中,在我国的蒙古、新疆、青藏高原、重庆、甘肃、陕西、山西和河北的预报误差在3℃以内,其他西南、华南、华东和东北地区的预报误差为2℃以内。原来是绝对误差大值区的青藏高原、新疆和四川等地的误差高值中心消失,由原来的绝对误差在4℃以上降到3℃以内;168小时的预报中在东北、华北和华南的大部分地区的预报绝对误差在2℃左右,内蒙西部、甘肃西部、青海北部和新疆等地的绝对误差在4℃左右,其他地区的绝对误差都在3℃左右。青藏高原、新疆和四川等地的误差高值中心消失,青藏高原和四川地区的高值中心的数值由5℃以上降到3℃以内,新疆地区的绝对误差降到4℃以内。整体而言,经过递减平均降尺度技术对插值结果进行误差订正后绝对误差显著减小,在插值结果中存在绝对误差高值中心的青藏高原、新疆、四川西部地区,经递减平均订正以后高值中心消失,并且在插值结果中误差相对较小的东南沿海和东北部分地区的预报状况也有所改善,所以经过递减平均订正后明显减小了东西部预报差异。同时降尺度预报结果7个时效的绝对误差平均值为2.62℃,比插值结果减少了0.29℃。所以,递减平均降尺度技术订正插值误差是明显有效的,不但普遍减小了全国的预报误差数值大小和误差高值中心的范围,而且很大程度上改善了东西部预报效果“不平衡”的现象。
4.2.2. 降尺度预报结果与插值结果系统性偏差比较
对比图2(a)~(d)发现,降尺度预报结果(BC_DF)与插值结果(BC_IDS)的系统性偏差都随着预报时效的增加都有所减少,系统性偏差的数值大小基本趋势是从东南地区向西北地区逐渐变大。由图2(a),图2(b)可得,首先我们以云南北部、重庆、陕西南部和甘肃为界,把我国大致分为东部和西部。插值结果中24小时和168小时预报结果在分界线以东地区以正系统性偏差为主,在河南东部、湖北东部、湖南东北部、内蒙中部、吉林西部等地区的系统性偏差在2℃以内,其他东部地区的系统性偏差在0℃~1℃之间。而在分界线以西的地区,以负系统性偏差为主,且数值较大。在西藏的东部、南部和西部、新疆西南部和东部、四川等地为系统性偏差大值区,其数值超过−4℃,其他西部的大部分地区的系统性偏差在-3℃以内,但在新疆东北部有一个正的系统性偏差大值区,其值在3℃以上。将图2(c)、图2(d)与图2(a)、图2(b)比较可以发现,降尺度预报结果在24小时和168小时预报中全国范围内的系统性偏差显著减小且其数值都在−1℃~1℃之间,没有明显的系统性偏差大值区,东西部没有明显的差异存在。同时降尺度预报结果的7个时效的系统性偏差的平均值为0.02℃,比插值结果的平均值少了0.06℃。所以整体而言,递减平均统计降尺度技术进行降尺度预报来减小系统性偏差是相当有效的,明显减小了插值结果的系统性偏差。
综合以上结果,本项目提出的基于降维的数据处理方法对中国地表气温的精确预测有很高的精度,并对其模型的下降均值DV进行了有效的修正,对数据处理方法的改进也进行了有效的修正,最终实现了对我国地表气温的精确预测,减少了东西部之间的预测“不平衡”。
5. 结论与展望
通过修正模型结果中的数据误差,实现统计降维,从而提升预测精度。首先采用卡尔曼滤波器降均值法对T213集预测数据进行偏差修正,减小了模型的模型误差,并对修正前和修正后的T213集预测结
Figure 2. Downscaling forecast results (BC_DF) and interpolation result (BC_IDS) Spatial distribution of systematic deviations at different ages (Unit: ˚C) ((a) BC_IDS Systematic deviation of 24 hour forecast; (b) BC_IDS Systematic deviation of 168 hour forecast; (c) BC_DF Systematic deviation of 24 hour forecast; (d) BC_DF Systematic deviation of 168 hour forecast)
图2. 降尺度预报结果(BC_DF)与插值结果(BC_IDS)不同时效系统性偏差空间分布图(单位:摄氏度/℃) ((a) BC_IDS 24小时预报的系统性偏差;(b) BC_IDS 168小时预报的系统性偏差;(c) BC_DF 24小时预报的系统性偏差;(d) BC_DF 168小时预报的系统性偏差)
果进行了对比研究。在此基础上,采用降维均值的方法,对格点预测场作缩比和内插方法的对比。得出的结果是:
1) 采用卡尔曼滤波器式的降均值方法,可以实现中国地面气温的精确预测。
2) 降均值修正法用于T213集预测数据的偏差修正,可显著降低误差幅度,不但可以去除偏高的数值中心,而且还可以提高修正之前偏低数据区的预测条件。在修正之前,西藏东部和南部及新疆东南部均有一个高于5摄氏度的高值区域,而西藏东部和南部则有一个高于−3摄氏度的低值中心。在偏差修正之后,误差的高值中心已经消失,24个小时的预测结果的绝对误差在2摄氏度之内,168个月的预测结果的预测结果的绝对误差在3摄氏度之内,而在这个时候,全国性的系统偏差一直保持在−1摄氏度到1摄氏度之间。在偏差修正后,7个时效的绝对误差和系统偏差的平均均值为1.65℃,−0.06℃,较偏差修正之前降低0.6℃和0.99℃。
3) 利用递减平均降尺度方法,可对修正后的格点场进行降维,可降低内插偏差,特别是在偏低的西部,内插偏差明显减少,可明显降低东西部之间的“不平衡”,同时也可提高偏低偏差区域的预测水平。我国北部边境及西部地区因地貌较为复杂,测站数量稀少,导致内插误差呈自东往西趋势,并随时间延长而呈递增趋势,尤其是西藏、新疆及四川等地区,近24~168 h的预测结果均为4摄氏度以上,而正、负型的预测结果则为3摄氏度以上,−4摄氏度以上。在降维预测之后,该地区的高值误差中心逐渐消退,24 h和168 h的预测结果都保持在3摄氏度以下,而168 h的预测结果则保持在−1摄氏度至1摄氏度的水平。7个时效绝对误差和系统性偏差的平均值分别为2.62℃,0.02℃,与内插值相比降低了0.29℃和0.06℃。
提出了一种适用于地面气温精细预测的数值模拟方法,该方法思路明确,设计合理。但是,目前尚有一些不足之处,即因模式资料本身含有系统与随机两种因素,致使模式预报的精度既来自资料本身,又来自模式计算过程,造成模式资料间的差异,从而影响模式资料处理结果的一致性及准确性。接下来,我们将对自适应参数w的选取进行深入探讨,以期为服务于现实应用中的精细模式预测奠定基础。