1. 引言
气象学中,降水预测是一项非常重要的内容。由于气象系统的复杂性、多样性以及地形、地貌、下垫面影响,降水具有时空分布不均衡、变率大、局地性强、预测准确率不高的特点,尤其是较长时间尺度如季节、年度的降水预测更为突出。由物理成因的定性分析及大量降水序列资料的统计分析得知,降水量可视为一列相依的随机变量,其相依程度的强弱,可采用自相关系数作为其定量的测度 [1]。基于此,可建立马尔科夫链模型进行预测分析。但实际上,降水是一种非常复杂的自然现象,具有大量的不确定性因素,很难严格满足“齐次性” [2];同时,有研究表面:考虑随机变量的中间状态从而充分利用信息,可提高预测精度 [3]。众多学者将加权马尔科夫链模型应用于降水量的预测且取得了良好的效果 [4] - [9]。
本文依据加权马尔可夫链模型原理,以乌鲁木齐市为例,依据天山区气象站1961~2008年年降水量资料建立加权马尔可夫链模型,计算了2009~2018年的降水量状态和年降水量,对预测降水量和实况降水量进行了对比分析;在此基础上,计算了新疆88个气象站近十年年降水量,通过对预测降水量距平百分率的分析,获得了加权马尔可夫链模型方法对新疆年降水量预测效果的可用性和适用范围。
2. 加权马尔科夫链原理和基本步骤
加权马尔科夫链的基本原理参见刘次华《随机过程》 [10]。构建加权马尔科夫链模型进行降水量预测时的基本步骤如下:
1) 以均值–标准差方法确定年降水量的分级标准。
2) 按照上述分级标准确定各年降水量状态,建立降水状态序列。
3) 对降水状态序列进行马氏性检验。
4) 计算各阶自相关系数并进行规范化。
5) 建立不同步长的状态概率转移矩阵。
6) 预测不同状态的概率并加权求和,获得该年降水的预测状态。
7) 利用预测状态和状态矩阵预测该年降水量。
8) 重复上述步骤,预测不同步长对应的降水状态和降水量。
3. 乌鲁木齐市2009~2018年降水量预测
1) 根据乌鲁木齐市1961~2008年的逐年降水量数据,计算出序列的均值x = 260.32 mm,均方差无偏估计值s = 61.83 mm,由此确定分级标准,如表1所示。

Table 1. The classification of annual precipitation of Urumqi from 1961 to 2008
表1. 乌鲁木齐市1961~2008年年降水量分级
2) 根据表1的分级标准确定乌鲁木齐市1961~2008年各年降水量状态,构建年降水状态序列,结果见表2。

Table 2. The states of annual precipitation of Urumqi from 1961 to 2008
表2. 乌鲁木齐市1961~2008年年降水量状态
3) 对降水状态序列做马氏性检验:构建服从自由度为(m − 1)2的χ2分布的统计量:
由表2可知乌鲁木齐市年降水量序列的状态数m = 5,给定显著性水平α = 0.05,查χ2分布分位数表可得χ2 ((5 − 1)2) = χ2 (16) = 26.296,经统计计算χ2 = 31.20。可见χ2 > χ2 (16),因此,该时间序列具有马氏性,即乌鲁木齐市1961~2008年年降水量状态序列可视为马尔科夫链。
4) 计算各阶自相关系数和权重并进行归一化,结果如表3所示。

Table 3. The autocorrelations and weights of different orders
表3. 各阶自相关系数及权重
5) 对表2中降水状态序列进行统计计算,得到步长为1~5的转移概率矩阵,见表4。

Table 4. The probability matrix of the shift of precipitation states
表4. 降水状态转移概率矩阵
6) 根据2004~2008年的年降水状态预测2009年的年降水状态,结果见表5。

Table 5. The prediction of annual precipitation state of Urumqi in 2009
表5. 乌鲁木齐市2009年降水状态预测
注:表中上标*的数值为Pi加权求和值。
由表5可知
,对应的状态为5,即乌鲁木齐市年降水量预测状态为5 (丰水年),也就是年降水量大于322.15 mm,而2009年的降水量实际值为353.1 mm,在此范围内,因此降水状态预测结果与实际吻合。
7) 重复上述步骤,可得2004~2008年五个年份预测的2009年降水量预测值,结果见表6。

Table 6. The prediction of annual precipitation of Urumqi in 2009
表6. 乌鲁木齐市2009年降水量预测
由表6可知,利用加权马尔科夫链方法预测的乌鲁木齐市2009年降水量为330.9 mm,与实际观测值353.1 mm相比较,相对误差为−6.3%,可以认为对2009年年降水量的预测是较为接近真实情况的。
8) 在年降水量序列中,加入2009年的实际观测值,同时去掉1961年降水量值,保持序列长度为40年,重复上述步骤,可得2010年的年降水量预测值。以此类推,直至计算出2018年的降水量预测值。2009~2018年降水量预测值与实际观测值的比较见表7。

Table 7. The comparison of prediction and observation rainfall in Urumqi from 1961 to 2008
表7. 乌鲁木齐市2009~2018年预测降水量与实际降水量对比
分析表6中的数据可知,若将预测值与观测值的误差控制在正负20%以内的预测认为是“有效预测”,则对于乌鲁木齐市2009~2018年降水量预测的有效率为70%,这7年中,仅2016年的误差超过10%,其余6年的相对误差都不大于10%。目前,在短期气候预测业务中,降水趋势预测准确率在60%~70%,可见,应用加权马尔科夫链模型预测乌鲁木齐市年降水量对于现有的短期气候预测业务评分而言,其预测效果是较好的。预测误差较大的3年分别为2010年、2011年和2015年,分析此三年的降水量可以发现,此三年中2010年降水量接近多年平均值,2011和2015年降水量分别较多年平均偏多32%和48%,属于明显偏多年份。由于加权马尔科夫链模型在预测中涉及的因子主要是序列的均值、均方差、预测起始年份状态以及各类状态转移概率,这些因素都可能影响到最终的预测效果,例如计算状态划分标准时选择的系数不同、预测起始年份状态的不同即降水量偏离常年平均状况的程度等。当然,由于加权马尔科夫链具有“自我调整能力”,个别年份预测误差显著偏大并不影响其他年份的预测效果。
4. 新疆88站2009~2018年年降水量预测与分析
4.1. 新疆88站2009~2018年年降水量预测分析
按照相同步骤,计算得出自1961年以来地面气象观测资料序列完整的88个气象站2009年~2018年年降水量状态和年降水量数值。考虑到短期气候预测业务中,对降水的预测主要是预测值相对于多年平均值的差异程度,即降水距平百分率,因此,预测结果的分析主要针对降水距平百分率。降水距平百分率的计算方法按照国家气候中心发布的短期气候预测相关业务规定。各站点预测降水距平百分率的具体数据因篇幅所限,不在本文中展示。
全疆范围内,预测降水距平百分率数值分布范围非常大,在−62%~110%之间,即预测年降水量相比常年平均值偏少可达6成以上,偏多达1.1倍,同时,与常年值接近的预测降水距平百分率低至1%以下。此外,在实际气候预测业务中,预测降水量相对常年值如果偏少、偏多程度在3成以上时,可认为偏差太大,预测效果不好,因此,重点分析各站预测降水距平百分率在正负30%的年份,具体细分为偏多偏少1成(10%)以内、偏多偏少2成(20%)以内、偏多偏少3成(30%)以内三种情况。各站预测降水距平百分率分别处于上述三种情况的年份如表8所示。

Table 8. Years of percents of precipitation in 88 stations in different ranges from 2009 to 2018
表8. 新疆88站2009~2018年预测降水量距离百分率处于不同区间的年份
由表8可知,各站预测降水距平百分率分布在1成、2成、3成范围的年份数差异较大,偏少1成以内的年份最少为0年(阿拉山口、伽师、阿瓦提),最多为9年(温泉、昭苏、小渠子)其余在2~8年中均有分布,5、6年的相对居多;偏少2成以内的年份最少为1年(莎车、淖毛湖),最多为10年(青河、北塔山、石河子、蔡家湖、昭苏、乌鲁木齐、小渠子、大西沟、天池、库米什、巴音布鲁克),占比较多的年份为6年、7年、8年;偏少3成以内的年份最少为4年(伽师、民丰),最多为10年(28站),占比较多的年份有7年(19站)、8(14站)、9年(16站)。从空间分布看,有一半以上的年份偏少1成以内的站点主要分布在北疆大部和南疆个别区域,南疆大部站点偏少1成以内的年份不足5年;偏少2成以内和3成以内的年份多于6年的区域主要分布在北疆大部、南疆西部山区、哈密市。总体而言,北疆和天山山区预测偏差小的年份明显多于南疆大部区域。
4.2. 不同降水区间2009~2018年年降水量预测分析
由于新疆远离海洋,深居内陆,有高山阻隔,海洋气流不易到达,全疆大部区域处于干旱区,降水量稀少,全疆年平均降水量为150毫米左右,但各地降水量相差很大,整体表现为北疆多于南疆,山区多于平地,西部多于东部。从88站多年平均降水量数据看,最少的是处于东疆吐鲁番盆地的吐鲁番站,仅为15.3毫米,最多的是处于天山山区的小渠子站,达575.6毫米。从5.1中各站预测降水量相对常年的偏差分布来看,降水相对较多的北疆和天山山区,预测效果优于降水相对较少的南疆区域,为进一步验证这一初步结论,将88个站按照常年降水量的多少分为5组,分析每组处于不同降水距平百分率区间的平均年份,所得结果如表9所示。
由表9可知,随着降水量的增加,偏少1成以内的平均年份显著增多,300毫米以下时,仅有不足一半的年份预测降水偏少在1成以内,300毫米以上时,预测降水偏少1成以内的年份接近7年。预测偏少2成以内和3成以内的站点的降水量不满足这一规律,即,并不是降水量越大,预测偏差在2成以内和3成以内的站点年份越多,对于偏差在2成以内的,降水量为50~100毫米的站点,平均年份最多,300毫米以上反而减少了;对于偏差在3成以内的,降水量在100毫米以下时平均年份最多,随着降水的增多,年份反而有所减少。

Table 9. Average years of percents of precipitation in 88 stations in different ranges from 2009 to 2018
表9. 新疆88站2009~2018年预测降水量距平百分率处于不同区间的平均年份
4.3. 代表站2009~2018年年降水量预测分析
在5.2降水量分组的基础上,考虑南北疆不同区域分布,从每组站点中选择降水量值处于中位数的站点作为每组的代表站,具体分析各站近十年预测年降水量距平百分率,具体结果如表10所示。

Table 10. The percents of precipitation of representative stations from 2009 to 2018 (%)
表10. 代表站2009~2018年预测降水量距离百分率(%)
注:站点名称下方的数据为该站常年降水量。
由表10数据可见,和田、库车、温泉、昭苏的预测效果明显优于吐鲁番和莫索湾,库车、温泉、昭苏的平均预测效果都比较好,年际变化也比较小,预测效果比较稳定,10年中偏差在1成以内的分别有3年、9年、9年,偏差在1~2成的分别有6年、0年、1年,昭苏预测效果更优于温泉和库车。和田和莫索湾的平均预测效果接近,10年中偏差在1成以内的分别有5年、5年,偏差在1~2成的分别有0年和2年,和田预测效果年际变化巨大,最好的年份仅偏少1.9%,最差的年份偏多96.6%。吐鲁番平均预测效果最差,3年偏差在1成以内,3年偏差在1~2成。整体而言,降水量相对偏多的北疆和天山山区站点预测效果要好于南疆站点且更加稳定。
5. 结论
1) 加权马尔科夫链模型预测以各种步长的状态概率转移矩阵为依据,考虑不同步长与待预测年份相依关系的强弱加权求和来预测降水量,与普通的马尔科夫链模型相比,该模型可以更加充分、合理地利用已有信息;
2) 对乌鲁木齐市2009~2018年十年的降水量距平百分率预测显示,预测值与观测值相对误差在1成以内和2成以内的年份分别占60%和70%,根据现行短期气候预测业务规范中相关标准,其预测效果较好;对于降水较常年明显偏多的2011和2015年,加权马尔科夫链模型方法误差较大,需要在后续研究中进一步调整预测方法,以期得到更好的预测效果。
3) 对新疆88个站点2009~2018年十年的降水量距平百分率预测显示,各站差异较大,偏少1成以内的年份在0~9年中均有分布,5、6年的相对居多;偏少2成以内的年份在1~10年中均有分布,占比较多的年份有7年、8年、9年。一半以上年份偏少1成以内的站点主要分布在北疆大部和南疆个别区域,南疆大部偏少1成以内的年份不足5年;偏少2成以内和3成以内的年份多于6年的主要分布在北疆大部、南疆西部山区、哈密市。总体而言,北疆和天山山区预测偏差小的年份明显多于南疆大部。
4) 各站实际降水量的多少明显影响偏差在1成以内的预测效果。随着降水量的增加,偏少1成以内的平均年份显著增多,300毫米以下时,仅有不足一半的年份预测降水偏少在1成以内,300毫米以上时,预测降水偏少1成以内的年份接近7年。但预测偏少2成以内和3成以内的站点的降水量不满足这一规律。如果只考虑偏差在1成以内的预测效果,加权马尔科夫链模型适用于常年降水量在300毫米以上的站点。
5) 对于不同降水量分组中6个代表站的预测结果来看,和田、库车、温泉、昭苏的预测效果明显优于吐鲁番和莫索湾;库车、温泉、昭苏的平均预测效果都比较好,年际变化也比较小,预测效果比较稳定,昭苏预测效果更优于温泉和库车;和田和莫索湾的平均预测效果接近,和田预测效果年际变化较大;吐鲁番平均预测效果最差。再次验证了加权马尔科夫链模型在降水量相对偏多的北疆和天山山区站点预测效果好于南疆站点且效果更加稳定。
基金项目
新疆汛期降水异常的多因子相互作用及业务应用(IDM2020008)、加权马尔科夫预测模型在新疆降水预测业务中的应用研究(CAAS202007)资助。