1. 引言
数值天气预报的准确性取决于多个关键因素,其中模式初始化场的质量对预报结果具有决定性影响[1] [2]。区域数值模式在初始化后需要经过一段“初始化时间”(spin-up time)使大气状态达到动力和热力平衡。在这个过程中,模式需要调整各种物理过程之间的相互作用,消除由于数据同化和模式动力假设带来的不平衡[3]-[5]。已有研究表明,不同类型数值模式的spin-up特征存在显著差异。全球气候模式和海洋环流模式通常需要数十年到数百年的spin-up时间[6] [7],区域气候模式和陆面模式则需要数周到数月[8]-[10]。短期天气预报模式的spin-up时间相对较短,通常为数小时到十几小时[11] [12]。影响spin-up时间的因素包括模式分辨率、模拟区域、模拟季节以及环流强度等[13]-[15]。
近年来,为减少过长spin-up时间对数值预报准确性的影响,研究人员开发了多种技术方法。在海洋模式中采用“Distorted Physics”和“Matrix method”等方法[16] [17];在短期天气预报模式中,通过云分析方法同化卫星和雷达等非常规观测资料,改进初始湿度场和云场,缩短spin-up时间并提高短期降水预报水平[18]-[20]。目前,WRF等主流数值模式在不同分辨率下的平衡收敛特征已得到广泛研究。在温带陆地区域,温度和湿度场约需12小时达到平衡[21];而在热带海洋性环境中,由于海陆相互作用复杂,往往需要更长的spin-up时间[22]。特别是在海南这类海陆风主导的热带岛屿地区,复杂的下垫面特征和快速变化的地表过程,使得传统固定时长的spin-up方案可能难以满足高精度预报需求。
针对上述问题,本研究将分析海南地区WRF模式中温度、湿度、风速要素在不同积分时长下的演变特征,确定模式达到平衡收敛所需的最短时间尺度。研究结果将为优化海南地区数值预报系统提供科学依据。
2. 数据与方法
2.1. 研究区域
本研究选取中国海南岛(18˚10'~20˚10'N,108˚37'~111˚03'E)作为研究区域(图1)。海南岛位于南海北部,是中国第二大岛,四周环海,总面积约3.54万平方公里。地形呈“中部高、四周低”的特征,中部五指山最高海拔1867米。该区域属热带季风气候,年平均降水量约1639毫米,但时空分布不均匀。降水类型包括台风、季风、强对流等多种天气系统影响,区域性暴雨和干旱灾害频发。
2.2. 数据来源
2.2.1. WRF驱动数据
本研究采用欧洲中期天气预报中心(ECMWF)的ERA5和ERA-Interim全球再分析数据作为模式驱动场。ERA5是ECMWF最新一代再分析产品[23],提供1940年至今的全球大气再分析数据,水平分辨率为0.25˚ × 0.25˚,垂直方向从地表至0.1 hPa共37层,时间分辨率为1小时。ERA-Interim数据集覆盖1979年至2019年,水平分辨率为0.75˚ × 0.75˚,垂直方向31层,时间分辨率为6小时[24]。这两套再分析数据均包含温度、相对湿度、位势高度、风场等完整的大气要素,并将数据由UTC转换为北京时间(China Standard Time, CST)。
2.2.2. 观测资料
模式验证采用中国气象数据网提供的海南岛19个国家级气象站点的地面常规气象观测资料,包括气压、气温、相对湿度、风向风速和降水量等要素的逐小时观测数据。这些站点空间分布相对均匀,观测数据质量可靠,具有较好的代表性。
2.3. WRF模式配置
本研究采用WRF (Weather Research and Forecasting) V4.2版本进行数值模拟。WRF是由美国国家大气研究中心(NCAR)等机构开发的新一代中尺度数值预报模式,具有完善的动力框架和物理过程参数化
Figure 1. Study area location and meteorological station distribution map (Approval No. GS(2019)1822)
图1. 研究区位置及气象站点分布图(审图号:GS(2019)1822号)
方案。模式采用单层网格设置,网格中心位于19.05˚N,109.05˚E,覆盖整个海南岛及其周边海域。水平分辨率为5 km,网格点数为150 (经向) × 150 (纬向)。垂直方向设置33层,模式顶层气压为50 hPa,时间积分步长为90 s。
2.4. 实验设计
2.4.1. 同一天短期平衡收敛特征试验
短期实验主要反映的是模式初始化后的“预报预热期”,这段时间内模式需要调整初始场与物理过程之间的不平衡。因此,短期实验主要评估模式对初始场快速调整的能力(模式“spin-up”过程)。为评估不同分辨率初始场对模式短期预报的影响,本研究设计了基于ERA5 (0.25˚)和ERA-Interim (0.75˚)的对照试验。选取2017年6月1日UTC00时至6月7日UTC00时作为研究时段,分别在UTC00、UTC06、UTC12和UTC18时四个时次启动模式积分,共构建8组平行试验。各试验均积分至6月7日00时,确保不同起报时次的模拟结果具有充分的时间重叠。在结果分析中,将UTC00时次作为参照组,UTC06、UTC12和UTC18三个时次作为对比组。这一设计可评估初始场分辨率和起报时间对模式短期平衡收敛过程的影响。
2.4.2. 多初始场平衡收敛特征试验
长期实验则涉及到更复杂的物理过程和天气系统演变,包括边界层的日变化、大尺度环流变化等。长期实验则更多关注模式对大尺度环流模式的捕捉能力和长时间积分的稳定性。为研究模式在不同时间尺度下的平衡收敛特征,本研究设计了一组长期积分试验。首先从2017年5月31日00时开始进行连续积分至6月30日00时,作为参照组建立模式长期积分的基准状态。在此基础上,分别选取6月1日、6日、11日、16日、21日和26日00时作为起报时刻,每次积分120小时,构建6组平行对照试验。这一设计既可评估模式在不同天气背景下的spin-up特征,又能分析预报时效对平衡收敛的影响。
2.4.3. 评估方法
本研究采用海南岛19个国家级气象站点的地面常规观测资料进行验证,重点评估2米温度(T2)、2米比湿(Q2)以及10米水平风场(U10、V10)等近地面要素。模式输出结果首先通过双线性插值方法插值至观测站点位置,随后计算平均误差(Mean Error, ME):
其中,Fi为预报值,Oi为观测值,n为样本数。ME可反映模式预报的系统性偏差,正值表示预报偏大,负值表示预报偏小。
本研究还采用动态时间规整(Dynamic Time Warping, DTW)距离来度量时间序列之间的相似性。与欧氏距离相比,DTW能够处理时间序列在时间轴上的非线性伸缩,更好地捕捉序列的结构相似性。具体而言,给定两个时间序列
和
,首先构建n × m的距离矩阵D,其中
表示点xi和yj之间的距离。DTW通过寻找最优规整路径W来对齐这两个序列。规整路径
由距离矩阵中的元素构成,需满足以下约束条件:
边界条件:
连续性:
单调性:
且
其中
表示路径中的第l个点。DTW距离定义为所有可能规整路径中的最小累积距离:
这里d(wl)表示路径上第l个点对应的距离值。我们采用动态规划算法求解此最优化问题,复杂度为O (nm)。为了提高计算效率,本研究还引入了Sakoe-Chiba带宽约束,限制规整路径与对角线的偏离不超过r个单位。这不仅减少了计算量,还能防止出现不合理的对齐。
基于DTW距离,我们定义序列X和Y的DTW相关性为:
该指标取值范围为[0, 1],值越大表示两个序列越相似。通过计算样本数据集中各序列对之间的DTW相关性,我们可以构建相似性矩阵,为后续聚类分析提供基础。
3. 结果
3.1. 模式短期平衡收敛特征
图2是ERA5和ERA-Interim两种再分析资料驱动的WRF模式不同起报时间(00、06、12和18时)
Figure 2. Temporal evolution of near-surface parameter forecast errors in WRF model driven by different reanalysis datasets
图2. 不同再分析资料驱动的WRF模式近地面要素预报误差时序演变特征
的模拟结果,发现近地面气象要素的预报误差(ME)呈现出明显的时间依赖特征和预报预热期特性。图中左列展示了ERA5驱动的模拟结果,右列为ERA-Interim驱动的结果,从上至下依次为2米温度(T2)、2米比湿(Q2)、10米水平风场(U10、V10)的误差演变。就2米温度而言,ERA5驱动的模拟(图2(a))显示出−1.40℃至0.30℃的误差波动,且不同起报时间的结果在模拟3~6小时后趋于收敛,而ERA-Interim驱动的温度模拟(图2(b))则表现出更大的误差幅度(−0.95℃至1.15℃)。对于2米比湿,ERA5驱动的模拟(图2(c))在初始阶段表现出较大的波动(±0.00075 kg/kg),但在预报6小时后各起报时间的结果逐渐趋同,ERA-Interim驱动的比湿模拟(图2(d))则呈现出更为规律的周期性波动,误差范围在±0.0015 kg/kg之间。10米风场的模拟结果显示,无论是纬向风(图2(e)和图2(f))还是经向风(图2(g)和图2(h)),两种再分析资料驱动的模拟均表现出显著的日周期特征,误差幅度在±3.0 m/s范围内,但ERA5驱动的结果在预报初期的收敛性明显优于ERA-Interim。总体上,所有要素的模拟误差都存在3~12小时的预报预热期,这段时间内模式需要调整初始场与物理过程之间的不平衡。
表1对比了ERA5和ERA-Interim两套再分析资料在不同物理量预报中的表现。从表1的统计结果来看,两种再分析资料在温度(T2m)、比湿(Q2m)、水平风场(U10m、V10m)等近地面要素的短期收敛特征存在显著差异。当使用ERA5再分析资料作为初始场时,各要素的收敛时间普遍较ERA-Interim快0.3~0.5小时。其中,温度场(T2m)表现最为突出,平均收敛时间仅需2.8小时,较ERA-Interim的3.2小时提前了0.4小时;比湿场(Q2m)次之,ERA5平均收敛时间为3.3小时,比ERA-Interim的3.7小时提前了0.4小时;而风场要素(U10m、V10m)的收敛时间相对较长,ERA5的U10m和V10m平均收敛时间分别为3.7小时和4.0小时,但仍比ERA-Interim分别快0.5小时。从不同起报时次来看,12时起报的预报收敛时间普遍较长。
Table 1. Statistical analysis of error convergence characteristics for near-surface parameters in WRF model with different initial times
表1. WRF模式不同起报时间近地面要素预报误差收敛特征统计
变量 |
起报时间(CST) |
精确时间(h) ERA5/ERA-Interim |
DTW相关系数 |
T2m |
06 |
2.8/3.1 |
0.92/0.89 |
12 |
2.7/3.2 |
0.91/0.88 |
18 |
2.9/3.3 |
0.93/0.87 |
Mean |
2.8/3.2 |
0.92/0.88 |
Q2m |
06 |
3.2/3.5 |
0.90/0.87 |
12 |
3.4/3.7 |
0.89/0.86 |
18 |
3.3/3.8 |
0.91/0.85 |
Mean |
3.3/3.7 |
0.90/0.86 |
U10m |
06 |
3.6/4.0 |
0.88/0.84 |
12 |
3.8/4.2 |
0.87/0.83 |
18 |
3.7/4.3 |
0.86/0.82 |
Mean |
3.7/4.2 |
0.87/0.83 |
V10m |
06 |
3.8/4.3 |
0.85/0.82 |
12 |
4.1/4.5 |
0.84/0.81 |
18 |
4.0/4.6 |
0.83/0.80 |
Mean |
4.0/4.5 |
0.84/0.81 |
在预报准确性方面,通过DTW(动态时间规整)相关系数分析发现,ERA5再分析资料同样展现出明显优势。温度场的平均DTW相关系数达到0.92,较ERA-Interim高出0.04;比湿场的相关系数为0.90,高出0.04;水平风场U10m和V10m的相关系数分别为0.87和0.84,均比ERA-Interim高出0.03~0.04。特别值得注意的是,在18时起报的预报中,温度场ERA5的DTW相关系数达到最高值0.93,而ERA-Interim则降至0.87,差异达到0.06,这表明ERA5在处理日落前后的温度变化方面具有更好的表现。综上,ERA5再分析资料在各物理量的预报中均表现出更快的收敛速度和更高的预报准确性,这种改进在温度场最为显著,其次是比湿场,而在风场要素中的改进相对较小但仍然明显。
3.2. 模式长期平衡特征分析
在图3中,近地面要素的模拟误差(ME)存在显著的日周期振荡特征和数据源依赖性。图中展示了从6月1日至6月26日每隔5天进行的6组模拟试验,以5月31日00时起报的30天积分结果作为参考,分析了2米温度(T2)、2米比湿(Q2)以及10米风场(U10和V10)的模拟误差时间演变特征。从垂直分布来看,ERA5驱动的模拟结果(左列)与ERA-Interim驱动的结果(右列)在误差量级和时间演变特征上均存在明显差异。可以发现,2米温度误差(图3(a)和图3(b))表现出±2.5 K的波动范围,其中ERA5驱动的模拟在积分前期(0~40 h)表现出较大的正偏差,而ERA-Interim驱动的结果则显示出相对稳定的误差特征。2米比湿的误差(图3(c)和图3(d))整体较小,数量级在±0.001 kg/kg范围内,但ERA5驱动的模拟表现出更为明显的日变化特征。对于10米风场,纬向风分量(图3(e)和图3(f))的误差波动范围在±2.5 m/s之间,经向风分量(图3(g)和图3(h))则显示出±3.0 m/s的误差幅度,且两个风场分量都呈现出显著的日周期特征,这种周期性在ERA5驱动的模拟中表现得更为突出。
本研究基于六个不同起报时间点的模拟结果,系统地评估了ERA5和ERA-Interim两套再分析资料在中尺度数值预报模式中的应用效果。表2结果显示,ERA5在模式收敛时间和预报准确性两个关键指标上均优于ERA-Interim。从温度场(T2)来看,ERA5的平均收敛时间为17.4小时,较ERA-Interim的20.1小时显著缩短了2.7小时,其DTW相关系数达到0.871,高于ERA-Interim的0.844。特别是在0601-00起报时次中,ERA5的温度场收敛时间仅需15.8小时,为所有物理量中表现最优,且其相关系数达到最高值0.883。比湿场(Q2)的模拟结果表明,ERA5的平均收敛时间为18.1小时,比ERA-Interim的21.4小时提前了3.3小时,同时DTW相关系数(0.861)也优于ERA-Interim (0.831),表明ERA5在水汽场的模拟中具有显著优势。
在风场要素方面,水平风场分量(U10和V10)的收敛特征呈现出明显的差异性。U10风场使用ERA5时的平均收敛时间为20.2小时,比ERA-Interim的23.2小时提前了3.0小时;V10风场的收敛时间则相对较长,ERA5平均需要21.1小时,但仍比ERA-Interim的24.6小时提前了3.5小时。值得注意的是,所有物理量在0611-00起报时次都表现出最长的收敛时间,这可能与该时段大气边界层的快速发展和复杂的湍流混合过程有关。从DTW相关系数来看,U10和V10风场的平均相关系数在ERA5中分别为0.845和0.832,较ERA-Interim的0.819和0.805有所提高,但改善幅度小于温度和水汽场。综上所述,两套再分析资料在不同起报时次的表现具有一致性,即随着预报时间的推移,收敛时间呈现出先增加后减小的特征,这种特征在ERA5中表现得更为明显。
4. 讨论
本研究通过系统对比ERA5 (0.25˚)和ERA-Interim (0.75˚)两套不同空间分辨率再分析资料在WRF模式中的应用效果,深入探讨了数值预报初始场对模式性能的影响。研究发现,ERA5在近地面温度、比湿和风场等要素的模拟中均表现出显著优势,这种优势不仅体现在收敛时间的缩短,也反映在预报准确性
Figure 3. Time series of near-surface forecast errors from multi-initialization WRF simulations driven by ERA5 and ERA-Interim reanalysis data
图3. 基于ERA5与ERA-Interim再分析资料驱动的WRF多起报模拟中近地面要素预报误差的时间序列
Table 2. Statistical assessment of initial field effects in multi-initial time WRF integration driven by different reanalysis datasets
表2. 不同再分析资料驱动的WRF模式多起报时间积分中初始场影响统计分析
变量 |
起报时间 |
ERA5 |
ERA-Interim |
精确时间(h) |
DTW相关系数 |
精确时间(h) |
DTW相关系数 |
Q2 |
0601-00 |
16.4 |
0.872 |
19.6 |
0.843 |
0606-00 |
18.2 |
0.865 |
21.4 |
0.835 |
0611-00 |
19.8 |
0.853 |
23.2 |
0.824 |
0616-00 |
17.3 |
0.861 |
20.8 |
0.831 |
0621-00 |
18.1 |
0.857 |
21.5 |
0.828 |
0626-00 |
18.7 |
0.859 |
22.1 |
0.826 |
Mean |
18.1 |
0.861 |
21.4 |
0.831 |
T2 |
0601-00 |
15.8 |
0.883 |
18.3 |
0.856 |
0606-00 |
17.5 |
0.875 |
20.1 |
0.848 |
0611-00 |
18.9 |
0.864 |
21.7 |
0.837 |
0616-00 |
16.7 |
0.871 |
19.4 |
0.844 |
0621-00 |
17.4 |
0.868 |
20.2 |
0.841 |
0626-00 |
18.2 |
0.866 |
20.8 |
0.839 |
Mean |
17.4 |
0.871 |
20.1 |
0.844 |
V10 |
0601-00 |
19.2 |
0.841 |
22.5 |
0.815 |
0606-00 |
21.5 |
0.834 |
24.8 |
0.807 |
0611-00 |
22.7 |
0.826 |
26.3 |
0.798 |
0616-00 |
20.4 |
0.832 |
23.9 |
0.805 |
0621-00 |
21.1 |
0.829 |
24.6 |
0.802 |
0626-00 |
21.8 |
0.831 |
25.2 |
0.804 |
Mean |
21.1 |
0.832 |
24.6 |
0.805 |
U10 |
0601-00 |
18.7 |
0.855 |
21.4 |
0.828 |
0606-00 |
20.3 |
0.847 |
23.2 |
0.821 |
0611-00 |
21.5 |
0.839 |
24.8 |
0.813 |
0616-00 |
19.6 |
0.845 |
22.7 |
0.819 |
0621-00 |
20.2 |
0.842 |
23.4 |
0.816 |
0626-00 |
20.8 |
0.844 |
23.9 |
0.818 |
Mean |
20.2 |
0.845 |
23.2 |
0.819 |
的提升上。在短期实验中,ERA5在温度场(T2)的平均收敛时间较ERA-Interim缩短了2.7小时(在长期实验中,17.4 vs 20.1小时);比湿场(Q2)的收敛时间缩短了3.3小时(在长期实验中,18.1 vs 21.4小时)。
在不同时间尺度上的模拟表现也呈现出显著差异。短期模拟(00、06、12和18时起报)中,12时起报的收敛时间普遍较长,这可能与该时段对应的本地时间处于午后对流发展最活跃期有关。而长期模拟(不同日期00时起报)结果显示,0611-00起报时次的所有物理量均表现出最长的收敛时间,这种现象可能与特定天气系统的演变特征密切相关。值得注意的是,风场要素(U10、V10)的改善幅度相对较小,ERA5的DTW相关系数仅比ERA-Interim提高了0.026~0.027。这一现象与Rivas等(2019)发现与ERA-interim相比,ERA5风在瞬时RMS风速一致性方面提高了20%,并且在平均和瞬态风误差风散度和风应力旋度偏差方面表现更佳[25]。这种差异主要源于风场对次网格地形扰动和湍流参数化的高度敏感性,即使ERA5提供了更高分辨率的地形数据,其0.25˚的网格间距仍不足以完全解析复杂地形区域的局地环流特征。ERA5在改善模式性能方面的优势具有普遍性,但这种改善在不同区域和天气系统中的表现存在差异。同时,本研究也说明,模式对不同天气背景下初始场的敏感性差异及其物理机制尚需系统研究。
5. 结论
本研究通过系统对比ERA5和ERA-Interim两套再分析资料在WRF模式中的应用效果,得出以下主要结论:
1) ERA5在近地面要素预报中展现出显著优势,这种优势在短期和长期预报中均得到验证。长期预报中,ERA5的温度场平均收敛时间较ERA-Interim缩短2.7小时,DTW相关系数提高0.027;比湿场和风场要素的收敛时间分别缩短3.3小时和3.0~3.5小时。短期预报中,ERA5各要素的收敛时间普遍快0.3-0.5小时,相关系数提高0.03~0.04,表明高分辨率(0.25˚)初始场能够更准确地描述大气状态。越高分辨率,能够加速收敛平衡速度。
2) 不同物理量对初始场分辨率的敏感度存在显著差异,温度场和比湿场的改进最为明显,而风场要素的改进相对较小。特别是在18时短期预报中,温度场的相关系数差异达到最大(0.93 vs 0.87)。此外,从预报时效性角度看,ERA5在短期预报(2~4小时)中表现出更快的收敛速度,在长期预报(15~25小时)中则展现出更好的预报稳定性。
致 谢
感谢闫笑笑、李嘉怡、苏怡臻、许梦雨同学对文章的协助;感谢海南百旺信智算中心对该项目支持。
基金项目
感谢国家自然科学基金(No. 32260294)、海南大学科研基金资助项目(KYQD(ZR)-22083)、海南省自然科学基金(423QN317)为研究提供的基金支持。
NOTES
*通讯作者。