1. 引言
近年来西安机场及周边多次出现尺度小、强度大、生消和移动迅速的副高边沿的非系统性雷暴,基于传统天气学方法难以满足当前西安机场对精细化雷暴天气的预报需求,这就要求转变预报思路,需要着眼于大气要素和物理量的综合诊断,而对流参数是判断对流发生、发展及其潜在强度的物理量,可用于定量化表征大气的环境。例如梁维亮等(2015) [1]证实对流参数阈值可有效区分南宁地区的有无雷暴天气。宝乐尔(2022) [2]则通过建立潜势预报方程,成功应用于贺兰山地区雷暴预报。秦兆军等(2025) [3]发现K指数、对流温度、总指数、沙氏指数和抬升指数等热力稳定度参数在雷暴过程中表现出稳定性,适合作为呼和浩特地区雷暴过程判断的阈值。周方媛等(2020) [4]基于关键对流参数构建的预报方法得到了广泛使用,并取得了良好效果。西安机场雷暴天气的过程和相关对流参数的特征受地理特点与气候背景的影响,且雷暴发生所需的基本条件并非相互独立,而是存在一定关系:在某一条件对天气影响比较突出时,其他条件的作用会降低,这致使预报员很难对某一种数据因素设定阈值[5]。针对上述问题,本文在西安机场雷暴天气特征的基础上融合多种对流参数构建西安机场的雷暴潜势预报方法,以提升西安机场短临天气预报的准确度。
2. 西安机场概况、资料与方法说明
2.1. 机场概况
西安机场位于地势平坦的关中平原,其南面约45公里处坐落着平均海拔超2000米的秦岭山脉,呈东西向绵延。机场北侧有嵯峨山、五峰山等,机场北边有泾河,自西北向东南流入机场南边的渭河。在大陆性季风气候背景下,西安机场的天气呈现明显的季节转换:冬季晴朗,春秋阴雨频繁,夏季受副热带高压摆动影响,易出现雷雨天气。
2.2. 资料说明
本文利用西安机场2019~2025年逐小时地面气象观测资料、探空资料以及观测特殊天气纪要栏记录的雷暴过程进行统计分析。泾阳探空站距离西安机场约30千米,可用于西安机场雷暴天气的数据统计,因探空资料无法与观测的雷暴天气在时间上对应,因此选取当日的08时和20时探空数据(最接近雷暴发生时的数据)。将泾阳站(57131)的数据带入MICAPS 4.6系统计算输出,其中2019~2024年的样本数据用于建模分析,2025年的数据用于独立验证。查阅地面观测月总簿,围绕是否有闻雷、闪电记录,有雷暴天气记为(w = 1),无雷暴天气记为(w = 0)。除去缺测和异常数据,2019~2024年夏季(6~8月)西安机场共有855个探空数据,其中雷暴天气为45个;2025年有112个探空数据,其中雷暴天气为8个。
2.3. 对流参数的选取
雷暴天气的发生需要具备三个要素:不稳定的层结、充沛的水汽、抬升气块到凝结高度的触发机制,其中对抬升触发机制诊断较少,原因是抬升触发机制大多与中尺度系统有关,而中尺度系统具有形成时间短、范围小、发展迅速的特点,常难以进行有效的预报,因此本文关注不稳定的层结、水汽条件,选取6个常用的对流参数,分别为整层比湿积分(IQ)、总指数(TT)、K指数(KI)、沙氏指数(SI)、抬升指数(LI)、对流有效位能(CAPE)进行分析计算(表1)。
Table 1. Convective parameters and their expressions
表1. 对流参数及表达式
|
整层比湿积分(IQ)是指从地面到大气顶整层比湿(q)的积分,其数值直接反映空气柱中水汽含量;总指数(TT)结合了温度直减率和低层水汽,数值越大通常表示中层大气不稳定程度加剧且低层更为潮湿,K指数(KI)结合层结稳定性和水汽厚度,数值越高,表示大气越不稳定且低层越湿、同时考虑中层水汽饱和程度,总指数(TT)和K指数(KI)综合反映了垂直温度递减率及中低层水汽状况;沙氏指数(SI)是衡量气块从850 hPa高度被抬升到500 hPa高度后,其温度与500 hPa环境温度的差值,数值越小表示越不稳定;抬升指数(LI)与SI类似,通过接近地面层次的气块进行抬升,比SI更准确,沙氏指数(SI)和抬升指数(LI)体现了大气层结稳定程度;对流有效位能(CAPE)表示气块从自由对流高度(LFC)上升到平衡高度(EL)中,因正浮力所获得的总能量,表征了不稳定能量的多少。基于“配料法”的建模思路,本文选取上述对流参数作为回归自变量,构建逻辑回归预报模型,以预估雷暴发生的概率。在此基础上可进一步借助自动站数据、雷达拼图和卫星云图等,实现雷暴落区的定位。
3. 结果分析
3.1. 对流参数和雷暴天气概率分析
3.1.1. 有无雷暴天气时对流参数分布
基于西安机场2019至2024年的对流参数样本数据,本文将天气过程划分为有、无雷暴两组,分别统计两组中6项对流参数的数值分布情况。在有雷暴天气时,有75%的IQ ≥ 3224.21 g⋅hPa⋅kg−1 (图1(1)),75%的KI ≥ 29.55℃(图1(2)),75%的LI ≤ 0.28℃(图1(3)),75%的TT ≥ 42.37℃(图1(4)),75%的SI ≤ 1.97℃(图1(5)),75%的CAPE ≥ 63.4J⋅kg−1 (图1(6));在无雷暴天气时,有75%的IQ ≤ 3133.8 g⋅hPa⋅kg−1 (图1(1)),75%的TT ≤ 43.95℃(图1(2)),75%的KI ≤ 28.8℃(图1(3)),75%的SI ≥ 2.43℃(图1(4)),75%的LI ≥ 1.26℃(图1(5)),75%的CAPE ≤ 33.65 J⋅kg−1 (图1(6))。对图1分析表明,对流参数数值在有无雷暴天气条件下的分布存在差异。其中,IQ、KI、LI、SI和CAPE等数值在特定区间范围内设定合理阈值后都能较好地预报雷暴天气的有无。设IQ为3133.8~3224.21 g·hPa·kg−1,KI为28.8℃~29.55℃,LI为0.28℃~1.26℃,CAPE为33.65~63.4 J·kg−1,SI为1.97℃~2.43℃。总指数(TT)虽然在一定程度上可区分有无雷暴天气,但在两类天气条件下TT的对流参数数值重叠部分较多,导致其辨别能力和指示意义不如前五个对流参数。
Figure 1. Box plots of convective indices at Jingyang Station (57131) for thunderstorm and non-thunderstorm days: (1) IQ index, (2) KI index, (3) LI index, (4) TT index, (5) SI index, (6) CAPE index
图1. 泾阳站(57131)有雷暴和无雷暴的对流指数箱线图:(1) IQ指数,(2) KI指数,(3) LI指数,(4) TT指数,(5) SI指数,(6) CAPE指数
3.1.2. 雷暴天气概率
分析各参数在特定阈值区间内对应的雷暴发生的概率,即(雷暴发生次数/对流参数满足该条件的总次数),然后根据雷暴天气概率的高低将预报能力划分为四个等级,分别为:低于25%为“不易发生”,25%~50%为“可能发生”,50%~75%为“容易发生”,高于75%为“极易发生”。
Figure 2. Probability of thunderstorms at Xi’an Airport from 2019 to 2024 based on convective parameters: (1) IQ index, (2) KI index, (3) LI index, (4) TT index, (5) SI index, (6) CAPE index
图2. 西安机场2019~2024年对流参数:(1) IQ指数,(2) KI指数,(3) LI指数,(4) TT指数,(5) SI指数,(6) CAPE指数雷暴天气概率
统计检验表明,各对流参数在正常变化区间内与雷暴发生概率呈显著线性关联。雷暴发生概率与IQ、KI、TT及CAPE值呈正相关,而与LI、SI值呈负相关。当IQ > 4500 g·hPa·kg−1时,分析雷暴天气出现概率即容易发生,同理雷暴天气极易发生时IQ > 5500 g·hPa·kg−1时(图2(1));当KI > 36.0℃时,分析雷暴天气出现概率较小即可能发生,同理雷暴天气极易发生时KI > 38.0℃时(图2(2));当LI < 1.0℃时,分析得出雷暴天气可能发生,雷暴天气容易发生时LI位于−2.0℃时,当LI 越小雷暴出现的概率越大,LI < −3.0℃时雷暴天气极易发生(图2(3));当TT > 46.0℃时雷暴天气可能发生,TT > 48.0℃时雷暴天气容易发生,当TT > 50.0℃以上时雷暴天气极易发生(图2(4));当SI < 1.0℃时雷暴天气可能发生,当SI < −1.0℃时雷暴天气容易发生,当SI < −3.0℃时雷暴天气极易发生(图2(5));CAPE > 400 J·kg−1时,雷暴天气容易发生,CAPE > 1200.0℃以上时雷暴天气极易发生(图2(6))。当IQ和CAPE超过一定值后,雷暴极易发生。
3.1.3. 对流参数与雷暴天气的相关分析
预报雷暴天气概率整体趋势呈线性关系,但数据接近到某个特定值后,继续增大或减小时,雷暴天气概率与整体趋势会有变化,因此在建立回归方程时,先进行二值化处理[6]。在选取二值化阈值时,应确保二值化后的参数与雷暴的相关系数较于实际值相比有所增加。设对流参数I的最佳阈值为a,其方法为连续选取穷尽的a值,当I满足阈值a时取1,否则取0,并计算相关系数r(a)。使r(a)max对应a值即为最佳阈值(表2)。最佳阈值选取方法:用Youden’s index在ROC曲线上寻找一个“最佳阈值”[7],然后在阈值处侧重做统计检验:分别为二值预测与真值的列联卡方、连续取值在两类上的t检验、Mann-Whitney U [8]、二值预测与真值的相关及其p值。从检验得知以上数据无显著性差异。
Table 2. Tests of optimal thresholds and correlation coefficients for convective parameters
表2. 最佳阈值和相关系数的检验
序号 |
参数 |
最佳阈值 |
方向 |
AUC |
相关系数 |
t检验_p值 |
相关系数_p |
Mann-Whitney U_p值 |
卡方检验_p值 |
0 |
IQ |
3176.70 |
>= |
0.819415 |
0.471762 |
4.944168e−12 |
1.526647e−09 |
3.722272e−10 |
2.122740e−10 |
1 |
TT |
40.10 |
>= |
0.803909 |
0.363160 |
2.253898e−07 |
3.601121e−12 |
2.503397e−09 |
1.197955e−06 |
2 |
KI |
26.00 |
>= |
0.879422 |
0.472604 |
4.478168e−12 |
2.259758e−21 |
9.863036e−14 |
1.862692e−10 |
3 |
SI |
0.43 |
<= |
0.859796 |
0.554340 |
7.336042e−17 |
1.401273e−15 |
1.694669e−12 |
8.131930e−14 |
4 |
LI |
0.39 |
<= |
0.851559 |
0.506887 |
6.285319e−14 |
2.003349e−14 |
5.351901e−12 |
8.328024e−12 |
5 |
CAPE |
267.40 |
>= |
0.858020 |
0.565821 |
1.212405e−17 |
2.051593e−06 |
2.600589e−14 |
2.433016e−14 |
Table 3. Correlation coefficients between convective parameters (optimal thresholds, binarized values, and actual values) and thunderstorm occurrence [9]
表3. 最佳阈值、二值化后数值、实际值与雷暴天气相关系数[9]
类别 |
IO |
TT |
KI |
SI |
LI |
CAPE |
最佳阈值 |
≥3176.7 |
≥40.1 |
≥26.0 |
≤0.4 |
≤0.4 |
≥267.4 |
二值化 |
0.4718 |
0.3632 |
0.4726 |
0.5543 |
0.5069 |
0.5658 |
实际值 |
−0.4964 |
−0.3927 |
−0.4502 |
0.4655 |
0.4424 |
−0.5963 |
结果显示(表3) [9],经二值化处理的对流参数均与雷暴天气存在显著相关。相较于参数实际值,IQ、TT和CAPE的相关系数接近,KI的相关系数则有小幅提升,而SI与LI的提升幅度显著。这表明采用最佳阈值二值化处理,能有效提升对流参数的预报雷暴的指示能力。
3.2. 概率预报模型
3.2.1. 预报模型的构建方法
基于前述获得最佳阈值,先进行二值化处理,随后通过Logistic回归方法建立预报模型:
(1)
式(1)中,P为事件出现概率;
(2)
a为回归系数,X为自变量。利用Python软件进行计算雷暴天气出现(对应w = 1)的概率。并将六个对流参数带入公式,最终确定回归方程如下:
式(2)中,X1、X2、X3、X4、X₅、X6依次为二值化的IQ、TT、KI、LI、SI和CAPE。出现雷暴天气的概率P为:
(3)
综上,式(3)即为预报西安机场雷暴发生概率的数学模型。为评估其实际应用潜力,以下将基于2025年样本数据对该模型进行检验与评估。
3.2.2. 预报阈值和预报检验
通常采用临界成功指数(CSI)、命中率(POD)和虚警率(FAR)等关键指标进行检验。通常认为,预报准确性与CSI和POD呈正相关,而与FAR呈负相关[10]。各指标具体计算方式如下:
CSI = 预报正确次数/(预报正确次数 + 空报次数 + 漏报次数)
POD = 预报正确次数/(预报正确次数 + 漏报次数)
FAR = 空报次数/(预报正确次数 + 空报次数)
其中,预报正确指预报发生且实际发生,空报指预报发生但实际未发生,漏报指预报未发生但实际发生。选取西安机场对流参数带入式(3)计算对应雷暴天气的概率。逻辑回归模型输出的仅为雷暴发生的概率值,在实际业务应用中需设定一个最佳阈值。阈值的设定对预报效果具有不同影响:较高的阈值可能降低误报率,同时也可能提高漏报率;而较低的阈值虽可减少漏报,却会相应提高空报的可能性。为了找到最合适的平衡点,本文选用四种常见的方法来算阈值。分别为Youden’s index,同时最大化召回率(减少漏报)和特异度(减少误报);用F1-score的方法能平衡精确率(减少误报)和召回率(减少漏报);Accuracy可直接看准确率即追求整体预测正确最多;而最小期望代价则可以按照实际情况,给漏报和误报设不同权重,让结果更符合真实需求(表4) [11]。
分别选取以上方法得出的最佳阈值,计算各阈值下的三个指标,Youden’s indexCSI = 15.5%,POD = 84.4%,FAR = 84.0%;F1-score最优和Accuracy最优CSI = 37.9%,POD = 55.6%,FAR = 45.7%;最小期望代价CSI = 18.5%,POD = 77.8%,FAR = 80.5%。Youden’s index方法命中率(POD)最高,但虚警率(FAR)也很高,导致CSI较低。F1-score最优和Accuracy最优方法在CSI和FAR上表现更好,但命中率较低。最小期望代价方法在命中率和CSI上介于两者之间,但虚警率较高。综上,选取CSI、POD与FAR中较为平衡的F1-score最优和Accuracy 最优方法(两者取值相同),确定当P ≥ 52.9%时作为预报有雷暴的临界值效果最好。
Table 4. Best thresholds and corresponding forecasting performance determined by Youden’s index, F1-score optimization, Accuracy optimization, and minimum expected cost method [11]
表4. Youden’s index、F1-score最优、Accuracy最优、最小期望代价方法所对应的最佳阈值及预报效果[11]
方法/最佳阈值 |
Youden’s index/
最佳阈值16.43% |
F1-score最优/
最佳阈值52.9% |
Accuracy最优/
最佳阈值52.9% |
最小期望代价/
最佳阈值19.02% |
预报有 |
预报无 |
预报有 |
预报无 |
预报有 |
预报无 |
预报有 |
预报无 |
实况有 |
38 |
7 |
25 |
20 |
25 |
20 |
35 |
10 |
实况无 |
200 |
655 |
21 |
834 |
21 |
834 |
144 |
711 |
总计 |
238 |
662 |
46 |
854 |
46 |
854 |
179 |
721 |
将2025年西安机场的对流参数带入预报模型生成预报结果详见表5。分别选取P < 10.0%、P ≥ 52.9%、P ≥ 70%的预报阈值,当P ≥ 52.9%其预报西安机场有雷暴天气为8次,其中预报正确次数为6,空报次数为1,漏报次数为2,计算CSI、POD、FAR分别为66.7%、75.0%、14.3%。P ≥ 70%,预报正确次数6次,空报次数为0,漏报次数为2,计算CSI、POD、FAR分别为75.0%、75.0%、0.0%。当P < 10.0%时,108次无雷暴样本中有107次未出现雷暴,POD = 99%。结果显示,当选取的概率P较大时,CSI、POD较高,FAR较低,模型预报效果较好。另外,当选取的概率P较小时,模型对无雷暴天气的预报准确率较优。
Table 5. Forecast verification of the probabilistic model for thunderstorms at Xi’an Airport in 2025
表5. 概率预报模型对西安机场2025年雷暴天气的预报检验
预报阈值 |
10.0% |
52.9% |
70.0% |
预报有 |
预报无 |
预报有 |
预报无 |
预报有 |
预报无 |
实况有 |
7 |
1 |
6 |
2 |
6 |
2 |
实况无 |
5 |
107 |
1 |
111 |
0 |
112 |
总计 |
12 |
108 |
7 |
113 |
6 |
114 |
4. 结论与讨论
(1) 西安机场样本数据的对流参数数值在有无雷暴天气条件下的分布存在差异。其中,IQ、KI、LI、SI和CAPE等数值在特定区间范围内设定合理阈值后都能较好地预报雷暴天气的有无。
(2) 六个对流参数在正常变化区间内与雷暴发生概率的显著线性关联。雷暴发生概率与IQ、KI、TT及CAPE值呈正相关,而与LI、SI值呈负相关。
(3) 对流参数经二值化处理后的相关系数优于参数实际值,其中IQ、TT和CAPE的相关系数接近,KI的相关系数则有小幅提升,而SI与LI的提升幅度显著,可以更好地提升预报雷暴的指示能力。
(4) 利用二值Logistic回归建立概率预报模型,根据模型输出结果,选定P ≥ 52.9%为预报阈值;使用2025年数据进行准确性预报,验证该模型对西安机场雷暴潜势预报效果良好。
(5) 在统计分析中,由于样本较少,个别数据对整体趋势有影响,下一步将增加历史样本,不断完善雷暴模型,进一步有力支撑结论,同时将制作可视化程序,用于方便快捷辅助预报员预测雷暴天气。