1. 引言
机场能见度是决定机场航班能否起飞、降落的重要气象要素,雾、霾、烟及沙尘等大气污染物是导致机场能见度变差的主要原因。历史资料统计显示,北疆沿天山一带为雾多发区,同时随着城市发展和工业建设,各类污染物也逐渐加剧此区域雾霾天气的形成。乌鲁木齐机场地处天山山脉北麓,受此区域气候特征影响,冬季频繁出现大雾天气 [1] [2],导致新疆区域内大面积航班延误、取消,严重影响新疆区域民航运行的正常,也给飞行安全、公司效益、民众出行带来极大的影响。
乌鲁木齐机场冬季低能见度天气的发生,通常与特殊的地理特征和适宜的低空层结和水汽分布相关,现有的预测手段主要以分析上下游气象要素、空中气象要素分布特征,利用气候统计特征进行主观预报。结合低能见度天气的预测方法,国内学者尝试通过数值模拟、模式释用等方法,模拟大雾的发生、维持、消散机理,但由于低层地形条件复杂、气象要素变化大等问题,无法进行准确的业务化预报 [3] - [9]。随着探测资料精度提高,机器学习及大数据挖掘技术的发展,机场能见度方面的预测逐渐开始结合大数据分析和深度学习方法,构建预测模型,开展能见度的客观要素预报 [10] [11] [12] [13] [14],例如采用BP神经网络对能见度预测具有较高的精度和模型泛化能力 [15] 深度学习作为近几年发展较快的处理非线性问题的方法,在图像分类、语音识别等领域取得较好的效果,本文通过引入深度学习构建机场能见度预测模型,为业务人员提供客观的能见度预测产品。
2. 深度学习方法简介
深度学习(Deep Learning)是机器学习的重要分支,随着近些年计算机性能提升以及GPU加速技术的广泛应用,深度学习在车牌识别、购物推荐、搜索引擎等实际案例中取得较好的效果。早期的人工神经网络中,受限计算能力,其中函数的非线性运算组合水平较低,而深度学习可以将非线性运算组合水平设置较高的层次,用于更好的描述训练样本中因子间的非线性关系。鉴于深度学习在解决非线性问题的优势,本文尝试通过深度学习方法,来进行机场能见度的预测。
对神经网络而言,深度指的是网络学习得到的函数中非线性运算组合水平的数量 [16] [17]。当前神经网络的学习算法多是针对较低水平的网络结构,将这种网络称为浅结构神经网络,如一个输入层、一个隐层和一个输出层;与此相反,将非线性运算组合水平较高的网络称为深度结构神经网络,如一个输入层、三个隐含层和一个输出层的神经网络。通常认为MLP模型的层数(包含一个输入层,一个输出层和一个以上的隐含层)超过三层就是深层神经网络,如图1所示。
3. 深度学习模型构建
3.1. 资料预处理及因子构建
本文使用乌鲁木齐机场2000年至2021年11月至次年3月的历史观测资料,通过数据清洗和质量控

Figure 1. Schematic diagram of three-layer neural network
图1. 三层神经网络示意图
制,插值填补缺测资料,获得乌鲁木齐机场逐小时能见度数据,合计195,024条数据记录。考虑逐小时能见度为预测对象,本文采用过去n小时的主导能见度作为预报因子,利用这些数据构建样本数据进行建模训练。
3.2. 预测模型训练
通过构建差异化的资料样本,基于不同时长的机场能见度资料构建样本,具体见表1。为提高模型训练效率,评估模型预测效果,将历史样本数据中80%的数据作为训练样本,采用开源深度学习工具包TensorFlow和Keras进行建模运算,进行模型训练,利用剩余的数据检测模型预测结果的误差。

Table 1. Construction list of predictors
表1. 预报因子构建列表
4. 模型预测结果检验
4.1. 不同模型的预测效果对比
通过利用过去n小时的主导能见度作为资料样本的因子,其中n取值见图2所示,通过参数寻优和模型训练,获得基于历史时次机场能见度的预测模型,具体模型预测能力如下所述:模型预测机场能见度的平均绝对误差分布在300~400 m区间内,选取不同时间长度的因子获得的模型,平均绝对误差随着时间范围增加而增大。选取过去48小时能见度资料构建的因子模型平均绝对误差最小,仅为322 m。

Figure 2. Comparison of prediction effects of different models on dominant visibility
图2. 不同模型对主导能见度的预测效果对比
4.2. 不同量级的机场能见度预测效果检验
通过统计间隔1000 m量级的机场能见度预测效果可以看到,模型预测的机场能见度平均绝对误差大部分为700 m以内。为对比不同因子对机场能见度的预测效果,下面将会分析5000 m以内的机场能见度预测效果,具体见表2:

Table 2. Comparison of the mean absolute errors of airport visibility forecasting (unit: m)
表2. 机场能见度预测平均绝对误差对比(单位m)
从表2的平均绝对误差对比分析可以看到,5000 m以内的机场能见度预测结果中,平均绝对误差均在400~700 m之间分布;其中1000 m以内的平均绝对误差最小,过去24小时能见度资料构建的因子模型的平均绝对误差为393 m。
4.3. 低能见度天气过程预测
结合不同因子训练的模型对比结果,采用过去48小时的能见度作为因子进行训练的模型相对较好,本文选取乌鲁木齐机场2022年2月13日至16日一次低能见度过程,采用过去48小时能见度资料构建的因子模型进行预测评估,实况与预测结果对比如下图3所示:

Figure 3. Comparison of forecast effects of low-visibility weather processes at Urumqi Airport from February 13 to February 16, 2022
图3. 乌鲁木齐机场2022年2月13日至2月16日低能见度天气过程预测效果对比
这里选取乌鲁木齐机场2022年2月13日至16日的能见度进行预测,天气过程机场能见度变化较大,2月14日2时能见度由10,000 m突然将至2000 m,而后在1500 m至3000 m区间波动,最后在2月16日8时迅速转好至1000 m,此次天气过程中能见度变化幅度大,且低能见度持续时间长,采用过去48小时能见度资料构建的因子模型进行预测模拟。
通过模型预测可以看到,48 h单要素模型的预测效果相对更好,尤其是在长时间持续能见度3000 m至1500 m时,单要素预测的能见度平均绝对误差达到10 m,同时模型能够预测出当日能见度持续、变差以及好转的趋势,可以作为业务人员预测能见度的客观参考。
虽然模型能够较好地预测机场能见度,但是逐个时刻分析也可以看到,在机场能见度好转和变差的时间预测,与实际天气情况还存在差异。
5. 结语
1) 通过对比检验发现,采用过去48小时能见度资料构建的因子模型,机场能见度平均绝对误差可达322 m左右,能够较好地预测乌鲁木齐机场能见度演变过程,可以作为机场能见度客观预报的参考。
2) 预测模型对低能见度天气出现、消散的时刻预测存在一定偏差,对于低能见度维持预测效果较好,后续需要深入研究模型预测输出结果,改进天气出现和消散时间预测效果。
3) 考虑乌鲁木齐机场冬季低能见度天气成因复杂,本文的历史能见度资料训练构建预测模型,未考虑天气形式、风、相对湿度、温度等气象要素,导致模型预测效果不稳定,且在能见度转换时机预测具有一定的滞后性问题。在后续研究中,应当着重开展将影响低能见度天气的其他气象要素作为训练样本,改善模型的预测效果,提高产品的可用性。