1. 引言
控制大气污染是城市污染重点防治规划的治理内容之一,建立空气质量预报模型,及时获知潜在的大气污染过程并迅速采取各项预防控制处置措施,是尽可能减少大气污染对人体健康,生态环境和社会发展造成严重危害,提升空气质量水平的科学有效控制手段之一。目前国内常用的WRF-CMAQ体系 [1] 可以实现对空气质量进行粗略预报,其运行原理是利用CMAQ根据来自WRF系统的实时气象信息数据及场域内的主要污染物排放清单,基于物理和化学反应原理模拟污染物浓度的变化过程,得到某个特定时间段内的预报结果。但由于模拟气象场条件和污染物排放清单具有不确定性,以及不完全了解其中一些污染物(如臭氧)的生成机理,WRF-CMAQ预报空气质量的准确性还有很大提升空间。
现有研究中,郑瑶 [2] 等人构建了一个高精度的灰色关联组合模型,以获取各城市的PM10、PM2.5浓度预测值;文琴 [3] 采用长短期记忆网络作为空气质量指数预测模型建立空气质量指数预测系统;还有学者基于大数据分析算法与认知学习技术研究提出大气环境应用系统 [4] ,比较分析BP神经网络、决策树和支持向量机这类机器学习算法构建的空气质量预测模型 [5] 等。但鲜少文献直接在WRF-CMAQ一次预报结果的基础上进行改进,本文提出一种基于一次预报数据,结合更多实测气象数据的空气质量二次预报模型,以提高一次预报的准确性。
2. 基于WRF-CMAQ的二次预报模型
2.1. 评价指标
空气质量指数(AQI)是根据环境空气质量标准和细颗粒物(PM2.5)、可吸入颗粒物(PM10)、二氧化硫(SO2)、二氧化氮(NO2)、臭氧(O3)、一氧化碳(CO)等污染物对人体健康、生态、环境的影响,将常规监测的空气污染物浓度简化成为单一的概念性指数值形式,来表示空气污染程度和空气质量状况的分级指数 [6] 。根据《环境空气质量指数( )技术规定(试行)》(HJ633-2012),AQI可用于判别空气质量等级,其计算公式为
(1)
表示污染物P的空气质量分指数,
(2)
其中,Cp表示污染物P的质量浓度值,
,
分别表示与Cp相近的污染物浓度限值的高位值,低位值,
,
分别是与
,
对应的空气质量分指数。各项污染物项目浓度限值及对应的空气质量分指数级别见表1。

Table 1. IAQI and corresponding concentration limits of pollutants
表1. 空气质量分指数(IAQI)及对应的污染物项目浓度限值
空气质量等级范围根据AQI数值划分,等级对应的AQI范围见表2。

Table 2. Air quality grade and range of corresponding AQI
表2. 空气质量等级及对应空气质量指数(AQI)范围
2.2. 整体流程
图1对二次预报系统中各个模块的集成机制与交互关系进行了整体描述,其中,输入层的一次预报数据来自WRF-CMAQ模型;处理层的二次预报模型构建是本文的目标;输出层预测各污染物浓度,由此预报出AQI、空气质量等级和首要污染物,其准确率是评价二次预报模型精度的主要标准。

Figure 1. Overall flow of secondary forecast
图1. 二次预报整体流程
2.3. 二次预报模型
在不同天气系统下,空气的宏观热力、动力结构差异较大,对污染物的水平扩散和垂直输送能力有较大影响,会引起污染物浓度变化 [7] 。例如,金仁浩 [8] 等人通过相关性分析与回归分析得出风力对PM2.5浓度有着显著的负影响。因此,不同气象条件下各污染物浓度有其显著特点,先对气象条件分类很有必要。
地表温度、比湿、近地10米风速、大气压等气象变量可反映气象条件,但某些气象变量之间存在高度相关性,可先通过对实测气象数据画热力图,相关性分析,剔除相关性高的变量,选择其中m个作为气象变量。根据污染物浓度进行K均值聚类,再分类分析气象变量,总结其特点,完成气象条件分类。
综合近期相关污染物实测数据、气象实际监测数据以及根据WRF-CMAQ模型得到的一次预报数据,建立如下空气质量二次预报模型。
(3)
其中,
为T日污染物P的二次预报浓度,
为T − 1日污染物P的实测浓度,
为T日污染物P的一次预报浓度,
为T − 1日m种气象变量实测值向量,a, b为系数,
为气象系数向量,d为常数。
3. 实证分析
3.1. 数据来源及预处理
本文采用中国环境监测总站发布的北京昌平镇,上海普陀,重庆南坪3个国控点2019年4月16日至2021年7月13日的小时监测数据。在实际工作中,预报服务器电源停电、监测站点设备调试、维护等原因都会导致部分运行日期的数据缺失,一些偶然因素也可能使得数据异常,如污染物浓度出现负值。由于时间越相邻的气象与空气污染物浓度越相近,所以对于缺失值和异常值,本文采用临近值法进行了数据填充。
3.2. 气象分类结果
对实测气象数据进行相关性分析,综合考虑选择了其中12个作为气象变量,包括:温度(℃)、湿度(%)、气压(MBar)、风速(m/s)、风向(˚)、雨量(mm)、云量、边界层高度(m)、感热通量(W/m2)、潜热通量(W/m2)、短波辐射(W/m2)、地面太阳能辐射(W/m2)。
根据污染物浓度进行K均值聚类,类别数K值不同会导致聚类效果不同,分别令K = 3、K = 5、K = 10,进行了三次聚类,K = 5时聚类效果相对较好,故分为5个类别,各类别的污染物浓度中心如表3。
根据聚类结果,分别对五个类别的数据进行描述性统计分析,选取其中差异明显和相对不明显的变量进行展示,其中云量在五个类别中差异不大,而边界层高度和短波辐射在五个类别中差异较大。结果如表4所示。

Table 4. Descriptive statistical analysis of meteorological variables under different types
表4. 不同类别下部分气象变量的描述性统计分析
通过聚类分析发现各类别污染物浓度存在较大差异,以差异最大的几个气象变量(边界层高度、地面太阳能辐射和短波辐射)为主,其他气象变量为辅对气象系统进行气象类型划分,共分为热带辐合带、副热带高压、暖区辐合、雨带辐合、副极地低气压五类,如表5。

Table 5. Description of different meteorological types
表5. 不同气象型说明
3.3. 拟合结果
将2019年7月13日至2021年7月13日的污染物浓度、气象变量的实测数据和一次预报数据分为训练集和测试集,根据上述分类方法,将数据分为5类,再按类别逐步回归,得到各污染物浓度的二次预报模型。为了方便表达,当天实测污染物监测浓度(μg/m3),前一天实测污染物监测浓度(μg/m3),一次预报污染物小时平均浓度(μg/m3),温度(℃)、湿度(%)、气压(MBar)、风速(m/s)、风向(˚)、雨量(mm)、云量、边界层高度(m)、感热通量(W/m2)、潜热通量(W/m2)、短波辐射(W/m2)、地面太阳能辐射(W/m2)依次用
表示。由于篇幅限制,选取部分模型进行展示,见表6。
3.4. 预测效果检验
利用上述二次预报模型对测试集的数据进行预测,将得到的预测浓度与相应的实测浓度进行对比,观察两者的差异。图2展示了第五类中的四种污染物CO,SO2,PM10,O3实测浓度与二次预报浓度对比,可以看出这几种污染物的实测值与相应的二次预报值总体上在同一范围内,相差不大,其中,PM10的二次预报值相对实测值更靠近均值,其他污染物的二次预报值从直观上看都较为准确。

Table 6. Secondary prediction model of pollutant concentration under different types
表6. 不同类别下部分污染物浓度二次预报模型




Figure 2. Comparison between the predicted concentration and measured concentration of type V
图2. 第五类CO,SO2,PM10,O3预报浓度和实测浓度对比图
由于AQI难以直接比较以说明二次预报模型的预测效果,所以采用计算各类别二次预报空气质量等级和首要污染物准确率的方式来评价二次预报模型。各类空气质量等级和首要污染物的一次,二次预测准确率对比如表7。

Table 7. Accuracy comparison of primary and secondary prediction models
表7. 一次、二次预报模型准确率对比
可以看出,对于空气质量等级和首要污染物的预报,二次预报的正确率都明显高于一次预报。并且二次预报对这五类气象型的空气质量等级的预测准确率达到80%以上,其中第五类最准确。而首要污染物预测的准确率基本都在60%左右,第一类预测效果最好。综合两种指标来看,空气质量二次预报模型预报空气质量准确度较高,其预报结果对指导现实生活有一定的参考意义。
4. 结语
污染源排放、大气理化过程和气象条件是影响环境空气质量的主要因素,本文主要考虑了气象条件对空气质量的影响,在WRF-CMAQ模型预报数据的基础上建立了二次预报模型,提高了空气质量预报准确度。本文虽综合考虑了空气污染物实测和预报数据、大气状态但未仔细考虑各种因子所占权重,有待于今后进一步开展研究,以逐步改进该模型系统。还有许多其他模型包括人工神经网络、ARMA、动态统计等,都各有优缺点,可以在此基础上进行改进。
基金项目
重庆市自然科学基金项目(cstc2020jcyj-msxmX0232),重庆市高等教育教学改革研究项目(203332),重庆市研究生科研创新项目(CYS21475)。
NOTES
*通讯作者。