基于BP神经网络模型的贵阳市臭氧浓度预报研究
Research on Forecast of Ozone Concentration in Guiyang City Based on BP Neural Network Model
DOI: 10.12677/AEP.2022.122043, PDF, HTML, XML, 下载: 272  浏览: 408  科研立项经费支持
作者: 崔 蕾, 唐辟如, 刘 伟, 李 皓:贵州省人工影响天气办公室,贵州 贵阳;朱育雷:贵州省气象台,贵州 贵阳
关键词: 贵阳市O3质量浓度BP神经网络模型预测Guiyang City O3 Mass Concentration BP Neural Network Model Prediction
摘要: 本文基于BP神经网络模型,利用贵阳市环监站2016年6月~2017年9月O3浓度逐时数据以及对应时刻气象观测数据,在系统分析贵阳市臭氧浓度变化特征的基础上,利用BP神经网络模型,对贵阳市大气O3浓度进行预测,结果表明:1) 贵阳市O3浓度总体呈现出春夏高、秋冬低的波动变化特征,年均值为58 μg/m3;5月(86 μg/m3)、11月(40 μg/m3)分别为浓度最高、最低月。在季节时间尺度上表现为春季 > 夏季 > 冬季 > 秋季的特点,夏季均值明显高于其他三季;日变化特征为单峰型,18:00出现峰值,峰值为82 μg/m3;2) O3浓度与气压、相对湿度呈负相关,与温度、风速呈现正相关,相关系数分别为−0.61、−0.75、0.81和0.76;3) 基于只考虑气象因素和考虑气象因素加污染因素两种输入方案的BP神经网络均能较好地预测O3质量浓度,前者实测O3质量浓度与预测O3质量浓度相关系数为0.69,后者为0.81,且两者预测结果与实测数据的平均绝对误差分别为40.2%和29.6%。说明基于考虑了气象和污染双重因子的输入方案BP神经网络预测结果相较于基于只考虑气象因子的输入方案的BP神经网络预测结果更优。
Abstract: By using the hourly data of O3 concentration from June 2016 to September 2017 at Guiyang envi-ronmental monitoring station and the meteorological observation data at the corresponding time, based on the systematic analysis of the characteristics of the ozone concentration change in Guiyang, the BP neural network model was used to predict O3 concentration. The results showed that: 1) The O3 concentration in Guiyang showed a fluctuating characteristic, the value was high in spring and summer and low in autumn and winter, with an annual average value of 58 μg/m3; May (86 μg/m3) and November (40 μg/m3) were the highest and the lowest months respectively. On the seasonal time scale, the characteristics are spring > summer > winter > autumn. The average value of summer is significantly higher than which of the other three seasons. The daily variation was characterized by a single peak, with a peak at 18:00 (82 μg/m3); 2) O3 concentration was negatively correlated with air pressure and relative humidity, and positively correlated with temperature and wind speed, the correlation coefficients were −0.61, −0.75, 0.81 and 0.76 respectively; The BP neural network of the two input schemes can predict the O3 mass concentration well, the correlation coefficient of the measured O3 mass concentration and predicted O3 mass concentration was 0.69 of the former, and was 0.81 of the latter. The average absolute error between the predicted results of both was 40.2% and 29.6% respectively. The result of the input scheme that takes into account the dual factors of weather and pollution was better than the result of the input scheme which only considers the meteorological factors.
文章引用:崔蕾, 朱育雷, 唐辟如, 刘伟, 李皓. 基于BP神经网络模型的贵阳市臭氧浓度预报研究[J]. 环境保护前沿, 2022, 12(2): 314-323. https://doi.org/10.12677/AEP.2022.122043

1. 引言

大气污染本质上是社会、经济和环境诸多矛盾激化的产物 [1]。美国经济学家于1991年提出了“环境库兹涅茨曲线”假说表明:在发展阶段,环境污染程度随经济增长而加剧 [2]。在贵阳市GDP连续四年保持高增速、快发展的背景下 [3],由臭氧、细颗粒物为代表的大气污染问题已在云贵高原日益凸显 [4]。随之,墨迹天气等APP也将民众所关注的空气质量作为大气预报和出行活动的一项重要参考指标 [5]。

现有的空气质量预报方法主要为物理和化学机理模拟和基于机器学习两种类型 [6] [7] [8] [9] [10],相较机理模型对污染物的物理化学过程进行模拟,机器学习模型只要根据统计学原理,利用特定算法从数据中找出隐藏的转化规律即可 [5]。20世纪90年代,人工神经网络由于其自身的特性被应用到空气质量预测方面 [11]。反向传播神经网络(Back propagation neural network, BP)是一种多层前馈神经网络,该网络的主要特点是信号向前传递,误差反向传播,根据预测误差调整网络权值和阈值,从而使预测输出不断逼近期望输出 [12] [13] [14] [15]。同时也有BP神经网络算法的改进算法,可更好地预测函数输出 [11]。张旭,杜景林等 [16] 针对空气中PM2.5浓度与气象因素,设计了一种改进的PSO-GA混合算法,结果表明:改进的PSO-GA-BP预测模型和PSO-BP预测模型均可获得良好的预测结果,但前者比后者收敛性更好;闫妍 [5] 运用BP人工神经网络的多层神经网络对全市大气污染物浓度的实测值进行训练学习,建立模型对污染物浓度进行预测和预报,以达到对大气环境质量进行预测预警的作用。2009年,王芳、程水源等 [17] 设计基于GA-BP算法的空气污染物预测模型,对北京市PM10浓度进行了预测,结果表明:GA-BP 网络预测模型对于空气污染物浓度短期预测准确率较高;赵宏、刘爱霞等 [18] 的研究结果发现:遗传算法的加入让BP网络预测模型大放异彩,有效提高了预测模型的精度。薛同来 [19] 等建立了基于BP神经网络的PM2.5非线性回归预测模型对北京市PM2.5浓度进行预测,验证该方法具有较高适用性与准确性;熊生龙 [20] 基于BP神经网路,选取部分污染物浓度值以及气象因素作为模型输入因子,建立3种PM10预测模型,通过比较模型收敛性、相关性、稳定性等各种参数,判定模型预报优劣。

为此,本文基于BP神经网络模型,利用贵阳市环监站O3浓度逐时数据以及对应时刻气象观测数据在系统分析贵阳市臭氧浓度变化特征的基础上,利用BP神经网络模型,对贵阳市大气臭氧浓度进行预测,以期为贵阳市空气质量预测提供依据。

2. 资料与方法

研究表明,污染物之间的相互转换和二次生成,是影响彼此浓度的重要因素,同时,在污染源排放相对稳定的前提下,气象条件是决定空气质量优劣的关键因子。为此,本文所用数据为:贵阳市环监站O3浓度逐时数据以及对应时刻气象观测数据。

同时,选取BP神经网络模型的对O3浓度预测,采用过去N天数据作为训练样本,未来N + 1数据作为测试样本检验预报的准确性。

3. 结论与讨论

3.1. 臭氧浓度变化特征

由于O3的光化学生成受制于不同的影响条件,故存在较为明显的季、日变化特征,据此对O3浓度逐日变化(图1)、月均变化(图2)、日变化(图3)做了统计分析,不难得到以下结论:从图1可见,观测期间内,贵阳市O3浓度总体呈现出春夏高、秋冬低的波动变化特征,年均值为58 μg/m3。由图2可得,5月(86 μg/m3)、11月(40 μg/m3)分别为浓度最高、最低月。其变化过程表现为:1月至5月,O3浓度呈现出上升趋势,并在5月达到浓度峰值,6月至8月随着雨水增多,O3浓度较5月骤减,9月开始至12月,O3浓度逐渐降低。其在季节时间尺度上表现为春季 > 夏季 > 冬季 > 秋季的特点,四季均值分别为74 μg/m3、54 μg/m3、50 μg/m3、53 μg/m3

Figure 1. Changes of O3 concentration in Guiyang day-to-day

图1. 贵阳市O3浓度逐日变化

Figure 2. Monthly change of O3 concentration in Guiyang

图2. 贵阳市O3浓度月变化

图3给出了O3质量浓度的日变化特征,各时刻的O3质量浓度为对应观测期间内所有日期同时刻浓度的平均,从图中可以看出,贵阳市O3浓度日变化特征存在四个阶段。1) 00:00~08:00 (前夜累积阶段):O3浓度处在全日较低水平;2) 08:00~9:00 (O3抑制阶段):人类活动开始增强并伴随着一定汽车尾气的排放,但由于该时段太阳辐射弱,NO2浓度较低,O3与NO的反应占为主导,导致O3消耗,使得O3的浓度在这一时段内略有下降;3) 9:00~18:00 (O3光化学生成阶段):伴随着紫外线或太阳光的持续增强,O3前体物的大量排放和光解,O3浓度逐渐上升,至18:00出现峰值,峰值为82 μg/m3,该阶段为O3光化学生成阶段;4) 18:00过后(O3消耗阶段):由于晚高峰所带来的新增NO排放高峰对O3进行消耗结合混合层厚度的、太阳辐射的减弱等O3不利生成条件的综合作用,使得O3浓度在18:00至午夜逐渐降低。

Figure 3. Diurnal variation of O3 concentration in Guiyang

图3. 贵阳市O3浓度日变化

3.2. 臭氧浓度影响因子及相关性分析

对于O3的生成而言,总体在副热带高气压控制下,晴朗少云、强太阳辐射、高温等天气状况下,有利于光化学反应的进行。因而,春夏季是O3污染的是的高发和易发期。基于观测期间全年温度、气压、相对湿度以及风速数据,首先将其与贵阳市O3浓度的相关性(显著性水平α = 0.05)进行分析,得到表1,由表1可见,总体而言,O3浓度与气压、相对湿度成负相关,与温度、风速呈现正相关,相关系数分别为0.81、−0.61、0.76和−0.75。

Table 1. Correlation between meteorological elements and O3

表1. 气象要素和O3的相关性

图4进一步给出了温度、气压、风速以及相对湿度与O3浓度的逐日变化曲线图,由该图可直观看出前文所述的相关关系。

Figure 4. The daily variation curve of O3 concentration and meteorological elements

图4. O3浓度与气象要素的逐日变化曲线

3.3. 基于BP神经网络的臭氧浓度预报模型

3.3.1. 神经网络参数设置概要

在本文中,设计Case 1和Case 2两种不同的输入方案,输出数据均为O3逐时浓度,其中,Case 1选取的训练样本为:2016年10月~2017年3月逐时气象数据,共计3563组数据作为预测模型的训练样本:Case 2选取的训练样本为:2016年10月~2017年3月逐时气象数据和逐时污染物浓度数据,共计3563组数据作为预测模型的训练样本。

Case 1、Case 2选取的测试样本均为2017年4月至9月逐时O3质量浓度,共3815组数据作为预测模型的测试数据,详见表2

3.3.2. 预测结果比较

基于Case 1和Case 2的BP神经网络预测结果见图5图5(a)为实测O3质量浓度与基于Case 1的BP神经网络预测O3质量浓度散点图,图5(b)为实测O3质量浓度与基于Case 2的BP神经网络预测O3质量浓度散点图,由该图可见,基于Case 1和Case 2的BP神经网络均能较好地预测O3质量浓度。

Table 2. Summary of BP neural network parameter setting

表2. BP神经网络参数设置概要

(a)(b)(a)、(b)分别为基于Case 1和Case 2的O3预测值与实测值质量浓度

Figure 5. BP neural network prediction results based on Case 1 and Case 2

图5. 基于Case 1和Case 2的BP神经网络预测结果

两者预测浓度与实测浓度的相关系数均高于0.5。其中,实测O3质量浓度与基于Case 1的BP神经网络预测O3量浓度相关系数为0.69,实测O3质量浓度与基于Case 2的BP神经网络预测O3质量浓度相关系数为0.81,两者散点关系图见图6,说明基于Case 2的BP神经网络预测结果更优。

平均绝对误差是单个观测值与算术平均值的偏差的绝对值的平均,可以准确反映实际预测误差的大小,因此,进一步计算了基于Case 1和Case 2的BP神经网络预测结果与实测数据的平均绝对误差,计算公式见式(1):

= 1 n i = 1 n | R i F i | (1)

其中,Ri为第i个(次)实测O3质量浓度,Fi为第i个(次)预测O3质量浓度,n为数据样本个数。

(a)(b)(a)、(b) 分别为Case 1和Case 2

Figure 6. Scatter plot of mass concentration between predicted value and measured value based on BP neural network 3 of Case 1 and Case 2

图6. 基于Case 1和Case 2的BP神经网络3预测值与实测值质量浓度散点图

计算结果表明:基于Case 1和Case 2的BP神经网络预测结果与实测数据的平均绝对误差分别为40.2%和29.6%。说明基于考虑了气象和污染双重因子的Case 1输入层BP神经网络预测结果相较于基于只考虑气象因子的Case 2 S输入层的BP神经网络预测结果更优。

4. 结论

本文基于BP神经网络模型,利用贵阳市环监站O3浓度逐时数据以及对应时刻气象观测数据,在系统分析贵阳市臭氧浓度变化特征的基础上,利用BP神经网络模型,对贵阳市大气臭氧浓度进行预测,结果表明:

1) 贵阳市O3浓度总体呈现出春夏高、秋冬低的波动变化特征,年均值为58 μg/m3

2) 5月(86 μg/m3)、11月(40 μg/m3)分别为浓度最高、最低月。在季节时间尺度上表现为春季74 μg/m3 >夏季54 μg/m3 > 冬季53 μg/m3 > 秋季50 μg/m3的特点;

3) 日变化特征为单峰型,18:00出现峰值,峰值为82 μg/m3

4) O3浓度与相对湿度呈负相关,与温度、太阳辐射呈现正相关,相关系数分别高达−0.966、0.946及0.757;

5) 基于只考虑气象因素和考虑气象因素加污染因素两种输入方案的BP神经网络均能较好地预测O3质量浓度,前者实测O3质量浓度与预测O3质量浓度相关系数为0.69,后者为0.81,且两者预测结果与实测数据的平均绝对误差分别为40.2%和29.6%。说明基于考虑了气象和污染双重因子的输入方案BP神经网络预测结果相较于基于只考虑气象因子的输入方案的BP神经网络预测结果更优。

基金项目

贵州省气象局登记项目(黔气科登[2019]11-12号)。

参考文献

[1] 丁一汇, 柳艳菊. 近50年我国雾和霾的长期变化特征及其与大气湿度的关系[J]. 中国科学(地球科学), 2014(1): 37-48.
[2] 曲格平. 从“环境库兹涅茨曲线”说起[J]. 中国环境管理干部学院学报, 2006, 16(4): 1-3.
[3] @各级领导干部, 习近平两会上提出“攻坚”新要求[EB/OL].
https://news.163.com/19/0312/20/EA3HVARO000189FH.html, 2019-03-12.
[4] 舒卓智. 云贵高原清洁大气背景下贵阳市大气复合污染变化及气象影响研究[D]: [硕士学位论文]. 南京: 南京信息工程大学, 2018
[5] 闫硕. 基于神经网络的空气质量预测[D]: [硕士学位论文]. 北京: 北京工业大学, 2019.
[6] 许敏. 中国长三角地区PM2.5时空分布数值模拟研究[J]. 气象与环境学报, 2021, 37(4): 33-39.
[7] 肖林鸿, 陈焕盛, 陈婷婷, 等. 基于机器学习的短临预报方法及其在空气质量保障中的应用[J]. 中国环境监测, 2021, 37(3): 66-74.
[8] 徐爱兰, 张再峰, 孙强, 等. 基于深度学习的人工智能空气质量预报系统构建[J]. 中国环境监测, 2021, 37(2): 89-95.
[9] 黄树元, 唐晓, 陈科艺, 等. 武汉冬季典型月份PM2.5浓度变化的观测分析与模拟追因[J]. 环境科学学报, 2021, 41(3): 842-852.
[10] 沙桐. WRF-Chem模式中土壤NOX排放和气溶胶化学机制改进及其对空气质量影响研究[D]: [硕士学位论文]. 南京: 南京信息工程大学, 2021.
[11] 李玉刚. 基于遗传算法的PID控制系统[J]. 电脑知识与技术, 2009, 5(9): 2190-2192.
[12] 陈能汪, 余镒琦, 陈纪新, 等. 人工神经网络模型在水质预警中的应用研究进展[J]. 环境科学学报, 2021, 41(12): 4771-4782.
[13] 关成立, 杨岳. 反向传播神经网络在社会发展中的智慧应用研究[J]. 计算机时代, 2021(5): 46-48+52.
[14] 成华义. GA-PSO-BP神经网络在大气污染物浓度预测中的应用研究[D]: [硕士学位论文]. 武汉: 华中科技大学, 2014.
[15] 王光明. 基于PSO-BP网络学习方法研究[D]: [硕士学位论文]. 合肥: 安徽大学, 2015.
[16] 张旭, 杜景林. 改进PSO-GA-BP的PM2.5浓度预测[J]. 计算机工程与设计, 2019, 40(6): 1718-1723.
[17] 王芳, 程水源, 李明君, 等. 遗传算法优化神经网络用于大气污染物预报[J]. 北京工业大学学报, 2009, 35(9): 1230-1234.
[18] 赵宏, 刘爱媛, 王恺, 等. 基于GA-ANN改进的空气质量预测模型[J]. 环境科学研究, 2009, 22(11): 1276-1281.
[19] 薛同来, 赵冬晖, 韩菲. 基于BP神经网络的北京市PM2.5浓度预测[J]. 新型工业化, 2019, 9(8): 87-91.
[20] 熊生龙. 贵阳空气中PM10浓度的神经网络模拟预测与运用[D]: [硕士学位论文]. 杭州: 浙江大学, 2006.