1. 引言
全球城市化进程的加速和工业化水平的提高,使得城市的空气污染问题变得越发严重。交通排放、工业生产、建筑施工等活动导致了大量空气污染物的排放。特别是细颗粒物(PM2.5)、二氧化氮(NO2)、二氧化硫(SO2)等污染物,已经成为了影响空气质量和居民健康的主要因素。空气污染直接影响着健康、经济和环境。因此,准确地预测城市空气污染的变化趋势,可以让当地的政府部门及时地采取有效的污染控制措施,进而减少对公众健康的危害,这是具有重大的社会意义。如今大数据和人工智能技术的不断发展,基于数据统计的空气污染预测方法逐渐成为研究热点[1] [2]。准确的空气污染预测,可以提前帮助城市管理人员做好空气质量的监控和管理工作,同时为大家提供灾害预警信息,进而减少空气污染对人们身体健康的影响。对于城市的空气污染预测研究不仅具有重要的理论价值,还对改善城市环境质量、推动可持续发展和保障公众健康具有深远的实际意义。
预测大气污染物浓度的方法主要有两种:物理化学模型预测和数据统计模型预测。物理化学模型预测通过物理化学原理对空气污染物的物理化学反应进行建模和分析,从而预测不同尺度和区域的空气污染物变化。目前物理化学模型预测已经发展到第三代,它们主要包括社区多尺度空气质量建模系统(CMAQ) [3]、化学天气研究和预测模型(WRF-Chem) [4]和嵌套空气质量预测建模系统(NAQPMS) [5]。这些模型虽然有较好理论支撑,但往往需要复杂的模型配置和参数调整,并且有限的数据源和初始条件的使用限制了物理模型的应用范围[6],导致模型的预测结果有较高的不确定性。
因此,随着各地的气象观测站、气象卫星地面站、大气质量监测站等设备的建立,对大气污染物和气象的各项数据进行大范围的监控与采集,为气象预测提供了大量的数据支撑。数据统计模型预测方法也越来越多地用于大气污染物和气象的预测。从最开始的常用的模型有自回归移动平均模型(ARMA) [7]、自回归集成移动平均模型(ARIMA) [8]和多元线性回归模型(MLR) [9]。由于大气污染物和气象的各项数据有较高的不稳定性和非线性。上述统计建模方法在处理非线性序列数据时没有那么好,从而会影响数据预测的精度。近年来,随着机器学习的蓬勃发展,机器学习在空气质量预测领域得到了广泛的应用,多层感知器(MLP) [10] [11]等方法出现了、人工神经网络(ANN) [12]、分类和回归树(CART) [13]、支持向量机(SVM) [14]和随机森林(RF) [15]已被用于预测大气污染物和气象的数据。虽然传统的机器学习方法在预测空气污染方面取得了不错的效果,但大气污染物和气象的各项数据不仅具有相互转换和抵消的特点[16] [17],因此无法有效捕捉大气污染物和气象数据的时间序列特征信息。
为了从历史数据中提取内部特征关联信息,来更好地预测大气污染物和气象数据,许多学者使用深度学习预测模型,例如递归神经网络(RNN) [18]、长短期记忆(LSTM) [19]、加权长短期记忆神经网络扩展模型(WLSTME) [20]、双向长短期记忆神经网络(BiLSTM) [21]和门控循环单元(GRU) [22]。一些研究结合了上述网络来探索数据的长期依赖关系。例如,Huang等人[23]提出了集成CNN和LSTM架构,并通过累积降雨小时数、累积风速和PM等历史数据2.5浓度;Du等人[24]提出了一个基于一维CNN和Bi-LSTM的联合混合深度学习框架,用于多变量空气质量相关时间序列数据的共享表示特征学习;Sun等人[25]提出CEEMDAN-ARMA-LSTM模型,采用CEEMDAN模型对数据进行分解,提高数据信息的利用率,平滑的非白噪声分量被馈送到阿尔马模型,并且剩余的分量和残差被馈送到LSTM模型进行时间序列预测;Zhou等人[26]提出一种基于LSTM的TE-LSTM模型,采用时间加权策略优化时间信息的集成,捕获每个元素相对于目标元素的时间关系,并将其集成到LSTM中进行时间序列预测。上述基于深度学习的预测方法需要足够的训练数据。否则,训练后的神经网络鲁棒性差,准确率低,泛化能力弱。并且只能在短期预测上达到一定的精准度,在长期预测上精确度还不是很理想,这些方法在时间序列数据中的长期和复杂关系建模方面存在局限性,缺乏一定的并行计算能力。
为了在长时间序列上有良好的预测效果,学者们创造出Transformer [27]-[29],它的诞生很好的解决的长时间预测问题,它支持并行计算,训练速度更快,可以同时对长期和短期依赖关系进行建模,并在处理时态数据系列方面表现出良好的效果。Qin等人[30]研究出稀疏频率分解Transformer (SFDformer)预测污染物浓度的时间序列,其将计算复杂度从二次时间复杂度降低到线性时间复杂度。这种设计提高了计算效率,同时准确地提取关键特征;Hou等人[31]研究出Transformer-CNN模型网络架构的新型时间序列预测方法,用CNN捕获不同时间尺度的周期性特征,Transformer捕获长距离依赖性,在预测精度方面始终优于其他传统模型等等。然而,Transformers存在三个问题:计算复杂度高,内存占用量大,预测效率低。Zhou等人[32]提出了基于经典Transformer编解码器结构的Informer模型,在一定程度上解决了这些问题。
在本研究中,数据收集间隔较长,数据波动大以及非线性强,使用小波变换与Informer结合模型进行预测,然后与其他传统模型进行比较。(1) 对AQI、PM2.5、PM10、SO2、NO2、O3、CO、温度、降雨量、风速和风向这些数据,选择相对应好的小波基函数来对数据进行去噪以及提高其平稳性。小波变换后的数据平稳性提升,减少了噪声干扰,使得Informer的ProbSparse注意力机制能更高效地捕捉长期依赖关系,显著降低了预测误差。(2) 建立了4种AQI预测的深度学习模型(LSTM、Informer、Autoformer和小波变换与Informer结合模型),并在不同的预测时间段(seq len = 1, 4, 12, 24)下,比较了它们的预测结果。(3) 进一步提高AQI预测的准确性和可靠性,提高预测结果的质量,采用4个统计指标(MAE, MAPE, RMSE, R2)对预测结果进行量化。
2. 数据来源与数据处理
2.1. 数据来源
本文实验所用数据是从官方公开数据集网站上下载的,武汉市东湖生态旅游风景区的空气质量数据和气象数据相对来说是比较全面且完整的,选取了2023年1月1日至2024年12月31日的数据。空气质量数据来源于全国城市空气质量实时发布平台(https://air.cnemc.cn:18007/),气象数据来源于ear5数据中心(https://cds.climate.copernicus.eu/datasets),两部分数据都以小时为时间单位进行采集。数值主要属性为:AQI、PM2.5、PM10、SO2、NO2、O3、CO、温度、降雨量、风速和风向。
2.2. 数据预处理
在上述网站下载下来的数据存在着缺失值和重复值等情况,我们需要对存在问题的数据进行清洗操作。首先,使用相应的函数来检查数据的缺失和重复等问题。然后,采用删除重复值,使用平均数或者线性插值等方法进行空缺数据的填充。
3. 研究方法
本文将用处理过的数据,通过小波变换对气象数据进行再次优化处理,以提高数据的平稳性和去噪效果,再将处理后的数据输入到Informer模型进行长短期气象时间序列预测,具体步骤流程如图1。具体框架如下:选取数据、数据预处理、模型训练、模型评估、对比分析。小波变换与Informer结合的模型与其他时间序列模型在短期与长期的气象预测相比,表示出本研究模型的优点,并解释小波变换与Informer结合模型的优点以及决策力。
Figure 1. Flow diagram
图1. 流程图
4. 模型
4.1. 小波变换理论
小波变换经过不断的完善与发展,处理非平稳信号时有良好的表现,在时间序列预测领域发挥了重要作用。经典的小波变换有两种:连续小波变换和离散小波变换。
连续小波变换适用于连续信号,可将信号分解为不同频率的小波分量,保留时间和频率信息,常用于信号的时间频率分析、压缩及噪声去除等领域。对于连续信号
,其连续小波变换定义如下:
(1)
其中,a表示尺度参数,b表示平移参数,
表示小波基函数,
表示小波基函数的复共轭。
离散小波变换则针对离散信号,通过将信号分解为不同频率的小波系数,实现信号的多尺度分析,常用于信号的压缩、去噪和特征提取等任务。其过程可表示为:
(2)
其中,x表示输入信号,
和
分别表示低通和高通滤波器,n表示离散的时间。离散小波变换具有多层次分解的特性,即通过不断对低频部分进行分解来提取更深层次的信号信息。例如,首先对信号进行一次小波变换得到低频和高频分量,再对低频部分进行第二次小波变换,依此类推,直到达到预定的层数,从而实现多尺度的分解。
此外,还有快速小波变换(FWT)和离散小波包变换(DWPT)等,它们虽在算法和应用上略有差异,但都是基于小波函数的变换方法。小波基函数的选择是小波分析的关键。不同的小波基函数对应不同的尺度和频率,因此能够捕捉信号在不同时频域上的特征。常见的小波基函数包括Haar 小波、Daubechies小波、Morlet小波等。
小波变换模型应用
本文使用的AQI、PM2.5、PM10、SO2、NO2、O3、CO、温度、降雨量、风速和风向这些数据,我们选择相对应好的小波基函数来对数据进行去噪以及提高其平稳性。
对于AQI、PM2.5、PM10数据,我们选择db6小波基。Daubechies小波具有离散基和紧支撑的特点,虽然没有解析表达式,主要通过迭代计算,但在处理这类与空气质量相关的数据时,能够较好地捕捉数据的局部特征,适合进行信号的分解和分析。
对于SO2、NO2、O3、CO数据,我们采用sym6小波基。Symlets小波是Daubechies小波的改进版本,具有更好的对称性,在处理这几种气体污染物数据时,能够更准确地反映数据的特征,保留化学反应的连续性,有助于后续的分析和处理。
对于温度数据,我们选用coif3小波基。Coiflet小波可看作是Daubechies小波的一种特殊形式,同样具有离散基和紧支撑的特性,对于温度数据的处理,能够有效地进行多尺度分析,挖掘数据中的潜在信息。
对于降雨量数据,我们使用haar小波基。哈尔小波是最简单的离散基小波,虽然不够光滑,但在处理降雨量数据时,由于其简单性和对突变信号的敏感性,能够快速地对数据进行分解和压缩,处理间歇性脉冲型降水数据,有效分离雨量事件与噪声。
对于风速数据,我们采用bior3.3小波基。Biorthogonal小波具有双正交性,在处理风速数据时,能够在保证信号重构质量的同时,有效地提取数据的特征。
对于风向数据,我们选择db4小波基。同样基于Daubechies小波的特点,db4小波基能够较好地处理风向数据,捕捉风向变化的局部特征,由于风向是角度,可能需要不同的处理方式。例如,当处理角度数据时,直接进行小波变换可能会遇到问题,因为例如,359度和1度之间相差2度,但数值上差358度。这可能导致小波变换产生错误的细节系数。因此,处理风向数据的时候,我们要先将角度转换为正弦和余弦分量,分别处理后再转换回来,避免角度周期不连续性。
我们用python,对数据分别进行各自的小波变换,其中温度用(WD)表示,降雨量用(JS)表示,风速用(FS)表示,风向用(FX)表示。得出的结果如下图2。
Figure 2. Comparison graphs of each data before and after wavelet transform
图2. 各数据小波变换前后对比图
图2中蓝色曲线表示原始数据,橙色曲线表示小波变换后数据曲线。从图中可以发现在小波变换后,橙色曲线的异常突出点明显减少,整体更平滑,说明噪声被有效过滤,数据也在合理范围内。从各项数据来看,空气污染物(如PM2.5、PM10等)原始数据的异常突出点被抑制,去噪后保留污染变化趋势;气象类指标(如WD、FS)中,随机噪声导致的杂乱波动被消除,核心变化特征更突出;其他指标(如CO、JS)数据稳定性提升,异常值影响降低。整体体现小波变换在保留数据关键趋势的同时,完成噪声与有效信号分离,优化了数据预处理效果,便于后续分析。
4.2. Informer模型理论
图3展示的是Informer模型。它具有高效的长序列处理能力和稀疏注意力机制,可以很好地处理气象预测长短时预测。大气污染物和气象数据是高频且长时间跨度的时间序列,会有明显的季节性、非线性和不确定波动性。而Informer模型通过其独有的ProbSparse Self-Attention机制,可以降低长序列自注意力机制带来的计算复杂度。使其在处理大量历史数据时有很好的性能表现。同时,该模型的编码器–解码器架构能够有效捕捉气象数据随时间变化的趋势、周期性波动和突发事件,进而提供更精确的预测结果。
Figure 3. Informer model steps
图3. Informer模型步骤
Informer中的注意力机制,它是一个融合了卷积神经网络(Conv1d)与多头注意力机制(Multi-head Attention)的高级深度学习架构,专门针对复杂时间序列数据的特征提取和预测任务。输入层通过时间戳和标量数据的嵌入处理,利用Conv1d卷积操作实现了时序特征的有效编码,将原始序列数据映射到高维度的特征空间。对于气象的预测,这一过程能够精确捕捉时间和气象数据之间的动态关联,能够确保模型能够识别出不同时间点的气象状态。
每个注意力块(Attention Block)通过卷积操作逐步降低序列的维度。多头注意力机制在全局范围内捕捉时序依赖关系,特别适用于长时间跨度和复杂周期波动的数据特征。对于大气污染物和气象这种时变性显著且周期性强的数据,模型能够通过注意力机制抓住关键的历史时刻和全局的变换趋势。卷积操作则补充了局部特征的提取,使模型对短期波动也具有强大的适应性。
最后模型经过多层卷积和注意力处理的特征图(Feature Map)提炼出高阶时序特征,展现出气象数据在多时间尺度上的全局趋势和局部动态。该特征图为后续的预测任务提供了坚实的特征基础,模型也就能够生成精准的气象预测结果。因此Informer模型就能在降低计算复杂度的同时,也能大幅地提升处理长序列数据的效率与精度。
4.2.1. 结合模型预测未来1小时
我们将通过小波变换处理后的数据,输入到Informer模型中,选择70%的数据为训练集,20%的数据为测试集,10%的数据为验证集。编码器层数为2层、解码器层数1层、注意力头数8头、隐藏层维度512、输入序列长度seq_len = 96。超参数调优:通过网格搜索优化学习率最终选择0.0001、批量大小32、Dropout率0.05。训练迭代次数为15,数据在训练集上训练完,并在验证集上进行验证,之后在测试集上进行预测。生成部分Informer模型在测试集上的预测未来1个小时空气质量指数的效果如图4,生成的MAE和RMSE值如表1。
Figure 4. A comparison chart of AQI prediction data for the next hour
图4. 未来1小时AQI预测数据对比图
Table 1. The prediction model predicts the evaluation indicators for the next one hour
表1. 预测模型预测未来1小时评估指标
预测时长 |
预测模型 |
MAE |
RMSE |
MAPE |
R2 |
1 |
Ours |
2.003 |
3.149 |
0.036 |
0.986 |
图5中橙色线表示AQI的预测值,蓝色线表示AQI的真实值,可以看出两条线的趋势几乎是一样的,说明我们的结合模型对AQI未来1小时预测的结果是不错的。在表1中,可以知道目前我们的结合模型预测未来1小时AQI的MAE值为2.003,RMSE值为3.149,MAPE值为0.036,R2值为0.986都是很可观的数值。
4.2.2. 结合模型预测未来4小时
同预测未来1小时的方法,我们预测未来4小时的数据,生成部分Informer模型在测试集上的预测未来4个小时空气质量指数的效果如图5,生成的MAE和RMSE值如表2。
图6中橙色线表示AQI的预测值,蓝色线表示AQI的真实值,也可以看出两条线的趋势几乎是一样的,说明我们的结合模型对AQI未来4小时预测的结果也是不错的。在表2中,可以知道目前我们的结合模型预测未来4小时AQI的MAE值为4.521,RMSE值为7.183,MAPE值为0.045,R2值为0.983也都是很可观的数值。
Figure 5. A comparison chart of AQI prediction data for the next 4 hours
图5. 未来4小时AQI预测数据对比图
Table 2. The prediction model predicts the evaluation indicators for the next 4 hours
表2. 预测模型预测未来4小时评估指标
预测时长 |
预测模型 |
MAE |
RMSE |
MAPE |
R2 |
4 |
Ours |
4.521 |
7.183 |
0.045 |
0.983 |
4.2.3. 结合模型预测未来12小时
同上述方法,我们预测未来12小时的数据,生成部分Informer模型在测试集上的预测未来12个小时空气质量指数的效果如图6,生成的MAE和RMSE值如表3。
Figure 6. A comparison chart of AQI prediction data for the next 12 hours
图6. 未来12小时AQI预测数据对比图
Table 3. The prediction model predicts the evaluation indicators for the next 12 hours
表3. 预测模型预测未来12小时评估指标
预测时长 |
预测模型 |
MAE |
RMSE |
MAPE |
R2 |
12 |
Ours |
8.999 |
13.731 |
0.084 |
0.940 |
图7中橙色线表示AQI的预测值,蓝色线表示AQI的真实值,也可以看出两条线的趋势走向几乎一致,每个拐点也是预测到了,说明我们的结合模型对AQI未来12小时预测的结果也是不错的。在表3中,可以知道目前我们的结合模型预测未来12小时AQI的MAE值为8.999,RMSE值为13.731,MAPE值为0.084,R2值为0.940对于预测未来12小时的数据来说,也都是很可观的数值。
4.2.4. 结合模型预测未来24小时
同上述方法,我们预测未来24小时的数据,生成部分Informer模型在测试集上的预测未来24个小时空气质量指数的效果如图7,生成的MAE和RMSE值如表4。
Figure 7. A comparison chart of AQI prediction data for the next 24 hours
图7. 未来24小时AQI预测数据对比图
Table 4. The prediction model predicts the evaluation indicators for the next 24 hours
表4. 预测模型预测未来24小时评估指标
预测时长 |
预测模型 |
MAE |
RMSE |
MAPE |
R2 |
24 |
Ours |
12.064 |
17.303 |
0.127 |
0.883 |
图7中橙色线表示AQI的预测值,蓝色线表示AQI的真实值,也可以看出两条线的趋势走向几乎一致,每个拐点也是预测到了,说明我们的结合模型对AQI未来24小时预测的结果也是不错的。在表4中,可以知道目前我们的结合模型预测未来24小时AQI的MAE值为12.064,RMSE值为17.303,MAPE值为0.127,R2值为0.883对于预测未来24小时的数据来说,也都是很可观的数值。
5. 结合模型与其他模型对比
基于小波变换与Informer结合的模型在AQI预测中的表现与传统的时间序列预测方法LSTM预测模型、CNN-LSTM预测模型、Autoformer预测模型和Informer模型进行未来不同时长AQI预测时的各个评价指标对比。
预测结果对比分析
表5展示了小波变换与Informer结合的模型、LSTM预测模型、CNN-LSTM预测模型、Autoformer预测模型和Informer模型在预测未来不同时长AQI时的评价指标。MAE是用来描述预测值和真实值之间的偏差的,MAE的值越小说明模型的预测性能越好;RMSE描述的是一种离散程度,RMSE的值越小表明模型预测越稳定;MAPE是用来评价模型优劣性的,MAPE的值越小则表明模型精确度越高,模型就越优秀;R2是决定系数,R2越接近1,说明模型拟合效果越好。通过观察可发现在预测未来1小时、4小时、12小时和24小时预测AQI时 我们的预测模型的MAE、RMSE、MAPE和R2指标的值都比其他预测模型更加优秀,这表明我们的预测模型拥有较高的预测精确度。整体上来说,不管是预测精确度还是稳定性,我们的预测模型与其他预测模型相比,都是拥有优势的。
Table 5. Comparison of short-term and long-term predictive indicators of each model
表5. 各模型长短时预测指标对比
预测时长 |
预测模型 |
MAE |
RMSE |
MAPE |
R2 |
1 |
LSTM |
7.74 |
11.28 |
0.116 |
0.875 |
Informer |
6.021 |
9.703 |
0.113 |
0.880 |
Autoformer |
5.982 |
9.347 |
0.108 |
0.895 |
Ours |
2.003 |
3.149 |
0.036 |
0.986 |
4 |
LSTM |
11.63 |
16.21 |
0.154 |
0.796 |
Informer |
9.422 |
14.372 |
0.122 |
0.873 |
Autoformer |
7.182 |
10.076 |
0.144 |
0.863 |
Ours |
4.521 |
7.183 |
0.045 |
0.983 |
12 |
LSTM |
15.40 |
21.45 |
0.217 |
0.513 |
Informer |
13.157 |
19.094 |
0.149 |
0.836 |
Autoformer |
13.208 |
18.828 |
0.265 |
0.520 |
Ours |
8.999 |
13.731 |
0.084 |
0.940 |
24 |
LSTM |
17.72 |
25.19 |
0.324 |
0.256 |
Informer |
15.819 |
21.717 |
0.192 |
0.762 |
Autoformer |
15.890 |
22.601 |
0.316 |
0.301 |
Ours |
12.064 |
17.303 |
0.127 |
0.883 |
6. 结果和讨论
本文对AQI的长短期预测提出了小波变换与Informer结合的预测模型,并且对模型的建立和模型的训练以及预测的流程进行了详细的介绍,然后对模型的评价指标进行分析。本文首次提出对AQI、PM2.5、PM10、SO2、NO2、O3、CO、温度、降雨量、风速和风向这些数据,选择相对应好的小波基函数来对数据进行去噪以及提高其平稳性。对于AQI、PM2.5、PM10数据,我们选择选择db6小波基。对于SO2、NO2、O3、CO数据,我们采用sym6小波基。对于温度数据,我们选用coif3小波基。对于降雨量数据,我们使用haar小波基。对于风速数据,我们采用bior3.3小波基。对于风向数据,我们选择db4小波基,并在处理风向数据的时候,我们要先将角度转换为正弦和余弦分量,分别处理后再转换回来,避免角度周期不连续性。最后将小波变换后的数据整合放入Infromer模型中进行不同时间段预测。通过分析评估指标并与其他预测模型进行对比,证明了本文提出的小波变换与Informer结合的长短期预测模型在AQI长短期预测上相对于传统的时间序列模型都有足够好的优越性。
NOTES
*第一作者。
#通讯作者。