基于PSO-BiLSTM的乐山市空气质量指数预测
Air Quality Index Forecast of Leshan City Based on PSO-BiLSTM
DOI: 10.12677/sa.2025.145132, PDF, HTML, XML,   
作者: 陶诗仪, 余 言, 张佳怡, 龚书琪, 董芸吟, 王靖涵:乐山师范学院数理学院,四川 乐山;高仕龙*:乐山师范学院数理学院,四川 乐山;乐山师范学院应用数学研究中心,四川 乐山
关键词: 时间序列长短期记忆网络双向长短期记忆网络贝叶斯优化算法粒子群优化算法Time Series Long Short-Term Memory Network Bidirectional Long Short-Term Memory Network Bayesian Optimization Algorithm Particle Swarm Optimization Algorithm
摘要: 随着工业化和城市化的快速发展,空气质量问题已成为全球关注的焦点。乐山市作为四川省的一个重要城市,也面临着空气质量下降的严峻挑战。为了有效预测和应对空气污染问题,本研究采用时间序列分析方法,使用双向长短期记忆网络、贝叶斯优化算法以及粒子群优化算法对乐山市的历史空气质量指数进行了深入分析与预测。
Abstract: With the rapid development of industrialization and urbanization, air quality has become the focus of global attention. Leshan City, as an important city in Sichuan Province, is also facing the severe challenge of declining air quality. In order to effectively predict and deal with air pollution, this study adopts the method of time series analysis, and uses the bidirectional long short-term memory network, Bayesian optimization algorithm and particle swarm optimization algorithm to analyze and predict the historical air quality index of Leshan City.
文章引用:陶诗仪, 余言, 张佳怡, 龚书琪, 董芸吟, 王靖涵, 高仕龙. 基于PSO-BiLSTM的乐山市空气质量指数预测[J]. 统计学与应用, 2025, 14(5): 130-140. https://doi.org/10.12677/sa.2025.145132

1. 引言

在当今城市化进程加速、环境污染日益严峻的背景下,准确预测城市空气质量成为保障居民健康、制定环保政策的重要前提。乐山市位于四川省,处于岷江、青衣江、大渡河的三江汇流之处,这种地理特征使得乐山在生态环境保护方面具有特殊的重要性。城市空气质量的预测不仅对于乐山市当地居民的生活质量有着极大的影响,同时也对其他地区的生态环境保护具有示范作用。

在关于空气质量预测的研究中,研究者探索了多种混合模型的应用。黄怡容等[1]基于卷积神经网络(CNN)和长短期记忆神经网络(LSTM)构建了鄱阳湖生态经济区的大气污染物浓度时间序列预测模型,实验证明该模型在预测精度上优于传统的LSTM模型;张诗云等[2]提出一种基于变分模态分解和蜣螂优化算法的LSTM模型,可以大幅降低噪声干扰并提升预测精度;曹还君与李长云[3]通过麻雀搜索算法(SSA)对LSTM进行优化,进一步增强了空气质量预测能力;周建国等[4]结合二次分解、优化算法、双尺度预测和误差修正,不断优化LSTM和极限学习机(ELM)的关键参数,从最终的空气质量指数中发现基于二次分解、LSTM-ELM和误差修正的模型具有最高的预测精度;朱菊香等[5]提出一种基于孤立森林算法、同步压缩小波变换算法、改进麻雀搜索算法和LSTM的混合模型,其实验结果表明,该混合模型降低了均方根误差,提高了拟合度。

本文通过对双向长短期记忆网络(BiLSTM)进行贝叶斯优化和粒子群算法的超参数调优,构建了基于PSO-BiLSTM的空气质量指数预测模型。通过和BiLSTM模型、BO-BiLSTM模型的对比验证,发现PSO-BiLSTM模型的预测结果与实际AQI值最为接近,展现了显著的预测优势。

2. 基本理论

时间序列分析是一种强大的工具,可用于研究和预测空气质量数据。本文以双向长短期记忆网络、贝叶斯优化(BO)以及粒子群优化(PSO)算法为基础,构建了PSO-BiLSTM空气质量指数预测模型,以深入分析和预测乐山市空气质量的动态变化。

2.1. LSTM模型

长短期记忆网络(LSTM)是对传统递归神经网络的改进,它通过引入特定的门控机制,有效解决了梯度消失和梯度爆炸的问题,LSTM的每个单元由单元状态、遗忘门、输入门和输出门组成,这些关键门共同作用于信息的筛选与传递[6]。LSTM单元结构如图1所示。其中 f t 为遗忘门, i t 为输入门, O t 为输出门, h t 为本单元隐藏状态的输出, C t 为本单元存储的状态信息, C ˜ t 为当前时刻信息, x t 为当前的输入, 表示矩阵对应元素相乘, 表示矩阵相加[7]

遗忘门决定状态记忆单元中的遗忘部分[7]。它接收当前输入 x t 和前一时刻的隐藏状态 h t1 ,并通过一个sigmoid激活函数 σ( x ) 计算得到一个介于0和1之间的值,所得值越接近0,表示越多信息会被遗忘;所得值越接近1,表示更多信息会被保留。权重矩阵 W f h t1 x t 进行拼接,并通过线性变换生成一个新的向量。偏置项 b f 用于对输出进行细微调整,从而提升模型的灵活性。遗忘门函数表达式为

f t =σ( W f [ h t1 , x t ]+ b f ) (1)

Figure 1. Cell structure of LSTM

1. LSTM单元结构

输入门决定状态记忆单元中的保留部分且更新单元信息[7]。输入门接收当前输入 x t 的信息,并通过两个步骤处理。首先,sigmoid层计算哪些值需要更新,其值在0到1之间,表示更新的强度。接着,tanh层生成新的候选值,用于更新记忆单元。权重矩阵 W i W c 分别作用于前一时刻的隐状态 h t1 和输入 x t ,以确定哪些信息需要被更新和生成新的候选值。偏置项 b i b c 用于对这些计算进行调整,以增加模型的灵活性。输入门函数表达式为

i t =σ( W i [ h t1 , x t ]+ b i ) (2)

C ˜ t =tanh( W c [ h t1 , x t ]+ b c ) (3)

遗忘门控制记忆单元中的信息保留程度。遗忘门的输出 f t 决定了前一时刻记忆状态中需要保留的部分,输入门的输出 i t 和候选值 C ˜ t 决定了当前输入加入的新信息。表达式为

C t = f t C t1 + i t C ˜ t (4)

输出门决定下一个隐藏状态的值[7]。它首先通过一个sigmoid激活函数计算出输出门的激活值 O t ,这个值决定了当前隐藏状态的哪些部分会对下一个时刻的隐藏状态产生影响。权重矩阵 W o 将前一时刻的隐藏状态 h t1 和当前输入 x t 连接在一起,以线性变换的方式生成输出门的激活值。偏置项 b o 则用于对这个计算进行调整,进一步提高模型的精确度。最后,输出门的激活值 O t 与当前细胞状态 C t 的tanh变换结果相乘,得出当前的隐状态 h t 。表达式为

O t =σ( W o [ h t1 , x t ]+ b o ) (5)

h t = O t tanh( C t ) (6)

2.2. BiLSTM模型

BiLSTM模型能学习双向时间特征,在普通的LSTM基础上,通过进一步组合序列传递的反转信息,能实现更好的预测性能,提高了模型预测的精度,因此能对传统LSTM网络模型进一步优化[8]

BiLSTM模型结构如图2所示,W1W2W3W4W5W6为权重系数,BiLSTM具有前向、后向2个LSTM网络,双中间层结构共同提取特征并在输出层将提取到的特征向量进行拼接组合,以此达到更为全面的特征信息表达[9]

Figure 2. Model structure of the BiLSTM

2. BiLSTM模型结构

BiLSTM模型通过两个LSTM层来实现对序列数据的双向理解[10]。首先,前向LSTM层从序列的起始端逐步向前处理,记录每个时间点之前的信息,与此同时,后向LSTM层从序列的末端开始反向处理,记录每个时间点之后的信息。这样,每个时间点的输出都包含了来自序列两端的上下文信息。最终,这些来自两个方向的信息在每个时间点上被整合起来,形成对整个序列的全面理解,使得BiLSTM在处理诸如语言模型、文本分类等任务时,能够更加精准地捕捉到词与词之间的复杂关系。

2.3. 贝叶斯优化算法

超参数是机器学习模型在学习流程启动之前所预设的一系列参数,超参数无法直接通过训练数据的分析来优化,但超参数的选择对模型最终的预测性能有着至关重要的影响[11]

贝叶斯优化(Bayesian Optimization, BO)是一种有效的全局优化算法,通过建立一个代表目标函数的概率模型来进行序贯的超参数搜索,并通过不断更新模型来减少实验次数以寻找最优解[12],其核心包括两部分:一是使用高斯过程回归建立目标函数的数学模型,计算每个点的函数值的均值和方差;二是基于后验概率分布构造采集函数,以确定每次迭代中的最优采样点[13]。贝叶斯定理作为贝叶斯优化的基础,描述了如何结合先验信息和观测数据来更新对目标函数的后验概率分布,对应方程为

P( A|B )= P( B|A )P( A ) P( B ) (7)

上式表示代理模型的参数A和观测数据B的关系。其中, P( A ) P( B ) 分别为参数A、数据B先验概率, P( A|B ) 表示给定数据B后参数A的后验概率; P( B|A ) 表示B给定时A的似然函数。

高斯过程通过对贝叶斯优化中的目标函数建模并获得其后验概率,从而实现了对未知函数的精确拟合与优化。高斯过程有两个关键组成部分:数学期望和协方差函数,即

f( x )=GP( μ( x ),K( x, x ) ) (8)

其中, f( x ) x的目标函数, μ( x )=E( f( x ) ) f( x ) 的数学期望; K( x, x ) 为协方差函数。 x 是贝叶斯优化过程中的新采样点,是高斯过程根据当前已知数据选择的下一个评估点。GP (高斯过程)是一种用于对目标函数 f( x ) 进行建模的方法,依赖于数学期望 μ( x ) 和协方差函数 K( x, x ) 来描述输入数据点之间的关系。

采集函数又叫AC函数,AC函数通过已观测到的数据集构造后验分布,并通过最大化AC值选择下一个采样点 x t+1 ,即

x t+1 = argmax xR α( x ) (9)

其中, x t+1 为下一时刻采样点, α( x ) 为采集函数[14]

贝叶斯优化BiLSTM模型的流程如图3

Figure 3. Flowchart of the Bayesian optimization process

3. 贝叶斯流程图

2.4. 粒子群优化算法

粒子群优化(Particle Swarm Optimization, PSO)是一种进化计算技术,该算法最初是受到飞鸟集群活动的规律性启发,进而利用群体智能建立的一个简化模型[15]。粒子群算法在对动物集群活动行为观察基础上,利用群体中的个体对信息的共享使整个群体的运动在问题求解空间中产生从无序到有序的演化过程,从而获得最优解,群体中的每个粒子代表待优化问题的一个潜在解,这些粒子通过“群体”和“个体”的最优位置不断调整飞行方向来寻找问题的最优解[15]。其流程图如图4

Figure 4. Flowchart of the particle swarm optimization algorithm

4. 粒子群优化算法流程图

PSO优化算法中,对于 N x 维搜索空间,假设粒子的种群数为 N p ,记第i个粒子的位置

x i = ( x i,1 , x i,2 ,, x i, N x ) T , i=1,2,3,, N P (10)

i个粒子的速度:

v i = ( v i,1 , v i,2 ,, v i, N x ) T , i=1,2,3,, N P (11)

n + 1优化步中第i个粒子的位置和速度更新为:

{ x i,j n+1 = x i,j n + v i,j n+1 v i,j n+1 =ω v i,j n + c 1 r 1 n ( b i,j n x i,j n )+ c 2 r 2 n ( g j n x i,j n ) (12)

其中 x i,j n+1 表示第i个粒子位置的第j个分量, v i,j n+1 表示第i个粒子速度的第j个分量,而上标“n + 1”表示优化步; c 1 c 2 分别为个体和社会学习因子; r 1 n r 2 n [ 0,1 ] 区间上服从均匀分布的随机数; ω 为惯性权重系数; b i,j n 为第i个粒子的个体最优位置 b i n = ( b i,1 n , b i,2 n ,, b i, N x n ) T 的第j个分量; g j n 为群体的全局最优位置 g n = ( g 1 n , g 2 n ,, g N x n ) T 的第j个分量[16]

2.5. 模型评价指标

RMSE为预测值与实际值之间均值误差平方和的算术平方根,对误差较大的数据值较敏感[14]

RMSE= 1 m i=1 m ( y i y ^ i ) 2 (13)

MAE为预测值与实际值的绝对误差平均值,不易受极端值的影响[14]

ΜΑΕ= 1 m i=1 m | y i y ^ i | (14)

MAPE为预测值与实际值之间相对误差的平均百分比,对于不同量级的预测问题更具可比性。

MAPE= 100% m | i=1 n y ^ i y i y i | (15)

其中 y ^ i 代表第i个样本的预测值, y i 代表第i个样本的实际值,m代表样本数量。

3. 数据来源及模型应用

3.1. 数据来源

本篇文章中所使用的乐山市空气质量数据,来源于中国空气质量在线监测分析平台(https://www.aqistudy.cn/)。我们从2015年1月1日至2023年12月31日,共计3287天。空气质量数据按年以及整体进行描述性统计如表1

Table 1. Descriptive statistical results

1. 描述性统计结果

年份

观测值

平均值

标准差

最小值

中位数

最大值

2015

365

84

41

28

78

267

2016

366

83

37

29

75

327

2017

365

90

48

24

81

408

2018

365

65

33

0

60

214

2019

365

69

34

24

59

205

2020

366

66

30

22

60

217

2021

365

69

31

22

62

200

2022

365

73

31

22

67

202

2023

365

76

36

24

71

228

2015~2023

3287

74

37

0

67

408

乐山市近年来的空气质量分析如表1所示,在3287天的监测期间,AQI平均值大约为74,这一数值处于二级水平,表明空气质量总体上是可接受的。然而,对于极少数异常敏感的人群,某些污染物可能会对他们的健康产生轻微影响。观测数据显示,AQI的最小值为0,最大值为408,没有达到极端的“爆表值”(500),这表明乐山市没有发生过严重的空气污染事件。

特别值得注意的是,通过对比各个年度的AQI统计结果,2018-2022年间的平均AQI相对较低。这一改善趋势可能得益于乐山市在此期间实施的一系列积极有效的措施和政策。例如,乐山市政府制定了《乐山市大气污染防治三年攻坚行动总体方案》,明确了空气质量改善的具体目标和行动计划。在工业源污染控制方面,乐山市推动了水泥、钢铁、陶瓷和化工等行业的深度治理,并鼓励企业进行环保技术改造,实现绿色清洁生产。同时,扬尘源污染得到了有效控制,通过加强建筑工地的扬尘管理和提升道路清扫保洁工作。针对移动源污染,乐山市优化了城区货运车辆的绕行方案,并对渣土运输车和“黑烟车”进行了专项整治。此外,面源污染也得到了严格的控制,包括加强对露天焚烧和烟花爆竹燃放的管理。

综合这些措施,乐山市近年来的空气质量总体尚可,且在最近五年内呈现改善趋势。为了进一步描绘了空气质量分布的详细情况,我们绘制AQI的核密度估计如图5所示。

Figure 5. Kernel density distribution of AQI

5. AQI核密度分布

从分布图来看,乐山市的AQI主要集中在在0~200之间。

3.2. 模型应用

首先对数据进行了数据预处理,并采用MinMaxScaler将所有AQI值缩放至[0, 1]区间。数据集按7:3比例划分为训练集和测试集,并将2023年的数据作为验证集,用于评估模型的泛化能力。在模型结构方面,首先引入一层一维卷积层(Conv1D),包含32个卷积核,卷积核大小为3,激活函数为ReLU,用于提取时间序列的局部特征。随后连接两层BiLSTM层,第一层设置78个神经元并返回完整序列,第二层设置64个神经元输出最终状态。在BiLSTM层之后加入Dropout层以防止过拟合,dropout率为0.2,最后通过一层全连接(Dense)输出层生成预测值。训练阶段,首先使用贝叶斯优化进行10次迭代,初步筛选出较优超参数组合;接着应用粒子群优化算法,设置粒子数为15,优化维度为3,最大迭代次数为20,最终得到最优参数表如表2所示。模型使用Adam优化器进行训练,损失函数为均方误差(MSE),训练轮数为50,batchsize为32。

Table 2. Optimal parameters

2. 最优参数表

LSTM神经元数量

最佳学习率

最佳批量大小

贝叶斯优化

23.00

0.0041

16.00

粒子群优化

23.00

0.0054

11.00

为了评估不同模型的预测性能,我们设计了对比实验,涵盖了单一的BiLSTM模型、BO-BiLSTM模型和PSO-BiLSTM模型,能更清晰地展现不同模型的预测效果。通过呈现2023年9月至2023年12月的AQI对比分析,可以清晰地看到不同模型在实际预测中的表现差异。

(a) BiLSTM (b) BO-BiLSTM

(c) PSO-BiLSTM

Figure 6. Comparison of model prediction results

6. 模型预测结果对比

图6所示,三种模型的预测值均在一定程度上能够反映实际值的总体变化趋势,但在拟合程度和预测精度上存在差异。超参数对模型预测性能的影响至关重要。Bi-LSTM模型使用未经精细调优的超参数,往往难以适应乐山市空气质量数据的复杂特征,导致模型无法充分学习数据中的规律。特别是在AQI波动剧烈时,模型无法精准捕捉数据变化,预测值与实际值在部分时间段偏离较大。贝叶斯优化虽然在某些场景下表现出较高的精度和效率,但在搜索超参数空间时,有可能陷入局部最优解。这意味着找到的并非全局最优的超参数组合,而只是在某个局部区域内表现较好,因此无法大幅度提升模型性能,改进效果相对有限。在乐山市空气质量预测中,采用BO-BiLSTM模型虽有一定改进,但在某些关键节点仍出现明显偏差。相比之下,粒子群优化算法通过“群体”和“个体”的最优位置不断调整飞行方向来寻找问题的最优解。这种方式相比贝叶斯优化更不容易陷入局部最优,从而能够找到更优的超参数组合。在乐山市空气质量预测中,PSO-BiLSTM模型的预测曲线与实际值曲线贴合更为紧密,对AQI的波动趋势把握更准确,在整体时间段内的预测误差相对其他两个预测结果较小。由此表明,PSO-BiLSTM模型在这三种模型中预测效果更佳,能够为AQI预测提供更可靠的结果。为了进一步量化各个模型的预测结果,采用了RMSE、MAE、MAPE等评价指标,并将结果汇总在表3

Table 3. Evaluation metrics

3. 评价指标

预测模型

RMSE

MSE

MAE

BiLSTM

22.0691

487.0455

17.5424

BO-BiLSTM

21.8895

479.1515

17.2215

PSO-BiLSTM

21.8710

478.3419

16.9246

表3可知,PSO-BiLSTM的预测结果拟合效果表现最佳,相较于单一的BiLSTM模型、BO-BiLSTM模型,PSO-BiLSTM的均方根误差(RMSE)分别降低了0.815%、0.898%,均方误差(MSE)分别降低了1.62%、1.79%,平均绝对误差(MAE)分别降低了1.83%,3.53%。这些结果进一步证明了PSO-BiLSTM模型在预测空气质量指数方面的准确性最高,具有显著优势。下一阶段将引入气象等外部环境因素,以期进一步提升模型对空气质量变化的感知能力与预测精度。

4. 结论与建议

AQI是评估环境质量的关键指标,反映空气污染水平。在经济增长的同时,改善空气质量成为各地的共同目标。本研究利用乐山市的数据,通过BiLSTM模型预测未来空气质量趋势。BiLSTM模型因其双向记忆特性,能综合历史和未来信息,提供更全面的预测。实验表明,PSO-BiLSTM模型在预测精度上优于标准BiLSTM,推荐作为空气质量预测的首选模型。该模型有助于捕捉乐山市AQI变化规律,为环境管理和政策实施提供支持,帮助相关部门提前应对空气质量问题,保护公众健康和环境。

本研究虽取得一定成果,但为进一步提升预测效果,可进一步从以下方面入手:首先,数据集的局限性可能影响模型训练和预测精度。增加更多历史数据或扩大数据时间跨度,可增强模型稳定性和泛化能力。其次,本研究主要基于历史数据的时间序列分析,未充分考虑气象条件、工业排放、交通流量等外部因素,这些因素可能在特定情况下影响预测准确性。因此,未来的研究可以引入多变量分析方法,综合考虑气象数据、政策变化以及其他环境因素,以提高预测的全面性和准确性。

基金项目

乐山师范学院2024年国家级大学生创新创业训练计划资助项目(202410649028)。

NOTES

*通讯作者。

参考文献

[1] 黄怡容, 熊秋林, 熊正坤, 等. 基于CNN-LSTM的鄱阳湖生态经济区大气污染物时空预测[J]. 生态环境学报, 2024, 33(12): 1891-1901.
[2] 张诗云, 朱菊香, 张涛, 等. 基于VMD-DBO-LSTM的空气质量预测[J]. 国外电子测量技术, 2024, 43(3): 58-66.
[3] 曹还君, 李长云. 基于SSA-LSTM模型的空气质量预测研究[J]. 现代信息科技, 2024, 8(4): 142-146+152.
[4] 周建国, 秦远, 周路明. 基于二次分解、LSTM-ELM和误差修正的空气质量指数预测模型[J]. 安全与环境学报, 2025, 25(1): 322-334.
[5] 朱菊香, 谷卫, 任明煜, 等. 基于SWT-ISSA-LSTM的地铁空气质量预测建模[J]. 国外电子测量技术, 2023, 42(7): 164-174.
[6] 杨艺, 赵惊涛, 付国强. 基于PSO-LSTM模型的地热储层温度预测研究[J]. 矿业科学学报, 2024, 9(4): 538-548.
[7] 高寒旭, 袁祖晴, 张淑婷, 等. 基于LSTM模型的短期光伏功率预测[J]. 太阳能学报, 2024, 45(6): 376-381.
[8] 王雷, 张煜, 赵艺琨, 等. 基于多空间维度联合方法改进的BiLSTM出水氨氮预测方法[J]. 中国农村水利水电, 2025(2): 17-24.
[9] 梁靖, 张红, 叶晨, 等. 基于Bi-LSTM的浅层地下双孔洞探测技术[J]. 合肥工业大学学报(自然科学版), 2024, 47(6): 778-783.
[10] 谢小良, 吴琳琳. 基于DA-CNN-BiLSTM的河流溶解氧浓度预测[J]. 人民黄河, 2024, 46(7): 92-97+111.
[11] Victoria, A.H. and Maragatham, G. (2021) Automatic Tuning of Hyperparameters Using Bayesian Optimization. Evolving Systems, 12, 217-223.
https://doi.org/10.1007/s12530-020-09345-2
[12] Ghahramani, Z. (2015) Probabilistic Machine Learning and Artificial Intelligence. Nature, 521, 452-429.
https://doi.org/10.1038/nature14541
[13] 崔佳旭, 杨博. 贝叶斯优化方法和应用综述[J]. 软件学报, 2018, 29(10): 3068-3090.
[14] 刘行, 王秋晨, 文韵豪, 等. 基于BO-LSTM的天然气处理厂负荷率预测模型[J]. 天然气与石油, 2023, 41(5): 122-130.
[15] 杨帆, 乌景秀, 范子武, 等. 快速综合学习粒子群优化算法[J]. 水利水电技术(中英文), 2025, 56(2): 30-44.
[16] 杨维, 李歧强. 粒子群优化算法综述[J]. 中国工程科学, 2004, 6(5): 87-94.