1. 引言
空气,作为人类生存的必要条件,对人类生存有着重大意义,它影响着世界万物的方方面面。而空气污染,这一常被称作大气污染的现象,依据国际标准化组织(ISO)的权威定义,通常指的是由于人类活动或自然过程的影响,致使某些物质进入大气层,并在其中达到足以造成危害的浓度,且持续足够长的时间,进而对人类的舒适度、健康状况、生活福利乃至整个生态环境产生不良影响。空气污染预报是一项极具前瞻性的工作,它依据气象条件——诸如风速、风向、大气稳定度、降水状况以及天气形势等,并结合污染源的排放情况,对特定区域未来某一时刻的污染浓度及其空间分布进行精准预测。这一预报成果对于人类深入探究空气质量状况、科学评判其优劣程度具有举足轻重的作用,能够为制定针对性的污染防控策略提供有力支撑。在空气污染预测的技术领域中,LSTM的学习过程本质上是一个动态调整权重参数的过程,一旦这些参数被精确确立,LSTM便能够高效地完成对输入样本的预测与分类任务。长短时神经网络(LSTM)结构见图1。相较于传统的神经网络预测方法,LSTM在预测准确率上展现出了显著的提升,有助于有效预防重大污染事件的发生。
Figure 1. LSMT network structure
图1. LSMT网络结构
2. 利用LSTM预报空气污染的意义
长短时神经网络(LSTM)是建立在基础神经网络上的一种新型神经网络,通过修改神经网络中的隐藏层和核心代码对神经网络进行完善。空气污染预报普遍采用空气污染指数的形式向公众发布空气质量的信息,其中常见的对空气污染指数有影响作用的气象因子有:温度、风速、气流密度、PM2.5,平均气压等等。空气污染与气象条件密切相关,所以在建立环境空气污染预报模型时,如果考虑各种气象因子与环境空气质量之间的关系,应该有利于提高所建立模型预测的准确率[1]。
对比传统的神经网络,长短时神经网络(LSTM)具有更好的数据储存和处理能力,可以用更多的数据来对模型进行训练,可以获得更高的准确率。神经网络在面对数据量多以及特征量多的时候,会出现梯度消失和梯度爆炸的情况,将导致模型能力大幅度降低。长短时神经网络(LSTM)可以处理更多的数据和更多的特征量,模型也将更加准确,对数据的包容性也较大。
3. 长短时神经网络(LSTM)在空气污染预报中的研究进展
长短时神经网络(LSTM)是最近几年所发展起来的新型科技,它是计算机与大数据的结合,利用人工收集的大数据进行简单处理后,用计算机进行模型构建,越多的特征量和越多的数据,模型预测的准确率就越高。
长短时神经网络(LSTM)从1997年被提出,主要目的是解决神经网络梯度消失和梯度爆炸的情况,之后20年随着遗忘门、输入门、输出门(见图1)的提出,长短时神经网络(LSTM)功能逐渐完善,开始尝试与其他功能相结合的利用发展。空气污染也逐渐成为当今环境问题的主流关注点,越来越多的学者开始关注大气环境问题。袁伟程[2]对大气环境污染问题进行了多层次,多方面的相关分析,大气问题日益严重。李飞开始利用数字系统对大气环境监测[3],利用数字监测,将空气问题数字化,更好构建LSTM神经网络。
长短时神经网络(LSTM)具有三个门,在面对大量数据和较多的特征的数据库时,具有更好的效果。长短时神经网络(LSTM)的核心原理可概括为:它通过细胞状态构建了一条贯穿网络的信息“高速公路”,用以长期保存关键数据,克服了传统神经网络(RNN)因反复乘法运算导致的梯度消失和长期记忆丢失问题;同时,其遗忘门、输入门、输出门三道智能“门控”机制分工协作——遗忘门像“橡皮擦”般剔除过时信息(如天气预测中短暂降温),输入门如“记事本”选择性记录新信息(如持续高温),输出门则似“过滤器”控制当前输出(如结合长期趋势与近期变化预测未来) [4];模型每一步都基于输入和历史状态动态调整记忆与遗忘的平衡,既能捕捉长序列中的长期依赖(如句子主语与动词的关联),又能灵活适应短期变化,最终以“细胞状态存储记忆 + 门控机制筛选信息”的创新设计,彻底解决了传统神经网络处理长序列时的“健忘”难题。国内已用通过LSTM对用水量预测的相关研究,选取29个影响用水量的特征因子构建数据作为自变量,年用水量作为因变量,同时构建长短时神经网络(LSTM)基线模型和3种不同架构的深度学习模型:门控循环单元模型(Gated Recurrent Unit, GRU)、时间卷积网络模型(Temporal Convolutional Network, TCN)和Transformer模型进行对比分析。最终结果显示长短时神经网络(LSTM)模型的模拟结果优于其他模型,MAE、MAPE和RMSE分别降低了7.7%~40.6%、22.6%~44.1%、0.7%~32.1%,整体性能优越[5]。洪水的爆发对人类生存和环境都是较大的危害,发生不可预测的洪水时,会造成大量的财产损失。洪水毋庸置疑和暴雨相关,但是这与山体构造,地貌等相关。例如,胡川等人通过收集南宁市邕江流域为案例造成暴雨的降水量,以长短时神经网络(LSTM)为主体,提出了一种融合注意力机制和自定义Floss损失函数的长短时神经网络(LSTM)模型,结果表明:通过引入注意力机制和自定义损失函数提升了模型的预测精度和鲁棒性,为洪水智能预报提供了新的方法路径与技术支撑[6]。关于长短时神经网络(LSTM)的预测模型还有很多,通过凌干展使用长短时神经网络(LSTM)滨海航道水深预测及应用研究[7],也有孟繁佳对于日光温室环境预测模型,对于中国农业有着重要影响[8]。这俩种方法都以长短时神经网络(LSTM)为主体,通过融合注意力机制方式提高LSTM的准确性。
4. 长短时神经网络(LSTM)与传统神经网络(RNN)对比
长短时神经网络(LSTM)相对于传统的神经网络具有明显的优势:1. 长距离依赖建模,长短时神经网络(LSTM)通过细胞状态和门控机制,能捕捉序列中数百步的长距离依赖关系,而传统神经网络(RNN)仅能处理短程依赖(通常<10步)。2. 梯度稳定性长短时神经网络(LSTM)的加法更新和门控结构有效缓解梯度消失/爆炸问题,使深层网络训练更稳定,而传统神经网络(RNN)易因梯度问题训练失败[9]-[15]。动态信息控制LSTM通过输入门、遗忘门、输出门动态选择信息的保留或丢弃,实现灵活的记忆管理,而传统神经网络缺乏选择性机制。3. 参数效率优化尽管长短时神经网络(LSTM)单元参数更多,但其门控机制提升了信息利用率,在相同参数量下通常比传统神经网络(RNN)表现更好。4. 序列任务通用性长短时神经网络(LSTM)可直接处理变长序列(如文本、语音),支持单向/双向建模,而传统全连接网络无法处理时序数据。5. 抗干扰能力长短时神经网络(LSTM)的门控机制能过滤噪声信息,聚焦关键特征,在含噪声的序列数据(如传感器信号)中表现更鲁棒。6. 历史信息持久化长短时神经网络(LSTM)的细胞状态像“传送带”一样长期保留重要信息,避免传统RNN因隐藏状态重置导致的信息丢失。7. 迁移学习适配性长短时神经网络(LSTM)预训练模型(如语言模型)可微调至下游任务,而传统神经网络需从头训练,难以利用序列先验知识。(表1)
Table 1. Related research on LSTM networks
表1. LSTM网络相关研究
研究者 |
网络类型 |
网络特点 |
许非凡等[5] |
LSTM神经网络 |
LSTM具有较高的准确性,记忆单元能够较好地捕捉长期依赖关系,具有良好的效果。 |
胡川[6] |
LSTM神经网络 |
LSTM较高的预测准确率,模型预测的洪峰水位未出现低估且误差在1.15 m内,能为防洪减灾提供决策支持。 |
孟繁佳[8] |
SSA-LSTM-Attention |
传统的时间序列预测模型相比,添加Attention机制后LSTM模型的精度有了明显提升,长序列预测效果表现良好,达到了预期目标。 |
5. 神经网络在空气污染预报中的未来展望
5.1. 多源数据融合与时空动态建模:突破传统预测的单一性
未来长短时神经网络(LSTM)将深度整合卫星遥感、地面传感器、社交媒体等多源异构数据,构建覆盖大气成分、气象条件、人类活动的全息化数据集。通过CNN-LSTM混合架构或图神经网络(GNN)增强空间特征提取能力,实现污染物浓度、气象要素的时空动态预测。例如,结合卫星云图与地面PM2.5监测数据,可精准模拟雾霾跨区域传输路径,为区域联防联控提供科学依据。
5.2. 端到端深度学习架构
替代传统数值模型的“黑箱”突破长短时神经网络(LSTM)将逐步替代基于物理方程的数值天气预报(NWP)模型,通过端到端学习直接从海量历史数据中挖掘大气演化的非线性规律。结合物理引导神经网络(PINN),在模型训练中嵌入流体力学约束,既保留深度学习的灵活性,又提升对极端天气(如台风、暴雨)的预测可靠性。这种架构可大幅降低计算成本,并支持实时动态调整,适应气候变化下的环境突变。
5.3. 实时监测与自适应决策支持:从预测到治理的闭环应用
依托物联网与边缘计算,长短时神经网络(LSTM)将实现大气环境的秒级实时监测与分钟级预测更新。通过在线学习机制持续吸收新数据,自动修正模型偏差,例如快速响应突发工业排放或沙尘暴入侵。预测结果将直接联动污染管控系统,如自动触发交通限行、工业减排指令,形成“预测–预警–干预”的闭环治理链条,显著提升环境管理的时效性与精准度。
6. 结语
本文综述了长短时神经网络(LSTM)在空气污染预报中的研究进展,通过对相关文献的梳理和分析,以及对传统神经网络的对比,我们发现长短时神经网络(LSTM)在空气污染预报中的必要性,LSTM的特点包括准确度高、可以接受大量数据、多个特征量等特点。相比传统神经方法,长短时神经网络(LSTM)解决了梯度消失和梯度爆炸情况。然而,目前LSTM系统的研究仍存不同特征量的比重设置不同,导致训练模型容易出现偏差,目前LSTM的应用较多,但对于大气环境的研究较少。
基金项目
成都工业学院大学生创新创业项目计划项目,长短时记忆神经网络应用于成都市空气臭氧污染预警(QM2024053)。