使用机器学习改进土地利用回归模型预测中国PM2.5污染时空格局
Using Machine Learning to Improve the Land Use Regression Model to Predict the Spatial and Temporal Pattern of PM2.5 Pollution in China
DOI: 10.12677/aep.2024.145141, PDF,    科研立项经费支持
作者: 张慧婧, 王 勇, 李明垚, 张凤倩, 张 平:西安工程大学环境与化学工程学院,陕西 西安
关键词: PM2.5土地利用回归(LUR)模型Adaboost空气污染PM2.5 Land Use Regression (LUR) Model Adaboost Air Pollution
摘要: 随着工业化加速和经济快速发展,PM2.5引起的空气污染日益严重,对环境和人类健康造成严重影响。本研究采用Adaboost机器学习方法优化土地利用回归模型(LUR),利用2015年中国PM2.5监测数据及多源遥感数据,模拟中国PM2.5的空间分布,并评价模型拟合效果。结果显示,Adaboost优化后的LUR模型拟合精度显著提高,R2从0.241提高至0.62 (春)、0.69 (夏)、0.60 (秋)、0.67 (冬)和0.65 (年),并通过SPSS软件识别出28个与PM2.5浓度相关的变量。研究发现,PM2.5浓度具有季节性变化,冬季最高,夏季最低,且存在明显的空间自相关性,表现为高–高集聚以及低–低集聚。本研究为PM2.5浓度精确预测提供了新方法,对公共健康保护和空气质量管理具有重要意义。
Abstract: With the acceleration of industrialization and rapid economic development, the air pollution caused by PM2.5 is becoming more and more serious, causing serious impacts on the environment and human health. In this study, the Adaboost machine learning method was used to optimize the land use regression (LUR) model to simulate the spatial distribution of PM2.5 in China by using the 2015 Chinese PM2.5 monitoring data and multi-source remote sensing data, and to evaluate the model fitting effect. The results showed that the fitting accuracy of LUR model optimized by Adaboost was significantly improved, R2 increased from 0.241 to 0.62 (spring), 0.69 (summer), 0.60 (autumn), 0.67 (winter) and 0.65 (year). 28 variables related to PM2.5 concentration were identified by SPSS software. It was found that PM2.5 concentration has seasonal variations, with the highest in winter and the lowest in summer, and there is an obvious spatial autocorrelation, which is manifested as high-high concentration as well as low-low concentration. This study provides a new method for accurate prediction of PM2.5 concentration, which is important for public health protection and air quality management.
文章引用:张慧婧, 王勇, 李明垚, 张凤倩, 张平. 使用机器学习改进土地利用回归模型预测中国PM2.5污染时空格局[J]. 环境保护前沿, 2024, 14(5): 1096-1110. https://doi.org/10.12677/aep.2024.145141

参考文献

[1] 张少红, 于少华. PM2.5的来源、危害及防治措施研究[J]. 环境科学与管理, 2014, 39(7): 92-94.
[2] 吴健生, 谢舞丹, 李嘉诚. 土地利用回归模型在大气污染时空分异研究中的应用[J]. 环境科学, 2016, 37(2): 413-419.
[3] 刘炳杰, 彭晓敏, 李继红. 基于LUR模型的中国PM2.5时空变化分析[J]. 环境科学, 2018, 39(12): 5296-5307.
[4] 江曲图, 何俊昱, 王占山, 等. 基于LUR/BME的海岸带地区PM2.5时空特性研究[J]. 中国环境科学, 2017, 37(2): 424-431.
[5] 于梦婷. 基于改进LUR模型的PM2.5时空分布与土地利用关系的研究[D]: [硕士学位论文]. 大连: 大连理工大学, 2023.
[6] 申婷, 闫庆武, 李飞雪. 晋陕蒙地区PM2.5遥感反演与时空分布研究[J]. 干旱区资源与环境, 2022, 36(2): 99-104.
[7] 吴迪, 杜宁, 王莉, 等. 基于GTWR-XGBoost模型的四川省PM2.5小时浓度估算[J]. 环境科学, 2023, 44(7): 3738-3748.
[8] 肖诗霖, 王杨君, 田梦悦, 等. 基于机器学习利用低成本传感器数据构建城市近地面PM2.5浓度的高分辨率空间分布[J]. 环境科学学报, 2022, 42(9): 440-451.
[9] Wong, P., Lee, H., Chen, Y., Zeng, Y., Chern, Y., Chen, N., et al. (2021) Using a Land Use Regression Model with Machine Learning to Estimate Ground Level PM2.5. Environmental Pollution, 277, Article ID: 116846. [Google Scholar] [CrossRef] [PubMed]
[10] Represa, S.N., Palomar-Vázquez, J., Porta, A. and Fernández-Sarría, A. (2019) Daily Concentrations of PM2.5 in the Valencian Community Using Random Forest for the Period 2008-2018. Proceedings, 19, Article No. 13.
[11] 王辉. 中国区域降水时空变化模式分析[D]: [硕士学位论文]. 青岛: 山东科技大学, 2011.
[12] 王宁. 基于LUR模型的土壤重金属浓度空间分布模拟[D]: [硕士学位论文]. 兰州: 兰州大学, 2021.
[13] 杨明亮, 朱宗玖. 基于LUR模型下PM2.5浓度的空间分布模拟分析[J]. 大气与环境光学学报, 2022, 17(3): 347-359.
[14] 唐蓉, 谭定英, 张海扬, 等. 双变量相关分析法在嵌入式医学仪器特性的研究[J]. 现代计算机(专业版), 2015(21): 3-6.
[15] 方雷, 王红, 苏凯. 基于MAPG1S的沙尘暴信息管理系统[J]. 河北遥感, 2012(1): 16-21.
[16] 李玉洁, 江洪, 刘宣广. 基于CatBoost的植被总初级生产力遥感模拟方法及在福建省的应用[J]. 地球信息科学学报, 2023, 25(9): 1908-1922.
[17] 黄寰, 王若楠, 肖义. 长江经济带科技创新与生态效率的协同演化及影响因素[J]. 长江流域资源与环境, 2024, 33(4): 671-686.