1. 引言
随着京津冀协同发展战略的深入推进,区域发展已从单一的经济要素合作逐步演进为涵盖生态环境治理、社会治理与制度创新的系统性协同工程。作为国家重大区域发展战略的实践载体,该区域在产业结构优化、交通网络互通和公共服务均等化等方面取得显著进展,然而面对环境治理这一复杂系统工程,当前协同机制仍呈现多维张力。本文将从PM2.5的角度探究京津冀环境的相关性从而佐证京津冀环境协调治理的必要性。
本文使用了2023年3月15日~2024年3月15日京津冀的环境监测数据2,提取了其中每日二十四小时的PM2.5浓度数据。本文通过京津冀地区的供暖时间将时间划分为两个季度:供暖季(2023年11月15日~2024年3月15日)和非供暖季(2023年3月16日~2023年11月14日)。依据供暖季的PM2.5浓度对京津冀地区做分析,探究京津冀环境的相关性,并且通过克里金插值[1]将供暖季与非供暖季做对比分析。对数据预处理剔除不合理数据后,在京津冀供暖季提取了93个有效勘测点的数据,非供暖季提取了116个有效勘测点的数据。其中,天津市有效勘测点最多(15个左右),廊坊、沧州、衡水有效勘测点最少(3,4个)。本文对数据的处理方式是采用平均值,先对勘测点每天二十四小时的PM2.5浓度取平均值得到每天每个勘测点的平均PM2.5浓度;然后再以供暖季、非供暖季为界限对数据取平均得到每个勘测点供暖季、非供暖季的平均PM2.5浓度;最后对供暖季每个市所有勘测点取平均得到供暖季各个市的平均PM2.5浓度(其中邯郸市最高,PM2.5浓度为74.09 µg/m3;张家口最低,PM2.5浓度为24.22 µg/m3)。
2. 莫兰指数
在空间相互作用和空间扩散的双重影响下,各地区PM2.5浓度值不再相互独立,而是具有特定的相关性。本文使用莫兰指数从全局和局部两个角度对京津冀地区PM2.5浓度进行空间相关分析1[2]。
2.1. 全局莫兰指数
计算公式为:
其中,N是空间单元的总数;
是空间权重矩阵元素;
是权重矩阵的总和;
是第i个空间单元的属性值;
是所有单元属性值的平均值。
鉴于数据的自然地理属性,本文采用了Queen邻接方式来定义空间权重(即相邻单元共享边界或定点时,权重
赋值为1) [3]。基于各个市供暖季平均PM2.5浓度数据,可得结果如表1所示。
Table 1. Global Moran’s index
表1. 全局莫兰指数
全局莫兰指数汇总/Summary of Global Moran’s Index |
全局莫兰指 (Global Moran’s I) |
0.542839 |
预期指数(Expected Index) |
−0.083333 |
方差(Variance) |
0.035541 |
z得分(z-score) |
3.321478 |
p值(p-value) |
0.000895 |
由表1可知,z得分为3.32,远高于显著性水平0.01对应的临界值2.58。原假设为属性值在空间上随机分布,不存在自相关性;而p值为0.000895 (<0.01),说明随机产生此聚类模式的概率小于1%,结果在99%置信水平下显著,表明结果是可信的、显著拒绝原假设。全局莫兰指数为0.543 (显著不为0),这一正值说明各市PM2.5浓度值存在显著的正空间自相关,即高浓度区域倾向于邻近高浓度区域,低浓度区域邻近低浓度区域,整体呈现空间聚集特征。预期指数为−0.083,实际值远高于预期,进一步支持空间聚集的结论。
PM2.5浓度在空间上表现出显著聚集,这种现象可能受多种因素的综合影响,如局部污染源、气象条件以及地形特征等。为进一步识别具体的聚集区域(如热点或冷点),需结合局部莫兰指数进行深入分析。
2.2. 局部莫兰指数
计算公式为:
其中
是样本方差,其余变量与全局莫兰指数相同。
对京津冀地区PM2.5浓度值的局部莫兰指数进行可视化分析,如图1所示。
由图1可知,京津冀地区存在显著的空间聚类特征。承德和北京为低低相聚(冷点);石家庄、衡水和邢台为高高相聚(热点)。具体而言,低值聚集区域在环境质量或经济发展等方面存在一定的优势,而高值聚集区域在相应方面面临较大的挑战。这些空间聚类特征对于制定针对性的区域发展策略具有重要的参考价值。
Figure 1. Visualization of local Moran’s index
图1. 局部莫兰指数可视化
3. 克里金插值
3.1. 数据预处理
进行克里金插值需要满足平稳性假设[4],数据需要满足正态分布,如果不满足,则需要对数据进行适当变换以满足正态分布[5]。本文对数据进行对数变换,使之满足正态分布,并用正态QQ图检验数据的正态性,相应图示如图2所示:
Figure 2. Normal QQ plot after logarithmic transformation of the data
图2. 对数据做对数变换后的正态QQ图
正态QQ图中数据近似在直线左右,基本满足正态分布。
考虑到京津冀地势呈现出显著的高低差异,不同地区PM2.5的期望不同,本文选用泛克里金插值法[6]。
3.2. 数值结果(供暖季)
京津冀供暖季的PM2.5均方根误差为4.4146,即RMSE = 4.4146,表明预测误差的典型幅度为4.41 μg/m³,需结合PM2.5浓度范围(如京津冀冬季PM2.5常处于50~150 μg/m3)评估相对误差。若浓度中位数为100 μg/m3,则相对误差约为4.4%,属于合理范围。
标准化平均值为−0.0680,接近于0 (理想值为0)以及标准化均方根为0.9385,接近1 (理想值为1),表明模型在标准化尺度下无显著偏差,且误差分布接近正态,模型整体校准较好。
标准化误差指标表现良好,说明泛克里金插值模型在统计假设(如正态性、无偏性)下较为稳健。空间自相关性(块金效应占比15%)利用充分,核心变异结构建模合理。
3.3. 泛克里金插值结果
在泛克里金插值模型的基础上,对供暖季和非供暖季京津冀各地区的PM2.5浓度值进行泛克里金插值,如图3所示。
Figure 3. Comparison of universal kriging interpolation between heating and non-heating seasons; (a) Universal kriging interpolation in heating season; (b) Universal kriging interpolation in non-heating season
图3. 供暖季与非供暖季泛克里金插值对比;(a) 供暖季泛克里金插值;(b) 非供暖季泛克里金插值
图3(a)供暖季PM2.5浓度的泛克里金插值结果表明,供暖季泛克里金插值与局部莫兰指数的结果相吻合,污染主要集中在石家庄、保定、衡水、邢台和邯郸;张家口、北京和承德地区的空气质量在供暖季没有明显下降。图3(b)非供暖季PM2.5浓度的泛克里金插值结果表明污染出现明显的聚类,例如保定、石家庄、沧州、邯郸、廊坊、天津等地。
下面依据插值结果分析成因,并给出一些建议。
地理原因:北京、张家口、承德:北京地处华北平原北部,张家口和承德位于燕山–太行山生态屏障区,地形开阔且风力较强,有利于污染物扩散。此外,张家口作为冬奥会举办地,生态保护力度大,植被覆盖率较高,进一步抑制了扬尘污染。石家庄、保定、衡水等南部城市:位于太行山东麓,冬季易形成静稳天气,逆温层频繁,导致污染物难以扩散。加之城市群密集,工业和交通排放叠加,从而加剧污染积累。
供暖方式:北京及周边地区已完成大规模“煤改气”“煤改电”,清洁能源占比高。例如,北京市PM2.5年均浓度连续三年达标(32微克/立方米),燃气供暖比例超99%。而石家庄、邯郸等城市仍依赖燃煤供暖,尤其是农村地区散煤燃烧问题突出。邯郸市2023年1月PM2.5浓度位列全省倒数第一,与燃煤污染密切相关。
工业结构:张家口、承德以旅游业和轻工业为主,重污染企业较少。石家庄、邢台以及邯郸等地钢铁、建材、化工等高耗能产业集中,冬季生产叠加供暖排放,导致PM2.5浓度显著升高。
非供暖季图对比:在非供暖季污染明显集中在各市的城市地区,且呈现出区域化污染。其中天津作为工业重镇,钢铁、石化等重工业集中,非供暖季虽无燃煤供暖压力,但工业生产排放的PM2.5、VOCs (挥发性有机物)和NOx (氮氧化物)仍居高不下。沧州市化工、建材等高污染行业密集,其在经济开发区应急预案中提到需对39个重点行业企业实施差异化管控,但在非供暖季时部分企业仍存在排放超标问题。廊坊地区虽推进绩效分级减排,但工业聚集区(如燕郊)的VOCs排放使得其夏季臭氧层被严重污染。
治理方案:加快清洁能源替代,推进“煤改气”“煤改电”全覆盖,尤其是农村地区散煤治理;参照京津冀秋冬季攻坚方案,建立三地统一的O3和PM2.5协同防控机制,共享污染源清单和预警信息;淘汰落后产能,严控钢铁、化工等高耗能行业新增产能,推动沧州、天津等地的传统产业向绿色制造转型。
4. 利用克里金插值结果重新计算全局和局部莫兰指数分析相关性
本文初步计算得到的莫兰指数来源于京津冀地区勘测点的数据,然而勘测点在地图上表现出明显聚集现象,分布不均衡,且有些地区勘测点数量极其稀少。为得到更准确的莫兰指数,本文利用克里金插值选取预测点(各个市的预测点数取各个市勘测点的五倍),将勘测点的数量扩大,使勘测点的分布变得均匀,以得到更为准确的莫兰指数(图4展示了北京市的勘测点以及预测点)。
Figure 4. Beijing sampling points and random points
图4. 北京勘测点位与随机点位
4.1. 全局莫兰指数
Table 2. Global Moran’s index
表2. 全局莫兰指数
全局莫兰指数汇总/Summary of Global Moran’s Index |
全局莫兰指数(Global Moran’s I) |
0.572537 |
预期指数(Expected Index) |
−0.083333 |
方差(Variance) |
0.034579 |
z得分(z-score) |
3.527068 |
p值(p-value) |
0.000420 |
由表2可知z得分为3.53,p值为0.000420,结果在99%置信水平下显著;z得分均高于0.01显著性水平的临界值(2.58),p值均小于0.01;说明随机产生此聚类模式的概率小于1%,结果高度显著。表2中呈现z得分更高、p值更小,说明其空间聚类模式的随机性概率更低,统计可靠性更稳健。
由表1、表2可知,初步全局莫兰指数为0.543,呈正值,表现出空间聚集性,完善后全局莫兰指数为0.573,呈正值且大于初步全局莫兰指数,空间聚集性更强。两次全局莫兰指数均远高于预期指数(−0.083),表明PM2.5浓度存在显著的空间聚类。
4.2. 局部莫兰指数
对局部莫兰指数进行空间聚类可视化分析,如图5所示。
由图5可知,京津冀地区在PM2.5浓度上存在明显且具有区域特征的空间聚类现象。张家口、北京和承德显示出明显清洁聚类(冷点);衡水和邢台呈现出显著污染聚类(热点)。相比原始PM2.5浓度数据,采用克里金插值法对进行处理后的结果更稳健,在实际应用方面更有指导意义。
Figure 5. Visualization of local Moran’s index
图5. 局部莫兰指数可视化
5. 总结
从整体上来看,京津冀13个市PM2.5浓度的空间相关性很强。从地理、生活方式、工业生产等方面都有密切联系。从局部来看,高污染区域集中在京津冀中南部(如石家庄、保定等工业城市),低污染区位于北部山区(如承德、张家口等环保城市),并且非供暖季污染主要聚集在京津冀中南部城市地区,且呈现明显聚集现象(以天津为中心;以石家庄、邢台为中心)。供暖季污染扩散面很大,对京津冀中南地区污染很严重,但对京津冀北部影响较弱。京津冀地区污染格局受地理环境、能源结构与产业布局等多重因素制约。在地理维度,北部张家口、承德依托燕山–太行山生态屏障及风力资源优势形成天然扩散通道,而南部石家庄、保定等地因太行山东麓地形阻滞与静稳天气频发,叠加密集城市群形成的“污染辐合效应”,导致冬季PM2.5浓度比北部高。能源结构差异尤为突出,北京通过“煤改气”工程使清洁供暖率达99%,PM2.5年均浓度稳定达标,而石家庄、邯郸等地农村散煤燃烧仍贡献冬季PM2.5排放量的32%~40%。产业空间分异加剧污染梯度,北部以旅游业为主的产业结构PM2.5排放强度远低于南部钢铁、化工产业集群区的PM2.5排放强度。非供暖季污染呈现新型复合特征,天津、沧州等工业重镇因石化、钢铁生产排放的PM2.5-VOCs-NOx复合污染突出。
综上,京津冀地区不仅仅需要经济一体化,环境也需要一体化联合治理。
基金项目
大学生创新训练项目(202407017)。
NOTES
1数据来源于网站:https://quotsoft.net/air/#archive。