统计学与应用  >> Vol. 8 No. 3 (June 2019)

对31个主要城市空气污染的研究
The Study on Air Pollution in 31 Main Cities

DOI: 10.12677/SA.2019.83064, PDF, HTML, XML, 下载: 402  浏览: 676 

作者: 刘 哲, 高 波:北方工业大学,理学院,北京

关键词: 空气污染对应分析典型性相关分析主要城市 Air Pollution Correspondence Analysis Canonical Correlation Analysis Main Cities

摘要: 本文基于对应分析与典型性相关分析,对31个主要城市的空气污染与城市关系进行分析。通过对应分析研究,简单分类不同城市,分析因区位条件、产业布局等因素,造成空气质量的不同的因素。随后通过典型性相关分析,研究空气质量指标中的PM2.5、PM10主要受哪些污染物影响,针对这些污染物提出合理的改进建议。
Abstract: Based on correspondence analysis and canonical correlation analysis, the relationship between air pollution and cities in 31 main cities is analyzed in this paper. Through the corresponding analysis and research, we can simply classify different cities and analyze the different factors of air quality due to factors such as location conditions and industrial layout. Then, through the typical correlation analysis, it is studied which kinds of pollutants will affect PM2.5 and PM10 in the air quality index, and reasonable improvement suggestions are proposed for these pollutants.

文章引用: 刘哲, 高波. 对31个主要城市空气污染的研究[J]. 统计学与应用, 2019, 8(3): 567-573. https://doi.org/10.12677/SA.2019.83064

1. 研究背景

改革开放以来,我国综合实力迅速提升,在经济飞速发展的同时,环境污染、空气污染问题也愈发严重,以颗粒污染物、二氧化硫、氮氧化物等为主要污染物的空气环境污染问题突出。对于空气污染与支气管哮喘之间的关系,研究发现空气污染与因哮喘继续加重而到急诊就诊或住院的人数呈正相关,同时与多种呼吸道症状、用药量呈正相关 [1] 。王必哲 [2] 等人研究了城市发达程度与空气污染之间的关系,研究发现空气污染与城市发达程度呈正相关。贺祥 [3] 在对长三角洲主要城市上海、南京、杭州PM2.5浓度变化进行研究,揭示CO是影响各时段不同周期尺度PM2.5浓度变化的主要驱动因素,其次是SO2和NO2

控制空气污染物,保护空气环境良好是人们近些年来的迫切愿望。因此,本文基于2015年《中国统计年鉴》中《主要城市废气中主要污染物排放情况2015》和中国空气质量在线监测分析平台发布的历史数据,基于对应分析和典型相关分析,研究各主要城市与空气质量之间的关系,以及主要城市污染物排放同空气中主要污染物浓度之间的关系。

2. 数据收集与整理

空气质量数据来源于中国空气质量在线监测平台,选取2015年12个月主要城市的天气数据,空气质量按照优、良、轻度污染、中度污染、重度污染分类,按月份统计各个城市全年各种空气质量的发生次数,同时按月份统计各个城市各种主要空气污染物浓度。按照前五个城市为范例,具体表格如下表1表2所示。

主要城市废气排放数据来自于《中国统计年鉴》中《主要城市废气中主要污染物排放情况2015》。按照前五个城市为范例,具体表格如下表3所示。

Table 1. Air quality data for 2015 (top five cities)

表1. 2015年空气质量数据(前五个城市)

Table 2. Air pollutant concentrations in major cities by month (top five cities)

表2. 按月份主要城市空气污染物浓度(前五个城市)

Table 3. Emissions of major pollutants in exhaust gas of major cities in 2015 (top five cities)

表3. 主要城市废气中主要污染物排放情况2015 (前五个城市)

3. 基于对应分析与典型相关分析的数据处理与解读

3.1. 对应分析原理

设有n个样品,每个样品有p个变量,即数据矩阵为:

X = ( x i j ) n × p (3.1.1)

行和、列和与总和:

x i . = j = 1 p x i j x . j = i = 1 n x i j x .. = i = 1 n j = 1 p x i j (3.1.2)

对数据矩阵X作对应分析的具体步骤:

1) 由数据矩阵X计算规格化的概率矩阵 P = ( p i j ) n × p

2) 计算过渡矩阵

Z = ( z i j ) = [ ( p i j p i . p . j ) / p i . p . j ] n × p = ( x i j x i . x . j / x .. x i . x . j ) n × p (3.1.3)

3) 进行因子分析

a) R型因子分析:计算协方差矩阵 A = Z T Z 的特征值 λ 1 , λ 2 , , λ p ,按照累积百分比 i = 1 m λ i / i = 1 p λ i 85 % ,取前m个特征值 λ 1 , λ 2 , , λ m ,并计算对应的单位特征向量 u 1 , u 2 , , u m ,得到因子荷载矩阵:

F = [ u 11 λ 1 u 12 λ 2 u 1 m λ m u 21 λ 1 u 22 λ 2 u 2 m λ m u p 1 λ 1 u p 2 λ 2 u p m λ m ] (3.1.4)

b) Q型因子分析:由上述求得的特征值,计算 B = Z Z T 所对应的单位特征向量 v i = 1 λ i Z u i ,得到因子荷载矩阵

G = [ v 11 λ 1 v 12 λ 2 v 1 m λ m v 21 λ 1 v 22 λ 2 v 2 m λ m v p 1 λ 1 v p 2 λ 2 v p m λ m ] (3.1.5)

c) 在同一坐标轴上作变量点图与样品点图:分析变量点之间的关系;分析样品点之间的关系;同时综合分析变量点和样品点之间的关系。

3.2. 典型相关分析原理

假设有两组变量,一组变量为 x = ( x 1 , x 2 , , x p ) T ,另一组变量为 y = ( y 1 , y 2 , , y q ) T ,且 p q ,变量x与变量y的协方差阵为:

Σ = C o v ( x , y ) = [ V a r ( x ) C o v ( x , y ) C o v ( y , x ) V a r ( y ) ] = [ Σ 11 Σ 12 Σ 21 Σ 22 ] (3.2.1)

为研究变量x与变量y之间的线性相关关系,我们考虑它们之间的线性组合:

{ u = a 1 x 1 + a 2 x 2 + + a p x p = a T x v = b 1 y 1 + b 2 y 2 + + b q y q = b T y (3.2.2)

u和v的方差和协方差分别为:

V a r ( u ) = V a r ( a T x ) = a T V a r ( x ) a = a T Σ 11 a V a r ( v ) = V a r ( b T y ) = b T V a r ( y ) b = b T Σ 22 b C o v ( u , v ) = C o v ( a T x , b T y ) = a T C o v ( x , y ) b = a T Σ 12 b (3.2.3)

两个新变量u和v之间的相关系数(即典型相关系数)为:

ρ = C o r r ( u , v ) = C o r r ( a T x , b T y ) = a T Σ 12 b ( a T Σ 11 a ) ( b T Σ 22 b ) (3.2.4)

由于变量u和v乘以不为零常数不改变它们之间的相关性,即对任意常数 c 0 ,有 C o r r ( c u , c v ) = C o r r ( u , v ) ,所以通常需对a和b附加约束条件,使变量a和b唯一,最好的约束条件是:

{ V a r ( u ) = V a r ( a T x ) = a T V a r ( x ) a = a T Σ 11 a = 1 V a r ( v ) = V a r ( b T y ) = b T V a r ( y ) b = b T Σ 22 b = 1 (3.2.5)

也即在约束条件下求a和b,由式:

G = a T Σ 12 b λ 2 ( a T Σ 11 a 1 ) μ 2 ( b T Σ 22 b 1 ) (3.2.6)

通过拉格朗日乘数法,分别对向量a和b求导,并令其为0,经计算整理后,得:

{ a T Σ 12 b = λ a T Σ 11 a = λ b T Σ 21 a = μ b T Σ 22 a = μ (3.2.7)

( b T Σ 21 a ) T = a T Σ 21 b = ρ ,所以 λ = μ = ρ ,即 λ 恰好就是u和v的相关系数。

在经整理可得:

{ A a = λ 2 a B b = λ 2 b (3.2.8)

λ 2 既是A的特征根又是B的特征根,a和b是其相应的特征向量。

一对典型变量为:

{ u i = a i 1 x 1 + a i 2 x 2 + + a i p x p = a i T x v i = b i 1 y 1 + b i 2 y 2 + + b i p y p = b i T y (3.2.9)

3.3. 基于对应分析研究城市与空气质量之间的关系

根据对应分析结果,如图1所示。可以看出:北京、郑州、济南三个城市2015年全年的空气污染情况大致相同,处于轻度污染、中度污染和重度污染之间。乌鲁木齐、石家庄、西安、呼和浩特等城市,空气质量主要处于良和轻度污染之间。南昌、拉萨、贵阳、昆明、哈尔滨,这些城市的全年空气质量大致处于优与良之间。而海口与福州全年空气质量主要为优。

Figure 1. Correspondence analysis map of air pollution in major cities of China

图1. 全国主要城市空气污染情况对应分析图

根据这些城市具体情况分析,大致得出以下结论:一、沿海城市空气污染程度明显好于非沿海城市,说明当前来讲,大气扩散条件的好坏,会影响到城市的空气质量。二、依据库兹涅兹曲线(以人均财富增长为横坐标,以环境污染指标分配为纵坐标,二者关系遵循倒U型曲线规律) [4] 。若以成都为例,成都在2015年人均GDP已进入“发达国家”水平,所以成都空气质量应该较好,但实际情况是处于良与轻度污染之间。这说明成都存在人均财富分配不均衡,或者政府的环境治理政策存在问题。三、根据城市污染情况,也可看出不同产业和能源结构对城市污染具有很大影响。如郑州以煤炭为主要能源来源 [5] ,对空气质量影响明显,空气质量长期处于污染分类中。而昆明则以旅游为主要产业,在空气质量方面具有明显优势 [2] 。同时一些城市,如长沙,处于产业优化升级阶段,存在经济发展与工业废气呈负相关的关系 [6] 。

3.4. 基于典型相关分析研究主要城市废气排放对空气质量指标的影响

1) 在对城市废气排放与空气中CO、SO2和NO2等指标进行典型相关分析,相关性如下表4所示,发现两者并不存在直接的相关关系。这与一般的认知并不相符,经分析后认为,由于选取全国31个主要城市,存在有不同的区位条件,因此存在大气扩散条件不同的因素,而在空气质量中,这也是很重要的影响因素 [7] 。所以判断,空气质量受不同城市的风力等大气扩散条件影响。

Table 4. Canonical correlation analysis

表4. 典型相关分析

2) 鉴于城市区位扩散条件的影响,于是对空气中CO、SO2、NO2和PM2.5、PM10等空气指标进行典型性相关分析,由于这些数据是直接决定空气质量的指标,所以不存在受不可控因素干扰检验的可能。经检验前两列典型相关变量相关系数显著,但根据相关性结果看,第一组相关性较好,结果如下表5~7所示。

Table 5. Canonical correlation analysis

表5. 典型相关分析相关性

Table 6. Canonical correlation analysis for Ui

表6. Ui典型相关变量结果

Table 7. Canonical correlation analysis for Vi

表7. Vi典型相关变量结果

可得出前两对典型相关变量来的表达式:

第一组典型相关变量表达式:

U 1 = 0.009718337 X 1 + 0.174149964 X 2 V 1 = 0.05071641 Y 1 + 0.09547422 Y 2 + 0.07978821 Y 3 + 0.01023794 Y 4

第二组典型相关变量表达式:

U 1 = 0.357534 X 1 0.3124048 X 2 V 1 = 0.001070345 Y 1 0.188519541 Y 2 + 0.20400649 Y 3 0.012659033 Y 4

根据典型荷载系数,可以看出PM10的荷载系数较大,说明在空气中颗粒物主要是这个范围内的影响较大。再根据 V 1 中各个变量的荷载系数,可以看出CO、NO2、SO2依次对PM2.5、PM10影响较大,这与贺祥 [3] 在对长三角洲主要城市空气污染物浓度变化对PM2.5影响较大是相符合的。说明在大气污染治理中,如何控制CO、NO2、SO2这三种主要污染物的排放,是治理大气污染的关键。

4. 结论

城市空气质量同城市自身所处区位条件有关,沿海城市由于大气扩散条件较好,具有较好的空气质量;城市自身的产业和能源结构,对城市的空气质量具有影响;同时,在空气质量这个问题上,虽然大众逐渐开始留意,但是存在的人均收入分配不均等问题,牵制了很多群众对空气质量的关注,从而没能督促政府强有力的介入,使空气质量与城市的经济发展同步。

居民生活与工业废气这个变量,对大气主要污染物这项的影响,在典型分析结果中并不具有较强的相关性。这点应该与城市区位条件不同,大气扩散条件不同有关,造成把主要城市放在一起后数据相关性不强。但是单纯通过研究结果去判断,可能掩盖了实际的污染状况问题。即城市实际产业存在较大污染,但在一些区位条件优势下,存在被掩盖的可能性,所以有关部门在这方面也应该加强实际监督,特别沿海城市,最近几年赤潮现象在沿海城市多次发生。而影响空气中颗粒物衡量标准PM2.5、PM10主要受CO、NO2、SO2这三种污染物的影响。因此对于城市管理者,可以适当管理、引导居民和企业减少在这方面的污染物排放,可以有效改善空气质量。

参考文献

[1] 王科富. 空气污染与肺部健康[D]: [博士学位论文]. 北京: 北京协和医学院, 2016: 6.
[2] 王必哲, 吕王勇, 余文瀚, 谢佳益. 基于对应分析法对城市和污染关系的研究[J]. 资源与环境, 2017(4): 113-114.
[3] 贺祥. PM2.5浓度变化驱动机制研究——以长江三角洲为例[D]: [博士学位论文]. 南京: 南京师范大学, 2017: 5.
[4] Mitra, R.L.S. (2014) Corruption, Pollution, and the Kuznets Environment Curve. Journal of Environmental Economics and Man-agement, 40, 137-150.
https://doi.org/10.1006/jeem.1999.1107
[5] 李钢, 蒋文静, 徐洁. 应用灰理论对郑州空气主要污染物分析与预测[J]. 河南城建学院学报, 2013, 22(4): 41-59.
[6] 徐承凤. 长沙市产业结构与空气污染关系的实证研究[J]. 经贸实践, 2018(5): 36-37.
[7] 张晓娟. 郑州市空气污染指数与地面气象要素相关条件分析[J]. 气象科学, 2015(18): 200.