基于京津冀地区居民人均消费水平差异的协方差分析模型
The Analysis of Covariance Model Based on the Difference between Per Capita Consumption Level of Residents in Beijing, Tianjin and Hebei
摘要: 推动京津冀协同发展是一个重要的国家战略。本文基于2014~2020年京津冀地区居民人均消费支出及人均可支配收入数据,考虑了居民人均可支配收入对居民人均消费支出的影响,利用统计中的协方差分析方法构建模型,证实了京津冀三地的人均消费水平存在显著性差异。北京市的人均消费水平显著高于天津市,天津市的人均消费水平显著高于河北省,得出的结论较方差分析而言更为准确。本文还分析得到了进一步的结论——除经济发展水平的影响外,非经济因素对三地居民人均消费水平差异的形成也有显著影响。
Abstract: Coordinated development of Beijing-Tianjin-Hebei region is an important national strategy. Based on data of per capita consumption expenditure and per capita disposable income of residents in Beijing-Tianjin-Hebei region from 2014 to 2020, this paper considers the impact of per capita disposable income of residents on per capita consumption expenditure of residents, and uses analysis of covariance method in statistics to build a model. There is a significant difference in the per capita consumption level between Beijing, Tianjin and Hebei. The per capita consumption level in Beijing is significantly higher than that in Tianjin. And the per capita consumption level in Tianjin is significantly higher than that in Hebei. The results of analysis of covariance are more accurate than that of ANOVA. And further conclusions are drawn from the analysis—in addition to the influence of the level of economic development, non-economic factors also have a significant impact on the formation of the difference in the per capita consumption level of residents in the three places.
文章引用:刘程馨, 牟唯嫣, 王欣. 基于京津冀地区居民人均消费水平差异的协方差分析模型[J]. 统计学与应用, 2022, 11(4): 739-746. https://doi.org/10.12677/SA.2022.114078

1. 引言

推动京津冀协同发展,是党中央在新的历史条件下作出的重大决策部署。目前,京津冀地区的发展取得了阶段性的成果,但发展不平衡的问题仍然存在。而消费对地区发展具有重要影响。因此,研究三个地区居民人均消费水平的差异性及其影响因素对区域经济发展具有指导意义。

居民人均消费水平不仅受经济发展水平的影响,也与文化背景、消费观念及消费环境等非经济因素有关。人均可支配收入是反映区域经济发展和居民生活水平的重要指标 [1] 。本文以2014~2020年京津冀地区居民人均消费水平为例,以居民人均消费支出和人均可支配收入分别对居民人均消费水平和经济发展水平进行描述。本文将居民人均消费支出作为响应变量,同时考虑了居民人均可支配收入对居民人均消费水平的影响,将居民人均可支配收入视为协变量。采用统计中的协方差分析方法构建了数学模型,证实了北京市、天津市和河北省三地的居民人均消费水平之间存在显著性差异,并且除经济发展水平的影响外,非经济因素对三省(市)居民人均消费水平差异的形成也具有显著影响。

2. 理论方法

协方差分析模型是方差分析模型和线性回归模型的一种“混合” [2] 。其中方差分析是主要部分,回归部分是由于协变量无法或很难控制而引入的。协方差分析的目的是略去回归部分,即排除协变量的影响,对得到的纯方差分析模型的方差分析进行适当校正,以分析控制变量对响应变量的影响。

2.1. 数据来源及相关说明

本文选取了北京市、天津市和河北省2014~2020年共7年的数据,居民人均消费支出和居民人均可支配收入数据均来自2021年中国统计年鉴 [3] ,整理相关数据得表1。居民人均消费支出用于衡量居民人均消费水平,而居民人均可支配收入是衡量经济发展水平的重要指标。因此,本文以居民人均消费支出和居民人均可支配收入分别对居民人均消费水平和经济发展水平进行描述,并基于SPSS26.0进行数据分析。

Table 1. The per capita consumption expenditure and per capita disposable income of residents in the Beijing-Tianjin-Hebei region from 2014 to 2020

表1. 京津冀地区2014~2020年居民人均消费支出和居民人均可支配收入

单位:元。

2.2. 模型的构建

考虑到居民人均可支配收入对居民人均消费支出的影响,将前者视为协变量,它是连续数值型变量。控制变量为地区,是分类型变量,它有3个水平,即北京市、天津市和河北省。7年来居民人均消费支出和居民人均可支配收入的数据可看作是重复试验,共重复7次 [4] 。我们来构建具有一个协变量的单因素协方差分析模型,用于分析京津冀三省(市)居民人均消费支出的差异性及影响因素。假设控制变量有 a 个水平,在各水平下重复观测的次数均为 n 次,则在第 i 水平下第 j 次观测的响应变量观测值可以表示为:

y i j = μ + α i + γ z i j + e i j , i = 1 , , a ; j = 1 , , n ,

其中 e i j 为随机误差,且假定 e i j N ( 0 , σ 2 ) ,诸 e i j 相互独立, μ 为总平均, α i 为控制变量第 i 水平的效应, γ 为协变量系数, z i j 为第 i 水平下第 j 次观测的协变量观测值。

针对所研究的问题,我们作出如下假设:

原假设 H 0 : 居民人均可支配收入对居民人均消费水平无显著影响以及 H 1 : 地区对居民人均消费水平无显著影响。

y i j z i j 分别为第 i 水平下第 j 次观测的响应变量和协变量观测值;

y ¯ i . 为控制变量在第 i 个水平下的样本均值;

z ¯ i . 为协变量在第 i 个水平下的样本均值;

y ¯ 为所有 n 个响应变量观测值的总均值;

z ¯ 为所有 n 个协变量观测值的总均值;

E y y = i = 1 a j = 1 n ( y i j y ¯ ) 2

E y z = i = 1 a j = 1 n ( y i j y ¯ ) ( z i j z ¯ )

E z z = i = 1 a j = 1 n ( z i j z ¯ ) 2

A y y = i = 1 a j = 1 n ( y ¯ i . y ¯ ) 2

A y z = i = 1 a j = 1 n ( y ¯ i . y ¯ ) ( z ¯ i . z ¯ )

A z z = i = 1 a j = 1 n ( z ¯ i . z ¯ ) 2

为检验上述假设,构造的统计量为:

对于 H 0 F 0 = E y z 2 / E z z [ ( E y y E y z 2 / E z z ) ] / [ ( a 1 ) ( n 1 ) 1 ]

对于 H 1 F 1 = [ ( E y y + A y y ) ( E y z + A y z ) 2 / ( E z z + A z z ) ( E y y E y z 2 / E z z ) ] / ( a 1 ) ( E y y E y z 2 / E z z ) / [ ( a 1 ) ( n 1 ) 1 ]

3. 实证分析

3.1. 方差分析

首先我们不考虑协变量的影响,进行方差分析。由于方差分析需满足诸样本相互独立、正态性和方差齐性三个假设条件,我们对此来进行验证。由于观测数据来自不同地区、不同年份,独立性基本可以满足。方差齐性和正态性检验结果见表2表3

Table 2. Variance homogeneity test

表2. 方差齐性检验

Table 3. Normal test

表3. 正态性检验

*这是真显著性的下限。a里利氏显著性修正。

方差分析的假设条件满足后,我们来进行单因素方差分析,实验结果见表4。从表中可以看出,对于给定的显著性水平 α = 0.05 ,相伴概率值为0.000,小于给定的显著性水平 α = 0.05 ,从而拒绝原假设,认为不同的地区的居民人均消费水平具有显著性差异 [5] 。

Table 4. Analysis of variance table

表4. 方差分析表

我们采用LSD检验法进一步进行多重比较,结果见表5。在给定的显著性水平 α = 0.05 下,北京市、天津市和河北省中任意两省(市)之间的相伴概率 p 值均为0.000,由此说明,三省(市)之间的居民人均消费支出差异均是显著的。

Table 5. LSD multiple comparisons

表5. LSD多重比较

*平均值差值的显著性水平为0.05。

3.2. 协方差分析

在满足协方差分析基本假设的条件下,我们构建的协方差模型才具有统计分析价值,由此得到协方差分析的结果才是可靠的。因此,对相关假设进行验证是必不可少的,检验结果见图1表6

图1可以看出,人均可支配收入和人均消费支出呈线性正相关。由表6结果可知,人均可支配收入和人均消费支出之间的交互效应不显著,满足平行性检验。

以上分析表明,收集的数据满足协方差分析的基本假设,故可对收集的数据进行协方差分析,分析结果见表7

表7可知,协变量居民人均可支配收入对应的 p 值为0.000,小于给定的显著性水平 α = 0.05 ,说明人均可支配收入对人均消费支出的影响是显著的,进一步说明地区经济发展水平对居民人均消费水平有显著影响 [6] 。地区对应的相伴概率在 α = 0.05 的显著性水平下也是显著的,由此我们得到北京市、天津市和河北省三地的人均消费水平存在显著性差异,且其 F 值比方差分析的 F 值小。

Figure 1. Per capita disposable income and per capita consumption expenditure by region scatter chart

图1. 人均可支配收入与人均消费支出分地区散点图

Table 6. Test of the effect of the subject (considering the interaction between regions and per capita disposable income)

表6. 主体间效应检验(考虑地区与人均可支配收入交互作用)

aR方 = 0.986 (调整后R方 = 0.981)。

Table 7. Test of the effect of the subject (not considering the interaction between regions and per capita disposable income)

表7. 主体间效应检验(不考虑地区与人均可支配收入交互作用)

aR方 = 0.983 (调整后R方 = 0.980)。

进一步通过偏差对比(表8)我们可以得到,北京(标记为级别1)、天津(标记为级别2)与河北(标记为级别3)之间的居民人均消费支出之间存在显著性差异。

Table 8. Comparison of deviations

表8. 偏差对比

a参考类别 = 3。

接下来我们通过协方差分析进行修正,并对消除协变量影响前后京津冀三地的人均消费支出的均值进行比较,结果如表9所示。

表9中可以看出,北京市、天津市和河北省三地的人均消费支出依然存在差异,但消除了协变量人均可支配收入的影响后,它们之间的差异明显缩小了。排除了经济发展水平的影响,人均消费支出均值从高到低的排序依然是北京市、天津市、河北省,同方差分析的结果一致,但因排除了协变量的干扰而更加可靠。由图2可以看出,京津冀三地修正后的均值之间均存在较大差异。由此可知,京津冀地区居民的平均消费水平在一定程度上因经济发展水平的制约而存在显著差异,但三地间居民的消费观念、消费模式以及社会环境等非经济因素的不同,也致使居民消费意愿有很大不同 [7] 。

Table 9. The means before and after correction

表9. 校正前后的均值

Figure 2. Line chart of the estimated marginal average of per capita consumer expenditure

图2. 人均消费支出的估算边际平均值折线图

4. 结论

本文针对2014~2020年京津冀地区居民平均消费水平的差异,应用协方差分析方法构建了数学模型,进行了统计分析,相较于方差分析方法,得到了更为准确的结果。从结果中可以发现,有效消除了反映经济发展水平的协变量——居民人均可支配收入的影响后,北京市、天津市和河北省之间的居民人均消费水平的差距虽有缩小,但仍显著存在,居民人均消费水平从高到低的排序依然是:北京市、天津市和河北省。这表明京津冀三省(市)的消费差异不仅受经济发展水平的影响,也与社会背景、消费观念等非经济因素的显著影响有关。因此,国家在大力推动地区经济发展的同时,也要促进居民消费价值观的正向更新,积极营造良好的社会环境及消费环境,从而进一步推动京津冀协同发展。本文仅从消费的角度研究了京津冀地区的差异性,给出了相关建议,具有一定的局限性,而后的研究工作可从其他视角对京津冀地区的发展展开进一步研究。

基金项目

特别感谢北京建筑大学2022年度研究生创新项目(项目编号:PG2022138)对本文的资助。

参考文献

[1] 朱婷婷, 马小雯, 孙玉会, 徐永芳, 周生伟. 基于空间统计分析甘肃省人均可支配收入发展研究[J]. 甘肃科技, 2019, 35(4): 66-68+16.
[2] 王松桂, 史建红, 尹素菊, 吴密霞, 编著. 线性模型引论[M]. 北京: 科学出版社, 2004.
[3] 国家统计局. 《中国统计年鉴2021》[EB/OL]. http://www.stats.gov.cn/tjsj/ndsj/2021/indexch.htm, 2021-10-23.
[4] 赵淳. 江浙沪区域内社会消费品零售总额协方差分析[J]. 中国市场, 2011(2): 170-171.
[5] 薛薇. 统计分析与SPSS的应用[M]. 第四版. 北京: 中国人民大学出版社, 2014: 8.
[6] 杜强, 贾丽艳, 编著. SPSS统计分析从入门到精通[M]. 北京: 人民邮电出版社, 2011.
[7] 马海锋, 朱琴华. 基于试验设计的我国城镇居民消费区域差异分析[J]. 中国市场, 2010(27): 6-8.