1. 研究目的及意义
随着我国经济的高速发展,GDP的不断提高,城镇化建设步伐加快,产业结构不断调整,我国的房地产行业得到了飞速发展。如今房地产行业已成为国民经济的一大支柱产业,为国民经济的发展做出了巨大贡献。房地产市场的理性发展与稳定的住房价格对我国经济发展有着重要的影响。通过研究住房价格影响因素及影响机理,在保证经济发展的同时,将房价控制在合理的范围内,可实现社会经济可持续发展,有利于国家和政府在制定相应的房地产市场调控措施时有的放矢,保证房地产市场稳定、有序、和谐的发展 [1] 。
2. 变量样本的选取
本文研究了2021年北京市各区县住房价格的影响因素及其空间效应。影响房价的因素有很多,作为一种高价消费品,房地产市场政策、各地区经济发展水平等都是影响房价的重要因素。本文选取北京市16个区县2021年房价月均价为因变量,以各区县国民生产总值、人口密度、居民人均可支配收入为自变量,各自变量说明如表1所示:
Table 1. Variable explanation table
表1. 变量解释说明表
3. 基于空间计量构建房价影响因素分析模型
3.1. 空间自相关检验
3.1.1. 建立空间权重矩阵
空间权重矩阵是空间数据分析的核心要素。本文基于地理Rook邻近性构建空间权重矩阵,即若用
来表示区县i与区县j的共有边界长度,空间权重矩阵定义为:
3.1.2. 检验空间相关性:全域空间自相关
全域空间自相关Moran指数可用于分析房价在北京市区县范围内的空间分布模式。其定义如式(1)所示:
(1)
其中,
表示第i个区县的房价;
表示变量
的均值;
为样本方差,
为区县总个数。
3.2. 模型的建立和选择
3.2.1. 空间自相关检验结果分析
北京市16个区县2021年房价均值对应的全局Moran指数,如表2所示。
Table 2. The significance test of global autocorrelation of housing prices in districts and counties of Beijing in 2021
表2. 2021年北京市各区县房价全域自相关显著性检验
由表2可知,Z值为3.6340,P值为0.0010,因此在1%的显著性水平下应拒绝原假设:北京市房价呈随机分布;同时得到y的Moran指数为0.4394,说明北京市16个区县的房价在空间分布上具有显著的正向空间自相关性,表现为某些区县的房价在空间上趋于集聚;也说明某些区县的房价不仅受自身的影响,而且受其他区县房价影响。
Table 3. The significance test of local autocorrelation of housing prices in districts and counties of Beijing in 2021
表3. 2021年北京市各区县房价局域自相关显著性检验
表3为在5%的显著性水平下局域自相关检验统计上显著的五个区县,其余区县在统计上不显著。其中,丰台、海淀、东城、西城在地图上表现为聚类的核心区域,该四个区位于高–高聚类区域,可以明显看出北京高房价区县集中分布于市中心。
3.2.2. 普通最小二乘模型
为便于空间计量模型的构建,首先在不考虑空间自相关影响前提下,对数据进行普通最小二乘回归,所得结果如表4所示:
Table 4. Ordinary least squares regression results
表4. 普通最小二乘回归结果
进一步,对OLS模型回归后的残差进行空间相依性检验,结果如表5所示:
Table 5. Spatial dependence test of OLS model residuals
表5. OLS模型残差的空间相依性检验
表5中,Moran指数为−0.2950,P值为0.0390,表明可以在5%的显著性水平下拒绝原假设:OLS模型残差不存在空间相依性,模型存在显著的空间自相关性。因此,有必要考虑基于OLS模型残差中的空间相依性,进一步考虑其他空间计量模型。
3.2.3. 拉格朗日乘子检验
对于模型残差中的空间相依性,Anselin (1988)指出可以使用空间滞后模型或空间误差模型进行拟合 [2] 。拉格朗日乘子法检验的结果可用以模型选择。
Table 6. Test results of Lagrange multiplier method
表6. 拉格朗日乘子法检验结果
由表6可知,LM-error统计量在10%的显著性水平下拒绝了原假设:不是空间误差模型。而LM-lag统计量的伴随概率大于10%,因此无法拒绝原假设:不是空间滞后模型。从而模型应选择空间误差模型。
3.2.4. 空间滞后模型
空间滞后模型如式(2)所示:
(2)
其中,
为空间权重矩阵,
为待估自变量回归系数,
为待估空间回归参数,空间相依性由单一参数
来刻画,并且用
度量空间滞后
对y的影响 [3] 。
基于极大似然估计,模型参数估计如表7所示:
Table 7. Spatial lag model regression results
表7. 空间滞后模型回归结果
表7显示,模型拟合优度R2为0.9768,房价变异的97.68%可由模型设定自变量所解释,拟合程度良好。同时,结果显示,在1%的显著性水平下人口密度x1、GDP x2均对房价有显著影响,且二者的增加均能导致房价的上涨。居民人均可支配收入x3在5%的显著性水平下对房价的影响不显著,最终模型剔除了这个自变量。空间自回归系数ρ的值为0.2752,伴随概率为0.0293,说明在5%的显著性水平下拒绝原假设:rho(ρ)等于0,房价在北京市各区县之间的相关性明显,即周围地区房价越高,那么本地区房价也会越高。
3.2.5. 空间误差模型
考虑到空间相依性还可能通过对多个单元均有影响的遗漏变量来体现,可将各观测的误差项设为空间相关,建立空间误差模型(SEM),如式(3)所示:
(3)
其中,
表示待估自变量系数,
为空间权重矩阵,
表示待估误差项空间滞后自相关系数。相关估计结果如表8所示。
Table 8. Spatial error model regression results
表8. 空间误差模型回归结果
表8显示,该模型的拟合优度为0.9815,说明房价变异的98.15%为模型自变量所解释,拟合程度良好。结果显示,人口密度x1、GDP x2均对房价产生显著性的影响,且二者均对房价具有正向的促进作用。而居民人均可支配收入x3在5%的显著性水平对房价的影响不显著,因此最终模型剔除了该变量。系数lambda,系数值为−0.6825,伴随概率为0.0659,在10%的显著性水平下拒绝原假设:该系数值为0,这说明误差项确实存在空间相依性。
3.2.6. 模型的比较
OLS模型、空间滞后模型和空间误差模型回归结果的比较见表9。
表9显示,空间误差模型的对数似然值在三个模型中最大,同时AIC和SC值均最小,拟合优度最高,可见空间误差模型比其他两个模型更优。
3.3. 直接效应和间接效应
3.3.1. 空间滞后模型
空间滞后模型中自变量对因变量的影响被分解为直接效应和间接效应。其中直接效应是本区县自变量对因变量的影响,间接效应是周围地区自变量对该空间因变量的影响。
空间滞后模型直接效应和间接效应计算结果如表10所示。
Table 10. Direct and indirect effects of spatial hysteresis model
表10. 空间滞后模型的直接效应和间接效应
对于直接效应,自变量x1、x2直接效应伴随概率分别为0.8407、0.1271,在5%的显著性水平下自变量x1、x2对y均没有显著影响。
对于间接效应,自变量x1、x2间接效应伴随概率分别为0.8529、0.7797,在5%的显著性水平下自变量x1、x2对y均没有显著影响。
3.3.2. 空间误差模型
空间误差模型的第二部分包含空间自相关误差项,由偏导理论可知,由于空间自相关误差项在对因变量y求X偏导时并不起作用,因此空间误差模型自变量
的直接效应等于自变量的系数
,而间接效应等于0 [2] 。
4. 空间面板数据模型
以上主要是建立截面数据的空间计量模型的研究,该模型受制于样本容量,所包含信息量较小,没有考虑个体异质性。面板数据与一维数据相比能提供更丰富的信息,减少偏差。因此在该模型的基础上引入面板数据,控制个体异质性的同时能够控制遗漏变量,更好地反映房价的实际情况。
空间面板数据模型将空间计量经济学和面板数据方法相结合,在传统的面板数据模型中增加了空间相关性和异质性。空间面板数据模型的一般形式如式(4)所示:
(4)
其中N表示北京市16个区,为截面维度;T表示年份,为时间维度。X为北京市第i个区县第t年的房价均值,是NT × K维向量,K为自变量个数,Y为北京市第i个区县第t年的因变量的观测值,是NT × K维向量,
为K × 1系数列向量,WN是N × N维空间权重矩阵。
是矩阵的kronecker乘积,IT是T × T单位阵,
,
是空间相关系数,
是NT × 1维个体固定效应向量,
对应均值向量为0,方差阵为
,且满足独立同分布的随机误差成分。空间面板模型(4)可分为空间滞后面板数据模型和空间误差面板数据模型两类 [4] 。
当
时,模型(4)即为空间滞后面板数据模型
(5)
当
时,模型(4)即为空间误差面板数据模型
(6)
4.1. 模型的选择
4.1.1. 模型的初步估计
选取2015~2021年北京市16个区县房价月均值,共112个观测样本,数据来源于《北京市统计年鉴》和全国房价行情数据库,所有数据均进行对数处理,以减少异方差。所用到空间权重矩阵与前文一致。解释变量选择了人口密度、各区县国民生产总值、居民人均可支配收入 [3] 。
首先判断空间因素的特殊性是固定效应还是随机效应,空间面板模型也分为空间固定效应模型和空间随机效应模型。
对于固定效应模型与随机效应的选择,可基于豪斯曼检验进行。检验结果如表11所示。
表11表明,LR1 = 54.0214,由于截面单元数量为16,因此这个似然比统计量服从自由度为16的
分布,由计算结果可知,伴随概率为0.0000,这表明在1%的显著性水平下拒绝原假设:空间固定效应联合不显著,因此模型应该考虑空间固定效应。LR2 = 60.3610,由于时间长度为7年,因此这个似然比统计量服从自由度为7的
分布。由计算结果可知,伴随概率为0.0000,这表明在1%的显著性水平下拒绝原假设:时间固定效应联合不显著,因此模型应该考虑空间和时间双固定效应。接下来同时比较三个对数似然值,发现空间与时间双固定效应的对数似然值最大,因此应考虑空间和时间双固定效应的模型。综上,模型初步选择空间和时间双固定效应的空间面板数据模型,该模型如式(7)所示:
(7)
其中,
和
分别表示空间固定效应和时间固定效应。
4.1.2. 拉格朗日乘子检验
前文中进行了空间自相关检验,表明北京市16个区房价均值之间存在明显的空间相关性,因此考虑各区之间的相互作用,同时邻近地区关于因变量的误差冲击对本地区的观测值也可能产生影响,因此可以在模型中引入空间滞后因变量或空间滞后误差项,来反映各区房价均值之间的空间自相关。通过拉格朗日乘子检验以及稳健性的拉格朗日乘子检验区分空间相关是空间滞后还是空间误差形式。
Table 12. Test results of Lagrange multiplier method
表12. 拉格朗日乘子法检验结果
表12给出的拉格朗日乘子检验结果表明,robust LM test no spatial lag, probability = 0.0007 < 0.01,统计检验结果表明在1%的显著性水平下拒绝原假设:不存在因变量空间滞后项,即存在因变量空间滞后项Wy。robust LM test no spatial lag, probability = 0.0065 < 0.01,因此可以拒绝原假设:不存在因变量空间滞后项,即存在空间滞后项。
由表13可知,模型拟合优度和对数似然值都表明空间滞后模型优于空间误差模型,因此最终选择空间和时间双固定的空间滞后模型。模型定义如式(8)所示:
(8)
4.2. 评估结果分析
Table 14. Spatially and temporally fixed spatial lag model regression results
表14. 空间和时间双固定的空间滞后模型回归结果
对北京市各区县和三个解释变量建立空间和时间双固定的空间滞后模型。表14给出的极大似然(ML)估计结果表明,x1的回归系数在10%的水平上显著,且x1的系数为正,说明人口密度与房价均值呈现正相关,在其他因素不变的前提下,人口密度每增加一个单位,房价均值增加0.2099个单位。模型的自变量空间滞后项Wy系数为0.3558,p值为0.0027,通过了1%的显著性检验,从而进一步证实了北京市各区县房价均值有明显的空间相关性,房价均值的变化通过地理机制发挥作用。此外,模型的R2和Log-likelihood均较高,分别为0.9907和168.8203,该模型消除了模型的空间自相关,从而能比较客观地反映真实情况。
表15展现了时间特殊影响。通过观察双固定空间滞后模型的时间固定效应,可以分析北京市各区房价均值随时间变化是否存在较大幅度的波动。在考察期间的7个年份影响都不显著(p值均大于0.8),这说明整体来看北京市各区房价均值在个年份之间是基本稳定的。同时,表16展现了空间特殊效应,可以发现北京市16个区县的p值均大于0.6,说明各地区的房价均值较稳定。
5. 结论
本文基于北京市16个区县2021年房价均值,采用空间计量的方法以及空间面板数据模型对商品房销售价格和其影响因素进行研究。通过空间相关性检验确定房价之间的空间相依性,从而运用模型对数据进行估计,进一步研究分析房价的空间自相关性及其影响因素,得到如下结论:
(1) 北京市不同区县的房价存在显著的空间效应。本文通过在各区之间引入空间权重矩阵计算房价之间的Moran指数,结果表明北京市16个区县2021年房价均价之间存在显著的空间相关性,即高房价地区相对集聚,低房价地区相对集聚。说明某地区的房价不仅受自身因素的影响,而且受其他地区因素的影响。其中,房价较高的地区丰台区、海淀区、东城区、西城区集中分布于北京市市中心,而低房价区域分布于北京市五环以外。
(2) 最终确定了空间和时间双固定的空间滞后模型。通过模型分析了北京市商品房价格预期影响因素之间的关系。结果显示,房价在北京市各区县之间的相关性明显,说明邻近区域的房价在一定程度上影响本区域的商品房价格。实证结果显示,房价均值与人口密度呈现正相关性,从不同年份来看,2015~2021年各年间的时间固定效应均不显著,特别是在疫情爆发的2020年,没有发现各区房价均值大幅度被影响的迹象,从而进一步证实北京市各区县房价均值在各年份之间是基本稳定的。
基金项目
本文受中国矿业大学(北京)教改项目数据分析课程设计的R语言实现(J230704)支持。
参考文献