关于海南省商品住宅价格模型的分析与预测
Analysis and Forecast of Commodity Housing Price Model in Hainan Province
摘要: 基于海南省主要城市商品住宅价格的数据和相关研究文献,运用MATLAB软件和SPSS软件中皮尔逊相关系数、卡方检验的方法对某些相关因素进行了定量、定性分析,进一步采用主成分分析的方法提取主成分,建立回归方程,对模型进一步优化和检验,据此建立海南省商品住宅价格的数学模型,并利用粗糙集理论和灰色预测模型,找出相关性最大的指标,预测了海南省商品住宅价格的变化趋势。此外,还构建了VAR模型,将限购政策的实施和取消作为虚拟变量,用Eviews 8.0进行自回归分析,定量讨论了政策对房价市场的影响。
Abstract: Based on the data of commodity housing prices in the major cities of Hainan Province and the relevant research literature, this paper makes a quantitative and qualitative analysis of some related factors by using Pearson correlation coefficient in MATLAB software and SPSS software and chi-square test method. Furthermore, principal components are extracted by principal component analysis, regression equation is established, the model is further optimized and tested, and then the mathematical model of commodity housing price in Hainan Province is established, and the rough set theory and grey prediction model are used to find out the biggest correlation index, and forecast the change trend of commodity housing price in Hainan Province. In addition, a VAR model was built to implement the purchase restriction policy Applying and Canceling as virtual variables, autoregressive analysis is carried out with Eviews 8.0. The influence of policy on house price market is discussed quantitatively.
文章引用:滕薇, 岳疏桐. 关于海南省商品住宅价格模型的分析与预测[J]. 统计学与应用, 2019, 8(2): 341-357. https://doi.org/10.12677/SA.2019.82038

1. 引言

随着社会经济的发展和各种政策的出台,房地产价格呈现出极大程度的波动。而房地产价格作为房地产行业运行的重要参照,不仅是政府宏观调控的重要指标,也牵扯着重要的民生问题。因此,对于房地产价格的分析和预测是极其重要的。

发展现状:据《中国房地产市场年鉴(1996)》统计,1988年,海南省商品住宅价格平均为1350元每平方米,1993年达到7500元每平方米,之后几年商品住宅价格比较平稳略有小幅回落。2010年国家发改委批复了《海南国际旅游岛建设发展规划纲要》,海南省商品住宅价格再次迎来飙升,由6000多元每平米,涨至1万多元每平米。2018年4月13日,海南全岛建设自贸区(港)这一重大政策利好出台后,海口商品住宅价格每天涨幅达每平米500元到1000元,三亚商品住宅价格一夜之间每平米上涨3000元到8000元。2018年4月22日晚,海南省委、省政府发布了《关于进一步稳定房地产市场的通知》,在已出台限购政策基础上,实施全域限购,被称为“全国最严厉调控措施”。

房地产价格作为房地产业运行的“晴雨表”,变化不断,而房地产价格的未来走势也将成为社会各界所关注的一个重要问题。

问题的产生:

根据中国电机工程学会电工数学专委会提供的相关数据来源网站,我们将研究以下几个问题:

1) 搜集相关数据,找出决定海南省主要城市商品住宅价格的影响因素,进行相关定性定量分析,并分析各种因素之间的关系。

2) 假设政府没有出台限购政策,结合问题二中建立的数学模型,按照月份预测2018年6月~2019年5月海南省主要城市商品住宅价格。

3) 若考虑2018年4月22日限购政策出台,重新建立数学模型,按照月份预测2018年6月~2019年5月海南省主要城市商品住宅价格。

2. 问题说明

(I) 符号假定

这里只列出论文各部分通用符号,个别模型单独使用的符号在首次使用时再进行说明。

1) 海口城市:

符号解释变量:

x 1 :居民人均可支配收入;

x 2 :城市经济发展;

x 3 :旅游业;

y :商品住宅价格。

2) 三亚城市:

符号解释变量:

:居民人均可支配收入;

x 2 :城市经济发展;

x 3 :城市经济发展;

x 4 :房屋造价;

y :商品住宅价格。

(II) 模型假设

1) 假定搜集到的数据具有一定的可靠性和真实性;

2) 数据预测时期假定没有出台各种相关政策,受到其他因素的影响都在可控范围内;

3) 海口和三亚两个城市对于海南省有较好的代表性。

(III) 数据预处理

1) 在相关网站上搜集爬取有关数据,并进行统计整理;

2) 使用MATLAB软件,对各种指标的单位进行标准化处理,以消除量纲对模型的影响。

3. 模型的建立与求解

3.1. 问题一分析海南省商品住宅价格的影响因素

3.1.1. 海南省主要城市商品住宅价格变化总体趋势

通过图1的趋势图可以看出,海口和三亚两个城市的商品住宅价格都呈现出总体上升的趋势,但是三亚商品住宅价格明显高于海口,初步考虑由于两个城市中某些因素不同导致的房价差别很大。并且海口在2010年有一个折点,三亚在2014年有一个折点,初步考虑分别为某些因素对商品住宅价格在这一年产生了一定的影响。故接下来分析影响海南省主要城市商品住宅价格的各种因素。

Figure 1. Change trend of commercial housing in major cities of Hainan Province

图1. 海南省主要城市商品住宅变化趋势图

3.1.2. 商品住宅价格影响因素的定性分析

1) 国家宏观政策:

近十年,国家出台近百个政策,从重点调控海口、三亚主力城市到全省大范围布局,勾勒出一条限制购房–鼓励购房–限制购房的起伏线。

2009年,国务院正式批复《国务院关于推进海南国际旅游岛建设发展的若干意见》,2010年,史上最严的房地产调控政策“新国十条”发布,但海南省受国际旅游岛概念影响,旅游业大幅度发展,游客对房地产需求增大,导致房价大幅上涨。2011年,楼市“三限”、一房一价出台,国家调控力度加大,全国房价继续上涨,海南省房价回落,降为近十年最低价格。2012、2013年,海南省要求清理楼市库存,商品住宅价格下行明显,开发商开始以价换量。

2014年,三亚停建80平以下户型,海口限购松绑,新政出台后,全国楼市普遍迎来成交高峰,但海南成交持续下行。2015、2016年,海南省停建60平以下小户型,中国人民银行降准降息,海南下调住房公积金存贷款利率,海南实施“两个暂停”政策,购房者回归理性,一线城市爆发涨价潮,海南依然以去库存为主,全省库存大幅下降,量价普涨 [1] 。

2) 交通发展:

交通线路的便捷程度也是影响房价的重要因素,对消费者而言,住宅周边环境设施越完善,便会极大地满足消费者的需求,消费者对住宅的需求量增大,在供给量不变的情况下,房价会升高;对开发商而言,住宅周边环境设施越完善,成本就会越高,房价上涨。近十年,海南省交通建设迅速发展。前半期,海南省的交通发展缓慢,交通对房价的影响较小,随着交通的发展,海口、三亚城市交通居省内前列,线路网密集程度高,带动房价的升高。

3) 消费者理性预期心理因素:

参考文献 [1] ,国家政策的实施、城市建设的发展、以往价格水平和居住环境等因素都会对消费者预期产生影响。针对房地产价格的波动变化,消费者在做出购置决策之前会对住宅价格及未来价值做出一定预测,预测前景乐观,则倾向于购买,住宅价格便会上涨;反之则不予购买,住宅价格便会回落。

3.1.3. 商品住宅价格影响因素的定量分析

通过查阅相关资料,参考文献 [2] ,初步确定了几个对商品住宅价格影响较大的因素:城市经济发展水平、居民可支配人均收入、城市常住人口数、旅游业发展经济额、商品住宅造价。广泛搜集有关资料,并进行筛选统计,得到了近八年海口和三亚各种影响因素的相关数据。

(I) 海口城市各相关因素变化情况

图2,可以明显看出生产总值、人口总数、人均可支配收入、旅游业发展都是递年上升的。

Figure 2. Trend map of various factors in Haikou city

图2. 海口市各因素变化趋势图

接着,使用MATLAB软件,分别画出各种因素数值变化趋势图,如图3所示。

Figure 3. Trend diagram of four factors

图3. 四种因素趋势变化图

通过以上图形,可以看出人口总数在2010年急剧上升,这很好地解释了海口城市在2010年房价的突增情况。

(II) 三亚城市各相关因素变化情况

图4,可以看出三亚的各种相关因素的变化趋势,再使用MATLAB软件,分别画出各种因素数值变化趋势图,如图5所示。

通过以上图形可以清楚地看到,三亚市生产总值、人口总数、人均可支配收入、旅游业发展也都是递年上升的,但是商业住宅造价在2014年达到峰值后,又呈现一个下降趋势,并且考虑到三亚市商品住宅价格也是在2014年达到最大值,因此,三亚市房价可能在一定程度上受到了住宅造价的影响。

Figure 4. Trends of various related factors in Sanya city

图4. 三亚的各种相关因素变化趋势

Figure 5. Trend Map of various factors in Sanya city

图5. 三亚市各因素变化趋势图

3.2. 构建商品住宅价格数学模型

3.2.1. 初步分析商品住宅价格的线性相关模型

结合问题一,参考文献 [3] ,考虑到商品住宅价格变化与各种因素的影响关系,建立海南省主要城市的线性回归模型。

1) 模型建立

将商品住宅价格记为 y ,各影响因素分别记为 x 1 , x 2 , x 3 建立多元线性回归方程:

y = β 0 + β 1 x 1 + β 2 x 2 + β 3 x 3

其中参数 β i ( i = 0 , 1 , 2 , 3 ) 称为回归系数。

2) 模型求解

使用MATLAB软件,利用regress函数进行求解,使用格式为[b, bint, r, rint, stats] = regress(y, x) [4] ,得到回归系数估计值及其置信区间(置信水平 = 0 .05 ),检验统计量如表1所示。

Table 1. Test statistic

表1. 检验统计量

在此回归分析中, R 2 的值较小,只为0.3313,因此回归结果可能不是非常准确。接着使用MATLAB画出残差图,检验此回归精确程度。

3) 残差分析

图6可以看出,除第五个数据外,其余数据的残差离零点均较近,且残差的置信区间均包含零点,但是因为数据较少,因此不应该允许出现异常点。

Figure 6. Residual plot

图6. 残差图

通过以上分析可以看出,不管是计算回归方程的决定系数,还是统计量的检验值,统计量所对应的概率值,还是通过对残差的分析,此模型都不是非常合理的。因此,需要舍弃这种函数模型,考虑多重共线性,建立一个多元回归方程。

3.2.2. 自变量多重共线性的处理

在问题一中,已经分析得出很多因素之间是相互影响的,存在着一定的相关关系。基于各种变量之间的这种交互作用,采用主成分分析的方法,实现海南省主要城市商品住宅价格数学模型的建立。主要使用SPSS软件,考虑多线性交互作用来建立模型。主要步骤如下:

(I) 海口市共线性处理

1) 相关性检验

问题一中已知商品住宅价格主要与城市居民可支配收入、城市经济发展和旅游业这三种因素有关。首先检验这三种因素之间的相关关系,采用因子分析中的主成分分析方法,

首先进行相关性检验,得到表2如下。

Table 2. Test of KMO and Bartlett

表2. KMO和Bartlett的检验

综合KMO值小于0.7,且Bartlett球形度检验,P值 < 0.001,说明这三种因素之间具有一定的相关性。可以进行主成分分析。

a) 提取主成分和公因子

输出主成分结果并输出碎石图,如表3图7所示。

Table 3. Total variance explained

表3. 解释的总方差

Figure 7. Gravel chart

图7. 碎石图

从表中数据可以看出,成分1的特征值大于1,且能解释98.836%的方差,且通过碎石图可以看出,前边陡峭的部分特征值大,包含的信息多,后边相对比较平坦,包含信息少。故可以提取成分1作为主要解释变量。

得到的成分矩阵如表4所示。

2) 计算正交化单位特征向量

根据主成分载阵的计算公式,可以得到主成分的特征向量值。计算公式为:

l i = λ i e i ( i = 1 , 2 , 3 )

代入相关数值,可以得到表格如表5所示。

3) 建立回归方程并拟合其相关性

使用SSPS软件,利用回归的方法,建立商品住宅价格与主成分变量 X 之间的函数关系,在这里,首先要排除掉量纲的影响,因此使用MATLAB对量纲进行了标准化处理。其次分析了线性建模和二次建模,得到图形如图8所示。

Table 4. Component matrix

表4. 成份矩阵a

Table 5. Principal component eigenvector value

表5. 主成分特征向量值

Figure 8. Curve fitting graph

图8. 曲线拟合图形

通过图8可以看出,线性模型和二次模型的拟合优度相差不大。为了使得最后的模型更加简练,在此选择线性函数模型。得到系数图表,如图所示:(表6)

并进行相关检验,得到表7

由此, r 2 比较接近于1,因此,此模型的拟合程度比较高,是适用的。

Table 6. Coefficient

表6. 系数

Table 7. Model summary

表7. 模型汇总

最终得到函数表达式:

y = 0 .766 X

根据主成分的单位特征向量值,得到最终的函数模型为:

y = 0.444 x 1 + 0.443 x 2 + 0.329 x 3

(II) 三亚

对于三亚,同题(I)海南的相关解答,进行同样的主成分分析,得到单位特征向量如表8所示。

Table 8. Unit eigenvector

表8. 单位特征向量

然后进行线性回归,得到表9

Table 9. Coefficient

表9. 系数

并进行相关检验,得到表10

Table 10. Model summary

表10. 模型汇总

由此, r 2 比较接近于1,因此,此模型的拟合程度比较高,是适用的。

最终得到函数表达式:

y = 0 .933 X

根据主成分的单位特征向量值,得到最终的函数模型为:

y = 0.48516 ( x 1 + x 2 + x 3 ) + 0.40119 x 4

3.2.3. 模型的最终确定

根据以上分析,可以得到海南省主要城市商品住宅价格数学模型:

海口: y = 0.444 x 1 + 0.443 x 2 + 0.329 x 3

三亚: y = 0.48516 ( x 1 + x 2 + x 3 ) + 0.40119 x 4

3.3. 按月分析2018年6月~2019年5月海南省商品住宅房价格

3.3.1. 粗糙集的划分

选取全国平均水平作为标准,比较历年海南省与该标准的各指标情况如表11所示(0表示低于全国平均水平1表示高于全国平均水平)。

Table 11. Indicators of Hainan province in the past years

表11. 海南省历年指标情况

假设A代表年份集合, ,C代表条件属性集合, C = { c 1 , c 2 , c 3 , c 4 , c 5 } ,其中c1为居民人均可支配收入,c2为人口总数,c3为造价,c4为城市经济发展水平,c5为旅游业收入,D代表决策属性集合,这里为房价集合, Pos _ R { X } 为X的正域,

Pos _ c { D } = { 2013 , 2014 , 2015 , 2016 }

Pos _ ( c c 2 ) { D } = { 2011 , 2013 , 2014 } = Pos _ c { D }

Pos _ ( c c 3 ) { D } = { 2012 , 2015 , 2016 } = Pos _ c { D }

因此c2和c3为冗余项,即可删除的属性,所以C的D约简为 C { c 2 , c 3 } = { c 1 , c 4 , c 5 } ,于是我们得到影响海口市房价的主要因素为居民人均可支配收入、城市经济发展水平和旅游业收入三个指标,这也进一步验证了第一问结论的正确性。同样,也可做出三亚市2009年~2016年各指标与全国平均水平的比较结果(见附录),得到影响三亚市房价的主要因素除了与海口市相同的三个外还包括房屋造价。

3.3.2. 灰色模型GM(1, 1)建立

参考文献 [5] ,设时间序列 X ( 0 ) n 个观测值 X ( 0 ) = { X ( 0 ) ( 1 ) , X ( 0 ) ( 2 ) , , X ( 0 ) ( n ) } ,通过累加生成新序列 X ( 1 ) = { X ( 1 ) ( 1 ) , X ( 1 ) ( 2 ) , , X ( 1 ) ( n ) } ,则 G M ( 1 , 1 ) 模型相应的微分方程为:

d X ( 1 ) d t + a X ( 1 ) = μ (5.12)

其中, a ——发展灰度, μ ——内生控制灰度。

为待估参数向量, ,利用最小二乘法求解可得:

δ = ( B T B ) ( 1 ) B T Y n (5.13)

其中: B = [ 1 2 [ X ( 1 ) ( 1 ) + X ( 1 ) ( 2 ) ] 1 2 [ X ( 1 ) ( 2 ) + X ( 1 ) ( 3 ) ] 1 2 [ X ( 1 ) ( n 1 ) + X ( 1 ) ( n ) ] ] Y n = [ X ( 0 ) ( 2 ) X ( 0 ) ( 3 ) X ( 0 ) ( n ) ] ,求解微分方程,即可得到预测模型:

X ( 1 ) ( k ^ + 1 ) = [ X ( 0 ) ( 1 ) μ a ] e a k + μ a ( k = 0 , 1 , 2 , n ) (5.14)

3.3.3. 模型检验校正

灰色预测模型检验一般有残差检验、关联度检验和后验差检验。我们采用级比偏差值检验。首先参考数据 x ( 0 ) ( k 1 ) x ( 0 ) ( k ) 计算出级比 λ ( k ) ,再用发展系数 α 求出相应级比偏差

ρ ( k ) = 1 ( 1 0.5 a 1 + 0.5 a ) λ (k)

如果 ρ ( k ) < 0.2,则可认为达到一般要求;如果 ρ ( k ) < 0.1,则可以认为达到较高要求。

3.3.4. 模型求解

1) 数据检验和预处理

设参考序列为 x ( 0 ) = ( x ( 0 ) ( 1 ) , x ( 0 ) ( 2 ) , , x ( 0 ) ( n ) ) ,计算序列的平均数和级比,其中级比的计算公式为:

λ ( k ) = x ( 0 ) ( k 1 ) x ( 0 ) ( k ) , k = 2 , 3 , , n .

所有级比的值应落在可容覆盖区间 ( e 2 n + 1 , e 2 n + 1 ) 内,本题要预测12个月份,所以将n = 12代入得区间范围为(0.8669, 1.1535)内,否则须对序列做必要的变换处理,使其落入可容覆盖内,即选取适当常数C,做平移变换。

2) 利用matlab编程进行GM(1, 1)建模

分别将三组数据代入,可得待估参数向量与序列的解如下,预测值以及预测图如表12图9所示。

δ 1 = [ 0.034 13.185 ] , y 1 = 405.085 * e 0.0342791 * t 384.645 δ 2 = [ 0.008 2442.56 ] , y 2 = 325800 * e 0.0075673 * t 322772 δ 3 = [ 0.0095 113.909 ] , y 3 = 11919.2 * e 0.00945915 * t + 12042.2

Table 12. Prediction of data based on gray-scale model

表12. 基于灰度模型的各数据预测值

Figure 9. Trend of prediction value of each data based on gray-scale model

图9. 基于灰度模型的各数据预测值变化趋势

3) 模型的检验

分别利用三个公式的发展系数 α 计算出相应的级比偏差值, ρ 1 ( k ) = 0.035 ρ 2 ( k ) = 0.116 ρ 3 ( k ) = 0.057

可知旅游收入和GDP的偏差值均小于0.1,因此预测具有较好的可靠性,而可支配输入的偏差值略大于0.1但小于0.2,故也达到了预测的一般要求,具有实际意义。

3.3.5. 模型的代入

将求解得到的数据代入第二问中建立好的多元线性回归模型中,得到海口市和三亚市房价预测结果,如表13~14和图10~11所示。

海口: y = 0.444 x 1 + 0.443 x 2 + 0.329 x 3

三亚:

1) 海口

Table 13. Forecast of house price in Haikou city

表13. 海口市房价预测值

Figure 10. Trend of house price forecast in Haikou city

图10. 海口市房价预测值变化趋势

2) 三亚

Table 14. Forecast of house price in Sanya city

表14. 三亚市房价预测值

3.4. 按月分析政策出台后2018年6月~2019年5月海南省商品住宅房价格

3.4.1. 数据预处理及海口市VAR模型的构建

本问题采用2013年1月到2018年5月海南省(主要考虑海口和三亚)商品住宅价格月度数据,数据的处理和建模采用Eviews 8.0。

VAR模型对于相互联系的时间序列变量系统是有效的预测模型,对于政策虚拟变量,本问题将运用VAR模型来研究其对商品住宅价格的动态影响。参考文献 [6] ,为减小数据序列的异方差影响,首先对政策虚拟变量取自然对数,得到ln(P)的一个新的时间序列数据。从而建立滞后K期的VAR模型如下:

Figure 11. Trend of house price forecast in Sanya city

图11. 三亚市房价预测值变化趋势

( ln Price t ln P t ln T t lnGDP t ) = c + i = 1 k ( ln Price t 1 ln P t 2 ln T t 3 lnGDP t 3 ) + ( u 1 u 2 u 3 u 4 )

其中,c为常数项,为1 × 4的系数矩阵,u为随机扰动项。

用Eviews 8.0计量经济学软件对变量进行平稳性检验和季节性调整,检验结果表见附录,符合VAR模型的变量要求。

3.4.2. 脉冲函数响应分析

根据脉冲响应函数理论 [7] ,选定上述四个原始变量,运用Eviews 8.0软件进行操作,选择impulse菜单,Responses只留房价,得到脉冲响应曲线图12

Figure 12. Impulse response chart of house price

图12. 房价脉冲响应图

Impluses只留P (政策虚拟变量),得到脉冲曲线图13

Figure 13. Policy dummy variable impulse response graph

图13. 政策虚拟变量脉冲响应图

3.4.3. 商品住宅价格预测

经过上述检验和分析,用Eviews 8.0进行自回归分析,最终得到海口市商品住宅价格的预测模型VAR(2)如下:

Δ ln Price t = ( 1.231831 82.31819 0.365957 0.247278 ) T ( ln Price t 1 Δ ln P t 1 Δ ln T t 1 Δ ln GDP t 1 ) + ( 0.194865 148.1100 10.97197 1.030293 ) T ( Δ ln Price t 2 Δ ln P t 2 Δ ln T t 2 Δ ln GDP t 2 ) 384.6593

三亚市商品住宅价格的预测模型如下:

Δ ln Price t = ( 0.917230 649.9250 3.401510 2.948141 ) T ( ln Price t 1 Δ ln P t 1 Δ ln T t 1 Δ ln GDP t 1 ) + ( 0.184801 463.2524 13.73099 0.261242 ) T ( Δ ln Price t 2 Δ ln P t 2 Δ ln T t 2 Δ ln GDP t 2 ) 2143.552

3.4.4. 模型预测

最终通过所建立的VAR模型预测出2018年6月~2019年5月三亚的商品住宅价格为:33,847、32,647、31,185、30,735、30,142、28,765、28,103、27,831、28,940、29,462、30,913、33,721。

海口的商品住宅价格为:13,292、12,075、11,630、10,428、9762、9631、8815、9682、10,378、11,196、12,193、13,086。

3.4.5. 结合数据定性分析政策影响

在政策实施后,商品住宅价格会有一短下行期,限购令造成房价下降;但房价不是持续下降的,在一段时间后,由于房地产市场需求大于供给,导致房价回升,预测结果与数据相吻合,即房价是先下降后回升,在以后较长一段时间内,会形成往复循环现象。

参考文献

[1] 张澜, 周千秋. 市场预期对房地产价格的影响——消费者的理性预期[J]. 中国科技信息, 2006(13): 197-198.
[2] 赖一飞, 龙倩倩, 周雅. 城市商品住宅价格合理性实证分析[J]. 科技进步与对策, 2011, 28(13): 152-155.
[3] 韩中庚. 数学建模方法及其应用[M]. 北京: 高等教育出版社, 2009.
[4] 卓金武. MATLAB在数学建模中的应用[M]. 北京: 北京航空航天大学出版社, 2011.
[5] 司守奎, 孙玺菁. 数学建模算法与应用[M]. 北京: 国防工业出版社, 2011.
[6] 徐锦, 叶子青. 基于VAR模型的商品房价格影响因素分析[J]. 统计与决策, 2017(11): 95-99.
[7] 吴亚楠, 葛鹏, 高聪. 房地产行业的数学建模分析[J]. 数学的实践与认识, 2012, 42(15): 169-179.