基于时空视角下的城市房价预测模型构建——以北京市为例
Construction of Urban Housing Price Forecasting Model Based on Space-Time Perspective—A Case Study of Beijing
DOI: 10.12677/sa.2024.132028, PDF, HTML, XML, 下载: 32  浏览: 95 
作者: 朱玉忠, 郑 蕾:陆军工程大学研究生学院,江苏 南京;朱万红:陆军工程大学院野战工程学院,江苏 南京
关键词: 时空视角多元线性回归灰色理论北京市房价预测Spatial and Temporal Perspective Multiple Linear Regression Gray Theory Beijing Housing Price Forecast
摘要: 本文在对城市房价影响因素定性分析基础上,以北京市为例,采取皮尔逊相关系数法对采集的实例数据进行分析,从中选取影响北京市房价的7个重要影响因素指标。综合运用多元线性回归和灰色理论方法,通过对指标影响因素逐个解算和分析,构建了基于时空视角下的北京市房价预测模型并进行了检验,同时提出了房价调控的有关建议。
Abstract: On the basis of qualitative analysis of urban housing price factors, this paper takes Beijing as an example, adopts the Person correlation coefficient method to analyze the collected case data, and selects 7 important influencing factor indicators of Beijing housing price. Based on the comprehensive use of multiple linear regression and the grey theory method, the paper constructs and analyzes the influencing factors of the index one by one, and tests the forecast model of Beijing housing price from the perspective of time and space, and puts forward some suggestions on housing price regulation.
文章引用:朱玉忠, 郑蕾, 朱万红. 基于时空视角下的城市房价预测模型构建——以北京市为例[J]. 统计学与应用, 2024, 13(2): 276-283. https://doi.org/10.12677/sa.2024.132028

1. 引言

住房保障是关系国计民生和社会长治久安的重大问题,而房价是体现住房保障质量水平的关键性指标,党和国家对此历来高度重视,特别是党的十八大以来,以习近平同志为核心的党中央着眼我国住房市场发展形势,明确提出“坚持‘房子是用来住的,不是用来炒的’定位”,先后出台一系列加强住房调控的政策措施,对抑制房价过快增涨、改善民生发挥了重要作用。由于我国区域经济发展不平衡,各地城镇化水平有高有低,加之房地产业市场成熟度也不一样,各地政府贯彻落实党和国家住房调整政策时,应当结合自身实际因城施策,因此有必要构建城市房价预测模型对影响因素指标进行研究,以便制定精准房价调控政策。

目前,学者们对房价预测研究的方法较多,比如唐晓彬等(2018)将蝙蝠算法引入SVR模型,通过不断迭代寻找模型的最优参数,构建了BA-SVR混合模型,预测效果较好 [1] ;侯普光等(2014)利用小波分析理论对房价原始数据分解重构后进行参数估计,并与ARMA模型相结合,较好地解决了数据平稳性问题,提高了预测精度 [2] ;张荣艳(2018)提出采用灰色理论构建GM(1,N)模型,实现房价预测 [3] ;张军(1999)使用带参函数变换方法,改进灰色理论GM(1,1)模型,克服了传统GM(1,1)模型精度不高的问题 [4] 。对于房价预测而言,站在不同的视角以及采用不同的研究方法得出的结果可能不一样。由于房价受多种复杂因素影响,对其准确预测需要大量的样本数据做支撑,而多元线性回归模型恰好适用于分析这种复杂数据关系,且通过该模型确定的回归系数能够分辨各影响因素的重要程度,易于结果的理解和利用。这就避免了一元线性回归模型解释变量单一的缺陷,也克服了蝙蝠算法、支持向量机等机器语言难以处理大样本数据且对缺失数据敏感等不足。因此,为尽可能全面准确揭露房价变化规律,本文采用时空分析视角,在空间维度上利用多元线性回归方法分析房价影响因素,在时间维度上采用灰色理论方法探寻影响指标自身随时间变化规律,从而构建出时空房价预测模型。

2. 城市房价影响因素及其度量指标

2.1. 影响因素分析

从研究国内外文献情况看,城市房价受多重因素交互影响 [5] [6] [7] [8] [9] 。首先,住房作为一种商品,其供求关系是影响房价的主要因素,体现为住房市场供应能力、人口数量和居民个体消费能力。其次,住房是房地产业的投资品,而房地产业是构成地区国民经济的重要组成部分,因此房价又受到国民经济发展水平、自身产业结构和发展状况等宏观经济影响。再次,住房是一种社会消费品,具有明显的社会属性,而房价高低关系民生福祉,必然受到政府政策调控的影响,比如政府限价限售、土地出让管控、增加保障性住房供给等。

2.2. 指标选取及数据收集整理

本文选取了北京市2010年至2019年数据较为完整且易于描述影响当地房价的因素指标,将其归纳为宏观经济、居民个人住房消费能力、人口因素、住房市场供应能力、政策因素五个层面,并对相关数据进行了收集整理,具体度量指标及数据如表1所示。

Table 1. Indicators of factors affecting housing price and related data table (Beijing, 2010~2019)

表1. 影响房价的因素指标及相关数据表(北京市2010~2019年)

注:本表所收集整理的数据除商品房价格源自于安居客网站外,其余数据源自于北京市统计年鉴。

3. 模型构建

3.1. 预测变量选取

采用皮尔逊相关系数(Pearson correlation coefficient,记为r)对影响房价的因素指标进行衡量。根据|r|大小进行排序,选取线性相关程度最高的前7个指标(房地产产业总值、城镇人均居民可支配收入、户籍户数、人均GDP、城镇居民人均消费支出、恩格尔系数、在岗职工平均工资)作为预测变量进行回归分析。具体结果如表2所示。

Table 2. Correlation analysis of housing price and influencing factors index and selection table of predictive variables

表2. 房价与影响因素指标相关性分析及预测变量选取表

注:r值用于度量各因素指标与房价线性相关程度, r [ 1 , 1 ] ,|r|越接近1表明两个变量之间越相关;t检验是衡量这种相关性是否成立的指标,在给定显著性水平a = 0.05情况下,若p-value < 0.05代表通过t检验,说明影响因素指标与房价之间显著线性相关,反之则不成立。

3.2. 空间模型构建

将房价作为被解释变量,记为Y;将选取的7个影响因素指标作为解释变量,记为(X1, X2, X3, X4, X5, X6, X7),建立线性回归模型:

Y = β 0 + β 1 X 1 + β 2 X 2 + β 3 X 3 + β 4 X 4 + β 5 X 5 + β 6 X 6 + β 7 X 7 + ε (1)

E ( Y t | X 1 t , X 2 t , , X 7 t ) = β 0 + β 1 X 1 t + β 2 X 2 t + β 3 X 3 t + β 4 X 4 t + β 5 X 5 t + β 6 X 6 t + β 7 X 7 t (2)

式(1)称为总体回归模型,其中: ε 是随机扰动项。(β0, β1, β2, β3, β4, β5, β6, β7)为待估参数。式(2)称为样本总体回归函数,其中:(X1t, X2t, X3t, X4t, X5t, X6t, X7t)为样本观测值, t = ( 1 , 2 , , 10 ) 。根据最小二乘法原理,求解下列方程组得到待估参数值:

Q β k = 0 , Q = i = 1 10 ( Y ^ t Y t ) 2 , k = 0 , 1 , 2 , , 7 (3)

{ ( β 0 + β 1 X 1 t + β 2 X 2 t + β 3 X 3 t + β 4 X 4 t + β 5 X 5 t + β 6 X 6 t + β 7 X 7 t ) = Y t ( β 0 + β 1 X 1 t + β 2 X 2 t + β 3 X 3 t + β 4 X 4 t + β 5 X 5 t + β 6 X 6 t + β 7 X 7 t ) = Y t X 1 t ( β 0 + β 1 X 1 t + β 2 X 2 t + β 3 X 3 t + β 4 X 4 t + β 5 X 5 t + β 6 X 6 t + β 7 X 7 t ) = Y t X 2 t ( β 0 + β 1 X 1 t + β 2 X 2 t + β 3 X 3 t + β 4 X 4 t + β 5 X 5 t + β 6 X 6 t + β 7 X 7 t ) = Y t X 3 t ( β 0 + β 1 X 1 t + β 2 X 2 t + β 3 X 3 t + β 4 X 4 t + β 5 X 5 t + β 6 X 6 t + β 7 X 7 t ) = Y t X 4 t ( β 0 + β 1 X 1 t + β 2 X 2 t + β 3 X 3 t + β 4 X 4 t + β 5 X 5 t + β 6 X 6 t + β 7 X 7 t ) = Y t X 5 t ( β 0 + β 1 X 1 t + β 2 X 2 t + β 3 X 3 t + β 4 X 4 t + β 5 X 5 t + β 6 X 6 t + β 7 X 7 t ) = Y t X 6 t ( β 0 + β 1 X 1 t + β 2 X 2 t + β 3 X 3 t + β 4 X 4 t + β 5 X 5 t + β 6 X 6 t + β 7 X 7 t ) = Y t X 7 t (4)

将样本观测值带入式(4)解得(β0, β1, β2, β3, β4, β5, β6, β7)的值为(404, 120, 17.01, 7.06, −980.85, −0.61, −3.04, 1374.55, −0.8224),得到样本回归函数。

Y = 404120 + 17.01 X 1 + 7.06 X 2 980.85 X 3 0.61 X 4 3.04 X 5 + 1374.55 X 6 0.82 X 7 (5)

3.3. 时间模型构建

由于不同空间维度的房价影响指标自身随着时间而变化,这种变化呈现出一种不确定性,为此引入灰色理论GM(1,1)模型寻找指标内在变化规律。设 X k ( 0 ) = ( X k ( 0 ) ( 1 ) , X k ( 0 ) ( 2 ) , , X k ( 0 ) ( 10 ) ) 为第K个影响指标样本值构成的原始序列,对该序列进行一次累加处理,生成 X k ( 0 ) 的1-AGO序列,记为

X k ( 1 ) = ( X k ( 1 ) ( 1 ) , X k ( 1 ) ( 2 ) , , X k ( 1 ) ( 10 ) ) 。计算 X k ( 1 ) 序列紧邻均值,生成均值序列 Z k ( 1 ) = ( Z k ( 1 ) ( 2 ) , Z k ( 1 ) ( 3 ) , , Z k ( 1 ) ( 10 ) ) ,建立GM(1,1)模型,其中:

X k ( 0 ) ( t ) + a Z k ( 1 ) ( t ) = b (6)

d X k ( 1 ) d t + a X k ( 1 ) = b (7)

式(6)称为GM(1,1)模型的基本形式,式(7)称为GM(1,1)模型的白化方程,其中:a表示发展系数,反映了 X k ( 0 ) X k ( 1 ) 的发展趋势;b表示灰色作用量,反映了原始数据序列 X k ( 0 ) 的变化规律。

计算待估系数a、b的值,设列向量 W = ( a , b ) T ,根据最小二乘法原理则有: W = ( a , b ) T = ( B T B ) 1 B T A ,求出列向量w以后即可以建立GM(1,1)模型的时间响应式:

{ X ^ k ( 1 ) ( t + 1 ) = ( X k ( 0 ) ( 1 ) b a ) e a t + b a , t = 1 , 2 , , 10 X ^ k ( 0 ) ( t + 1 ) = X ^ k ( 1 ) ( t + 1 ) X ^ k ( 1 ) ( t ) = ( 1 e a ) ( X k ( 0 ) ( 1 ) b a ) e a t , t = 1 , 2 , , 10 (8)

将收集整理的北京市实例数据代入公式(8),逐个求出7个影响指标的预测值,结果如表3所示。

Table 3. 7 influencing factor indicators GM(1,1) model prediction results table

表3. 7个影响因素指标GM(1,1)模型预测结果计算表

通过对预测值与实际值进行对比,发现模型精度还不够高,由于模型精度受影响因素指标原始序列光滑度的影响,故采取下列含参线性函数变换的方法予以修正。

式(9)中p、q为待估参数,为使平均误差最小,采取最小二乘法可求出p、q的值。根据逆变函数对预测值进行修正:

X ^ k ( 0 ) ( t ) = X k ( 0 ) ( t ) q p (9)

X ^ k ( 0 ) ( t ) = ( 1 e a ) ( X k ( 0 ) ( 1 ) b a ) e a ( t 1 ) q p (10)

公式(10)为修正后的时间响应式,代入数据计算结果如表4所示。

Table 4. 7 influencing factor indicators GM(1,1) model prediction results revised calculation table

表4. 7个影响因素指标GM(1,1)模型预测结果修正计算表

3.4. 时空模型构建

将房价的7个影响因素指标时间响应式代入公式(5)可以得到时空函数,该函数是关于时间t的表达式,据此对房价进行预测:

Y ^ ( t ) = 404120 + 17.01 X ^ 1 ( 0 ) ( t ) + 7.06 X ^ 2 ( 0 ) ( t ) 980.85 X ^ 3 ( 0 ) ( t ) 0.61 X ^ 4 ( 0 ) ( t ) 3.04 X ^ 5 ( 0 ) ( t ) + 1374.55 X ^ 6 ( 0 ) ( t ) 0.82 X ^ 7 ( 0 ) ( t ) (11)

3.5. 模型检验

3.5.1. 相对误差大小检验

把预测值与实际值进行比较,观测其相对误差是否满足实际要求,最终取平均值,计算公式如下:

u ( t ) = | Y ^ ( 0 ) ( t ) Y ( 0 ) ( t ) Y ( 0 ) ( t ) | × 100 % (12)

e ( t ) = Y ^ ( 0 ) ( t ) Y ( 0 ) ( t ) (13)

r = ( 1 1 10 t = 1 10 | u ( t ) | × 100 % ) × 100 % (14)

式(12)中u(t)为相关误差序列,式(13)中e(t)为残差序列,式(14)中r为模型精度,一般r > 90%,说明模型精度良好。

3.5.2. 后验差检验

按照残差的概率分布进行检验,计算公式如下:

S 1 2 ( t ) = 1 10 t = 1 10 ( Y ( 0 ) ( t ) Y ¯ ( 0 ) ) 2 (15)

S 2 2 ( t ) = 1 10 t = 1 10 ( e ( t ) e ¯ ) 2 (16)

P = p { | e ( t ) e ¯ | < 0.6745 S 1 } (17)

式(15)中 S 1 2 ( t ) 为实际序列的方差,式(16)中 S 2 2 ( t ) 为残差序列的方差。C为S2与S1比值,C ≤ 0.35时模型精度好。P为小误差概率,该值越大表明模拟拟合程度越好,说明预测值分布比较均匀,p ≥ 0.80模型精度合格。代入相关数据计算得到北京市房价预测值和各类检验值,计算结果如表5所示。观察结果发现2019年预测偏差相对较大,究其原因是因为灰色理论GM(1,1)模型实质上通过对原始数据累加后寻找指数增长规律,为简化问题,本文采用平均累加的方式,即对不同时间均赋予相同的权重,然而时间越近其影响程度应该越大,因此在构造累加序列时可采取按时间远近逐渐递增赋权重的方式予以修正,由于篇幅有限,本文在此不再赘述。

Table 5. Beijing housing price development trend forecast table

表5. 北京市房价发展趋势预测表

4. 结语

当前,对房价预测的研究大多基于单一视角,有的从时间维度探寻其内在演变的规律,有的从空间维度探讨其变化趋势。然而,事物的发展既有其内在规律,同时也要受其它影响因素的制约。因此,本文从时间和空间两个维度出发,综合运用多元线性回归和灰色理论的方法,考虑时间因素和各种影响指标对房价的复合作用,构建时空预测模型,能够较为全面准确地预测房价变化趋势。从北京市实例解算结果看,影响房价的主要因素有7个,按照相关性大到小排序依次为房地产业生产总值、城镇居民人均可支配收入、户籍户数、人均GDP、城镇居民人均支配支出、恩格尔系数、在岗职工平均工资。推动北京市房价上涨的主要原因是市场供求关系,特别是城镇居民住房需求和个人支付能力。因此,在考虑制订相关政策制度时,要针对不同人群不同需求施行差异化调控,总的来说就是保障刚需、支持改善、遏制投机。比如,对低收入刚需家庭而言,可以采取政府提供保障性住房、共有产权住房等方式,提高低收入人群住房现实购买力,使其能够在房价上涨的情况下买得起房,实现住有所居的目标;对于高收入有改善型住房需求的家庭而言,鼓励市场按照供求关系和个人购买力实现住房保障。但是对于房产投机行为,则通过抑制住房需求、加大投机行为经济成本的方式,降低其对房价的助推影响,通过限贷、限购、限售、提高首付款比例等方式,抑制不合理需求,遏制投机行为,保持房价涨势基本平稳,促进房地产业持续健康发展。

参考文献

[1] 唐晓彬. 基于蝙蝠算法SVR模型的北京市二手房价预测研究[J]. 统计研究, 2018, 35(11): 71-81.
[2] 侯普光, 乔泽群. 基于小波分析和ARMA模型的房价预测研究[J]. 统计与决策, 2014(15): 20-22.
[3] 张荣艳. 基于GM(1,N)模型的郑州市房地产价格预测[J]. 数学的实践与认识, 2018, 48(5): 82-88.
[4] 张军. 灰色预测模型的改进及其应用[D]: [硕士学位论文]. 西安: 西安理工大学, 2008.
[5] 周亮锦, 夏恩君. 国外房价影响因素研究综述[J]. 技术经济, 2018, 37(12): 111-119.
[6] 张智鹏. 影响区域房价的客观因素挖掘分析[J]. 计算机应用与软件, 2019, 36(11): 32-38.
[7] 程道平, 景霖霖, 彭山桂. 城市住房价格跨区域联动的检验与模式研究[J]. 建筑经济, 2020, 41(4): 101-105.
[8] 刘有章, 徐颖. 中国长三角地区房价影响因素实证分析——基于空间视角[J]. 海南大学学报(人文社会科学版), 2019, 37(6): 77-85.
[9] 吴翔华, 王竹. 基于多维度模型的城镇住房保障面积标准研究[J]. 统计与决策, 2017(18): 40-44.