1. 引言
2019年,上海商品住宅供应726.85万平方米,较18年同期下降5.39%,为近五年同期中位水平,月均供应量为60.57万方。尽管中央已经出台各项楼市调控的政策,房价仍然未下跌 [1] 。房价问题一直是上海等发达地区市民关心的问题。房价居高不下的问题,让即将步入社会的大学生们为赖以栖居的住房乃至家庭和婚姻的幸福而担忧。时至今日,“蜗居”仍然是大学生们讨论的热点问题,从另一方面体现了高房价情形之下,大学毕业生的生活压力。甚至很多上海市民,数年来只能蜗居在几十甚至十几平方米的小屋里,生活质量很难有确切保障。社会快速发展的压力也让人们愈加烦躁,贫富差异更加明显,社会在这样的情况下就会慢慢滋生诸多矛盾。因此,上海市区住宅商品房平均销售价格的研究就显得尤为重要。
首先,通过研究能够发现影响上海市区住宅商品房平均销售价格的主要因素和预测分析,可以了解将来上海市区住宅商品房平均销售价格的发展趋势 [2] 。广大市民急切希望了解住宅商品房平均销售价格,方便与自身是选择早日买房或是与自身经济实力相比择日另买更加划算。其次,本文是在对前人探究上海市区住宅商品房平均销售价格影响因素的基础上完成的,旨在探索是否有其他更为显著的因素在发挥影响。因此,在剔除了上海居民消费价格指数和上海人均GDP后,选取其他与现实生活更密切相关,广为人知的因素探究上海市区住宅商品房平均销售价格的影响因素。本文从2002年为时间起点,分析了2002到2019年这18年的数据房地产开发住宅投资额,年末常住人口,在岗职工平均工资,房地产开发企业住宅竣工房屋住宅面积,这几个因素对上海市区住宅商品房平均销售价格的影响。通过建立并分析模型,进一步探讨影响上海市区住宅商品房平均销售价格这一社会问题。
2. 理论基础与模型构建
2.1. 数据与变量的选取
本文从《国家统计年鉴》选取了上海住宅商品房平均销售价格18年的数据。
一般而言,微观上房地产开发住宅投资额越大往往会使住宅商品房平均销售价格越大(正相关),宏观上年末常住人口越多往往住宅商品房平均销售价格会越大(正相关),在需求因素方面在岗职工平均工资越多住宅商品房平均销售价格会越大(正相关),在供给因素方面房屋竣工面积越多住宅商品房平均销售价格会越小(负相关) [1] 。因此对房地产开发住宅投资额、年末常住人口、在岗职工平均工资、房屋竣工面积这四个影响因素的研究对制定房价政策具有重要的意义,理论上我们假设在岗职工平均工资是最显著的影响因素。
首先,建立了多元线性回归模型 [3] 如下:
(1)
其中,被解释变量:住宅商品房平均销售价格(Y,元/平方米)。解释变量:房地产开发住宅投资额(X1,亿元),年末常住人口(X2,万人),在岗职工平均工资(X3,元),房地产开发企业住宅竣工房屋住宅面积(X4,万平方米)和随机误差项(C)。所选取2002~2019年各个变量的数据如图1所示。

Figure 1. Data on residential investment in real estate development from 2002 to 2019
图1. 2002~2019年房地产开发住宅投资额等数据
2.2. 散点图
通过Eviews软件分别做被解释变量(Y)与解释变量(X1, X2, X3, X4)的散点图(见图2~图5)。
从散点图可以看出,影响因素X1,X2和X3随着住宅商品房平均销售价格Y的上升而增加,且近似于线性关系。影响因素X4随着住宅商品房平均销售价格Y的上升呈现非线性关系。
2.3. 回归方程
运用Eviews的最小二乘法程序,输出的结果如图6所示。
由图6,得到的回归方程为
(2)
(1.386233) (0.570214) (−1.482637) (4.184236) (0.599594)
残差平方和为:Sum squared resid = 30067939
回归标准差为:S.E. of regression = 1520.828

Figure 6. Results of a multiple linear regression
图6. 一次多元线性回归结果
R2 = 0.977226,修正后的R2 = 0.970219,n = 18,df = 13,F = 139.4585。
2.4. 经济意义检验
由经济分析可知,住宅商品房平均销售价格(Y)与房地产开发住宅投资额(X1),年末常住人口(X2),在岗职工平均工资(X3)应呈现正相关关系,与房地产开发企业住宅竣工房屋住宅面积(X4)应呈现负相关关系。但是,多元回归模型中年末常住人口(X2)前的系数符号为负,证明成负相关关系,住宅竣工房屋住宅面积(X4)前的系数为正,证明成正相关关系,这与经济学意义不符合,故认为原模型存在错误,需要进行调整。
3. 检验与修正模型
3.1. 统计检验
由上述回归结果可知,可决系数R2与修正的可决系数的值都接近于1,表明模型的拟合度很高。在α = 0.05的显著性水平下,X3的t统计量值通过了显著性检验,X1,X4的P值分别为0.5783,0.5591,明显大于0.05,所以结果不显著。以上表明所建立的模型存在误差,需要进行修正。
3.2. 多重共线性检验
X1,X2,X3,X4的相关系数如图7所示。

Figure 7. Correlation coefficients of X1, X2, X3, X4
图7. X1,X2,X3,X4的相关系数
由图7可知,各相关变量相互之间的相关系数较高,所以存在严重的多重共线性问题,为了检验和处理多重共线性,采用修正Frisch法。
1) 对Y分别做关于X1,X2,X3,X4做最小二乘回归,得
(1) Y1 = −5531.093 + 14.90089X1
(−3.821173) (15.14270)
R2 = 0.934774,修正后的R2 = 0.930698,DW = 1.168786,F = 229.3015
(2) Y2 = −241207.0 + 181.8516X2
(32005.94) (22.72811)
R2 = 0.800047,修正后的R2 = 0.787550,DW = 1.597849,F = 64.01882
(3) Y3 = −1771.149 + 0.212164X3
(−2.247686) (23.56104)
R2 = 0.971985,修正后的R2 = 0.970234,DW = 1.356840,F = 555.1227
(4) Y4 = 32199.58 + −9.177489X4
(4.831704) (−2.714044)
R2 = 0.315245,修正后的R2 = 0.272448,DW = 0.294834,F = 7.366035
其中括号内的数字是t值,根据经济理论分析和回归结果易知X3是最重要的解释变量,所以选取第3个回归方程为基本回归方程。
2) 加入房地产开发住宅投资额X1,对Y关于X1,X3作最小二乘回归,得
Y = −1765.015 − 0.020812X1 + 0.212449X3
(−1.365081) (−0.006106) (4.463610)
R2 = 0.971985,修正后的R2 = 0.968250,DW = 1.356410,F = 260.2144
可以看出,在加入X1后,拟合优度R2增加不显著,修正后的R2有所减小,并且X1和X3系数均不显著说明存在严重的多重共线性,比较X1和X3,在岗职工平均工资比房地产开发住宅投资额对住宅商品房平均销售价格的影响大,所以在模型中保留解释变量X3略去解释变量X1。
3) 加入年末常住人口X2,对Y关于X2,X3作最小二乘回归,得
Y = 39497.99 − 31.00655X2 + 0.242639X3
(1.331686) (−1.391865) (10.29016)
R2 = 0.975189,修正后的R2 = 0.971881,DW = 1.423973,F = 294.7897
可以看出,在加入X2后,虽然提高了回归方程的拟合优度,使R2,修正后的R2均有所增加,但是X2参数估计值的符号为负,与实际经济情况不符。比较X2和X3,在岗职工平均工资比年末常住人口对住宅商品房平均销售价格的影响大,所以在模型中保留解释变量X3略去解释变量X2。
4) 加入房地产开发企业住宅竣工房屋住宅面积X4,对Y关于X3,X4作最小二乘回归,得
Y = −3533.812 + 0.217681X3 + 0.701439X4
(−1.530993) (19.17856) (0.813628)
R2 = 0.973169,修正后的R2 = 0.969592,DW = 1.496035,F = 272.0287
可以看出,在加入X1后,拟合优度R2增加不显著,修正后的R2有所减小,并且X4参数估计值的符号为负,与实际经济情况不符。比较X2和X3,在岗职工平均工资比房地产开发企业住宅竣工房屋住宅面积对住宅商品房平均销售价格的影响大,所以在模型中保留解释变量X3略去解释变量X4。
综上所述,得到Y关于X3的回归方程,运用Eviews的最小二乘法程序,输出的结果如图8所示。
Y = −1771.149 + 0.212164X3
(−2.247686) (23.56104)
R2 = 0.971985,修正后的R2 = 0.970234,DW = 1.356840,F = 555.1227
该模型中系数均显著,且符号正确,仅余一个解释变量,因此不再存在高度线性关系。也说明房地产开发住宅投资额,年末常住人口,与房地产开发企业住宅竣工房屋住宅面积不适合用来作为住宅商品房平均销售价格的解释变量。
3.3. 异方差分析
观察图8的残差ei取值,好像随X3的变化而变化,怀疑模型存在异方差性,接下来用怀特检验随机误差项的异方差性。
运用Eviews软件,输出的结果如图9所示。
因为式中只含有一个解释变量,所以White检验辅助回归式中应该包括两个解释变量。辅助回归式估计结果如下:
(−0.149376) (−0.257417) (0.568533)

Figure 8. Multiple linear regression results after model correction
图8. 模型修正后的一次多元线性回归结果
R2 = 0.138903,T = 18
因为TR2 = 18 × 0.138903 = 2.500254,且概率大于0.05,则拒绝原假设,表明模型中随机误差不存在异方差,不需要对模型异方差性修正。
3.4. 自相关检验
3.4.1. DW检验
对模型进行DW检验,因为T = 18,解释变量的个数为1,根据DW图表得到下限临界值dL = 1.16,dU = 1.39,DW = 1.356840,取值在(dL, dU)之间,这种检验没有结论,即不能判别u3是否存在一阶自相关。
3.4.2. LM检验
运用Eviews软件,输出的结果如图10所示。
可知nR2 = 2.10444 < 5.9915,并且概率值P远大于0.05,说明不存在自相关,不需要对模型进行修正。
4. 结论
上文首先构建被解释变量:住宅商品房平均销售价格(Y,元/平方米),解释变量:房地产开发住宅投资额(X1,亿元),年末常住人口(X2,万人),在岗职工平均工资(X3,元),房地产开发企业住宅竣工房屋住宅面积(X4,万平方米)和随机误差项(C)的多元线性回归模型,然后分别进行了经济意义检验和统计检验,发现该模型存在错误,需要调整。用Eviews软件对模型进行多重共线性检验,剔除不显著的影响因素后,对模型进行异方差分析和自相关检验,得到修正后的模型不需要进行异方差性修正和自相关性修正。
综上所述,可知最后建立的模型为
Y = −1771.149 + 0.212164X3
(−2.247686) (23.56104)
R2 = 0.971985,修正后的R2 = 0.970234,DW = 1.356840,F = 555.1227
该模型表示,当在岗职工平均工资每增加一元时,住宅商品房平均销售价格将上升0.212164元/平方米。
不足之处,本文所选取的住宅商品房平均销售价格影响因素较少,因试图将住宅商品房人均居住面积影响因素与住宅商品房平均销售价格影响因素比较,观察前者影响因素是否适用于后者,导致所选影响因素较为片面。诸多因素并未加以考虑,例如:狭义货币供应量,上海市区人均实际GDP,货币利率等等。
本文最终确定了影响住宅商品房平均销售价格的一个因素,即在岗职工平均工资,接下来根据所建立的最终模型给出相关的政策建议。
在岗职工平均工资是根据现行统计制度,城镇单位在岗职工工资统计范围包括国有单位、城镇集体单位、以及联营经济、股份制经济、外商投资经济、港澳台投资经济单位,尚未包括城镇的私营企业和个体工商户。而工资总额则是指这些单位在一定时期内直接支付给本单位全部职工的劳动报酬总额,包括计时工资、计件工资、奖金、津贴和补贴、加班加点工资、特殊情况下支付的工资,不论是否计入成本,也不论是以货币形式还是以实物形式支付,均包括在内。
国家调控房地产价格的手段不能只有提高在岗职工平均工资,因为当在岗职工平均工资提高时,住宅商品房平均销售价格也在提高,不能很好地解决住宅商品房平均销售价格过高的问题,应当从其他方面入手,如改变货币供应量等等。
致谢
这次基于Eviews软件的上海住宅商品房平均销售价格影响因素的研究分析,使我对Eviews软件如何制作散点图,运用最小二乘法做回归方程,并且对异方差、自相关性、多重共线性的检验如何操作,结果如何处理,有了更深一步的了解。同时,对上海住宅商品房平均销售价格影响因素有了初步的认识。感谢我的指导老师吴常群和给予我能够利用图书馆知网免费查询参考论文的学校。感谢给我提供诸多帮助的同学。