基于网络数据对沈阳市商品住宅价格指数预测的分析
Research on the Prediction and Regulation Mechanism of Shenyang Commercial Housing Price Index Based on Network Data
摘要: 本文利用NLPIR语义系统提取文本信息并进行扩充分析,构造网络搜索关键词词库;再利用相关系数等对收集数据预处理与筛选形成最终词库,利用词库数据构建主成分分析和回归分析的组合模型,利用模型对沈阳市新建商品住宅的月度价格指数进行预测,并根据构造词库对沈阳市商品住宅的调控机制进行相关分析。
Abstract: This paper uses the NLPIR semantic system to extract text information and expand the analysis, construct the network search keyword word bank; uses the correlation coefficient to pretreatment and screen the collected data, uses the word bank data to build a combination model of principal component analysis and regression analysis, predicts the monthly price index of new commercial housing in Shenyang, and analyzes the regulation mechanism of Shenyang commercial housing according to the construction word base.
文章引用:赵梦瑶, 陈兵. 基于网络数据对沈阳市商品住宅价格指数预测的分析[J]. 地理科学研究, 2024, 13(5): 892-901. https://doi.org/10.12677/gser.2024.135084

1. 引言

随着科技发展,网络加深了生活中的联系,网络搜索数据现如今也普遍应用于各行各业,新闻类、商务交易类、娱乐类、房地产类等。房地产行业是我国经济高速发展的重要组成部分,与人民群众的安居问题关系十分密切,同时合理的房地产价格是社会和谐和民生稳定的保障。随着搜索引擎功能程序的不断完善,人们对于房地产市场环境的了解乃至购买途径逐渐发生了改变。

网络搜索数据与房地产市场的研究起步较晚,国内外研究如下:里尊妮娜等人探索根据谷歌趋势搜索量指数(SVI)的互联网搜索强度是否是房地产价格变化的预测指标[1];布莱·吉勒姆等人比较了从十个网站得出的财产估算和从中央国家税务服务数据库计算的房地产价格,以分层抽样60个法国城市,对用于绘制当地房地产价格的Web数据质量进行了统计分析[2];张娟选取与房地产价格相关度较高的7个关键词构建综合网络搜索指数,运用自回归滞后模型对房地产价格指数进行拟合与预测,得到房地产价格指数预测模型,并进行了验证和预测[3];房地产评估容易因主观性过强出现估价误差,基于此毛胜波将网络搜索指数应用于房地产批量估价中,通过对关键词进行筛选,构造网络搜索指数,以提高房地产估价的精度[4];张大力通过文本提取获取关键字并进行拓展和筛选,再利用随机森林递归消除进行筛选,并根据筛选出的关键字建立随机森林模型来进行分析和预测[5];杨树新等人尝试构建网络搜索数据与房地产价格指数之间的关系框架,通过皮尔逊相关系数法选取关键词,探讨房屋价格指数与提前几个月搜索指数的相关性最大等研究[6]-[8]

当前国内对房地产价格指数的研究而言:①研究网络搜索数据与房地产价格之间关系的论文较少;②初步确定的关键词信息来源不准确,大多源于主观判断;③部分研究在筛选网络搜索关键词进行房地产价格研究的预测,只考虑到相关性或者滞后性两者其一;④缺乏针对论文研究区域所做出的相应调控机制研究。本篇文章结合最终词库的相关数据,利用主成分与回归相结合进行分析,综合优点如下:可以更好概述数据之间的关系;解决回归分析中共线性问题;在考察变量间相关性的同时,保留原始数据达到降维目的;能构建出重要变量替代原始数据的主成分及原始变量的线性组合,提高了模型的性能。

2. 变量描述与模型构建

2.1. 理论基础

就用户规模分析,截至2023年12月,我国网民规模达10.67亿,互联网普及率已达75.6%,2023年中国搜索引擎市场份额中百度占比83.4%,作为搜索头部企业代表的百度在2023年第一季度百度APP平均月活用户达到6.32亿,因此本篇文章对于关键词指数的检索采用百度指数平台。房地产市场在很多方面与其他市场不一样,其最大的特征是信息极不对称。网络搜索直接反映了其用户的行为与心理活动,而关键词的提取对社会经济发展趋势有着一定的指示作用。通过网络搜索,可以帮助消费者获得时效性与真实性较高的消息资料,也能为房地产开发商提供消费者的预期与偏好,国家及地方相关部门也能从而根据其经济行为制定相应政策,协调市场的供求关系。

2.2. 研究对象与数据变量介绍

(1) 研究对象

据国家统计局公布数据,本篇文章选取了沈阳市新建商品住宅价格指数2016年1月至2023年12月共96个月的同比月度数据。如表1所示:

Table 1. Year-on-year monthly data of Shenyang commercial housing price index from 2016 to 2023

1. 2016~2023年沈阳市商品住宅价格指数的同比月度数据

月份/年份

2016

2017

2018

2019

2020

2021

2022

2023

1

99.5

103.2

111.4

112.2

109.2

105.8

101.2

95.0

2

99.6

104.1

112.1

112.3

109.2

105.1

100.6

95.4

3

100.1

105.1

111.4

112.7

108.7

105.1

100.0

96.2

4

101.0

106.1

110.3

112.5

108.8

104.9

99.2

96.6

5

101.8

107.6

110.0

111.7

108.8

104.7

98.2

97.0

6

101.5

109.0

109.8

111.3

108.7

104.5

97.6

96.6

7

101.4

109.8

110.3

110.5

109.0

104.2

96.8

96.4

8

101.2

110.3

111.0

110.1

109.2

103.4

95.8

97.3

9

101.6

110.7

111.7

109.7

108.2

103.3

95.5

97.8

10

102.4

111.0

112.7

109.4

106.8

103.1

95.2

98.3

11

102.6

111.7

112.6

109.3

106.0

102.8

94.9

98.3

12

103.3

111.5

112.7

109.3

105.0

102.7

94.8

98.7

(2) 解释变量

本文确定研究地区为沈阳市,搜集了以下房地产中介网站的房地产快讯、房地产知识、房地产问答等相关文本信息,包括房天下(https://sy.fang.com)、安居客(https://sy.anjuke.com)等。同时也在以下新闻平台中搜索相关热点信息和新闻文章,包括腾讯房产(https://sy.house.qq.com)、网易房产(https://sy.house.163.com)等。对于所搜集的新闻、论坛等信息进行汇总,对于房产问答部分将网址录入,使用NLPIR语义系统进行关键词的提取,再利用百度需求图谱、主观经验进行补充。综合考虑多种因素,最终确定7个核心关键词:最终确定了房价、楼盘、房贷、公积金、房地产、政策、买房七个核心关键词。

考虑到政治与社会因素,可拓展出“买房政策”、“货币政策”与“财政政策”等有关的关键词;考虑到热门楼盘因素,可拓展出“万科”、“中海”、“碧桂园”等有关的关键词。通过二次搜索、长尾关键词以及理论分析对于初选关键词词库的拓展,形成了29个衍生关键词,7个核心关键词,共计36个,共同构成了网络搜索关键词词库,见表2

Table 2. Network keyword thesaurus

2. 网络关键词词库

核心关键词

衍生关键词

关键词个数

房价

沈阳房价、沈阳房价走势、房价上涨、房价下跌

5

楼盘

沈阳楼盘、沈阳地铁、楼盘网、沈阳二手房、学区房、万科、中海、碧桂园

9

房贷

房贷利率、房贷计算机、第二套房贷

4

公积金

住房公积金、公积金贷款、个税起征点、个人所得税

5

房地产

沈阳房地产、房地产信息网、房地产税

4

政策

买房政策、货币政策、财政政策

4

买房

房屋产权、购房合同、买房注意事项、房屋买卖协议

5

(3) 数据描述

本文选取了网络搜索关键词词库2015年1月至2023年12月共计108个月的百度指数搜索量,其中2015年数据的统计是为了对2016年月份数据进行同比处理。2016年后84个月度作为样本数据进入模型,2023年1至12月共12个月度用于检验模型预测效果。由于国家统计局公布出的房地产价格指数均为同比月度数据,因此也需要对关键词百度指数搜索量进行同比处理。

对于关键词中含“沈阳”的关键词搜索范围定为“全国”,对于不含“沈阳”的关键词搜索范围定为“辽宁–沈阳”。由于新建商品住宅价格指数是同比月度数据,为了数值的相对一致性,对于关键词84个月的网络搜索量进行同比处理。以关键词“沈阳楼盘”为例,其百度指数网络搜索处理后同比数据见下表3

Table 3. Monthly data of Baidu Index of “Shenyang Real Estate” in 2016~2023

3. 2016~2023年“沈阳楼盘”网络搜索百度指数同比月度数据

月份/年份

2016

2017

2018

2019

2020

2021

2022

2023

1

104.6

103.5

90.7

90.2

67.0

111.5

77.9

103.5

2

117.4

120.4

69.8

101.9

78.5

85.1

102.8

92.5

3

114.6

118.6

71.1

98.3

80.2

87.9

88.8

76.8

4

100.4

134.5

76.3

95.0

73.4

88.7

95.3

79.6

5

106.3

106.7

98.5

87.3

74.8

77.7

111.8

66.4

6

147.0

73.9

115.1

81.0

68.1

81.9

109.9

50.7

7

142.6

73.1

114.6

69.3

80.6

92.4

101.4

57.4

8

179.1

53.8

109.2

79.8

81.3

84.7

108.3

59.0

9

168.1

57.7

107.1

77.2

88.7

79.4

106.9

68.6

10

136.1

71.8

113.5

71.0

85.5

75.2

122.6

59.6

11

129.6

74.3

113.7

80.7

77.7

83.6

118.9

53.1

12

120.0

73.5

123.2

113.4

56.1

72.4

120.9

43.6

3. 变量筛选

考虑到所研究关键词同比月度指数与沈阳市新建商品住宅价格指数同比数据的相关性,网络搜索数据与房地产价格均为时间序列数据,只有搜索关键字领先于房地产价格的关键词才具有研究价值,因此变量筛选过程需要考虑以上两个方面。

(1) 相关系数计算:本篇文章采用斯皮尔曼相关性分析,关键词同比指数作为变量X,房地产价格指数为变量Y。利用SPSS计算斯皮尔曼相关系数,筛选出关键词相关系数绝对值大于0.2且p值小于0.05的关键词。

(2) 时差相关分析使用的数学表达式为:

r l = i=1 n ( x il x ¯ )( y i y ¯ ) i=1 n ( x il x ¯ ) 2 i=1 n ( y i y ¯ ) 2 (1)

式中rl为滞后期,i为期数,时间序列yi为第i期沈阳市新建商品住宅房地产价格指数, y ¯ 为新建商品住宅房地产价格指数平均值,时间序列xi为某个关键字的搜索数据,xil为第il期的关键词数据, x ¯ 为有关房地产搜索数据平均值;l为时差数。考虑到现实需求,买房需求产生到做出决策大约是在两个季度内完成,关键字领先值l最多为8期。具体分析见表4

Table 4. Timely and poor analysis table of keyword correlation

4. 关键词相关性及时差分析表

关键词

相关系数及p值

滞后期

关键词

相关系数及p值

滞后期

楼盘网(X9)

相关系数0.272*

−1

房地产信息网(X26)

相关系数−0.493**

0

p值0.007

p值0.000

学区房(X11)

相关系数0.503**

−3

房地产税(X27)

相关系数0.335*

0

p值0.000

p值0.001

中海(X13)

相关系数0.691**

0

政策(X28)

相关系数0.351**

−4

p值0.000

p值0.000

房贷(X15)

相关系数0.395**

−4

买房政策(X29)

相关系数0.242*

0

p值0.000

p值0.018

房贷计算器(X17)

相关系数0.256*

0

货币政策(X30)

相关系数0.540**

0

p值0.012

p值0.000

第二套房贷(X18)

相关系数0.237*

0

财政政策(X31)

相关系数0.369**

−7

p值0.02

p值0.000

公积金(X19)

相关系数0.542**

−2

房屋产权(X33)

相关系数0.207*

−8

p值0.000

p值0.043

个税起征点(X22)

相关系数0.224*

0

购房合同(X34)

相关系数0.337**

−5

p值0.028

p值0.001

房地产(X24)

相关系数−0.225*

−4

房屋买卖协议(X36)

相关系数0.227*

−1

p值0.027

p值0.026

研究表明相关系数绝对值大于0.2且p值小于0.05的关键词有X9、X11、X13、X15、X17、X18、X19等18个。分析如下:Y和X9之间的相关系数值为0.272,并且呈现出0.01水平的显著性,因而说明Y和X9之间有着显著的正相关关系等。同时,通过沈阳市新建商品住宅房地产价格指数与多个时间滞后期中不同关键字之间相关系数的计算,发现大部分关键字的最佳滞后期落在0到−8的区间内,显示搜索关键字的变化与房价动态之间存在时间序列上的领先关系。关键字X9、X11、X15、X19等在房价变动上表现出显著的时间领先性,其最佳滞后期包含−1、−2、−3、−4、−5、−7和−8。此外,关键字X13、X17、X18、X22、X26、X27、X29和X30显示出与房价变化的同步性,其最佳滞后期均为0,表明这些搜索关键字的变化可能与房价变化几乎同步,反映出市场对房价即时变动的反应。考虑到现实需求,买房需求产生到做出决策大约是在两个季度内完成,关键字领先值l最多为8期,因此仅对关键词关键字X9、X11、X15、X19、X24、X28、X31、X33、X34和X36进行主成分分析。

4. 实证分析

本篇文章先采用主成分分析法对关键词进行降维,为新建商品房屋住宅的价格指数预测做好前提工作。通过主成分分析得到一定维度,将得到的成分得分进行命名,作为线性回归的自变量,沈阳市新建商品住宅房地产价格指数作为因变量来进行回归分析,并进行对结果描述,回归结果描述分为两大部分,一为中间分析过程,二为回归分析结果。本节主要目的是研究上述一定维度对于沈阳市新建商品住宅房地产价格指数(Y)的影响,最终得到结论。

(1) 主成分分析

数据变量标准化,判断是否能够进行主成分分析

主成分分析探索定量数据包括分析KMO值(检验统计量是用于比较变量间简单相关系数和偏相关系数的指标)及Bartlett检验分析两个方面:常用的标准是KMO值大于0.6或0.7时可以认为数据可行,值越高表示数据集中的变量之间的相关性越强,因而适合进行因素分析等方法的分析。定量数据分析见表5

Table 5. Quantitative data from the principal component analysis

5. 主成分分析定量数据

KMO值

0.746

Bartlett球形度检验

近似卡方

406.474

df

45

p值

0.000

从上表可以看出:KMO值为0.746,大于0.6,满足主成分分析的前提要求,意味着数据可用于主成分分析研究。以及数据通过Bartlett球形度检验(p < 0.05),说明研究数据适合进行主成分分析。

②计算相关系数矩阵

Table 6. Chart of correlation coefficient between keywords

6. 关键词之间相关系数图表

变量

X9

X11

X15

X19

X24

X28

X31

X33

X34

X36

X9

1

0.24

0.198

0.49

−0.094

0.23

0.041

−0.129

0.155

0.447

X11

0.24

1

0.464

0.626

−0.079

0.462

0.355

0.242

0.56

0.559

X15

0.198

0.464

1

0.688

0.189

0.467

0.387

0.335

0.519

0.471

X19

0.49

0.626

0.688

1

0.163

0.475

0.417

0.171

0.56

0.692

X24

−0.094

−0.079

0.189

0.163

1

0.185

0.15

0.006

−0.073

0.17

X28

0.23

0.462

0.467

0.475

0.185

1

0.431

0.283

0.404

0.272

X31

0.041

0.355

0.387

0.417

0.15

0.431

1

0.111

0.146

0.116

X33

−0.129

0.242

0.335

0.171

0.006

0.283

0.111

1

0.485

0.165

X34

0.155

0.56

0.519

0.56

−0.073

0.404

0.146

0.485

1

0.592

X36

0.447

0.559

0.471

0.692

0.17

0.272

0.116

0.165

0.592

1

相关系数矩阵展示研究项两两之间的相关关系情况:

(1) 如果某项与其余项之间的相关系数值过低(比如小于0.2),意味着其可能对信息浓缩帮助较小,可以考虑对其进行删除,以提高KMO值表现等;

(2) 如果某项与其余项之间的相关系数值过高(比如大于0.8),意味着信息重叠性过高,可以考虑对其进行删除后再次分析。关键词之间的相关性关系见表6

可以发现变量X24 (房地产)与其余项之间的相关系数均低于0.2,为提高KMO值表现,将该变量删除后重新进行主成分分析。删除变量X24后KMO值为0.81,满足主成分分析的前提要求,且通过Bartlett球形度检验(p < 0.05),说明研究数据非常适合进行主成分分析。

权重计算及确定主成分

贡献率反应的是某个因子相对的影响大小,它对应的是相关矩阵的特征值:特征值越大,贡献率越大。主成分的确认可以就以下三方面进行分析:总方差表累积贡献率理想状态为80%~85%,市场研究中达到50%尚可;特征值大于1,说明该主成分解释力度适宜;同时碎石图也能够更直观地展现因子数量和特征值。以上标准同时符合要求,最终确定了3个主成分,它们对应的加权后方差解释率即权重依次为:45.902/72.88 = 62.98%;14.779/72.88 = 20.28%;12.199/72.88 = 16.74%。权重计算和主成分确定见下表7

Table 7. Weight calculation table of the relative coefficient

7. 相对系数的权重计算表

编号

成分变量

主成分提取

特征根

方差解释率

累积

特征根

方差解释率

累积

1

4.131

45.902

45.902

4.131

45.902

45.902

2

1.33

14.779

60.681

1.33

14.779

60.681

3

1.098

12.199

72.88

1.098

12.199

72.88

4

0.64

7.115

79.995

-

-

-

5

0.56

6.225

86.22

-

-

-

6

0.447

4.966

91.186

-

-

-

7

0.335

3.724

94.91

-

-

-

8

0.278

3.088

97.999

-

-

-

9

0.18

2.001

100

-

-

-

④荷载系数分析

Table 8. Load factor table

8. 荷载系数表

编号

载荷系数

共同度(公因子方差)

主成分1

主成分2

主成分3

X9

0.429

−0.734

0.006

0.723

X11

0.777

0.002

0.005

0.603

X15

0.775

0.14

0.08

0.627

X19

0.88

−0.238

0.077

0.838

X28

0.661

0.198

0.342

0.593

X31

0.475

0.23

0.74

0.827

X33

0.407

0.681

−0.373

0.769

X34

0.759

0.204

−0.416

0.79

X36

0.751

−0.342

−0.329

0.789

从上表8可知:所有研究项对应的共同度值均高于0.4,意味着研究项和主成分之间有着较强的关联性,主成分可以有效的提取出信息。

⑤计算主成分

Table 9. The linear combined coefficient matrix

9. 线性组合系数矩阵

编号

成分

成分1

成分2

成分3

X9

0.211

−0.637

0.005

X11

0.382

0.001

0.005

X15

0.382

0.121

0.076

X19

0.433

−0.207

0.074

X28

0.325

0.171

0.327

X31

0.234

0.199

0.707

X33

0.2

0.591

−0.356

X34

0.373

0.177

−0.397

X36

0.37

−0.296

−0.314

结合表9的特征向量以及标准化变量等分析,得到综合评价值,写出最终的主成分计算公式:

PC1=0.211X9+0.382X11+0.382X15+0.433X19+0.325X28 +0.234X31+0.200X33+0.373X34+0.370X36 (2)

PC2=0.637X9+0.001X11+0.121X150.207X19+0.171X28 +0.199X31+0.591X33+0.177X340.296X36 (3)

PC3=0.005X9+0.005X11+0.076X15+0.074X19+0.327X28 +0.707X310.356X330.397X340.314X36 (4)

(2) 回归模型建立

数据通过主成分分析得到3个维度,将得到成分得分进行命名,3个分析项作为线性回归的自变量,进行回归分析和结果描述。

Table 10. Variable analysis table

10. 变量分析表

平方和

df

均分

F

p值

回归

804.294

3

268.098

11.085

0.000

残差

2225.169

92

24.187

总计

3029.462

95

从上表10可知回归方程的显著性检验中,统计量F = 11.085,对应的p值远小于0.05,说明模型通过F检验即PC1-,PC2-,PC3-中至少一项会对Y产生影响关系,被解释变量的线性关系是显著的,可以建立模型,还需要进一步查看模型的共线性问题(见下表11)。

Table 11. Correlation analysis of the multiple linear regression models

11. 多元线性回归模型的相关分析

编号

非标准化系数

标准化系数

t

p

共线诊断

B

标准误差

Beta

VIF

常数

104.83

0.502

-

208.85

0.000**

-

PC1-

1.365

0.248

0.491

5.5

0.000**

1

PC2-

0.1

0.438

0.02

0.229

0.82

1

PC3-

0.828

0.482

0.154

1.72

0.089

1

R2

0.265

调整R2

0.242

F

F (3, 92) = 11.085, p = 0.000

*p < 0.05 **p < 0.01.

VIF值用于检测共线性问题,从上表可知,变量的VIF值均小于5,不存在多重共线性问题;标准化系数(Beta)值的大小可以比对影响大小,由上表可得PC1、PC2、PC3均对沈阳市新建商品住宅房地产价格指数产生显著的正向影响关系。模型公式为:Y = 104.830 + 1.365*PC1 + 0.100*PC2 + 0.828*PC3。

(3) 模型预测分析

结合主成分计算及回归后模型公式可以求得2016年至2023年各月份的综合得分以及房地产价格指数的预测值,同时得出模型对于长期和短期性能表现。评估模型性能是确保模型对数据的拟合和预测能力良好的重要步骤。本篇文章利用MAE (平均绝对误差)、RMSE (均方根误差)以及MAPE (平均绝对百分比误差)对模型效果进行检验,能够直观衡量预测值与真实值之间的偏差度,且对异常值较为敏感,数据指标越小,模型效果越好,公式如下(其中yi为实际值, y ¯ i 为预测值,n为样本总数):

MAE= 1 n i=1 n | y i y ¯ i | (5)

RMSE= 1 n i=1 n ( y i y ¯ i ) 2 (6)

MAPE= 100% n   i=1 n | y i y ¯ i y i | (7)

房地产估价误差允许范围为±10%,从下表12可得模型对于长期预测的误差率为3.74%,短期预测的误差率为8.13%,由下表得出利用网络搜索数据并结合主成分和回归分析,能够对沈阳市新建商品住宅的价格指数有较好的预测,有一定的先行性。

Table 12. Model error analysis

12. 模型误差分析

模型

2016~2023年数据

2020~2023年数据

2023年数据

PCA-MLR

MAE

RMSE

MAPE

MAE

RMSE

MAPE

MAE

RMSE

MAPE

3.89

4.98

3.74%

4.70

5.66

4.71%

5.86

7.27

8.13%

5. 结语

本文结合消费者行为模式的实践基础,建立了网络搜索行为与房地产的理论研究框架,结合网络搜索数据建立的预测模型能够较好地预测,且基于模型对于长期预测的误差率为3.74%,短期预测的误差率为8.13%,满足了房地产估价的允许范围,说明基于大数据技术下将网络搜索数据运用到宏观经济指标的预测研究中,具有一定的合理性和预测的有效性,同时基于相同的预测方法,该模型还可推广到其他宏观指标相关预测研究中。基于百度指数建立的特定区域关键词词库,可以对该区域房地产调控有所帮助,对于本文的研究对象沈阳市必须要考虑到政策的长期性以及稳定性,同时也要注重供给侧改革,相关制度包括土地供应、租赁并举住房制度、房地产税等。从历年的调控政策来看,如限购限贷等,当市场出现波动时,短期内作用效果明显,当市场回归平稳时,政策便放宽;长效机制侧重于政策的长期性稳定性以及连续性,有助于市场长期稳定发展,例如完善土地供应体系、完善土地供应体系、住房体系的完善与创新、加强对房地产金融监管等等。

参考文献

[1] Rizun, N. and Baj-Rogowska, A. (2021) Can Web Search Queries Predict Prices Change on the Real Estate Market? IEEE Access, 9, 70095-70117.
https://doi.org/10.1109/access.2021.3077860
[2] Boulay, G., Blanke, D., Casanova Enault, L. and Granié, A. (2020) Moving from Market Opacity to Methodological Opacity: Are Web Data Good Enough for French Property Market Monitoring? The Professional Geographer, 73, 115-130.
https://doi.org/10.1080/00330124.2020.1824678
[3] 张娟. 基于网络搜索数据的河北省房地产价格预测研究[J]. 合作经济与科技, 2017(18): 70-73.
[4] 毛胜波. 基于信息技术的房地产批量估价方法研究——以某住宅类房地产项目为例[J]. 房地产世界, 2023(1): 58-61.
[5] 张大力, 林大川, 郑一帆. 基于网络搜索数据与随机森林模型的市场研究——以温州市商品住宅市场为例[J]. 现代信息科技, 2022, 6(5): 134-137.
[6] 杨树新, 董纪昌, 李秀婷. 基于网络关键词搜索的房地产价格影响因素研究[J]. 新疆财经大学学报, 2013(3): 5-12.
[7] 陈思宏, 刘紫仪. 基于网络爬虫的住宅型房地产评估测评系统[J]. 商业经济, 2020(5): 139-141.
[8] 邵为爽, 李晓红, 张天抒, 王焱. 数据挖掘在房地产价格预测中的应用研究[J]. 数学的实践与认识, 2020, 50(5): 306-311.