1. 绪论
1.1. 研究背景
基础设施是指“直接或间接地有助于提高产出水平和生产效率的经济活动,其基本要素是交通运输、动力生产、通讯和银行业、教育和卫生设施等系统,以及一个秩序井然的政府和政治结构”[1]。World Bank (1994)将基础设施分为经济性基础设施与社会性基础设施。其中,经济基础设施作为物质资本,直接参与生产过程,有利于提高社会生产能力,加快经济增长速度;社会基础设施水平的提高,有利于人力资本、社会资本、文化资本等的形成。是调整优化经济结构、改善投资环境、促进经济发展的基础[1]。通过查找相关文献[2]-[4],本文将“基础设施”用七个维度进行量化表示:道路交通、公共交通、供水排污、能源、公共设施、绿化环境、通信。
近年来,随着大数据和人工智能时代的到来,政府通过互联网、大数据、人工智能等技术的深度应用,有效支撑了传统基础设施的转型升级,涉及工业、交通、能源、通信、民生、环境、城市、农业农村等多个领域[5]。这些建设不仅提高了城乡发展品质,也是惠及民生的重要工程。
因此,本研究选择浙江省进行基础设施居民满意度及其影响因素调查研究,以期为政府提供政策制定的依据,从而促进当地基础设施建设。
1.2. 大数据与人工智能技术在研究中的应用优势
大数据源自信息技术的迅猛发展,表现为数据规模的庞大、增长速度的迅猛以及数据类型的多样性。人工智能(AI)技术,能够模仿人类思维过程,它利用大数据、先进算法和网络技术,具备感知、推理、学习和决策等能力,并能够实现特定目标的计算系统[6]。在近年来的应用实践中,大数据和人工智能之间紧密相连、深度融合[7]。
基于此,本研究选取大数据及人工智能技术,如Cite-space文献可视化、线性回归模型神经网络模型等方法,对浙江省基础设施居民满意度及其影响因素进行调查分析,找出隐藏在数据背后的规律和趋势,为深入了解居民需求、提升其满意度提供了科学、高效的手段,同时为决策和创新提供科学依据。
1.3. 研究目的及意义推进
城乡发展差距问题一直受到广泛关注,而基础设施建设是解决这一问题的重要手段。随着大数据与人工智能时代的到来,党和国家对基础设施的建设越发重视,大力推进传统基础设施向智能化、数字化转型升级。因此,本研究不仅有助于丰富基础设施建设的理论研究,而且对于指导实际工作,提高基础设施建设的质量和效益,具有一定的理论价值和重要的实践指导意义。
1.4. 研究方法
1.4.1. 定性分析
实地调查法:通过实地考察浙江省11市的基础设施建设情况,了解城乡发展差距现状,以及居民对基础设施的真实需求和满意度。
问卷调查法:本文结合文献设计了基础设施满意度及影响因素调查问卷,通过线上线下双渠道,向浙江省11市居民发放并收回问卷获得研究数据。
人物访谈法:通过与政府工作人员、普通居民的访谈,深入了解基础设施建设在政策制定和居民生活中的实际影响和感受。
1.4.2. 定量分析
文献可视化:对近二十年的中国基础设施建设领域研究论文进行分析,揭示学术研究的演进趋势和热点问题,在借鉴前人研究成果的基础上,构建了适用于本研究的理论基础和研究框架。
描述性统计分析法:完成对问卷、访谈数据的录入后,对单个变量及维度进行描述性统计,根据数据特征和数值汇总统计表直观反映调查对象基本情况及对基础设施建设的满意度现状。
统计分析方法:本文运用多元线性回归和BP神经网络模型对比分析居民对基础设施各维度满意度重要性感知,找出需要重点改善的区域为后期研究提升满意度的路径提供研究基础。
2. 文献研究
基础设施建设是一直是社会主义现代化建设的重要内容,是经济社会发展的重要支撑[8],主要包括道路、通讯、能源、水利等多个方面,是社会经济发展的基石,也是社会发展的前提条件[9]。通过多位学者的研究,我们了解到我国基础设施建设领域研究的现状和挑战,对我们洞悉其发展趋势、厘清其发展脉络具有重要意义[10]。在查阅大量文献后,文本以中国知识基础设施数据库(CNKI)的数据为基础,对中国基础设施建设和满意度研究领域的相关期刊和中国社会科学引文进行整理。
从宏观层面来看,存在影响居民对基础设施建设满意度的因素有很多。针对大力推进新型基础设施建设的现状,传统基础设施建设是近几年被忽略的对象。
与已有文献相比,本文可能的贡献在于:(1) 在研究数据层面,本文舍弃仅就基础设施的单一方向研究,而是结合宏观数据和问卷调查的微观数据,从多维度、多方向以浙江省举例探究基础设施建设的居民满意度情况。(2) 在研究内容上,国内学者更多是根据面板数据来从宏观层面和单一维度分析基础设施建设的情况,而本文更着重于对问卷调查的可视化数据分析。(3) 在分析方法上,本文创新型的引入了神经网络模型,更深入探究影响居民对基础设施建设满意度的相关因素。
3. 调查方案实施
3.1. 抽样设计
为了提高可信度,小组选取浙江省11个市,涵盖了浙江省的不同经济发展水平和地理特点。确认样本地目标后,接下来根据不同市常住人口数发放问卷进行样本量的确定。
为了使样本量更具科学性,本文取置信度为95%,最大允许误差为d = 5%,根据p = q = 0.5达到最大值计算初始样本量,得到的问卷数量为428.29份:
(1)
在此次线上预调查中,本文共发放了问卷50份,实际回收的有效问卷为48份,有效回收率r = 96%,根据回收率调整,确定最终样本为450份:
(2)
其中线下选取关键场所发放90份,线上在问卷星发放370份。根据最新数据,在浙江省下辖11个市,按常住人口比例发放问卷(370 × 该市常住人口比例),最终问卷分配结果如下:
1) 线下发放90份,选取每个市的至少6个关键场所,如下表1所示:
Table 1. Offline sample size distribution table
表1. 线下样本量分布表
时间 |
地点 |
预发问卷数 |
2025年1月25日 |
杭州菜市场 |
15 |
2025年1月26日 |
杭州大润发 |
15 |
2025年1月27日 |
丽水市图书馆 |
15 |
2025年1月28日 |
衢州市银泰百货广场 |
15 |
2025年1月29日 |
宁波市图书馆 |
15 |
2025年1月30日 |
温州市银泰百货商场 |
15 |
2) 线上问卷370份,问卷分配结果如下表2所示:
Table 2. Online sample size distribution table
表2. 线上样本量分布表
地区 |
地区常住人口(万人) |
抽样比(%) |
问卷数量 |
杭州市 |
1220.4 |
5.65 |
69 |
温州市 |
964.5 |
5.70 |
55 |
宁波市 |
954.4 |
5.66 |
54 |
金华市 |
712 |
5.62 |
40 |
台州市 |
666.1 |
5.70 |
38 |
嘉兴市 |
551.6 |
5.62 |
31 |
绍兴市 |
533.7 |
5.62 |
30 |
湖州市 |
340.7 |
5.58 |
19 |
丽水市 |
251.4 |
5.57 |
14 |
衢州市 |
228.7 |
5.68 |
13 |
舟山市 |
116.5 |
6.01 |
7 |
3.2. 问卷设计
本研究的调查问卷内容提纲如图1所示。
Figure 1. Survey questionnaire outline
图1. 调查问卷内容提纲图
3.3. 访谈设计
本文决定从道路交通、供水排污、能源基础建设、公共设施、城市绿化、通信基础五方面出发,多维度分析调研区域基础设施建设情况,对当地居民进行访谈。
3.4. 时间安排
本研究从2025年1月20日至2025年2月20日进行了问卷调查。
本研究于2025年1月20日至2025年2月20日对政府工作人员、居民、摊贩摊主、农民等进行访谈调查。
3.5. 回收统计
线下问卷回收统计都为有效问卷,线上问卷回收统计如表3所示。
Table 3. Questionnaire return statistics
表3. 问卷回收统计表
地区 |
回收份数 |
有效分数 |
有效率(%) |
杭州市 |
73 |
69 |
94.5 |
温州市 |
58 |
56 |
96.6 |
宁波市 |
57 |
55 |
96.5 |
金华市 |
43 |
41 |
95.3 |
台州市 |
42 |
38 |
90.5 |
嘉兴市 |
34 |
32 |
94.1 |
绍兴市 |
33 |
31 |
93.9 |
湖州市 |
23 |
19 |
89.6 |
丽水市 |
19 |
15 |
90.4 |
衢州市 |
16 |
14 |
87.5 |
舟山市 |
9 |
8 |
88.9 |
合计 |
408 |
379 |
92.8 |
小组共发放问卷(线上 + 线下) 408份,回收问卷408份,其中有效问卷379份,有效率为92.8%。
4. 数据质量控制
4.1. 基于问卷控制质量
4.1.1. 问卷设计
在进行问卷设计之前,小组成员通过查阅新闻、网上调查、了解当下基础设施建设政策、访问专家学者等方式详细了解浙江省基础设施建设的现状以及主要影响因素。
4.1.2. 问卷预调查
通过预调查的方法来测算正常认真完成问卷所需要的时长,并将该时长确定为筛选、剔除时长过短问卷的依据。
4.1.3. 问卷信效度分析
我们团队使用SPSS软件对问卷进行了信度和效度测试,如表4所示,Cronbach α系数约为0.9 (0.880),与内部数据较高相符,说明调查数据可靠,信度较好。
Table 4. Reliability analysis summary table
表4. 信度分析汇总表
可靠性统计量 |
数值 |
Cronbach’s Alpha |
0.880 |
观察表5,得到的KMO = 0.985非常接近于1,巴特利特球度检验结果P值 < 0.05,说明效度也可被接受,因此问卷的结构效度良好,此次问卷有效。
Table 5. Validity analysis summary
表5. 效度分析汇总
KMO取样适切性量数 |
0.985 |
Bartlett的球形度检验 |
近似卡方 |
37232.535 |
自由度 |
5151 |
显著性 |
0.000 |
4.2. 基于数据处理控制质量
通过对数据的处理控制结果在可接受范围内,将统计误差控制在可接受的置信区间内,保证统计数据的准确性,提高数据的质量,有助于本研究分析得出科学有价值的研究结果。
4.3. 基于调查的控制质量
4.3.1. 数据处理
本研究通过问卷星收集统计调查问卷,在处理数据方面采用统计软件SPSS、Excel等其他统计软件,对数据结果进行科学的分析、汇总,增加调查数据的准确性。
4.3.2. 问卷发放解释
在调查开始之前做好沟通工作,在与居民进行问卷填写时明确需要表达的内容,更准确的用词去说明问卷的内容,以保证填写的准确性。
5. 问卷描述性统计分析
根据问卷调查结果统计,本研究的问卷描述性统计分析如下表6所示。
Table 6. Descriptive analysis statistical table
表6. 描述性分析统计表
基本特征 |
样本分组 |
频数 |
百分比(%) |
基本特征 |
样本分组 |
频数 |
百分比(%) |
性别 |
男 |
186 |
45.59% |
教育背景 |
高中(职)及以下 |
58 |
14.22% |
女 |
222 |
54.41% |
大专 |
118 |
28.92% |
年龄 |
18岁以下 |
34 |
8.33% |
本科 |
207 |
50.74% |
18~25岁 |
174 |
42.65% |
硕士及以上 |
25 |
6.13% |
26~30岁 |
83 |
20.34% |
月工资收入 |
3000元以下 |
59 |
14.46% |
31~40岁 |
37 |
9.07% |
3001~5000元 |
234 |
57.35% |
|
41~50岁 |
40 |
9.8% |
|
5001~8000元 |
51 |
12.5% |
51~60岁 |
20 |
4.9% |
8001~10000元 |
46 |
11.27% |
60岁以上 |
20 |
4.9% |
10000元以上 |
18 |
4.41% |
职业 |
学生 |
31 |
7.6% |
|
|
|
|
专家学者 |
25 |
6.13% |
|
|
|
|
自由职业 |
28 |
6.86% |
|
|
|
|
企业员工 |
202 |
49.51% |
|
|
|
|
机关、事业单位 |
27 |
6.62% |
|
|
|
|
个体经营者 |
19 |
4.66% |
|
|
|
|
离休/退休 |
42 |
10.29% |
|
|
|
|
其他 |
34 |
8.33% |
|
|
|
|
6. 基于模型对比的满意度影响因素分析
6.1. 模型对比使用思路
BP神经网络是一种基于误差反向传播算法训练的多层前馈网络,由神经元的功能模拟而成[11],具有很强的非线性系统建模能力[12]。多层线性回归和BP神经网络都可以对影响因素进行分类。本研究使用这两种模型获得了重要性排序。
6.2. 基于多元线性回归的居民整体满意度影响因素分析
多元线性回归利用线性来拟合多个自变量和因变量的关系,从而确定多元线性回归模型的参数,回归至原假设方程中,通过回归方程来预测因变量的趋势[13]。同时,多元线性回归分析还有评定各个自变量对因变量影响相对重要性的功能。因此,本文基于多元线性回归对居民整体满意度的影响因素进行分析[14]。
6.2.1. 数据预处理
在原始数据中,量表答案为非数值型数据,因此对其进行独热编码处理,数据集如表7所示:
Table 7. Example of comment data
表7. 独热编码数据变换
|
一般 |
不太满意 |
不满意 |
比较满意 |
非常满意 |
1 |
0 |
0 |
1 |
0 |
0 |
2 |
0 |
1 |
0 |
0 |
0 |
3 |
1 |
0 |
0 |
0 |
0 |
4 |
0 |
0 |
0 |
1 |
0 |
5 |
0 |
0 |
0 |
0 |
1 |
6.2.2. 变量选取及模型构建
根据问卷设计以及对相关文献的研究总结,本文选取因变量为城市基础设施建设总体满意度(Y),自变量为道路交通(X1)、公共交通(X2)、供水排污(X3)、能源(X4)、公共设施(X5)、绿化环境(X6)、通信(X7),并构建多元线性回归模型如下:
(3)
6.2.3. 模型检验
使用SPSS 24.0进行多元线性回归分析,回归结果如表8所示:
Table 8. Table of linear regression analysis results of urban infrastructure construction satisfaction
表8. 城市基础设施建设满意度线性回归分析结果表
模型 |
非标准化系数 |
标准化系数 |
t |
P |
VIF |
容差 |
R2 |
调整
R2 |
F |
P |
B |
标准误差 |
Beta |
常数 |
0.214 |
0.067 |
- |
3.182 |
0.002 |
- |
- |
0.763 |
0.759 |
170.875 |
0.000 |
道路交通满意度 |
0.192 |
0.036 |
0.214 |
5.399 |
0.000 |
2.470 |
0.405 |
公共交通满意度 |
0.175 |
0.037 |
0.203 |
4.709 |
0.000 |
2.909 |
0.344 |
供水排污满意度 |
0.074 |
0.036 |
0.084 |
2.046 |
0.041 |
2.665 |
0.375 |
|
|
|
|
能源满意度 |
0.110 |
0.039 |
0.126 |
2.828 |
0.005 |
3.129 |
0.320 |
公共设施满意度 |
0.103 |
0.039 |
0.110 |
2.640 |
0.009 |
2.744 |
0.364 |
绿化环境满意度 |
0.111 |
0.038 |
0.121 |
2.902 |
0.004 |
2.742 |
0.365 |
通信满意度 |
0.152 |
0.039 |
0.164 |
3.903 |
0.000 |
2.751 |
0.363 |
根据上表8显示,在拟合度方面,R2越接近于1,表明回归方程对实际观测值的拟合度效果越好[15]。表中R2 = 0.763,即自变量可以解释因变量变化情况的76.3%,超过50%,可见回归拟合度达标。
在共线性方面,方差膨胀因子(VIF)的最大值为3.129,远小于10;容差最小值为0.320,大于0.100,说明回归方程不存在严重的多重共线性问题[16]。
在显著性方面,总显著性P为0.000 < 0.05,即回归方程整体显著[17]。其中,道路交通(β = 0.214, P = 0.000)、公共交通(β = 0.203, P = 0.000)、供水排污(β = 0.084, P = 0.041)、能源(β = 0.126, P = 0.005)、公共设施(β = 0.110, P = 0.009)、绿化环境(β = 0.121, P = 0.004)、通信(β = 0.164, P = 0.000)的回归系数均大于0,显著性均小于0.05,因此均显著正向影响居民城市基础设施建设整体满意度,并且按照影响程度从大到小排序依次是:道路交通 > 公共交通 > 通信 > 能源 > 绿化环境 > 公共设施 > 供水排污。
6.3. 基于BP神经网络的满意度影响因素分析
6.3.1. 神经网络结构
BP神经网络为误差反向传播神经网络,它是一种含有隐含层的前馈网络,其通常由输入层、输出层和隐含层构成,层与层之间的神经元采用全互联的连接方式[18],其结构图见图2所示。
6.3.2. 算法学习与模型训练
神经学习是逐步调整神经元之间的权重以实现给定目标的过程。这一过程使用误差反向传播算法(Back-Propagation algorithm, BP),如图3所示。神经网络从训练经验中获取数据集,然后通过各层反向传播数据,从输入层到隐藏层[19]。
Figure 2. Neural network structure diagram
图2. 神经网络结构图
Figure 3. Neural network error back propagation algorithm
图3. 神经网络误差反向传播算法
训练集主要是用于模型的拟合。验证集主要用于调整模型的超参数,并对模型的性能进行初步评估[20]。采用神经网络模型分析各因素对总体基础设施满意度情况,通过对目标数据设置训练集与检验集比例反复调试,得到下列正确百分比。
Table 9. Table of analysis results of neural network model of urban infrastructure construction satisfaction
表9. 城市基础设施建设满意度神经网络模型分析结果表
分类 |
样本 |
实测 |
预测 |
1.0 |
2.0 |
3.0 |
4.0 |
5.0 |
正确百分比 |
训练 |
1.0 |
17 |
63 |
0 |
0 |
0 |
81.3% |
2.0 |
3 |
87 |
3 |
0 |
1 |
92.6% |
3.0 |
2 |
38 |
5 |
0 |
9 |
91.3% |
4.0 |
0 |
2 |
1 |
0 |
12 |
80.0% |
|
5.0 |
0 |
0 |
0 |
0 |
30 |
100.0% |
总体百分比 |
8.1% |
59.6% |
3.3% |
10.0% |
19.0% |
90.9% |
检验 |
1.0 |
6 |
38 |
0 |
0 |
0 |
53.6% |
2.0 |
1 |
41 |
1 |
0 |
0 |
95.3% |
3.0 |
0 |
19 |
3 |
0 |
10 |
79.4% |
4.0 |
0 |
1 |
1 |
0 |
6 |
95.0% |
5.0 |
0 |
0 |
0 |
0 |
8 |
100.0% |
总体百分比 |
5.2% |
53.3% |
3.7% |
20.0% |
17.8% |
92.0% |
训练集与检验集总体正确百分率分别为0.909 > 1和0.92 > 1,如表9所示。这说明该神经网络模型进行重要程度排序的能力较为良好。
6.3.3. 模型应用
影响基础设施建设整体满意度的指标有7个,即道路交通,公共交通,供水排污,能源,公共设施,通信,环境绿化,将数据集导入训练好的模型中,通过IBM SPSS Statistics 27分析,导出结果如表10。
Table 10. Independent variable importance results table
表10. 自变量重要性结果表
自变量重要性 |
|
重要性 |
标准化系数 |
道路交通满意度 |
1 |
0.209 |
公共交通满意度 |
2 |
0.173 |
供水排污满意度 |
3 |
0.150 |
通信满意度 |
4 |
0.140 |
绿化环境满意度 |
5 |
0.116 |
能源满意度 |
6 |
0.107 |
公共设施满意度 |
7 |
0.105 |
各因素对总体基础设施满意度的影响程度最大的为道路交通总满意度和公共交通满意度,交通满意度在影响总体基础设施满意度中具有最高的重要性。这表明交通的质量和便利性对居民的满意度有着至关重要的影响。影响基础设施建设整体满意度的指标按影响程度从大到小排序依次是:道路交通 > 公共交通 > 污水排污 > 通信 > 绿化环境 > 能源 > 公共设施。
6.4. 模型对比
多元线性回归模型简单直观,适用于探讨线性关系,而神经网络模型可以处理非线性关系,并且在处理大规模数据和复杂关系时表现更加出色。下图4和图5分别为线性回归得出的满意度重要性排序和神经网络模型得出的满意度重要性排序。
Figure 4. Linear regression importance ranking
图4. 线性回归重要性排序
Figure 5. Neural network importance ranking
图5. 神经网络重要性排序
通过对比分析结果显示:无论是多元线性回归还是神经网络模型,道路交通满意度和公共交通满意度在排名上具有较高的重要性。这表明,当居民对交通的质量、便利性和可靠性感到满意时,他们更有可能对居住环境感到满意。
7. “CISM”建议体系
城市基础设施指的是在城市发展过程中,以及居民在生产、生活中所必需的基础设施,综合上述数据分析的结果,基于上述研究创新地提出“CISM”建议体系。
7.1. Coordination:各类基建协调发展,城乡区域协调发展
基础设施建设是城乡发展的关键,需确保各类基建协调发展,促进城乡均衡。政府应加强政策引导,鼓励民间投资,共同推动城乡一体化,实现全面小康目标。
7.2. Innovation:创新引领基建发展,创新赋予发展动力
创新是基础设施建设的动力,以创新引领基建发展。技术、管理和制度创新提升质量和效益,智能化提高资源利用效率,降低成本。政府鼓励科技企业和资本加大投入,推动基础设施创新发展,注入新动力。
7.3. Sustainability:贯彻可持续发展理念,提升可持续发展手段
浙江正向安全先进的计算基础设施迈进,是实现先进目标的必由之路。我们需齐心协力,实现数据中心的集约化和规模化部署,发展人工智能和区块链技术,构建可靠的计算和数据安全网络。部署数据中心时,确保区域发展均衡,提升集约化运营水平,建设多层次的计算基础设施。全面推动数字智慧能源综合基础设施建设,助力智能治理、智能交通、网络化能源等发展,提升能源供应水平。
7.4. Masses:全心全意满足群众要求,踏踏实实听取群众声音
公众参与是基础设施建设中不可或缺的一环,直接关系到民众的利益诉求和项目的顺利实施。浙江省政府应该积极扩大公众参与渠道,广泛听取各阶层、各群体的意见和建议,确保多方参与、多角度反馈。政府必须及时了解公众的观点和反应,持续改进基础设施建设决策,以确保项目的公平性和可持续性。
项目基金
2024年国家级大学生创新创业训练计划项目(248519021)。