1. 引言
近年来,中国深入实施网络强国战略、国家大数据战略,着力推动公共服务数字化,提出要持续提升公共服务数字化水平,促进公共服务更加普惠均等,发展智慧社会。数字化公共服务在现代城市管理中扮演着至关重要的角色。
而杭州市作为中国改革开放的先行者之一,在经济与社会发展方面取得了显著成就,同时杭州市政府也高度重视数字化公共服务建设。2016年,杭州在全国率先建设“城市大脑”;2018年,开始打造“移动办事之城”,办事变得像网购一样方便;2019年至今,“城市大脑”从“数字治堵”走向“全面治城”“精准治疫”……“数字改变生活”在杭州这座常住人口超千万、实际管理人口超1600万的城市,不再只是一句简单的口号,而是老百姓心中的切身感受。“数字”不仅擦亮了杭州“人间天堂”的幸福美好底色,也书写着这座城市高水平全面小康的时代答卷。
思考目前杭州市数字赋能公共服务有哪些路径,以及我们该如何针对市民的感受和需求去优化数字化公共服务的路径,是我们这篇文章的核心。
2. 文献综述
先前许多专家学者在数字赋能公共服务优化路径方面进行了深入探究,王林霞(2022)针对数字政府建设中面临的困境,从顶层架构、需求侧改革、运营模式创新、数据资源管理、信息安全防控五个方面提出持续优化的路径选择[1]。陈长英(2023)提出了南宁市公共交通数字化转型、公共交通数字化基础设施建设、公共交通补偿机制、居民参与管理等四个方面的公共交通服务质量优化路径[2]。周仁标等(2024)提出我国数字政府建设尚处于探索阶段,面临缺乏统一的制度规范、政务数据更新缓慢、公共服务供给与需求不平衡、数据信息安全难以保障等诸多挑战,提出要加强数字政府软件硬件建设、搭建数字交流沟通平台、破除单位和部门的数字壁垒、提高公务员的网上履职能力、构建数字安全制度保障等地方政府公共服务优化路径[3]。这些文献给我们在研究杭州市数字化公共服务优化路径提供了一个初步的研究方向,在以上文献的基础上,我们立足于当下的数字化发展,从影响市民数字化感知程度的主要因素入手,进而提出更实际切合的优化路径,希望能够为政府提供有关数字化公共服务的有效见解。
3. 样本收集
3.1. 样本量的确定
对于有限个总体,样本抽样的数量公式如下:
(1)
Δ表示最大容许的抽样误差,我们将其设置为0.05,即Δ = 0.05。在置信水平为95% (即α = 0.05)的条件下,t = 1.96,根据p = q = 0.5达到极大值时对初始样本量进行计算:
(2)
预期有效问卷为90%,故需调整样本量,拟定抽样样本量为:
(3)
3.2. 样本量的分配
本组以浙江省杭州市主城区18周岁及以上公民为调查目标总体。我们选择杭州市主城区作为抽样框,采取多阶段抽样:第一阶段对8个市辖区的53个管辖区进行PPS抽样,抽取18个下管辖区;第二阶段根据抽取到的各个区下管辖区的常住人口比例进行样本容量分配,采用偶遇抽样法。本小组共计发放问卷510份,剔除无效数据和极端数据后,获得有效问卷为458份。
本次调查得到有效样本的特征如下表1:
Table 1. Sample characteristics
表1. 样本特征
变量 |
占比(%) |
变量 |
占比(%) |
变量 |
占比(%) |
性别 |
|
60岁以上 |
6.55 |
月收入 |
|
男 |
50.22 |
学历 |
|
2500元及以下 |
34.06 |
女 |
49.78 |
小学及以下 |
3.93 |
2501~5000元 |
15.72 |
年龄 |
|
初中 |
8.73 |
5001~7500元 |
16.59 |
18~25岁 |
44.10 |
高中及中专 |
11.35 |
7501~10,000元 |
12.45 |
26~35岁 |
25.33 |
大专 |
12.23 |
10,001~15,000元 |
11.35 |
36~45岁 |
15.07 |
本科 |
52.18 |
15,000元以上 |
9.83 |
46~60岁 |
8.95 |
硕士及以上 |
11.57 |
|
|
4. 调研结果分析
4.1. 居民对数字化公共服务的参与现状
由于本项目组使用R语言软件进行分析,为了更好展示分析结果,首先对变量进行了简化处理,对于市民基本信息和认知情况、使用频率,我们根据表2的方式进行变量转换。
Table 2. Correspondence analysis variable name conversion table
表2. 对应分析变量名转换表
原变量名 |
程序变量名 |
性别 |
A1 |
年龄 |
A2 |
文化程度 |
A3 |
职业 |
A4 |
月收入 |
A5 |
居住地区 |
A6 |
工作地区 |
A7 |
了解程度 |
B1 |
地区偏好 |
B2 |
使用频率 |
C1 |
为了探究杭州市民的基本信息、认知情况与数字化公共服务平台使用频率之间的关系,我们首先对市民的性别、年龄、文化程度、职业、月收入、居住地区、工作地区、对杭州市数字化公共服务发展的了解程度和对数字化公共服务平台的使用频率进行了相关性分析,并根据相关系数画出了图1的相关系数色阶图:
Figure 1. Correlation coefficient color scale heatmap
图1. 相关系数色阶热图
在相关系数色阶图中,颜色越深表明两个变量间相关性越强,根据结果,我们选择了其中与数字化公共服务平台使用频率相关性较大的市民月收入、文化程度和了解程度三个变量进行对应分析,结果如下:
Figure 2. Multidimensional correspondence analysis biplot
图2. 多重对应分析二维对应图
由图2可以看出,使用频率与市民的文化程度、月收入和对数字化公共服务了解程度之间的对应特征,经过分析,我们总结出以下3个特征:
(1) 在同一象限的类别点,更可能存在较强的关联性。由此可知,文化程度和月收入水平较低,且对数字化公共服务的了解程度较低的市民,很少或完全不使用数字化公共服务,而三项指标较高的市民使用数字化公共服务的频率较高。这可能是由于数字化公共服务基于互联网、大数据等新兴技术,文化水平较高的市民对数字化公共服务有更高的接受度和了解程度造成的;
(2) 对使用频率类别点做共垂线,可以看出市民对数字化公共服务的了解程度与使用频率具有较高的相关性。同时,月收入的影响较文化程度更为显著。这可能是由于市民对公共服务的需求受月收入影响较大,如对交通服务的需求与早晚高峰通勤工作相关;
(3) 使用角余弦方法对文化程度类别点观察,发现“初中”和“高中及中专”的类别点相似,“本科”和“硕士及以上”类别点相似,“小学及以下”类别点与“初中”差别大。据此,市民对数字化公共服务使用频率的影响因素中,文化程度为“小学及以下”与“初中”、“高中及中专”之间构成明显差异,后者又与“本科”、“硕士及以上”构成明显差异。本科及以上的文化程度可能使市民对数字化公共服务的了解程度和使用频率更上一层楼。
4.2. 居民使用数字化公共服务的影响因素
4.2.1. 个人因素分析
为了进一步探究影响杭州市民对数字化公共服务的感知程度的个人因素,并得到影响因素的重要性排序,本小组将感知程度作为因变量,利用机器学习方法对影响因素的重要性进行量化排序,本组选择随机森林、XGBoost与Adaboost三个模型进行变量重要性的特征排序,并通过模型预测准确率和AUC值得到最优模型。
由于本项目组使用R语言构建随机森林、XGBoost与Adaboost模型,因此我们对影响感知程度的个人因素进行了变量转换,如表3所示:
Table 3. Perception degree variable name change table
表3. 感知程度变量名变更表
原变量名 |
程序变量名 |
性别 |
A1 |
年龄 |
A2 |
文化程度 |
A3 |
职业 |
A4 |
月收入 |
A5 |
居住地区 |
A6 |
工作地区 |
A7 |
政府信息关注程度 |
B1 |
数字化平台使用率 |
C1 |
1) 随机森林模型排序结果
Figure 3. Random forest variable importance ranking plot
图3. 随机森林变量重要性排序图
MeanDecreaseGini是度量变量准确性的指标,它表示由这一节点处的分裂导致的节点不纯度的下降,这一指标是我们经常使用的。一般来说,节点不纯度下降这一指标越大,变量越重要。图3的结果表明,在随机森林考虑的所有变量中,考虑节点不纯度下降最重要的三个变量是B1、A7、C1。即政府信息关注度、工作地区和数字化平台使用率。
2) XGBoost模型排序结果
通过xgb.importance()函数,本小组得到了影响杭州市市民对数字化公共服务感知程度的个人因素的特征排序。XGBoost算法给出的变量重要性排序条形图如图4所示:
Figure 4. XGBoost variable importance ranking bar chart
图4. XGBoost变量重要性排序条形图
图4展示了自变量的重要性比例,我们可以看到B1的重要性最大,达到了0.18,其次为C1,重要性比例为0.15,即XGBoost算法考虑的所有变量中,在影响市民对数字化公共服务的感知程度的个人因素里,对数字化公共服务的信息关注度及平台使用率是最重要的变量。
3) Adaboost模型排序结果
使用Adaboost算法得到的影响杭州市市民对数字化公共服务感知程度的个人因素的特征排序如图5所示:
Figure 5. AdaBoost feature importance ranking bar chart
图5. Adaboost变量重要性排序条形图
图5展示了自变量的重要性比例,我们可以看到,B1的重要性最大,达到了17,其次为C1,重要性为16,排序第三的为A7,即AdaBoost算法考虑的所有变量中,在影响市民对数字化公共服务的感知程度的个人因素里,对数字化公共服务的信息关注度及平台使用率是最重要的两个变量。
4.2.2. 结果分析
混淆矩阵的准确率(Accuracy)是一组给定的预测值与其真实值的接近或远离程度,指的是被预测得正确的样本占总样本的比重。准确率越高,表明模型预测越好。
AUC值是衡量学习器优劣的一种性能指标。针对某个模型,AUC (Area Under Curve)被定义为ROC曲线下的面积。一般来说,AUC的值在0.5~1之间,越接近1,模型结果越好。
上述三个模型的混淆矩阵准确率与AUC值如表4所示:
Table 4. Confusion matrix accuracy and AUC values table for three models
表4. 三模型混淆矩阵准确率与AUC值表
模型 |
Accuracy |
AUC |
随机森林 |
58.69% |
0.561 |
XGBoost |
65.21% |
0.683 |
Adaboost |
71.01% |
0.740 |
由上表可知,根据混淆矩阵准确率与AUC值,预测结果最好的模型是Adaboost。
Table 5. Perception degree influencing factors comparison table
表5. 感知程度影响因素对比表
自变量 |
随机森林 |
XGBoost |
Adaboost |
A1 (性别) |
9 |
9 |
6 |
A2 (年龄) |
8 |
7 |
9 |
A3 (文化程度) |
6 |
8 |
8 |
A4 (职业) |
7 |
5 |
7 |
A5 (月收入) |
4 |
6 |
4 |
A6 (居住地区) |
5 |
3 |
5 |
A7 (工作地区) |
2 |
4 |
3 |
B1 (政府信息关注程度) |
1 |
1 |
1 |
C1 (数字化平台使用率) |
3 |
2 |
2 |
如表5所示,根据模型比较的结果,本小组选择Adaboost算法给出的排序结构为最终排序结果,即结论为:市民对政府信息关注程度与数字化平台使用率对他们的感知程度影响最大。这可能是因为市民对政府信息的关注程度越高,就越可能了解到政府提供的各类公共服务,从而增加了他们对数字化公共服务的认知,市民使用数字化平台的频率越高,他们接触到的数字化公共服务种类也越多。频繁的使用使得市民有更多的机会体验到不同种类的服务,这进一步增强了他们对数字化公共服务的感知。
5. 优化路径探究结论与建议
5.1. 研究总结
结合上文可得,为提高数字化公共服务的性能与普惠性,我们应从两方面进行改善:
首先,市民对数字化公共服务的信息关注程度是影响感知程度的最重要的因素。由此可见,我们应加强对数字化公共服务的宣传程度,加深各年龄段、各职业的人群对数字化的理解,推广政府的优惠政策及数字化App的使用,实现公共服务普惠均等。
其次,市民对数字化公共服务平台的使用频率是影响感知程度的另一重要因素。由此可见,我们应推动多种类的数字化公共服务落实落地,遵循惠民利民的原则,注重公共服务的实际效用与公民体验感,实现数字化公共服务的高质量发展。
5.2. 策略建议
根据以上分析,数字化公共服务路径的优化需要从多个方面入手,包括增强数字化服务的便捷性和易用性、提高政府服务的透明度和公信力、加大数字化基础设施建设、加强平台技术保障和安全防护。这些措施的实施将有助于提升数字化公共服务的效率和质量,提升居民进行数字化公共服务时的使用感受,提高居民对数字化平台的信任度,从而更好地满足人民群众对数字化公共服务的需求。
第一,增强数字化服务的便捷性和易用性。
简化操作流程:优化数字化平台用户界面设计,使操作流程更加简洁明了,降低使用门槛。
丰富服务渠道:除了传统的网站和App,还可以开发小程序、公众号等多种数字公共服务渠道,方便居民随时随地获取数字服务;设立24小时政务服务热线,确保居民在任意时间都能获取所需的数字服务信息。
提供个性化服务:根据居民的需求和偏好,提供定制化的数字平台页面服务选项和推荐;针对老年人、残疾人等特殊群体,提供专门的数字服务通道和辅助工具。
第二,提高政府服务的透明度和公信力。
加强信息公开:定期发布公共服务的相关信息,包括服务内容、办理时限、收费标准等;通过多种渠道宣传和推广数字化公共服务,提高居民的知晓度和使用率。
建立反馈机制:设立在线反馈渠道,鼓励居民对服务进行评价和提出意见;对居民的反馈进行及时回应和处理,不断改进和优化服务。
第三,加强基础设施建设。
完善信息化建设:加快宽带网络、4G/5G网络覆盖步伐,为农村数字教育、智能生活提供基础条件。
推进数字化改造:加快既有住宅和社区设施数字化改造,打造智能垃圾箱、智能充电桩、智能停车场等公共设施,合理布设社区智能末端配送、智能安防、智慧康养等终端设施。
第四,加强平台技术保障和安全防护。
加强网络安全防护:建立健全网络安全保障体系,加强数据保护和网络攻击防范;定期对系统进行安全检测和漏洞修复,确保系统的稳定性和安全性。
提升技术支撑能力:加强技术团队的建设和培训,提高技术人员的专业水平和应对突发事件的能力;引入先进的技术和设备,提升系统的性能和稳定性。
基金项目
本文受到2024年浙江省大学生科技创新活动计划暨新苗人才计划项目(2024R407A032)的支持。