1. 引言
近年来,微信、微博、市长信箱、阳光热线等网络问卷渐渐地变成政府了解人民意愿、聚集人民智慧、凝聚民心的重要途径。各种社会形势和舆论相关的文本数据量不断增加,相关部门的工作面临着巨大的挑战。与此同时,在新时代背景下新兴技术不断进步,构建基于自然工程技术的智能管理系统(NLP)已成为创造和发展高动力社会治理的新政策。
为了提高政府相关部门处理留言的有效性,本文基于K近邻与因子分析法对所收集的社区热点问题进行分析,同时将PZB服务质量模型(Service Quality Model)与中国国情、现代社会环境的特征相结合,进而形成评价主体是群众、评价客体是有关政府部门提供的评估服务的一项全新的反应质量评估体系。评价结果的新的答复质量评价指标体系将会变为大众对评估目标和相关政府部门的回应质量。
2. 研究现状
智慧政务模型
(一) DPSIR模型
DPSIR理论模型在资源、人口、生态可持续发展研究中具有重要作用。DPSIR模型能够更好地反映人类活动与信息生态环境之间的关系和作用,为建立智能政府信息生态评价体系提供了基本的分析框架。该模型具有以下优点:第一,DPSIR模型非常适合于智能政府信息生态的研究。第二,DPSIR模型能够揭示智能政府信息生态的因果关系。第三,DPSIR模型可以为智能政府信息生态的发展提出战略建议 [1]。
(二) SERVQUAL模型
基于“顾客服务质量感知”的研究背景,PZB于1985年提出了“服务质量差距模型”。1988年,PZB将10个服务要素的数量减少到5个服务要素,并总结了服务质量的五要素模型,即SERVQUAL服务质量差距模型。1991年,PZB又将SERVQUAL测量模型重新进行了改良和修正,提高了这种模型的可靠性和效率 [2]。
(三) TOE理论框架
TOE理论框架(Technology-Organization-Environment),由学者Tornatzky和Fleischer于1990年提出,具体而言,TOE理论框架认为应该从技术因素、组织因素和外部环境因素三个方面去探索一项组织创新技术应用的影响因素,TOE框架为研究政务服务智慧能力关键影响因素提供了一个很好的基础框架,即从技术、组织、环境三个方面进行因素选择和探讨,然而在实际操作中需要注意,TOE模型更多是一种因素划分或者因素归类的框架,模型本身并没有对各个维度的因素予以具体规定,即不能使用该框架作为研究模型当中因素选择的理论基础或者动机分析 [3]。
本文增加新的自动答复模型,不及能够快速接收各种政务问题,而且能够及时快速回复群众,给群众以良好的使用感受。
3. 模型构建
图1为本文模型构建整体步骤框架,第一步使用Rstudio对文本数据进行分析和预处理,提取文本特征词主要使用到了文本分词方法来进行综合提取。第二步确定索引,使用信息增益算法作为所选特征词的索引,计算信息增益最大的特征词的TF-IDF权重,构造词权–文档矩阵。第三步使用k-最近邻法对留言的文本内容进行综合分类。
为了对反映特定地点或特定人群在一定时间内的问题的信息进行分类,采用因子分析法确定问题热评价指标体系中各指标层次的权重,定义合理的热评价指标,并给出评价结果。

Figure 1. Model building overall framework
图1. 模型构建整体框架
3.1. 数据预处理
(一) 数据采集
本文选择的数据集来源于中国国家统计局的社区留言总计9210条,采用旁置法来选择实验样本。
采集并预处理后的各专题文本分布如表1:

Table 1. Text set category distribution table
表1. 文本集类别分布表
(二) 分词
由于手工编写的分词函数功能没有得到充分的优化,分词工作效率相对较低,本文采用jieba软件包来完成分词部分。较为常用的中文分词技术是jieba分词,对文本的分词准确率较高 [4]。
(三) 去停用词
通过建立停用词列表来删除停用词。停用词表选取哈工大停用词表和百度停用词表组合 [5]。
(四) 特征提取
采取基于特征词典的分词方法即基于特征词和字符串相互匹配的分词方法切分文本进而提取一个特征词,根据这个词典中的某些规则,找出对应的一个给定词典中单词和特征句的文本。如果当文本中的段落文字与词典中的文本对应成功,段落将被截断,并视其为一个单词,之后把这个文本中的其他组成部分重新根据此规则对其进行再次对应,直到整个文本完成。
(五) 文本表示
分词的目的是获取一组特征词。每个特征词代表向量空间中的一个维度。接下来,确定文本在各个维度上的坐标位置的数值,不妨把这个坐标位置的值叫做词权。
提取特征项并确定词权重后,文本集中的文本可以由空间中的节点表示。文本相似性通常被认为是一个文本和另外一个文本之间的关系程度的一种衡量。文本可视化是通过分析文本内容,发现文本的关键信息,并将其以图形形式呈现出来的方法,能够直观地了解到关键的信息点。数据经过分词和去停用词后,若想要查看分词效果如何,可以绘制词云图来进行检验。画图的第一步利用Python先统计分词后各词语出现的频数,结果展示见表2;接着依据频数按从大到小进行排序;最后用Python工具中的wordcloud库进行编码绘图,最终绘制出来,如表2:

Table 2. Keyword word frequency table
表2. 关键词词频表
分析表2中Top20的词频,可以发现社区留言中有关劳动和社会保障板块的词语出现的频率较高,群众所反映的问题一般比较贴近于生活,比如“公积金补贴”、“工人工资拖欠”、“施工噪音”等热点问题,政府在解决相关问题的同时,还应该出台相应的政策,扎扎实实解决好群众最关心的利益问题和最忧虑的实际问题。
图2反映了全部类别的文本集不同特征词的重要程度,通过观察词云可以发现,劳动和社会保障板块词语分布较为集中,重要的词有“补贴”“公积金”“工作”“领导”等,该板块留言一般面向劳动群众,与之相比,城乡建设板块“公积金”等词的权重仍然不低但重要程度大幅下降,而环境保护及文体教育板块中的特征词并没有出现在图中.除此之外,劳动和社会保障板块中一些其他重要特征词还包括“福利”、“待遇”、“保护”等。
向量空间模型(VSM, Vector Space Model),也称为“单词袋”方法,是由著名研究人员Salton [6] 等发布的文本表示模型。通过将文档映射为特征向量,将对象以这种方式转换为空间向量的向量运算,通过其在空间上的相似性,我们可以用一种语言来表达文本之间的相似关系,这使得我们更容易处理文本。主要广泛应用在处理文本的数据过滤、信息源的检索、搜寻和信息索引以及分析文本的信息相关性质和排名等方面 [7]。向量空间模型为用户提供了将文本中的冗余数据转换为变量的技术框架。但是,在实际的数据分析、开发和文本挖掘工作过程中,对于一个文档集来说,字数是数不清的,而停用同义词表只能用来消除一小部分文本噪声,而且特征向量的文本维数非常大,一方面,很可能会消耗大量的时间和信息空间;另一方面这些冗余的文本变量也极有可能会对数据分析工作产生不利的结果影响。因此,需要在文本数据开始挖掘和进行分析之前对文本中的特征向量进行降维处理。词向量转化结果如下图3表示:

Figure 3. Convert text in message to word vector
图3. 留言中文本转化为词向量
(六) 特征降维与分类
本文主要采用基于统计的分类算法。分类算法的基本算法步骤是:第一步准确分析和判断训练文本集中的文本。再依据分类算法的结果,建立相关关系模型,相关关系指类别与具有训练文本的特征的相关关系;第二步对测试文本集进行分类,最大限度地利用该模型,不考虑文本数据的语言结构,而是使用特定的特征词来表示文本。
特征词的降维通常采用特征选择或特征提取的方法。特征选择是指根据一定条件从一组特征集中选择一些有助于文本分析的词,这些词构成一组特征子集。它通常是指根据一定的条件从特征集中选择对文本分析有重要贡献的一部分词来构造的特征子集。此过程仅删除相对不重要的要素,不会生成新的要素项。特征选择的规则主要涉及信息的获取等。
信息增益的定义是特征文档中存在或不存在特定信息特征词后的信息熵差,它表示当文档包含特定信息特征词时,特征文档中每个类别的平均累积信息增益。公式如下:
(1)
(2)
信息增益越大,与分类相关的特征词的影响和作用越明显。因此,降低了利用信息增益进行降维的效果。
K近邻法(KNN, K-nearest neighbor) [8] [9] 由cover与hart研究人员共同发现的一种在国内已经应用广泛分类类型算法,k近邻标签分类法主要是一种有监督的一种学习分类算法,其分类规则主要就是数据本身,并且不必再要求产生其他的分类数据来对其进行分类阐述。因此采用k邻近法建立一个群众留言一级标签分类算法模型,其思想简单直观。
在训练样本集中,可能有许多靠近测试样本的观察点。预测输出变量的依据应该是离测试样本最近的观测点的数量,即最近邻的数量,这是k-最近邻法的关键。
3.2. 指标体系构建
指标体系的构成是基于不同需求和目标差异的原则。指标体系分为三个层次。指标选择层次通常有三个重要原则:客观性原则、系统性原则和敏感性原则。依据问题热度这一特殊的研究对象,在设计和构建问题热度评价指标体系的时,在上述三个原则的基础之上,还增加了两个新的原则:趋势性原则和导向型原则。

Table 3. Weibo popularity evaluation index system and the connotation of each index
表3. 微博热度评价指标体系及各指标内涵
基于新闻学三要素及其新闻传播理论,我们将选取内容特征热影响和受众反映特征热影响两个要素,从问题传播内容和受众反映两个层面对问题热进行定量评价。
1) 内容特征热度影响力。根据流行的三大原因理论,我们可以知道留言信息内容本身的内容特点对热度的受欢迎程度有很大的影响。本文围绕两个方面:评论内容和内容表示方式,选取二级指标来进行反馈,它们分别为:留言信息充实度、留言出现及时率、留言内容相似度。
2) 观众特征热影响。受众特征是指受众在收到信息后的反应和态度。指标体系如表3所示。
3.3. 问题热度因子分析
运用因子分析法对本研究构建的指标体系进行分析。最后,根据模型的计算结果计算热点问题的层次排序。
结果表明,使用SPSS16.0是必要的。它对采集的数据变量进行因子分析可行性检验,样本通过KMO (Kaiser-Meyer-Olkin)检验统计量检验的结果为0.876,可用于因子分析;Bartlett’s球状检验的近似卡方值为65.84,并且得出P值为0.000,小于0.01,表明统计数据适合进行因子分析。根据因子分析中主成分特征值提取的原理,得到两个公因子F1和F2 (表4)。可以进一步发现二个公共因子能够分别解释热度相关信息的0.68007和0.17693,所计算出来的结果与总体信息的0.857一样,所以可以用它来对问题热度进行评价。

Table 4. Main factor eigenvalue, cumulative variance contribution rate
表4. 主因子特征值、累计方差贡献率
为了便于对各主要因子的研究,计算得到旋转因子载荷矩阵。见表5。
根据旋转因子载荷矩阵可知,X1字数充实度、X2出现及时性、X3内容相似度的载荷在第一个主因子F1所占比例都很高,它表示留言的内容信息具体详情,以及表现方法和时间特点,可以理解为内容特征因子。X4点赞数、X5反对数载荷在第二个主因子F2所占比例都很高,它表示受众对留言内容的反应情况,可以理解成为受众特征。
因为有旋转系数荷载矩阵中各指标和公因子的相关系数值可能希望列出F1和F2的计算公式,分别见公式(3)和公式(4)。
(3)
(4)
接着表5中三个公共因子的方差贡献率对留言信息的热度影响力采用累加,从而列出最终综合因子的表达式,见公式(5)。
(5)
得到公式后,制定评分标准,并利用Excel软件对数据进行处理。对于X1字数充实度,利用LEN函数进行计算;对于X2出现及时性与X3内容相似度,借助函数Get Matching Degree (Text_a, Text_b)比较两两字符串的相似度,查找相似内容后进行时间跨度计算并评分,对于X4点赞率与X5反对数,将其排序后进行评分。评分标准如表6~10:

Table 6. Word count fulfillment score
表6. 字数充实度评分

Table 9. Likes and dislikes score
表9. 点赞数、反对数评分
通过上面求得的热度综合得分计算公式,将实证选取的问题进行排序,用来检验指标体系的合理性和实用性,结果见表10:
通过热力综合评分计算公式,对论证中选取的问题进行组织和排序,检验指标体系的合理性和可行性。
在现有的相关文献的基础之上,本文以新闻传播学和大众化三要素理论为基础,建立了信息传播大众化的评价体系。评价体系包括两个维度、两个要素和五个指标。这两个维度分别指接收器和通信内容。此外,通过因子分析和实例进行验证,得出指标体系是具有一定的合理性和有效性。最后,基于这个结果对不同类型问题的热源组成进行了比较分析。总结了以下结论:
1) 目前,国内外学者对微博热点和微博热点话题都给予了关注,并取得了一定的研究成果。然而,目前还没有关于问题热的研究成果,也没有关于热点问题的全面界定的文献。在评价指标的构建研究中,仅采用转发率、评论率等简单的指标,不能充分反映问题热的影响因素或形成机理。因此,有必要根据相关理论建立问题热综合评价指标体系。
2) 根据问题热度排名可以看出,评价指标体系的估算结果与问题热排序结果一致,表明所构建的评价指标体系更为合理。估计结果表明,通信内容对热度的影响最大,即在该模型中,相似度对热度的影响最大,而微博热度对接收者的影响较小。
3) 对城乡建设类、教育文体类、交通运输类和民政类等14种类型的留言内容进行一一检验,结果表明它们影响热度的维度都不大相同,其中城乡建设类、环境保护类、教育文体类的问题居多。
3.4. 答复质量评价体系
基于顾客感知服务质量的定义,让服务接受者、服务提供者和第三方对服务进行打分评价,并从三维评估的概念对其进行评估。其中,群众评价的主体是群众,评价对象是反应绩效;相关政府部门将成为响应提供者的评估主体,评估对象为响应过程;第三方评估的主体是第三方组织。评估对象是回复的服务能力。评估对象证明并认可回复提供者提供的回复的服务质量。三方评价完成后,制定相应的评价指标,通过对评价指标进行加权,得出评价结果。答复质量评价的整体框架如图4所示。
PZB服务质量模型是由A. Parasuraman、Valarie A. Zeithamal和Leonard L. Berry等人提出,并且以此为理论依据。结合我国国情的特点与现代社会环境特点,构建了一个新的答复质量评价指标体系,新的答复质量评价指标体系是以群众为评价主体、有关政府部门提供的服务为评价客体、群众对政府相关部门提供答复质量的感知作为评价结果。具体指标如表11所示。

Figure 4. Overall framework for response quality assessment
图4. 答复质量评价的整体框架

Table 11. Response quality evaluation index system
表11. 答复质量评价指标体系
指标体系中有一级指标、二级指标、三级指标。因此,在制定指标过程中,与信息有关的指标被添加到三个维度中,它们是:可靠性,响应性和保证性。
指标中涉及的评估量表为Liken7级量表 [10],该量表有21个三级指标。人们会根据自己接受服务后的实际感受对服务质量进行评分。分值代表服务质量满意度,分值越高代表越满意,分值越低代表越不满意。作为答复提供方,政府相关部门要对答复提供过程进行检验。答复流程中的每一道工序都为其上一道工序提供基础保障,因此将评估纳入组织内部,用来确定服务是否满足群众的需求以及它是否满足答复规范的要求,以发现答复流程中出现的差异并作出响应,给改善答复质量指明方向。
4. 结论
本文为了提高政府相关部门处理留言的有效性,构建基于自然语言处理技术的智慧政务模型来解决此类问题。利用互联网公开留言记录,借助Excel、Rstudio等软件,运用jieba中文分词工具对样本进行预处理,使用K-means聚类的方法及KNN算法、SPSS16.0对收集的数据变量进行因子分析等。将PZB服务质量模型与中国国情与现代社会环境的特征相结合构建了评价主体是群众、评价客体则是有关政府部门提供的评估服务、群众对政府相关部门提供答复质量的感知作为评价结果的新的答复质量评价指标体系。
基金项目
2020年福建省闽江学院校长基金(编号:103952020082)。