1. 引言
随着互联网逐步渗透到我们生活的方方面面,网络世界中违法违规的现象也慢慢增加,互联网治理正逐渐成为社会关注的一个重要问题。政府是现实社会中政治治理的主体,它本身掌握着大量社会资源,作为公共权力代表的政府部门,政府部门应该为互联网世界有序发展制定一套行之有效的制度规定,并用强力去保证这套规定的实施。但在实际操作过程中,由于互联网技术架构设计的缺陷,导致政府网络行为认知能力的缺失,如:网民身份认知能力、网民地理空间认知能力、网民行为认知能力,上述能力的缺失限制了政府互联网治理能力的提升 [1] [2]。
“大数据信息技术”,基于它对信息资源在采集、整合、分析方面的有效利用,为政府部门有效识别和理解网络行为提供一种有效的工具。在这一工具的协助下,政府部门将极大提升互联网治理能力。但我国相关体制机制和观念是在大数据信息技术有效应用之前建设和形成的,科学技术创新远远超前于体制机制建设和观念的形成,因此如何破除上述障碍,对于互联网治理能力的提升,将是一个亟待解决的问题。
2. 大数据驱动下的互联网治理能力提升
大数据信息技术的“大”,一般包括两个层面的内容。一个是分析数据的“大”,大数据信息技术分析的数据区别过去专注于分析系统内部产生的交易类“小数据”,它更多的分析来自系统外部、互联网、传感器、各种公开发布的数据等“大数据”。第二个层次是分析能力的“大”,大数据信息技术除了能够运用Hadhoop平台处理单个服务器上难以进行快速分析运算的数据,以及利用新型数据库NoSQL处理大量如微博微信等非结构化数据之外,还能提供基于内存和数据库的快速数据处理。
2.1. “大数据”推动网络行为认知能力的建设
政府在互联网治理领域,传统的政策和法规很难延伸到互联网治理领域。其中一个最主要的因素就是治理信息资源的缺乏。拿现在,最引起群众诟病的网络诈骗为例。例如,医疗广告信息的发布,现实生活中,医院要在正规广播媒体上发布一则医疗广告。需要提供相应的资质证明。而在互联网上,虽然有类似的规定。政府却无法掌握这些治理信息资源。其中一个最重要的因素就是治理信息资源的缺乏。这里包括三类信息资源的缺乏:网络用户身份信息的缺乏、网络用户地理空间信息的缺乏、网络用户使用信息的缺乏。政府在对互联网违法违规行为进行治理时,如果缺乏有效的网络用户身份信息,将导致政府无法最终追查到违规的网络用户行为人。现行我国对违法违规行为的管理是属地管理,如果难以对违法违规的网络用户地理空间信息进行定位,将导致政府部门在执行相关处罚时,难以明确违法违规事件到底应该由哪级政府管辖。网络用户行为的性质信息的了解,我们很难提前对网络违法违规信息进行处罚和预警。以网络垃圾邮件为例,很多时候我们只有把该邮件点开后,才能知道该邮件是否违法违规。
随着大数据信息技术的有效应用,我们在治理信息资源的采集、利用方面取得了极大的进展。这些进展将有助于我们解决上述问题。
1) 网络身份认知能力建设
网络身份信息的识别传统的网上身份识别系统主要采取的是线下身份证识别线上身份的模式,即利用离线证件的防伪技术识别网上用户的真实身份。例如用户在注册时,必须提供姓名和身份证号相关信息,或者手机短信回复,有的甚至需要提供身份证复印件。这种方式一方面并不能真正阻止线上身份冒用、盗用的泛滥,另一方面,由于很多网络服务商管理的不完善,导致网络用户隐私信息的严重泄露。Hadhoop等数据资源调配和处理系统的出现,使新的可信身份识别体系成为可能。在我国以公安部第三研究所开发的基于eid的网络可信身份识别系统为代表,上述系统较传统系统,在隐私保护方面有着革命性突破。具体流程如下:系统为网民颁发一个网络身份证,该身份证包含了网民的所有信息。当相关政府组织或机关需要查询网民某一项信息时,该系统只用给出需要查询的内容,不用给出全部信息。以网上订餐服务为例,卫生部门如果要对提供服务的商家任职资格进行查询。在已构建完善的网络身份识别体系的背景下,该系统只用向相关的卫生监管部门提供网络用户是否有相关资质。
2) 网络用户地理信息认知能力建设
导致网络用户地理信息难以确定的一个关键性因素在于,网络IP地址是虚拟地址,它与现实地址毫无关联。IP地址对应的是网络上的逻辑地址。因此,理论上,现实地址相邻的IP地址并不意味着现实地址也相邻。但是用户的IP地址与现实地址还是存在着一定的关联性。传统的网络用户地理信息识别就是利用这种关联性对用户的地理信息进行识别。它们通过建立一套IP地址和现实地址的对应表,来最终实现间接识别IP数据包的现实地址。这种方式在识别机构用户方面较为有效。而在识别自然人用户时,由于自然人的流动性,IP地址与现实地址关系表建立较为困难。随着用户社会数据化,导航地位技术的普及,以及导航定位技术嵌入到生活具体应用的多个场景中,例如滴滴搭车服务、外卖服务,导航服务等。借助于用户在日常生活中导航数据、搜索数据收集,导航服务的提供商完全有可能建立一套自然人用户IP地址与现实地址的映射表,这些功能在百度搜索、百度地图、高德地图中已有体现。。
3) 网络用户行为认知能力建设
政府传统部门难以有效进入互联网治理领域,最后一个关键性因素在于我们难以网络用户的行为信息进行确认。在互联网已有协议中,只是将数据包分包,并贴上数据分包的结构标签,在数据没有真正接收到的前提下,任何人都无法知悉数据包的内容。例如,以网络虚假信息治理为例,网络上大量虚假信息和不实言论不仅严重侵犯了相关公民的权利,还损害了国家与社会整体利益。如网络上的各种“水军”。传统的解决方案主要通过两种方式进行,一种是网络用户收到虚假信息,或看到不良言论时,向相关网络监管部门进行举报。一种是由网络服务商对虚假信息进行关键字过滤。前者能够很好的辨识网络虚假信息,但往往当政府部门决定对某类虚假信息进行治理时,虚假信息造成的伤害已经发生。后者很难有效识别信息的真伪,即使某种算法能有效识别,网络上“水军”通过相关规则的研究,这种识别很快将失效。大数据信息技术为网络虚假信息的治理提供了一种新的解决思路,假设我们建立和完善了身份识别体系,我们可以对网民的言论建立一套可信度评价体系,发布或转发虚假言论降低可信度,发布真实可靠言论则提升可信度。同时在网民发布言论时,一并将他的可信度予以展示。这样网民在查看某一则信息时,可以有效判断相关信息的真实性。
2.2. 网络行为认知能力建设驱动互联网治理能力提升
网络行为认知能力建设驱动互联网治理能力的提升主要体现在以下几个方面:
1) 网络行为认知能力建设提升互联网治理政策法规实施的效率
网络行为认知能力的建设将提升网络政策法规实施的效率,以网络虚假信息治理为例。通过网络用户行为认知能力的建设,普通网民在接收某则网络信息时,发现相关信息的发布者可信度较低,他将有能力对信息真实性进行判断。通过网络身份信息认知能力的建设,政府部门可以按照相关法律法规对那些经常发布虚假信息的用户,给予相应的处罚。通过网络用户地理信息认知能力的建设,在处罚过程中,具体由哪个地方的哪个部门进行处罚,将得以明确。
2) 网络行为认知能力建设提升政府制定和执行政策的预判能力
在网络行为的认知基础上,政府通过数据挖掘等技术,能够建立两类模型,一类是实时干预模型。这类模型的特点是,它通过对网络违规行为特征进行建模,当违规行为发生时,进行及时干预。以近年来各地高发的网络诈骗为例,政府可以对网络诈骗的行为模式进行建模,如网络诈骗行为实施者大都集中在某一个地区,诈骗者使用的IP地址集中在某一类号段等。当符合上述特征的网络行为发生时,网络警察可以采取预警,或加以关注。第二类是响应模型。这类模型主要通过网络行为数据的收集,来帮助预测当某项政策发布时,网络用户可能做出的反应。例如以网络约车新政发布为例,当网络约车新政发布前,政府可以通过网络舆情学习,将网络上不同用户对于政策可能采取的态度和行为进行打分和评级,然后根据评级的结果生成不同的群组,以对不同群组内的网络用户采取不同的措施。
3. 大数据信息技术应用的障碍——以北京市为例
过去多年来北京市政府在互联网基础设施建设、互联网应用、互联网创新发展等方面都做了大量的投入,且成效大都在全国前列,因此我们选择北京市作为分析的个案,应具有一定的借鉴意义。
通过对北京市网络信息化办公室等相关部门的调研,以及相关领域的信息化专家的访谈。我们认为,通过网络行为认知能力的建设驱动网络治理能力提升,关键需要解决以下三个问题。网络行为信息数据应用支撑平台建设–云平台的建设问题,网络行为认知能力建设–网络行为数据信息的有效采集和整合问题,网络行为能力认知转化为治理能力–数据信息的有效利用问题 [3]。
3.1. 云计算平台建设方面的问题
云计算平台提供一种处理系统整合与互联的方法,能够较好的解决数据信息共享中存在的问题。是进行网络行为大数据利用开发的有效工具。云平台的建设是网络治理能力提升的技术保障。在我们针对云平台建设调研中,发现影响云计算平台配置和使用,除了隐私和安全方面的考量之外,云平台的计算能力或存储空间的使用效率问题,尤为突出。根据谷歌专家拉简·雪斯的研究表明,云计算平台相较于其它系统,最大优势是节约成本。云计算的使用效率越高,成本节约的效果越好,因为转移到云计算平台后,组织机构能够大幅度削减所需要的服务器数量。因此,云平台建设应该伴随着相应服务的转移和服务器的削减。根据我们对于北京市云平台建设的调研,虽然也强调对于云平台的投入,但对于如何提高使用效率,如何削减成本,在实际操作中考虑较少 [4] [5]。
3.2. 网络行为数据采集和整合方面的问题
网络行为认知能力的建设,需要建立在对各级政府收集到的网络行为数据信息有效采集和整合的基础上,各级政府在采集网络行为数据时,遇到的一个最大问题是隐私保护机制不够完善。隐私数据的保护是数据采集的前提基础。网民不愿意向政府提供信息的一项主要原因是,害怕隐私数据的泄露。例如孕妇去医院建卡,一回到家就接到月子中心的营销电话;另一网友在人社厅报名参加一个资格考试,随后就接到上百条买卖答案、修改成绩、参加培训辅导班的短信。虽然相关部门都很重视,但缺乏相互的协调,例如北京市工信部下设了三十多个司局,执行相关职能的,有“网络安全管理局”和“信息通信管理局”,在网页上,我看到它们的职责有:“电信网、互联网网络数据和用户信息安全保护管理工作”“监督管理电信和互联网市场竞争秩序、服务质量、互联互通、用户权益和个人信息保护”等相关职能。显然如果用户遇到需要投诉,很难找到相应的部门。
各级政府部门将网络行为数据采集上来后,存储的数据具有种类繁多、内容庞杂等特点,需要经过统一的规划、梳理、分级和分类,建立统一的政府信息资源目录体系才能实现共享。而部门分治,必然造成信息资源被重复采集、重复存储、重复加工,选用不同的数据库管理系统进行管理,形成诸多“异构系统”,这些系统产生的数据由于存在大量的数据冲突和不一致,将很难进行整合。而数据的整合是大数据分析的前提和基础,显然缺乏完整统一、有效的部门管理和协调机制,必然将影响大数据在互联网治理中的应用。
而现阶段,虽然中央成立了以习近平总书记为组长的网络安全和信息化领导小组,各省市地区也组建了相应的办事机构,这对从全局加强互联网治理的领导提供了重要保障。但在具体操作层面,在各地市领导下面,部门之间还缺乏一套完整统一、有效的治理体制和机制保障,“多头管理”的局面没有实质性改变。以北京市网络安全管理为例,涉及众多部门,如市委办、市政府办、、宣传部、网信办、经信委、公安局、国安局、新闻办、法制办、保密局、新闻出版与广电总局等。如果再加上一些网络治理的支撑机构如北京市信息网络安全检测中心等就更多了。上述现象说明,从表面上看,我们似乎已经形成了一个有多部门参与互联网治理的体系,但这些机构如何有效的协调运作,似乎并没有解决。显然互联网治理的体制弊端,是网络行为数据采集和整合面临的最大问题。
3.3. 数据有效利用开发问题
数据有效利用和开发是将网络行为认知能力转化为网络治理能力的关键。数据在互联网相关部门缺乏开发利用的积极性,既有观念方面的问题,也有人员配置方面、工作流程设计方面的问题。观念方面,领导层面没有形成有效的大数据项目思维。大数据项目跟传统IT项目不一样,传统项目,信息方面的需求和技术细节在前期设计阶段就确立了。信息的使用人员只需要看懂系统的说明书,会操作和录入系统就行了。而大数据项目,更多的是需要信息使用人员,如何有效利用项目产生的信息数据,改善和优化现有治理模式和治理行为。例如,公安局公司安装了一套自动处理交规罚款系统,在显著提升办事效率的同时,会产生一些额外信息。利用这些信息,交通部门可以建立各种模型,来判断司机是否能够获取网络专职司机的资格。如它可以利用汽车传感器上实时收集到的诸如驾驶速度、转弯、刹车和加速速度,来区分有责任的司机和不负责的司机,从而判断该司机发生交通事故的可能性,以及他是否有资格获得网络专职司机的资格。显然,仅仅依靠增设相关系统,并不能令政府自动获得上述认知。
正是上述思维的差距,导致大数据项目在资金配置上面,领导层面可能更多关注项目建设方面的费用,而对于人才的招募和使用方面,投入不足。大数据相关人才主要包括精通计算机科学和数学方面的人才,和认知科学和行为科学的人才。在政府部门,后两种人才,相对欠缺。
4. 对策和建议
根据前述大数据信息技术在互联网治理过程中面临的问题,笔者认为大数据驱动下,政府认知互联网行为规律的能力获得了极大的提升,但要想充分应用上述能力。应在下述层面进行变革:形成数据驱动治理观念,基于数据驱动治理的网络治理资源整合、围绕网络治理资源整合的体制机制变革:
第一,形成正确的数据驱动治理观。
大数据驱动下的网络治理变革。应该形成正确的数据驱动治理观。数据驱动互联网治理的本质,是通过数据提升我们认知互联网世界规律的能力,进而运用这种能力改造世界。我们要认知的规律应是互联网世界中的因果关系,而不是相关关系。相关关系并不等于因果关系,简单的相关关系并不能指导我们网络治理实践。例如在网络治理中,可能会发现某一个时间段,网络诈骗案与某一款软件使用频率有着密切的相关关系。导致上述相关关系的原因,即可能因为,这款软件充当了网络诈骗的帮凶。也可能仅仅因为国内疫情管控,国内居民上网频率增加,导致某款软件的使用频率增加,以及网络诈骗案的数据增加。通过简单的数据堆砌,浅尝辄止地统计分析,仅能发现数据中的相关关系,通过相关关系的分析,就制定和执行网络治理政策。既不科学,也缺乏政府责任。
正确的数据驱动网络治理观,应致力于从数据的相关关系,发现数据的因果关系。数据因果关系的发现,关键在于发现网络行为数据背后的因果规律,最终构建数据因果模型。通过数据因果模型的构建,能够发现互联网治理中存在的问题,提出网络治理的对策建议,有效预测互联网治理政策的实施效果。正确的因果模型构建,简单地依靠观测数据是不可靠的,需要大量的数据实验,这种数据实验既可以来自人工干预的数据实验,也可以来自自然随机实验。无论哪种数据实验都需要在一定的规划前提下,对政府网络治理中产生的有效数据,进行充分地采集和整理。
第二,基于数据驱动治理的网络治理资源整合。
网络治理资源的有效整合。是在政府数据资源整合的前提下,对已有的各种政府网络治理资源进行整合。在这里需要注意的是,网络治理资源的有效整合,是数据驱动和引导的。数据的驱动和引导,主要体现在以下两个层面,第一,各种互联网治理资源的数字化,即能够将所有能够影响互联网治理要素进行数字化编目。相关的互联网治理要素包括网络治理机构、互联网行为数据、互联网基础设施等核心要素。第二,网络治理资源的有效整合,这种整合既包括数据资源层面的整合,即互联网治理整个流程中产生的各种数据的有效整合,也包括互联网治理手段层面的整合,即互联网治理中各种治理手段的整合。前者的整合,解决了网络治理问题的及时发现,发现后可以选择什么样的干预手段。后者解决了当提出干预方案后,如何有效地调用资源,实施干预方案的问题。
第三,围绕网络治理资源整合的体制机制变革。
数据驱动的网络治理资源整合,需要完善的体制机制保障,具体来说,就是围绕数据资源整合层面,治理手段整合层面,通过职能整合和职责重构,进一步完善互联网治理的体制机制,具体措施如下:
一是要对拥有互联网管理的相关部门和机构,进行新的职能划分和职责边界的界定。按照相同和相近的事项由一个部门管理的原则,构建详细的权力清单、责任清单以及网络信息化投入的资金使用清单,以此建立部门间的互联网治理职责体系。如果再加上面向互联网、IT企业的负面清单,就可以通过这四张清单,构筑起体制内外相结合的互联网治理框架。
二是抓好四个关键领域的节点规范。按照网络安全、网络信息内容、信息化推广应用以及信息化基础设施和资源等四个关键领域,将相关机构进行归类,建立专业委员会,在中央网络安全与信息化领导小组统一领导下,由网信办(国信办)进行整体协调,明确相关的责任单位、参与单位,形成完整的运作规范和工作流程。
三是建立严格责任审查制度,最大限度地抑制和克服网络治理中的部门利益和保障信息系统和信息资源的应用,建立严格的责任追究制和信息审计制度。明确网络治理领域的重大决策,必须经历系统性的验证实验,以及在开发使用新系统时,对已有系统的信息资源、系统如何处置等情况,必须交由审计部门审计等。
基金项目
国家社会科学基金青年项目“网上公共服务绩效问责体系及其实现路径研究”(编号:16CGL069)。