1. 引言
第四次工业革命带来的信息技术和智能技术的发展,推动了“数字政府”建设的实践逐渐展开 [1]。目前,全球范围内已广泛开展了开放政府数据战略,旨在以社会需求为导向通过开放数据的门户网站,积极为公众开放可用的免费数据集,鼓励全社会基于开放的数据挖掘创新价值。在信息化建设的发展过程中,政府部门经过生成、采集一系列过程保存了大量与公众的生活相关的数据,如果可以开放给社会利用,毫无疑问会产生巨大的社会经济价值。开放这些政府在社会公共事务管理过程中采集和存储的数据,既能帮助政府提高自身透明度,又能增进政民互动,推进经济发展和社会创新 [2]。伴随着以“互联网+”为代表的物联网、大数据、区块链、人工智能等新一代信息技术的兴起,政府数据开放共享的广度和深度需要进一步深化 [3]。政府开放数据在各国间推行,并在政府信息领域中成为热门话题。我国也将政府数据开放提上日程,所以分析我国地方政府开放数据的存在问题及总结相关经验,对于推动我国政府数据开放工作的进一步发展具有现实意义。而且有助于加深对开放政府数据过程与结果的认识,并可以对中国开放政府数据实践与研究提出建议。信息技术更新速度不断加快,可以让政府数据的开放共享处于更为便捷的环境。政府数据开放已经逐渐在当代政府的工作内容中担当重要的角色,其他国家也都开始建立起政府数据开放共享的一些标准,顺应了时代要求。
2. 理论综述
从整体来说,政府部门掌握的数据资源超过其他渠道的80%。在研究地方政府数据开放政策扩散的相关文献进行了分析和梳理,发现国内外目前有关地方政府数据开放平台的现状研究的较多,而对于地方政府数据开放政策扩散的影响研究的还比较少。识别政府数据开放政策影响因素是当前政府部门全球范围内已广泛开展的数据战略,旨在通过开放数据的门户网站,以社会需求为导向积极为公众开放可机读的免费数据集,鼓励全社会基于开放的数据挖掘创新价值 [4]。所以,本研究对国内外有关地方政府数据开放政策的影响因素等领域的有关研究做了整理和分析。
2.1. 国外文献综述
国外学者对于政府数据开放的研究起步较早,研究内容较为丰富。从研究内容上讲,N. Huijboom等(2011)对5个国家的开放数据政策的特点进行比较,将开放数据战略实施的政策工具分为4种类型:教育和培训、自愿的方法、使用的经济工具以及立法和控制 [5]。T. Davies (2011)认为各国及地方层面都建立开放数据项目,但这些国家的政府数据开放计划在公共政策优先事项和发展水平上具有很大的差异 [6]。R. P. Nugroho等(2015)对不同国家的开放数据政策进行比较,认为如果有一般性的运作政策、健全的法律框架、数据质量有所保障、等方面的经验教训值得吸取;国家政策也应该集中在消除操作层面的障碍和推动数据发布和使用政策 [7]。这对制定开放数据政策的有益。A. Zuiderwijk和M. Janssen [8] 为开放政府数据政策的比较建立了一个框架,涵盖政策的内容、评估以及环境与背景三大方面。Altayar (2018)发现感知到的开放政府数据受益,如增加透明度、改善政府服务、等使数据开放行动理化 [9]。
2.2. 国内文献综述
国内己有的对政府数据开放政策的研究主要关注在对典型国家开放数据政策的案例研究方面:汤志伟、郭雨晖(2018)等人,基于政府创新扩散理论构建 了政治-经济-社会模型,研究结果表明政策数量、经济要素、信息化发展水平等都是促进政府数据开放的重要因素 [10]。齐艳芬、孙钰(2018)等,构建了城市政府开放数据行为的影响因素模型,从社会需求、政府技术能力等方面提出假设并进行假设检验 [11]。胡小明(2014)认为宽带互联网技术推动了信息公开向数据开放迈进 [12]。董姣(2017)在研究中发现,人民受教育程度、公民参与等对政府数据开放均有正向影响 [13]。黄如花等(2017)调查了法国政府数据开放的相关措施,发现法国政府通过制定数据平台相关政策并严格推行法律实施以保证政府数据开放 [14]。
综述总评:综上来看,国外学者研究在于对不同国家的开放政策进行比较,以求找到其中的差异性。国内学者对政府数据开放的内外因素都进行了一定的分析,对本研究的变量选取有一定的参考价值。
3. 理论框架与研究假设
TOE模型最早由学者Tornatzky在《技术创新的流程》一书中提出,认为组织对一项创新技术的采纳主要受到技术、组织和环境三方面因素的共同影响 [4],由于TOE框架主要用于系统考量这三大因素,对政府数据开放来说是一个通用框架,适用对政府组织数据开放的应用背景因素分析 [15]。下面基于TOE框架构建影响因素的理论模型。
3.1. 技术层面
在如今科技迅速发展的现代,毋庸置疑科技的重要性,科技创新在较长一段时间以来已经成为经济社会发展、生产生活方式变革的重要支撑。因此,一个地方科技资源越丰富,科技人才越多,科技创新水平越高,则该地方数据开放平台的越为完善,也就越有可能采纳政府数据开放政策。同时一些信息技术的使用能力也会关系到科技创新,一个地区的信息化水平高低关乎着政府等其他组织的创新发展快慢。平心而论,只有一个地区的信息化水平较高,更有可能采纳政府数据开放政策。也可以认为信息化水平较高地区的政府更有可能早一点实施数据开放政策,提升自身政府数据展水平。不少的前人研究也有说过一个地区要具备足够的信息技术能力才能实现对政府数据的有效开发利用 [16] 。故本文提出以下假设:H1:地级市科技创新水平越高与政府数据开放政策扩散力度正相关。H2:地方政府信息化水平越高,政府数据开放程度越高,信息化水平与政府数据开放。
3.2. 组织层面
行政级别。城市的行政级别会对地方政府采纳创新政策造成显著差异。我国的行政级别将全国的地级市划分为副省级城市、省会城市和普通地级市三类。副省级城市和省会城市较普通城市拥有更强的经济、人才技术等方面资源,会具有更高水平的电子政务和互联网政务服务能力,这就导致省政府在选择创新试点时往往会优先考虑资源较为丰富的省会和副省级城市,普通地级市得到的机会少。已有研究发现我国政务大数据政策扩散遵循了行政层级的顺序 [17]。因此,本文提出如下假设:H3:地级市行政级别与其采纳政府数据开放政策的概率正相关。
3.3. 环境层面
在不同城市和地区之间人口密度、公民教育等差异显著。一个城市人口数量越多、人口密度越大,其对政府数据开放的需求就越强烈和多元,地方政府就越有压力和动力去完善开放数据平台的数量和种类 [18],以满足日益增长和变化着的公众需求。除此之外,东中西三大经济地区之间由于自然条件与资源状况的不同,有着各自的发展特点,这一点也成为探究地级市政府数据开放政策扩散能力的差异问题时所须考虑的因素,故提出以下假设:H4:社会公众需求规模越大,政府开放数据服务能力就越强;H5:区域位置对政府数据开放政策产生显著影响,区域位置越接近东部发达地区,开放政策扩散影响力更大。
4. 变量选取和数据来源
本文的样本容量是以我国282个地级市作为研究样本,虽然我国自从2012年开通政府数据开放平台以来,不管是省级政府还是地级市政府等都开放了数据开放平台。但选择地级市的政府数据作为样本,考虑的理由如下:第一点是因为,当前80%的数据开放平台是地级市平台,地级市可以说是我国政府数据开放政策采纳的主体。第二点从整体数据收集来看,地级市开放数据的较省级更容易收集到,运用较县级更广泛,可操作性较强,更有现实意义。被解释变量是政府数据开放政策采纳,数据主要来源于《2020地方政府数据开放报告》。选取的解释变量来源于2020年《中国城市统计年鉴》和作者本人整理。
4.1. 变量测量
4.1.1. 被解释变量
本研究的被解释变量是政府数据开放政策采纳,该变量为虚拟变量,被解释变量的数据主要来自《2020地方政府数据开放报告》,里面有详细的地方政府数据开放记录,地级市政府i在2020年采纳了数据开放政策并上线了政府数据开放平台,变量赋值为“1”,没有采纳的赋值为“0”。
4.1.2. 解释变量
信息化水平信息化是指一个城市的利用信息技术,开发利用信息资源,促进信息交流和知识共享,提高经济增长质量,推动经济社会发展转型的历史进程。数据来源于2020年《中国城市统计年鉴》,用互联网宽带接入用户数来表示。
科技创新水平,一个城市的科技创新水平代表城市的科技技术水平,拥有较高技术水平的地区,数据来源于2020年《中国城市统计年鉴》,科技化水平用专利申请指标来表示。
行政级别是对城市行政等级的划分,将省级城市和副省级城市划分为“1”,将地级城市划分为“2”,来源于2020年《中国城市统计年鉴》。
社会公众需求是一个城市的居住人口对数据开放起着至关重要的作用,居住人口越多,对政府数据开放的需求会增加,用该地区居住人口总数取对数表示,来源于2020年《中国城市统计年鉴》。
区域位置,城市所处的地理位置至关重要,对于城市地理位置划分采用国家统计局对经济区域地带的划分方式,东部地区城市赋值“1”,中部城市赋值“2”,西部城市赋值“3”,此项为作者自己整理。详细情况呈现在表1。
5. 政府数据开放政策扩散的影响因素实证分析
5.1. 描述性统计分析
表2呈现了本研究的主要变量情况。

Table 1. Variables and measurement methods
表1. 变量及测量方法

Table 2. Descriptive statistics for variables
表2. 变量的描述性统计
5.2. 变量相关性分析
为了避免多重共线性问题的出现,本文进一步检验了解释变量的方差膨胀因子(VIF)和容忍度,结果显示方差膨胀因子均小于10,对应的容忍度均大于0.1,因此认为解释变量之间不存在多重共线性,其统计结果如下表3。

Table 3. Correlation analysis of variables
表3. 变量的相关性分析
注:*p < 0.1,**p < 0.05,***p < 0.01
从表3中变量的相关性分析结果可以发现,各个解释变量与政府数据开放政策采纳的相关关系均在1%水平上显著,本文涉及解释变量科技创新水平和需求规模的相关系数达到了0.60。
5.3. 回归分析
回归分析结果见下表4。

Table 4. Composite index regression results
表4. 综合指数回归结果
注:*p < 0.1,**p < 0.05,***p < 0.01
本文首先以地方政府数据开放政策作为被解释变量,政府信息化水平,科技创新水平、行政级别、需求规模和区域位置作为解释变量,逐步纳入“技术-组织-环境”层面的解释变量进行OLS回归。如表4所示,在模型一中仅纳入技术层面变量,结果显示模型的R1为19%,拟合程度较为显著;信息化水平和科技创新水平对地方政府数据开放能力扩散具有显著的正向作用。模型1中信息化水平通过了显著性检验,说明地级市政府对数据开放政策的采纳与当地信息化水平呈显著正相关,假设1通过。模型二在模型一的基础上纳入了组织层面的行政级别变量,结果发现模型拟合程度上升为21%,模型的拟合优度较好,在21%的水平上显著。行政级别对地方政府数据开放能力扩散有正向作用,假设3通过。
模型三进一步纳入了环境层面的变量,结果虽然显示与模型一二有差别。环境层面的自变量包括需求规模和区域位置。其中,需求规模用常住人口的数值测度;区域位置则根据国家发展和改革委员会相关解释,将31个省份分为东部、中部和西部来取观测值,东部观测值为“1”,中部观测值为“2”,西部观测值为“3”。其中居住人口对地方政府数据开放能力扩散有正向作用假设4通过,区域位置对地方政府数据开放能力扩散有显著的正相关关系,所以假设5通过。但在纳入所有变量之后关于变量城市科技创新的显著水平却有所下降,不再显著最终假设2未通过。
6. 结论与讨论
本文基于TOE模型框架,通过对中国282个地级市采用OLS回归分析方法实证分析了技术、组织和环境三个层面对地级政府开放数据平台政策扩散的影响因素分析。得出的主要结论有:回归分析在技术基础在技术、组织和环境因素中,技术因素对政府数据开放政策的影响最大,尤其是社会信息化的促进作用,良好的信息化水平可以促进政府数据开放,得出了信息化基础是政府数据开放政策扩散重要影响因素的结论。其次是从环境层面来说,居住人口越多的地方会对政府采纳数据开放政策的力度会更大,因为人口较多,会意味着需求更多,居民需求对政府政策采纳有显著的正相关关系。区域位置对地方政府开放数据政策的影响达到较高的显著水平,从事实来看我国政府数据开放平台的数据利用水平的确存在较大的差异性,东部地区的数据利用水平整体较高,中西部地区的数据利用水平整体较低。东部地区的政府数据开放程度显著高于中西部地区外,区域位置与政府数据开放政策扩散呈显著正相关关系,所以假设5通过。最后是组织层面的行政级别,地级市的行政级别不同,所拥有的资源也不同。较之于其他地级市,副省级和省会城市政府采纳数据开放政策的意愿更强。省会城市和副省级城市经济发达,政治地位高,拥有更大的空间。
本文还存在着一些不足点:此外,由于在数据获取方面存在一定困难,本文未能将全面地纳入所有相关因素予以考察。中国社会政策的发展往往经历着带有不同目标的多次政策扩散过程,在不同政策目标下,还有一些其他需要考虑的解释变量如政府的财政收入、政府之间的竞争压力等。最后,由于时间的限制,可以继续跟踪关于政策的发展和完善,考察地方政府在制定社会政策细则方面的创新机制,以及不同关系因素对不对政策扩散的动态影响 [19],未来还有较大发展空间。本文也只是做出了阶段性的结论,随着时间的推进,更长时间跨度的研究有待深入。最后,在数据分析方面,本文使用的是截面数据,未来可考虑使用面板数据或采用别的研究设计。关于政策主题扩散的分析有待进一步优化,可以尝试以词向量匹配的方式替代主题扩散指标的度量;最后,政策的分析维度多样,除了提到过的,还可以考虑诸如政策机构分布等对于政策扩散过程的影响 [20]。
基金项目
武汉工程大学第十三届研究生教育创新基金资助项目(CX2021237)。