1. 引言
党的十九届四中全会于2019年10月召开,会议首次将数据纳入土地、劳动力、资本、技术等传统要素中并列为第五种生产要素[1]。根据中国信息通信研究院发布的数据中心白皮书,数据要素被定义为计算机数据及相关产物经过收集、清洗和分析等相关程序后,能够满足特定的生产需求的一种基础性的生产资源[2]。近年来,中共中央和国务院陆续发布了一系列有关释放数据要素乘数效用的政策文件,突显了其作为新兴战略资源的重要地位。目前学术界对于数据要素的研究,主要集中在三个方面,首先是数据要素的特征和内涵。
蔡继明和曹越洋等(2023)认为数据要素具有虚拟性、非竞争性等特征,这也是和传统生产要素相区别的显著特征[3]。数据要素的虚拟性,不仅说明其存在形态是在虚拟网络空间中,更说明其价值的发挥需要与其他资源要素相结合。郭琎和王磊(2021)认为数据要素具有准公共物品的非竞争性特征,因此其边际使用成本接近于零[4]。
其次,关于数据要素的现有研究更多侧重于其对微观企业的赋能机制和作用。刘亦文和高京淋(2024)认为数字经济发展对制造业企业投资效率的影响具有两面性,初期可能产生负面影响,但随着发展会逐步改善,整体呈现U型曲线[5]。张天和易明等(2024)指出制造业企业通过数字化转型提高创新绩效,这种提升效果在大型企业中表现得更为突出[6]。徐翔和赵墨非等(2023)通过研究发现,大企业在生产中过于依赖于既有的数据要素,相比突破式创新更加偏好于迭代式创新,导致陷入“数据要素陷阱”,缺乏创新动力[7]。梁锦凯和陈关聚等(2024)由实证研究指出,数据要素市场化配置对企业创新具有显著的正向影响,并且这种影响在非国有和高竞争企业(创新数量方面)以及大型和高竞争企业(创新质量方面)表现得更为突出[8]。
最后,近些年来大量学者将目光放在数据要素对宏观经济与政府效率的辅助促进作用上。马路萌和余东华(2024)认为数据要素化投入对区域经济协调发展和经济产出具有良性的促进作用[9]。胡泽鹏认为通过建立大数据交易中心来驱动数据价值化,对所在省域内城市的全要素生产率提升和经济增长具有直接的促进作用[10]。丁志帆提出数字经济通过提升全要素生产率,并促进技术创新和要素优化配置,推动经济高质量发展[11]。
目前关于数据要素的研究探索已经成为经管领域的前沿方向和热点领域,相关理论研究成果不断涌现并取得了一定的突破。据此,本文借助CiteSpace这一可视化知识图谱软件对文献进行梳理分析,并以可视化的形式展现出来。进一步探索和考察该领域的知识结构,揭示其内在动因、发展脉络和未来趋势,从而为后续研究提供全景式的认知体系,旨在探寻释放中国巨大的数据要素潜力和分享数据红利的可行路径。
2. 数据来源及分析
2.1. 数据来源
本文以中国知网核心期刊为数据信息来源,设置“数据要素”为关键词进行高级检索,文献来源选择CSSCI核心期刊库,由于国内有关数据要素相关学术研究自2019年才开始出现,为确保文献的准确性,本研究将论文发表的时间区间限定为2019年至2025年,最终获取具有学术代表性的有效样本740篇,该时间跨度完整覆盖我国数据要素市场化改革的不同政策阶段。
2.2. 研究方法
本研究以CiteSpace作为分析工具对CNKI格式的数据进行可视化图谱分析,构建发文数量趋势图、研究作者及机构共现图谱和关键词聚类等可视化图谱,从而进一步研究和解读2019年至今关于“数据要素”的热点领域、前沿方向和发展趋势。
3. 结果分析
3.1. 发文数量和时间分布
将数据样本按照时间顺序进行整理和分析,将数据要素研究历程分为三个阶段,具体结果见图1所示。
Figure 1. Publication volume and temporal distribution of data element research, 2019~2025
图1. 2019~2025年数据要素研究发文数量和时间分布
1) 第一阶段:我国数据要素学术研究的发展起步期(2019~2021年),相关学术发文量较少,表明该领域尚未受到广泛关注,国内对数据要素相关研究集中在基础理论构建以及宏观经济的影响。
2) 第二阶段:我国数据要素学术研究的快速增长期(2021~2024年),发文量呈现快速增长的趋势,发文量维持在年均200篇左右,2024年发文量较2021年增长919.35%。在此阶段,国家持续发布了一系列与数据要素相关的政策方针,体现了政策对学科发展的推动作用,也表明数据要素研究已成为学术界关注的热点,受到越来越多的学者和研究机构的关注。
3) 第三阶段:我国数据要素学术研究的稳定成熟期(2021~2024年),此时期关于数据要素的发文量增长速度有所放缓,呈现出趋于平缓的态势。这一现象可能预示着此领域的研究已经进入较为成熟的阶段,或者研究热点开始向更精细化和更专业化的方向发展。
3.2. 文献作者合作可视化知识图谱分析
Table 1. Top 10 authors by publication volume on data elements, 2019~2025
表1. 2019~2025年数据要素发文量排名前10的作者情况
作者 |
发文量 |
欧阳日辉 |
15 |
王建冬 |
8 |
于施洋 |
6 |
任保平 |
6 |
黄倩倩 |
6 |
于柳箐 |
5 |
周文泓 |
5 |
夏义堃 |
5 |
姬祥飞 |
5 |
张夏恒 |
5 |
Figure 2. Co-occurrence network of authors in data element research, 2019~2025
图2. 2019~2025年数据要素研究作者共现图谱
根据研究作者发文量排名统计数据可知(见表1)。欧阳日辉以15篇论文发文量高居第一,表明其在数据要素相关领域具备较为深入的研究和持续的投入,王建冬(8篇)及于施洋、任保平和黄倩倩(均6篇)也具有一定的研究贡献和产出。前10名作者的发文量差距较小(5~15篇),研究生态呈现多元化特征,表1数据共同构成了我国数据要素研究领域的核心作者群体,其产出的研究成果对于促进数据要素领域发展具有重要意义。根据CiteSpace所展示的数据要素领域的作者合作网络共现图谱可知(见图2)。欧阳日辉的节点较大且位于中心位置,这与其在表1中的排名相符,进一步验证了其在该领域的影响力。欧阳日辉强调数据要素通过驱动数字经济与实体经济在生产端、流通端、消费端和分配端深度融,提升合企业数据能力、打破融合发展壁垒、支持创新模式探索。研究作者的整体合作网络集中状态有待加强,各研究团队之间在该领域的合作交流不够充分。
3.3. 研究机构可视化知识图谱分析
在CiteSpace的Node Types设置为Institution,根据所显示出的研究机构可视化图谱可知(见图3),可视化图谱中共有292节点,975条连线,密度为0.0226,通过筛选发文量大于10的研究机构,排名在前五名的机构依次是中国人民大学信息资源管理学院(17)、中央财经大学中国互联网经济研究院(16)、武汉大学信息管理学院(15)、国家信息中心大数据发展部(15)和西北大学经济管理学院(12),其中中央财经大学与中国人民大学较早开展相关内容的研究,因此在发文数量与研究持续度上,两所机构均对数据要素相关领域的发展做出重要贡献。但大部分研究机构在CSSCI的发文数量不足3篇,对该领域缺乏深入持续的研究,相互交流合作不够充分。
Figure 3. Co-occurrence network of research institutions in data element research, 2019~2025
图3. 2019~2025年数据要素研究机构共现图谱
3.4. 关键词可视化知识图谱分析
3.4.1. 关键词共现分析
共现分析通过关键词共现分析,可以了解关键词共同出现的频率;而关键词聚类则根据同质性,揭示研究热点的集中分布[12]。由关键词共现可视化图谱可知(见图4),共有298个节点,774条连线。节点的大小反映关键词出现的频率,频次越高,关键词节点越大,与主题的关联性也就越强,意味着其在研究中具有更高的价值,有助于把握数据要素领域的研究热点和未来走向,对于理解当下中国社会发展具有重要的参考价值。该领域高频关键词前5位依次是:“数据要素”(694次)、“数字经济”(155次)、“数据治理”(55次)、“数据交易”(31次)、“公共数据”(25次)。其中“数据要素”的中介中心性为1.85,远超0.1,不仅表明其对于其它关键词具备较强的辐射作用,更表明其在此领域的核心影响力。
3.4.2. 关键词聚类分析
在CiteSpace中使用关键词聚类功能,从而更加深入地理解该领域发展轨迹和内在逻辑,并呈现各个阶段的研究重点。为了衡量聚类结果的准确性,通常会考察模块化值(Modularity Q)和平均轮廓值(Mean Silhouette)这两个重要指标[13]。根据关键词聚类可视化图谱可知(见图5):模块化值(Q)为0.4542 > 0.3;平均轮廓值(S值)为0.9146 > 0.5,表明说明:聚类的社团结构显著且聚类结果具有高信度,具有较高的合理性。聚类编号的大小与聚类规模呈负相关,聚类规模越大,则其中包含的关键词数量越多,据此最终得出9个主要聚类集群,包括共同富裕、数字技术、数据治理、数据交易、数据财政、数据权利、人工智能、乘数效应和政府数据,反映出近年来数据要素领域的研究主要围绕的主题,也是当前领域的研究热点。
Figure 4. Keyword co-occurrence network, 2019~2025
图4. 2019~2025年关键词共现图谱
Figure 5. Keyword cluster analysis, 2019~2025
图5. 2019~2025年关键词聚类图谱
3.4.3. 关键词Timeline分析
在CiteSpace软件中构建以数据要素为关键词的Timeline可视化图谱(见图6)。如图所述,“数据要素”有关的相关文献最早可追溯到2019年,并一直持续到2025年。在此期间中央和国务院对中国数据要素发布了一系列政策文件,体现了国家对其高度重视,也对该领域的研究起到了一定的促进作用。以“数据要素”为核心系统性形成了三大支柱型聚类:1) 基础理论构建阶段的技术驱动维度(2019~2021):“#1数字技术”与前沿的“数据空间”形成强关联。2) 实践应用拓展阶段的制度设计维度(2022~2023):“#2数据治理”作为最大规模聚类,受到较强政策法规层面的推动作用。3) 系统优化升级阶段的经济价值层(2024~2025):“#3数据交易”、“#4数据财政”等经济指标节点与“数据市场”形成价值传导链。
在“#0共同富裕”聚类中,集中在利用数据要素更好地赋能制造业、平台企业,发展数智技术,完善收益分配和缩短城乡差距。在“#1数字技术”聚类中,平台经济中的“反垄断”较早被关注。其中熊鸿儒(2019)提出数据垄断、算法歧视、跨界传导等新型垄断行为对竞争秩序和消费者权益构成威胁[14]。在“#6数据权利”聚类中反映权益分配问题的研究升温。后续研究可聚焦于建立财政数据运作、技术创新与多方权益保障的三元平衡机制上。
Figure 6. Keyword Timeline visualization, 2019~2025
图6. 2019~2025年关键词Timeline图谱
3.4.4. 关键词突现分析
利用CiteSpace对关键词突现进行分析,便于直观的呈现关键词随时间轴的演变趋势,由此较为客观的揭示该领域的前沿热点情况[15]。我国数据要素的研究呈现出明显的阶段性特征(见图7)。具体可分为三个阶段:初始探索期、深化扩展期和体系完善期。
初始探索期(2019~2020)。“数据治理”是早期研究的焦点,强度高达6.53,反映出学术界对其具有较高研究热情。政府作为数据治理不可或缺的角色,“政府数据”的同步爆发表现出政府对于数据治理和共享机制实践探索的需求。唐要家和唐春晖(2020)指出数据治理体系的核心是数据产权政策、数据隐私保护政策、数据竞争政策和数据监管政策[16]。
深化扩展期(2021~2022)。“数据供给”(强度6.39)和“数据共享”(强度1.75)的突显,说明该阶段研究的焦点由数据治理向数据要素市场化流通迁移,注重供给侧改革和数据的价值释放。“反垄断”(强度2.45)及“平台监管”(强度1.6)的热度随之上升,这与政府对数字平台监管力度的增大以及学术上对数据垄断风险的关注度增加相契合。
体系完善期(2023~2025)。“数据产权”(强度3.4)、“数字生态”(强度1.43)彰显出研究方向转向产权界定和生产环境改善,旨在解决数据确权及利益分配方面的难题。“乘数效应”(强度1.61)于2024年起成为新兴研究热点,该现象预示着后续研究重点是探索数据要素与传统产业的融合增值有效路径。
上述不同阶段展现出我国数据要素研究呈现“治理奠基–市场深化–生态构建”阶段性发展轨迹。
Figure 7. Keyword burst detection, 2019~2025
图7. 2019~2025年关键词突现图谱
3.5. 案例研究分析
为验证数据要素对城市治理效率的赋能作用,并探究其现实局限性。选取杭州“城市大脑”项目进行深度案例分析。该项目由杭州市政府和阿里巴巴于2016年共同启动,旨在通过大数据、人工智能等技术整合城市公共数据资源,提升城市治理效能。其主要目标包括:缓解交通拥堵、增强应急响应能力、优化公共服务资源配置。
公共数据开放的交通优化路径及结果
杭州“城市大脑”通过整合包括交通管理、公共安全和气象监测在内的12个职能部门的实时数据资源,构建了一套智能交通调控系统。该项目的数据开放机制主要体现在跨领域数据资源整合、技术基础设施建设和具体场景应用转化三个维度。
杭州市交通管理局的数据显示(见表2),2018年至2022年,杭州核心城区通勤高峰拥堵指数从2.25降至1.78,降幅达20.9%。试点区域信号灯优化后,车辆平均等待时间减少15%~30%,主干道通行速度提升20%。案例表明,通过构建“数据–场景–治理”闭环生态,可以进一步释放数据要素乘数效应,同时为其他城市破解“数据开放–隐私保护–价值释放”三角悖论提供了可复用的方法论框架。
Table 2. Comparison of key traffic optimization metrics in Hangzhou (2018 vs. 2022)
表2. 杭州交通优化核心指标对比(2018 vs. 2022)
指标 |
2018年 |
2022年 |
变化率 |
高峰拥堵指数 |
2.25 |
1.78 |
−20.9% |
信号灯响应延迟(秒) |
45 |
32 |
−28.9% |
公交准点率 |
86% |
98% |
+14% |
4. 结论
本研究基于CiteSpace可视化工具,对2019~2025年中国知网(CNKI)核心期刊中740篇“数据要素”相关文献进行系统性分析得出以下研究结论:
1) 数据要素作为数字化时代的核心生产要素,其学术研究呈现显著的阶段性特征,研究议题与国家政策导向高度契合,为推动数据要素市场化配置、促进数字经济高质量发展提供了理论支撑与实践参考。
2) 数据要素研究的四大核心议题聚焦于:数据确权、流通机制、安全治理和技术创新。数据要素理论创新与政策实践双重维度展开:聚焦数据确权和分配,突出其区别于传统要素的特性;优化数据交易、共享及跨境流动的制度;构建数据隐私保护、反垄断规制风险防控体系;同时探索人工智能等技术赋能数据价值释放的创新路径。杭州“城市大脑”的案例进一步验证,数据要素的流通机制需突破部门壁垒与技术标准差异,未来应构建“全链条数据生态”,通过制度创新与数字技术融合的双轮驱动,建立高质高效的公共治理模式,推动国家治理体系在组织结构、运行流程及价值目标等维度实现结构性优化升级。
3) 研究热点与未来趋势:数字技术、数据交易、公共数据等衍生集群,反映研究重心从理论建构向实践应用拓展;跨学科融合需求显著增加,人工智能等技术与数据要素的交叉研究逐渐增多,凸显多学科协同创新的必要性。
4) 研究局限:作者与机构间协同不足,需强化跨机构和区域的合作;数据要素的基础理论(如价值创造机理)尚未形成共识,亟待深化。