1. 引言
随着信息技术的飞速发展和数字化浪潮的席卷,我们迎来了一个全新的时代——数字经济时代。在这一时代,数据已经超越了其原始的定义,成为了一种新的生产要素,不仅深刻地改变了我们的生产方式、生活方式,还对社会治理方式产生了深远的影响。相较于传统要素,数据要素具有非竞争性、价格差异性和跨时空快速流动性等特点,已然成为数字经济时代的战略性资源[1]。
近年来,我国为推动数据要素价值化进程,密集出台系列政策举措。2020年3月,中共中央、国务院发布《关于构建更加完善的要素市场化配置体制机制的意见》,首次将数据与土地、劳动力、资本、技术等传统生产要素并置,明确数据正式纳入生产要素范畴,同时强调加速培育数据要素市场的重要意义。2022年12月,《中共中央、国务院关于构建数据基础制度更好发挥数据要素作用的意见》(即“数据二十条”)出台,围绕数据产权界定、流通交易规则、收益分配机制、安全治理体系等维度展开全面制度设计,强调在合规、高效、安全的框架下充分激活数据要素价值,为数据要素市场发展锚定宏观方向。2024年初,国家数据局等17部门联合印发《“数据要素×”三年行动计划(2024~2026年)》,重点选取工业制造、现代农业、交通运输等12个领域部署专项行动。这些政策的出台均表明国家正全面推动数据要素融入中国式现代化建设新征程[2]。然而,国内数据要素研究尚处于起步阶段,数据要素价值化链条中仍存在诸多理论与实践难点亟待突破。在此背景下,深入理解数据要素及其市场化的核心目标成为研究焦点,而科学研判未来发展趋势,对培育新质生产力、夯实各行业发展基础具有关键意义。
2. 数据来源与研究方法
2.1. 数据来源
本次研究选择CNKI期刊数据库中CSSCI及北大核心期刊,由于数据要素概念在2020年国家相关发展战略上首次提出,因此本次文献检索的初始时间限制在2020年以后,截止文献检索时间为2024年。检索公式为“篇名 = 数据要素 or 关键词 = 数据要素”,检索结果998篇。通过人工筛选重复引用和低相关的无效文献,最终得到有效文献986篇。
2.2. 研究方法
采用发文量统计、关键词共现、聚类、突现及时间线分析的研究方法,利用CiteSpace知识图谱分析国内数据要素领域在不同时间段内的文献发表数量、发文机构和作者,洞悉国内关于数据要素的研究热度与学术进展情况[3]。
3. 我国数据要素研究的知识图谱分析
3.1. 发文量与发文时间统计分析
根据图1显示,自2020年数据要素被正式作为第五个生产要素以来,我国对数据要素的相关研究总体呈增长趋势,2020~2024年发文数量基本成倍数增加。2024年数量达到高峰,发文量为519篇,预计2025年发文数量会继续上升。
Figure 1. Publication time and quantity of data element research from 2020 to 2024
图1. 2020~2024年我国数据要素研究的发文时间与发文数量
3.2. 发文机构分析
通过将CiteSpace中的Node Types设置为Institution,以此展开对研究机构的分析并绘制了表1。根据表格发现,中国人民大学信息资源管理学院、中央财经大学中国互联网经济研究院以及中国社会科学院的两所研究所是发表文章数量最多的机构。结合图2中所绘制共谱图发现,虽然国内研究机构对于数据要素的研究还不够深入和成熟,但各个机构之间在保证自身对于该领域的研究投入的同时,也积极与其他研究机构进行合作。
Table 1. Top 10 research institutions for data element studies in China from 2020 to 2024
表1. 2020~2024年数据要素研究机构排名前10
序号 |
出现次数 |
机构 |
序号 |
出现次数 |
机构 |
1 |
64 |
中国人民大学 信息资源管理学院 |
6 |
31 |
武汉大学信息 管理学院 |
2 |
56 |
中国财经大学 互联网经济研究院 |
7 |
29 |
清华大学 经济与管理学院 |
3 |
45 |
中国社会科学院 工业经济研究所 |
8 |
27 |
南京大学 信息管理学院 |
4 |
45 |
中国社会科学院 数量经济与技术经济研究所 |
9 |
25 |
国家信息中心 大数据发展部 |
5 |
33 |
吉林大学 经济学院 |
10 |
18 |
中国人民大学 经济学院 |
Figure 2. Knowledge map of publishing institutions for data element research from 2020 to 2024
图2. 2020~2024年我国数据要素研究的发文机构图谱
3.3. 发文作者分析
通过将CiteSpace中的Node Types设置为Author进行发文作者分析,根据分析结果绘制了发文作者的汇总表格,如表2所示。根据表2中的数据发现,排名前三的作者分别为欧阳日辉(20篇)、张夏恒(10篇)、周文泓(9篇),由此可以看出三位学者对数据要素的研究做出了极大的贡献。其余7位作者发文量也很高,尤其是后五位作者的发文量均为7篇,对数据要素的研究也做出了一定的贡献。由图3可知,在研究领域中,周文泓与黄倩倩以及其他学者之间的合作网络相对密切,而欧阳日辉学者虽然发文量最高,但与其他学者之间的合作较少。
Table 2. Top 10 scholars by publication quantity in data element research from 2020 to 2024
表2. 2020~2024年数据要素研究部分学者发文数量排名前10
序号 |
出现次数 |
作者 |
序号 |
出现次数 |
作者 |
1 |
20 |
欧阳日辉 |
6 |
7 |
黄倩倩 |
2 |
10 |
张夏恒 |
7 |
7 |
任保平 |
3 |
9 |
周文泓 |
8 |
7 |
邱均平 |
4 |
8 |
郑煌杰 |
9 |
7 |
李娜 |
5 |
8 |
王晓丹 |
10 |
7 |
史丹 |
Figure 3. Knowledge map of publishing authors for data element research from 2020 to 2024
图3. 2020~2024年我国数据要素的发文作者图谱
4. 我国数据要素发展的研究热点和未来趋势分析
4.1. 数据要素关键词共现分析
本部分运用CiteSpace软件,对所搜集的文献进行关键词共现分析。在可视化图谱里,节点对应关键词,节点间连线体现关键词在文献中共同出现的关联,节点大小直观反映关键词出现频率,一般而言,节点越大,频率越高;颜色常承载时间或特定聚类属性信息。图4中的核心关键词是“数据要素”“数字经济”和“数据治理”等,表明这些是该领域内研究的核心主题,出现频率较高,是研究的重点。其他较小字号的关键词,如“新质生产力”“数据确权”和“数据安全”等,可能是当前研究的热点问题,受到学术界的广泛关注[4]。而其他一些关键词如“人工智能”、“区块链”等,彰显数据要素研究与其他技术领域的交叉融合态势,映射出跨学科协同、多元技术赋能数据要素发展的研究趋势,为该领域拓展研究边界、创新研究路径提供思路。
4.2. 数据要素关键词聚类分析
本部分研究利用CiteSpace软件,在设定节点类型为关键词(Keyword)的情况下,选择时间范围为2020年至2024年,每个时间切片为1年,此为参数生成国内数据要素研究的关键词聚类图谱,如图5所示。从图谱呈现来看,聚类结果清晰展现出该领域的研究结构,“#0数据要素”作为核心聚类,串联起#1、#2和#3等多个子聚类。这些聚类标签既体现数据要素从基础概念到市场应用的研究链条,也能彰显出数据要素与经济发展、社会目标的关联,为梳理该领域研究脉络、挖掘研究热点与趋势提供直观且系统的可视化支撑。
Figure 4. Keyword co-occurrence map of data element research from 2020 to 2024
图4. 2020~2024年我国数据要素研究的关键词共现图谱
图5展示了2020~2024年间关于数据要素领域的研究主题聚类情况,图中每个彩色区域代表一个聚类,标记的数字(如#0、#1等)是聚类的编号,旁边的中文标签是该聚类的主题名称。通过分析所绘制的聚类图谱发现,相关研究领域主要聚焦于以下方面:
(1) 数字经济相关:围绕数字经济展开,涵盖数字政府、大数据等。目前已有的研究主要关注数字技术如何赋能经济领域,探索数字经济新模式、新业态,推动产业数字化转型。
(2) 实体经济与制造业:涉及实体经济和制造业,着重探讨传统产业在数字化浪潮下的发展路径,如何借助数字技术提升实体经济效率与竞争力,实现智能制造等。
Figure 5. Keyword clustering map of data element research from 2020 to 2024
图5. 2020~2024年我国数据要素研究的关键词聚类图谱
(3) 数据要素相关:包含数据价值链、数据确权、数据要素配置、数据流通等。聚焦数据作为关键生产要素,在价值创造、产权界定、资源配置及流通交易等环节的理论与实践问题。
(4) 新质生产力:关注新质生产力,研究新兴技术如何催生新的生产方式和经济增长点,为经济高质量发展注入新动力。
(5) 大数据应用:大数据在各领域的深入应用已成为重要研究方向,包括利用大数据进行精准市场分析、优化决策制定、创新业务模式等,挖掘大数据在经济、社会等多领域的价值潜力,助力行业升级与创新发展。
总体来看,这些聚类反映了数据要素领域的研究热点和趋势,显示了数据要素在不同经济和社会领域中的应用和影响。通过这种聚类分析,研究者可以更好地理解该领域的研究动态,发现潜在的研究空白,并指导未来的研究方向。
4.3. 数据要素关键词Timeline分析
利用CiteSpace软件,生成了我国数据要素研究的关键词Timeline图谱,如图6所示。
Figure 6. Keyword timeline map of data element research in China from 2020 to 2024
图6. 2020~2024年我国数据要素研究的关键词Timeline图谱
根据所绘制的关键词Timeline图谱,我们可以清晰地看到在近年来学者有很多不同的关注焦点。本部分将2020~2021年的研究归为早期、2022~2023年归为中期、2024年归为近期,分成三个阶段进行研究。
(1) #0数据要素:早期“数据要素”“数据安全”和“数字化转型”等关键词出现,此阶段研究围绕数据要素基础概念、安全保障以及交易等应用层面展开,是数据要素研究的起步阶段,着重探索数据要素在各领域应用的可行性与基础条件。中期“政府数据开放”“数据要素市场化”“反垄断”等关键词凸显,研究开始深入到数据要素制度建设、在经济循环中的作用以及市场化配置等层面,推进数据要素实现规范化和市场化发展。近期“新质生产力”出现,表明研究朝着数据要素如何催生新生产力、推动经济高质量发展方向拓展,挖掘数据要素在创新驱动发展中的价值[5]。
(2) #1数字经济:早期围绕“数字经济”“倍增效应”“机制分析”“数字治理”等关键词出现,主要探讨数字经济的内在运行机制、治理模式与经济效应。中期更加关注数字经济与实体经济融合,尤其是对制造业升级的推动作用,以及技术创新和数据定价在数字经济发展中的关键地位。近期“资源配置”“营商环境”“数据信托” 等关键词出现,研究转向数字经济发展的外部环境优化与资源合理配置,探索数据信托等新机制在数字经济中的应用,以促进数字经济可持续发展。
(3) #2新质生产力:早期出现 “数据要素市场化”“价值体现”“一体化”等关键词,探索数据要素市场化对新质生产力价值体现的作用,从一体化视角寻找数据要素驱动新生产力的实现路径[6]。中期“作用机理”“实体经济”等关键词凸显,深入研究新质生产力作用于实体经济的内在机理,以及数据规制在其中的影响,明确新质生产力在实体经济中的价值创造机制。近期“数据要素×”的出现,研究致力于探索如何通过具体路径实现新质生产力的培育与发展,从理论逻辑层面深化对“数据要素×”新质生产力模式的理解。
(4) #3数据治理:早期“数据治理”“产权理论”“公共数据”等关键词出现,从理论层面探讨数据治理的产权基础,以及公共数据在治理体系中的角色,为数据治理体系构建提供理论支撑。中期“数据监管”“企业数据”“数据基础制度”等关键词涌现,研究延伸到企业数据监管、基础制度建设等实际治理问题,聚焦数据治理在企业层面的实践操作与规范管理。近期“数字金融”“数据要素×”“乘数效应”等关键词出现,探索数据治理在数字金融领域的应用及其理论逻辑,关注数据要素与其他要素结合产生的乘数效应,拓展数据治理的应用场景与理论深度。
(5) #4数据要素市场化:早期“市场化配置”“数据流通”“经济增长”等关键词出现,关注数据要素市场化的基础配置与流通环节,以及对经济增长的作用,是数据要素市场化起步探索阶段。中期“全要素生产率”“产业结构高级化”“信用品”等关键词凸显,研究深入到数据要素市场化对经济效率、产业结构升级以及信用体系建设的影响,挖掘其对宏观经济的推动作用。近期“乘数效应”“三权分置”“场景驱动创新”等关键词出现[7],开始关注数据要素市场化的连锁反应与放大效应,以及三权分置等新机制在场景驱动创新中的应用,评估其对经济增长的综合贡献。
(6) #5数据交易:早期“数据交易”“产权界定”“数据资产”等关键词出现,聚焦数据交易的产权界定、资产化等基础问题,为数据交易市场规范运行奠定基础。中期“价值评估”“交易场所”“数据中介”等关键词涌现,研究深入到数据交易的价值评估体系构建、交易场所建设以及中介机构作用等实际操作层面,推进数据交易市场的实体化建设。近期“制造业转型升级”“数据价值释放”“数据交易场所”等关键词出现,关注数据交易对制造业等实体经济转型升级的作用,探索数据价值在交易中的释放路径等问题。
(7) #6数据要素市场:早期“数据要素市场”“反垄断法”“产权界定”等关键词出现,从法律监管角度探讨数据要素市场规范,保障市场公平竞争环境,明确产权界定在市场建设中的重要性。中期“市场主体”“一般均衡模型”“数据权利”等关键词凸显,研究深入到市场主体行为、市场均衡理论以及数据权利保障等层面,构建市场分析理论框架。近期“政策工具”“数据登记”等关键词出现,关注如何运用政策工具引导和规范数据要素市场发展,推进数据登记等基础工作,明确政策主题方向,实现政策与市场的协同共进。
(8) #7价值创造:早期“价值创造”“价值分配”“企业转型”等关键词出现,从理论层面探讨数据要素价值创造与分配机制,以及对企业转型的作用,奠定价值研究基础。中期“实体经济”“作用机理”“数据要素价值”等关键词涌现,研究聚焦数据要素价值创造对实体经济发展的推动作用,深入分析其作用机理,探索价值转化路径。近期“中国式现代化”“经济高质量发展”“创新驱动”等关键词出现,将数据要素价值创造研究与国家发展战略相结合,从宏观层面提升数据要素价值创造的战略高度,强调其在经济高质量发展和创新驱动中的作用。
(9) #8实体经济:早期“实体经济”“传统产业”“数字化转型”等关键词出现,关注数字经济时代传统实体经济面临的挑战与机遇,探索数字化转型方向与路径。中期“信用品”“信用价值”“金融科技”等关键词凸显,研究深入到实体经济信用体系建设、信用价值挖掘以及金融科技对实体经济的支持等层面。近期“中国式现代化”“数据基础设施”“数据资本”等关键词出现,关注实体经济在中国式现代化进程中的发展路径,以及数据基础设施和数据资本对实体经济的支撑作用,探索实体经济新的发展动能[8]。
(10) #9共同富裕:早期“共同富裕”“平台经济”“公平竞争”等关键词出现,探讨平台经济在促进共同富裕中的作用,从经济模式角度寻找共同富裕实现路径,强调公平竞争环境的营造。中期“平台监管”“反垄断”“数据垄断”等关键词涌现,关注平台经济发展中的监管与反垄断问题,保障共同富裕实现过程中的公平竞争环境,防止数据垄断阻碍共同富裕进程。近期“数据劳动”“企业价值”“档案数据要素”等关键词出现,研究深入到数据劳动价值创造、档案数据要素等微观层面,挖掘微观主体在实现共同富裕中的价值[9]。
总体来看,数据要素领域研究从基础概念、理论与应用起步,逐渐向制度建设、市场机制、价值创造、与宏观经济及国家战略结合等方向拓展,反映了该领域研究不断深入、细化与完善的过程。
4.4. 数据要素关键词突现分析
本部分研究将CiteSpace软件中的设置参数设为“Burstnes”,生成了关键词突现图谱,如图7所示。通过对突现 内容进行分析,可以帮助未来的研究者了解某个领域在特定时间段内的热点问题,识别出各个时段出现的新主题或关键词,更好地把握后续的研究方向和关注重点。根据图7生成的关键词图谱,摘取了五个主要的关键词分析其突现年份、强度、持续时间和研究阶段特征,如下表3所示。
Table 3. Core data comparison of top 24 burst keywords
表3. Top 24突现关键词核心数据对比
关键词 |
突现年份 |
强度 |
持续时间 |
研究阶段特征 |
市场化配置 |
2020年 |
8.59 |
2020~2022年 |
数据要素市场化机制的基础探索 |
数据共享 |
2020年 |
1.71 |
2020~2024年 |
长期聚焦数据流通与协同利用 |
数据要素市场 |
2020年 |
4.34 |
2021~2022年 |
市场建设初期的规则与模式研究 |
数字政府 |
2021年 |
0.32 |
2021~2024年 |
政府数据开放与治理体系构建 |
新发展格局 |
2022年 |
1.98 |
2022~2024年 |
数据要素与经济发展全局的协同研究 |
Figure 7. Keyword clustering map of data element research in China from 2020 to 2024
图7. 2020~2024年我国数据要素研究的关键词聚类图谱
根据图片中数据要素研究的关键词突现情况,可以将其分为以下几点:
(1) 突现强度分析
从突现强度来看,“市场化配置””是数据要素领域中突现度最高的关键词(强度8.59)。数据要素作为新型生产要素,其市场化配置是优化资源分配的核心环节。在数字经济背景下,数据的价值释放依赖于市场化机制的建立,包括数据定价、交易规则等,因此成为研究焦点。
(2) 关键词出现时间分析
早期“生产要素”“大数据”等关键词早期出现,反映了数据要素在经济体系中的基础定位。2020年政策明确将数据纳入生产要素,推动学界对数据作为生产要素的属性、作用机制展开研究,而“生产要素”“大数据”“数字产业化”则与技术应用初期的探索相关。2021年起“数据共享”“数据交易”“数据要素市场化”等关键词逐渐凸显。随着数据要素市场建设的推进,数据流通、交易规则及市场机制成为研究重点。
(3) 突现时间分布与持续时长分析
从长期来看,“数据共享”突现持续时间最长,因其是数据要素价值释放的前提,涉及技术标准、隐私保护、跨主体协同等复杂问题,需长期探索。“数字政府”与“数据流通”的持续热度,体现了政策驱动下政府数据开放与社会数据流通的协同需求,例如公共数据资源的开发利用、数据安全流通体系建设等。短期来说,多数关键词突现持续时间为2~3年(如“反垄断”“公平竞争”等),反映出数据要素领域研究随政策与市场动态快速更新。例如2021年《反垄断法》修订后,数据垄断、平台竞争规则等议题短期内成为焦点。
(4) 研究时长与趋势分析
2020~2021年:研究集中于数据要素的基础属性(如“生产要素”“大数据”)和技术产业化应用(“数字产业化”“产业数字化”)。2022~2024年:研究向制度建设与生态构建延伸,“新发展系统”“生态系统”“基础制度”等关键词凸显,表明学界开始关注数据要素市场的顶层设计、法律框架及可持续发展路径。
5. 研究结论
本文基于CNKI和CSSCI数据库2020年~2024年文献,运用CiteSpace分析发现,我国数据要素研究自2020年后发文量持续增长,2024年达519篇,较2020年的29篇实现了近20倍的增长,这一数据充分表明数据要素领域已成为学术研究的热点方向。研究聚焦数据要素、数字经济、数据治理等核心主题,涉及数据确权、市场化配置、数据交易等基础问题,与区块链、人工智能等技术交叉融合显著,且政策驱动下新质生产力、中国式现代化、共同富裕成为新兴热点[10]。研究演进呈现三阶段特征:早期聚焦基础概念与技术应用,中期转向市场化机制与制度设计,近期强调新质生产力培育及国家战略耦合。未来需从三方面深化突破:
(1) 数据产权界定层面:建立“所有权–使用权–收益权”分层确权模式,制定数据产权负面清单制度,通过“白名单 + 负面清单”双轨制明确个人数据人格权、企业数据用益权、国家数据治理权的边界细则,同步构建数据产权登记公示系统。
(2) 价值评估体系建设层面:构建“成本–收益–风险”三维动态评估模型,整合数据采集成本、使用场景溢价、安全合规成本等量化指标,推动学术界建立数据要素价值评估数学模型,实务界试点行业基准价格指数,培育第三方数据资产评估机构。
(3) 跨领域协同机制构建层面:成立由工信部、发改委、司法部等组成的跨部门数据治理委员会,建立技术标准(如数据分类分级标准)与法律规范(如《数据安全法》实施细则)的衔接机制,推动数据要素在区块链存证、智能合约执行、数字经济统计核算等场景的跨领域应用创新。