1. 引言
在全球数字化转型的推动下,数据作为一种新型生产要素,正日益成为推动经济社会发展的核心动力之一。为推动数字中国建设和引领数字化转型,我国率先在全球范围内提出了“数据要素”的概念,并将其纳入国家发展的战略重点[1]。自2019年以来,国家相继出台了多项涉及数据要素的基础性政策文件,如《关于构建更加完善的数据要素市场化配置体制机制的意见》《“十四五”数字经济发展规划》《关于构建数据基础制度更好发挥数据要素作用的意见》等。随着新一轮科技革命和产业变革的深入推进,数据的战略地位愈加重要。在这一背景下,学术界和实务界对数据要素展开了广泛关注,研究内容涵盖了数据的价值、治理、管理及其在多领域的应用。
然而,尽管关于数据要素的研究逐渐增多,当前针对其研究现状的系统性梳理仍相对欠缺。虽然研究者们在理论框架构建、实证分析和应用实践等方面取得了一定进展,但在文献数量、研究方向、热点问题及前沿趋势等方面,仍需进一步深入分析。为此,本文基于CiteSpace文献计量分析工具,针对我国学术界在数据要素领域的研究现状、热点与前沿趋势进行了量化分析。通过对核心期刊文献的可视化分析,本文旨在全面展示我国数据要素研究的整体态势,并为后续的研究与实践提供参考依据。
2. 数据来源
本研究于2024年10月15日通过高级检索在CNKI数据库中进行,检索主题为“数据要素”,时间范围限定为2015年至2024年。检索匹配方式为“精确”,来源类别包括“北大核心期刊”、“中文社会科学引文索引(CSSCI)”以及“中国科学引文数据库(CSCD)”。经过人工筛选,剔除摘要、新闻类文献后,共获得1097篇高质量文献,作为本研究的分析样本。
3. 研究方法
CiteSpace是一款基于数据可视化背景下,通过处理文献资料生成科学知识图谱的可视化分析软件[2]。本研究采用CiteSpace软件(版本V6.1.R6)对筛选出的文献进行可视化分析,时间切片(years slicing)设置为1年。在研究现状部分,分析了“数据要素”领域的发文情况,包括文献数量的时间分布、核心作者及其合作网络、研究机构及主要发文期刊等内容。在研究热点与前沿趋势部分,基于关键词词频分析,进一步通过关键词聚类揭示该领域的研究热点,并通过突现词分析展示我国数据要素研究的前沿趋势。
1) 关键词是对研究文献核心内容的高度概括与提炼,能够简洁明了地体现文献的中心思想,反映作者的研究方向和研究价值[3]。关键词词频分析用于统计文献中关键词的出现频率,常常代表当前的热点研究主题,反映出科学研究的主要关注点。在软件操作方面,本研究在进行CiteSpace分析时,节点阈值(selection criteria)采用默认设置,网络裁剪(pruning)选择对每个时间切片的网络进行裁剪(pruning sliced networks),同时勾选路径向导(pathfinder)和修剪边缘网络(pruning the merged network)选项,以优化网络结构的呈现。
2) 关键词聚类分析通过科学计算,将相互关联度较高的关键词归为若干主题词组。本研究在关键词词频分析的基础上,利用CiteSpace软件自带的聚类功能对关键词进行聚类分析,并展示了前10个聚类结果,以进一步揭示该领域的研究热点和主题结构。
3) 突现词是指在特定时间段内出现频率显著增加的关键词,能够反映该时间段内的研究前沿和热点。鉴于本研究的时间跨度较长,在综合比较结果后,本研究选择了持续时间超过3年的关键词进行展示,以更好地揭示长期关注的研究热点及趋势。
4. 我国数据要素研究现状分析
4.1. 发文数量的时间分布
Figure 1. Annual distribution of the number of published papers on China’s data elements
图1. 我国数据要素发文数量的年度分布
发文数量随时间的变化能够反映出学术界对该研究领域的关注程度[4]。从2016年至2024年,数据要素领域的高质量文献发文数量逐年增加,年均发文数量呈现快速增长态势,年度分布如图1所示。这一趋势揭示出,随着数据要素概念的提出和相关政策的推动,学者们对这一领域的关注和研究显著加深。特别是在2020年后,发文数量大幅增加,显示出数据要素研究已成为近年来学术界的重要热点。
从年发文数量的分布情况来看,可以将数据要素领域的研究大致分为以下四个阶段:1) 萌芽阶段(2016~2019年),这一阶段的发文数量较少且波动较大,每年的发表数量在个位数徘徊,最少为2篇,最多为7篇,明显低于整体平均发文数量。表明此阶段“数据要素”尚未成为明确的学术与政策核心概念,国家层面尚未出台针对性的基础性政策,学术界对数据的研究多集中于“大数据”“数据治理”等泛化议题,数据要素的独立研究价值未被充分挖掘,因此研究关注度较低;2) 快速增长阶段(2020~2021年),从2020年开始,发文数量出现明显提升,年度发文量由之前的个位数迅速增加到43篇,并在2021年达到了87篇。这一阶段的增长与国家政策的密集出台直接相关:2019年我国首次明确将数据作为生产要素纳入战略范畴,2020年《关于构建更加完善的数据要素市场化配置体制机制的意见》正式发布,为数据要素研究提供了明确的政策导向与研究框架,推动学术界从“泛数据研究”转向“数据要素专项研究”,研究系统性显著增强;3) 加速扩展阶段(2022~2023年),在此阶段,发文数量继续快速上升,从2022年的185篇增长到2023年的343篇。2021年《“十四五”数字经济发展规划》将数据要素市场建设作为重点任务,2022年《关于构建数据基础制度更好发挥数据要素作用的意见》进一步明确“数据二十条”,政策红利持续释放,同时数字经济与实体经济融合加速催生了大量实践问题,推动法学、经济学、信息科学等多学科研究者涌入该领域,研究热度实现爆发式增长;4)高峰稳定阶段(2024年),截至2024年,发文数量达到了422篇,呈现高峰态势。这一阶段数据要素市场从“政策设计”进入“落地实践”阶段,上海、深圳等数据交易所的运营实践、数据确权的司法案例等为研究提供了丰富素材,学术界开始聚焦于具体问题的深度破解,研究呈现“总量增长、质量提升”的稳定态势,标志着该领域研究逐步走向成熟。
4.2. 核心作者与作者共现合作网络分析
本研究涉及的文献共计有237位作者。根据普莱斯(Price)定律[5],核心作者的发文量阈值可用公式表示为:
,其中N为核心作者发表的文献阈值,
最高产作者的发文数量。统计显示,发文最多的作者为陈兵,共发表16篇文献。根据计算,核心作者的最低发文量为2.99篇,取整数后为3篇。因此,本文确定的核心作者包括发文数量在3篇及以上的作者,共计48人。核心作者的数量占总作者数量的20%,这说明在数据要素领域内,有较多的研究者持续且深入地参与相关研究,形成了一批相对集中的高产学者群体,见表1。
Table 1. Statistical results of the number of published papers and affiliations of core authors (Top 20)
表1. 核心作者发文数量及工作单位统计结果(前20位)
序号 |
作者姓名 |
发文数量 |
首次发文年份 |
工作单位 |
1 |
陈兵 |
16 |
2021 |
南开大学法学院 |
2 |
欧阳日辉 |
15 |
2022 |
中央财经大学中国发展和改革研究院 |
3 |
王建冬 |
13 |
2020 |
国家发展和改革委员会价格监测中心 |
4 |
杨东 |
10 |
2020 |
中国人民大学法学院 |
5 |
夏义堃 |
8 |
2020 |
武汉大学信息管理学院 |
6 |
马海群 |
7 |
2023 |
黑龙江大学信息管理学院 |
7 |
尹西明 |
6 |
2022 |
北京理工大学管理与经济学院 |
8 |
陈劲 |
6 |
2022 |
清华大学经济管理学院 |
9 |
刘达 |
5 |
2024 |
东北师范大学经济与管理学院 |
10 |
高富平 |
5 |
2022 |
华东政法大学法律学院 |
11 |
张会平 |
5 |
2023 |
电子科技大学公共管理学院 |
12 |
石玉堂 |
5 |
2024 |
东北师范大学经济与管理学院 |
13 |
任保平 |
5 |
2022 |
南京大学数字经济与管理学院 |
14 |
聂耀昱 |
4 |
2023 |
清华大学五道口金融学院 |
15 |
夏杰长 |
4 |
2023 |
中国社会科学院大学商学院 |
16 |
林镇阳 |
4 |
2022 |
清华大学计算机技术与科学系 |
17 |
于柳箐 |
4 |
2024 |
西北大学经济管理学院 |
18 |
李爱君 |
4 |
2022 |
中国政法大学互联网金融法律研究院 |
19 |
姬祥飞 |
4 |
2023 |
西安石油大学经济管理学院 |
20 |
赵需要 |
4 |
2023 |
西安石油大学经济管理学院 |
Figure 2. Co-authorship network map of data element research in China
图2. 我国数据要素研究作者共现合作网络图
通过CiteSpace软件绘制的作者共现合作网络图,见图2,展示了选择合作频次大于2次的作者及其合作网络的情况。结果显示:该网络包含237个节点和132条连线,网络密度为0.0047。这一较低的网络密度表明作者之间的合作程度不高,整体合作网络较为松散。在合作网络中,陈兵、欧阳日辉、杨东等团队在数据要素研究领域中占据核心位置,具有较强的学术影响力。其中,陈兵团队的研究时间跨度较长,持续活跃于该领域。欧阳日辉团队在近几年成为研究主力,发文数量显著,表明他们对该领域的深入参与。此外,王建冬团队自2020年以来发文频繁,显示出对该领域的高度关注。总体来看,数据要素研究领域已经形成了一定的核心作者网络,但整体合作密度较低,研究者之间的合作关系仍显松散。未来,通过加强不同团队间的协作,有望进一步提升该领域的研究深度和影响力,形成更加紧密的学术合作群体。
4.3. 研究机构
本研究涉及的发文机构共有214家,其中发文数量在4篇及以上的机构共计52家,见表2。从发文机构的类型来看,主要包括信息管理学院、法学院、经济管理学院及相关科研院所,也包含若干大数据研究中心和政府部门的研究机构,这表明数据要素研究领域呈现出多学科、多部门参与的特点。
发文数量最多的机构是中国人民大学信息资源管理学院,共发表文献22篇,其次为武汉大学信息管理学院,发文数量为18篇。国家信息中心大数据发展部、南开大学法学院以及西北大学经济管理学院各发表了16篇文献,显示出这些机构在数据要素研究中的重要影响力。发文4篇及以上的机构数量为52家,占全部文献发文总量的24%,这表明在数据要素研究领域中,研究力量主要集中在部分高校和科研院所,体现了这些核心机构的持续研究投入。
Table 2. Number of published papers by key research institutions on China’s data elements (Top 20)
表2. 我国数据要素主要研究机构及发文数量(前20家)
研究机构 |
发文数量 |
中国人民大学信息资源管理学院 |
22 |
武汉大学信息管理学院 |
18 |
国家信息中心大数据发展部 |
16 |
南开大学法学院 |
16 |
西北大学经济管理学院 |
16 |
中国人民大学法学院 |
14 |
中国政法大学民商经济法学院 |
14 |
中央财经大学中国互联网经济研究院 |
14 |
中国人民大学经济学院 |
13 |
吉林大学经济学院 |
12 |
北京大学经济学院 |
11 |
中国社会科学院财经战略研究院 |
11 |
中国社会科学院数量经济与技术经济研究所 |
11 |
中国科学院大学经济与管理学院 |
11 |
黑龙江大学信息管理学院 |
10 |
南京大学信息管理学院 |
10 |
中国政法大学商学院 |
9 |
清华大学社会科学学院 |
9 |
深圳市数聚湾区大数据研究院 |
8 |
中国社会科学院大学应用经济学院 |
8 |
4.4. 主要发文期刊
本研究中,关于数据要素领域的相关研究文献,刊载最多的期刊为《电子政务》,共计40篇,占全部研究文献的相当比例;其次为《中国金融》,共发表33篇,《价格理论与实践》则发表了30篇,三者均为北大核心期刊。此外,《情报理论与实践》和《图书与情报》分别刊载了26篇和19篇,均为北大核心及CSSCI期刊。根据统计,CSSCI和/或CSCD (包含扩展版)期刊来源的文献数量共计162篇,占比较大。其中,刊载数量相对较多的期刊还有《信息资源管理学报》(CSSCI,18篇)、《上海经济研究》(CSCD,14篇)以及《统计与决策》(CSSCI,12篇)等。此外,北大核心期刊《现代情报》刊载了11篇文献,显示出该期刊在数据要素领域中的一定影响力,见表3。
Table 3. Key journals publishing papers on China’s data elements (Top 20)
表3.我国数据要素研究的主要发文期刊(前20)
发文期刊 |
发文数量/篇 |
入编目录情况 |
北大核心 |
CSCD |
CSSCI |
电子政务 |
40 |
√ |
|
√ |
中国金融 |
33 |
√ |
|
|
价格理论与实践 |
30 |
√ |
|
|
情报理论与实践 |
26 |
√ |
|
√ |
图书与情报 |
19 |
√ |
|
√ |
信息资源管理学报 |
18 |
|
|
√ |
商业经济研究 |
15 |
√ |
|
|
上海经济研究 |
14 |
√ |
|
√ |
统计与决策 |
12 |
√ |
|
√ |
税务研究 |
12 |
√ |
|
√ |
经济纵横 |
12 |
√ |
|
√ |
改革 |
12 |
√ |
|
√ |
现代情报 |
11 |
√ |
|
√ |
数字图书馆论坛 |
11 |
|
|
√ (扩展版) |
财会月刊 |
11 |
√ |
|
|
人民论坛 |
10 |
√ |
|
√ |
科技进步与对策 |
10 |
√ |
|
√ |
技术经济与管理研究 |
10 |
√ |
|
|
中国工业经济 |
9 |
√ |
|
√ |
征信 |
9 |
√ |
|
|
5. 研究热点与前沿趋势
5.1. 基础分析:关键词词频分析
根据CiteSpace软件对关键词进行分析,共得到了352个节点和420条连线,网络密度为0.0068,见图3。
Figure 3. Analysis of keyword frequency in research on data elements in C h i n a
图3. 我国数据要素研究关键词词频分析
研究中选取了频次 ≥ 6次的关键词进行展示,见表4。除了“数据要素”这一核心关键词外,其他高频关键词还包括“数字经济”(166次)、“数据治理”(89次)、“数据交易”(61次)、“数据资产”(61次)等。这些关键词表明学者们主要关注数据要素的内涵、数据治理机制以及数据资产化过程等方面的内容。
从关键词的中介中心性来看,中介中心性大于0.10的关键词可以被视为共现网络中的关键节点[6],其在学术网络中的桥梁作用显著。尽管关键词的频次和中介中心性并不总是呈正相关关系,但仍有一些关键词在二者之间取得了较好的平衡。例如,“数据治理”的中介中心性达到0.67,显示出其在研究网络中的重要地位,成为连接各研究主题的关键枢纽。此外,“生产要素”(中介中心性0.64)和“大数据”(中介中心性1.02)也起到了显著的桥梁作用,尽管其频次相对较低,但在构建学术网络整体结构中发挥了不可替代的作用。关键词如“数据要素”(442次)、“数字经济”(166次)等,尽管它们的频次很高,但在中介中心性上的表现则相对普通。相反,一些中介中心性较高的关键词,如“数据治理”、“生产要素”、“大数据”等,尽管在频次上并不是最高,但在研究领域中扮演了桥梁作用,连接着多个研究主题的讨论,是理解数据要素研究脉络的重要纽带。
“大数据”的“高中心性、低频次”特征具有明确的学术演进逻辑,该词于2017年较早出现,是数字经济发展初期的核心议题,为数据要素研究奠定了技术与认知基础(如数据采集、存储、分析等技术框架)。随着2019年“数据要素”概念的正式提出,学术界的研究重心从“数据本身的技术属性与治理”转向“数据作为生产要素的经济价值与制度设计”,“大数据”逐渐成为无需反复强调的基础性前提,因此出现频次(27次)远低于“数据要素”(442次)和“数字经济”(166次)。但其高达1.02的中介中心性表明,“大数据”仍是连接“数据治理”(聚类#1)、“数字经济”(聚类#4)与“技术创新”(聚类#10)的关键枢纽,是理解数据要素从“技术资源”向“生产要素”转化的核心逻辑纽带。
相比之下,关键词如“数据要素”(442次)、“数字经济”(166次)等,尽管它们的频次很高,但在中介中心性上的表现则相对普通,这是因为其作为核心主题词,更多承担“研究焦点”角色而非“跨主题连接”功能。而“数据治理”“生产要素”等关键词则通过连接技术研究、经济分析、制度设计等不同维度,构成了研究网络的骨架。
Table 4. List of high-frequency keywords (Top 20)
表4. 高频关键词列表(前20)
序号 |
关键词 |
频次 |
中介中心性 |
出现年份 |
1 |
数据要素 |
442 |
0.43 |
2019 |
2 |
数字经济 |
166 |
0.18 |
2020 |
3 |
数据治理 |
89 |
0.67 |
2017 |
4 |
数据交易 |
61 |
0.1 |
2020 |
5 |
数据资产 |
61 |
0.25 |
2021 |
6 |
公共数据 |
47 |
0.05 |
2021 |
7 |
数据产权 |
46 |
0.03 |
2020 |
8 |
数据 |
45 |
0.11 |
2019 |
9 |
数据确权 |
36 |
0.13 |
2021 |
10 |
数据安全 |
34 |
0.1 |
2020 |
11 |
数据流通 |
31 |
0.1 |
2020 |
12 |
生产要素 |
30 |
0.64 |
2020 |
13 |
大数据 |
27 |
1.02 |
2017 |
14 |
政府数据 |
24 |
0.11 |
2020 |
15 |
数据资源 |
22 |
0.12 |
2022 |
16 |
公共富裕 |
19 |
0.04 |
2022 |
17 |
经济增长 |
16 |
0.05 |
2020 |
18 |
区块链 |
14 |
0.19 |
2020 |
19 |
数据开放 |
14 |
0.13 |
2020 |
20 |
数据定价 |
14 |
0.03 |
2022 |
21 |
授权运营 |
14 |
0.08 |
2023 |
22 |
数据垄断 |
14 |
0.14 |
2020 |
23 |
数据价值 |
14 |
0.09 |
2022 |
24 |
数据共享 |
13 |
0.16 |
2020 |
25 |
企业数据 |
13 |
0.28 |
2022 |
26 |
数据资本 |
11 |
0 |
2023 |
27 |
数据市场 |
11 |
0.17 |
2020 |
28 |
数据权属 |
11 |
0.02 |
2022 |
29 |
数据财政 |
10 |
0.02 |
2020 |
30 |
数据赋能 |
10 |
0.04 |
2021 |
31 |
数字政府 |
10 |
0 |
2023 |
32 |
金融科技 |
10 |
0.05 |
2021 |
33 |
乘数效应 |
9 |
0.02 |
2024 |
34 |
实体经济 |
9 |
0.14 |
2023 |
35 |
数据供给 |
9 |
0 |
2020 |
36 |
制造业 |
8 |
0.02 |
2021 |
37 |
人工智能 |
8 |
0 |
2019 |
38 |
数字劳动 |
7 |
0.01 |
2023 |
39 |
要素市场 |
7 |
0.01 |
2023 |
40 |
价值创造 |
7 |
0.02 |
2023 |
41 |
数据驱动 |
7 |
0.06 |
2018 |
42 |
个人数据 |
7 |
0.01 |
2022 |
43 |
数字技术 |
7 |
0.05 |
2022 |
44 |
数据管理 |
6 |
0.05 |
2017 |
45 |
收益分配 |
6 |
0.07 |
2023 |
46 |
收入分配 |
6 |
0.02 |
2020 |
47 |
数据权利 |
6 |
0.03 |
2022 |
48 |
数据信托 |
6 |
0 |
2023 |
49 |
技术创新 |
6 |
0.09 |
2023 |
5.2. 研究热点:关键词聚类分析
关键词聚类分析的模块值和轮廓值均显示,聚类结果具有较好的效果,能够合理地反映出该领域的总体情况。模块值为0.986,大于临界值0.500,平均轮廓值在各聚类中均高于临界值0.700,这几个数值背后蕴含着该领域清晰的知识结构特征,模块值(Q = 0.986)远高于0.5的临界标准,表明我国数据要素研究已形成边界清晰、独立性较强的子研究领域,各聚类代表的研究方向(如数据治理、数据确权、数据安全、赋能经济)之间既有交叉又保持相对独立的研究重心,未出现明显的主题混淆,这与研究机构的多学科属性形成呼应。法学院聚焦数据权益与监管,信息管理学院侧重数据资源与技术,经济学院关注价值与增长,学科分工明确但又围绕“数据要素”核心形成整体。平均轮廓值(S > 0.7)则反映出各聚类内部的关键词关联度极高,例如聚类#0“数据要素”中“人工智能”“数据安全”“数据资产”的高频共现,体现了宏观层面对数据要素产业发展的多维度聚焦;聚类#7“数据确权”中“数据权利”“数据定价”“要素市场”的紧密关联,则反映出微观层面对权益分配机制的深度探索,表明各子领域的研究已形成体系化框架,而非零散议题的堆砌[7]。基于高频关键词聚类图图4和表5分析,我国数据要素研究领域可以分为多个方面。通过对聚类标签和相关文献的分析,总结出以下四个研究热点。
1) 根据聚类标签#0数据要素、#1大数据、#3数据资源、#4数字经济、#14生产要素,归纳得到研究热点一,即对数据要素产业发展现状、存在问题及政策建议进行分析,并提出趋势预测。此类研究主要侧重于宏观政策和产业层面的数据要素发展情况,涉及对数据治理、数据规制等方面的研究。如宋烁[8]对数据开放的用户需求导向进行了研究,提出应改造高价值数据认定程序。常宜龙[9]从数据要素市场化的角度分析了数据要素对商贸流通效率的提升。此类文献的研究强调政策与市场的协调推进,为构建数据要素市场的良好发展环境提供了政策参考。
2) 根据聚类标签#2个人数据、#7数据确权、#10技术创新,归纳得到研究热点二,即对数据确权及其价值化的过程和机制进行研究。主要研究方向包括个人数据的流通与保护,数据确权的理论与实践等。如李森[10]探讨了在数字经济背景下企业数据财产权的确权问题,并提出应以“单一赋权 + 合理限制”的理论构造来解决数据确权中的复杂性。朱秀梅等[11]对数据价值化进行了系统的梳理,并提出数据价值化的整合研究框架,涵盖数据资源化、资产化、商品化及资本化等阶段。
3) 根据聚类标签#5数据安全、#6平台经济、#9机器学习,归纳得到研究热点三,即对数据安全、数据流通及相关技术应用进行分析。这些研究主要集中在数据交易的安全性、平台经济中的数据垄断与数据流通的法律监管等方面。如李振宇等[12]提出基于区块链的数据加速交换方法,用于提升数据要素流通过程中的信任和监管能力。张川等[13]研究了联盟链技术在数据要素交易中的应用,并提出了一种跨联盟链的数据要素交易审计方案,以保障数据隐私和交易安全。
4) 根据聚类标签#8授权运营、#11政府数据、#12关键要素,归纳得到研究热点四,即数据要素赋能经济增长和创新驱动机制的研究。此类研究强调数据如何作为生产要素,通过创新驱动促进产业发展。如郭凯明等[14]探讨了数据要素在产业结构转型和生产率提升中的作用,指出数据要素的规模效应可以有效推动产业升级。王海等[15]基于公共数据开放对企业有效投资的影响进行了研究,发现省级公共数据平台的上线有助于优化产能利用,促进企业的有效投资。
Figure 4. Clustering map of high-frequency keywords
图4. 高频关键词聚类图
Table 5. Clustering information of high-frequency keywords
表5. 高频关键词聚类信息
聚类编号 |
聚类标签 |
发文数量/篇 |
轮廓值 |
包含关键词(选取前5个) |
#0 |
数据要素 |
46 |
1 |
数据要素、人工智能、数据、数据安全、数据资产 |
#1 |
大数据 |
44 |
0.95 |
大数据、数据治理、数据规制、数据监管、数据管理 |
#2 |
个人数据 |
23 |
0.942 |
个人数据、数据流通、企业数据、个人信息、利益平衡 |
#3 |
数据资源 |
22 |
0.986 |
数据资源、数据资产、数据产品、实践路径、会计确认 |
#4 |
数字经济 |
22 |
0.984 |
数字经济、数据产权、经济增长、政策建议、收入分配 |
#5 |
数据安全 |
20 |
0.931 |
数据安全、数据交易、数据价值、激励机制、机制设计 |
#6 |
平台经济 |
20 |
0.988 |
平台经济、金融科技、数据垄断、数字劳动、开放银行 |
#7 |
数据确权 |
19 |
0.898 |
数据确权、数据权利、数据定价、要素市场、规制 |
#8 |
授权运营 |
17 |
0.917 |
授权运营、公共数据、数字政府、共同富裕、价值创造 |
#9 |
机器学习 |
16 |
1 |
机器学习、随机森林、数据市场、倍增效应、数据权益 |
#10 |
技术创新 |
16 |
0.918 |
技术创新、融资约束、融合发展、实体经济、欧盟 |
#11 |
政府数据 |
15 |
0.914 |
政府数据、数据开放、图情档学科建设、新型智库建设、科学大数据 |
#12 |
关键要素 |
15 |
0.919 |
关键要素、作用机制、实现路径、扎根理论、数据驱动 |
#13 |
数据 |
12 |
1 |
数据、创新驱动、政治经济学、存储、矢量空间 |
#14 |
生产要素 |
11 |
0.975 |
生产要素、激励网络、要素分配、分账机制、资产 |
5.3. 前沿趋势:突现词分析
本研究共识别出25个突现词,突现词分析结果见图5。结合3.1中对数据要素研究阶段的划分,我们可以看出我国数据要素领域前沿研究热点的演进趋势。
5.3.1. 萌芽阶段(2016~2019年):数据治理与管理
在萌芽阶段,数据要素的研究尚处于初步探索期,研究重点主要集中在数据治理和管理框架的搭建。该阶段的主要突现词有“大数据”“数据治理”“数据管理”等。2016年以后,随着我国信息化建设的不断推进,社会对数据的管理和治理需求逐渐增加,推动了相关领域的学术研究。为了适应快速发展的信息环境,我国政府发布了一系列政策,以支持数据基础设施建设、数据资源管理以及数据安全治理。这些政策的出台为该领域研究提供了重要支持,研究者们开始关注如何通过有效的数据治理手段来保障数据的合规性和有效利用,从而推动数据作为资源的潜力逐渐释放。
5.3.2. 快速增长阶段(2020~2021年):数据供需与竞争
从2020年起,数据要素领域进入了快速增长期,研究逐渐扩展到数据作为经济生产要素的应用探索。该阶段的主要突现词有“数据供给”“生产要素”“数据竞争”等。随着数字经济的兴起,数据资源的重要性愈发显现,社会各界对数据的需求快速增长,使得数据的供需关系成为学术研究的重点议题。同时,“数据竞争”成为重要突现词,表明研究者们开始关注不同主体之间的数据获取、应用和竞争策略。在这一背景下,学术界从多角度探讨了如何通过数据供给体系和市场机制来实现数据资源的高效配置,从而增强经济增长动力。
Figure 5. Results of keyword burst analysis for research on China’s data elements
图5. 关键词突变分析结果
5.3.3. 加速扩展阶段(2022~2023年):数据权益与经济增长
在2022至2023年期间,数据要素领域进入了加速扩展期,研究热度不断攀升。该阶段的主要突现词包括“数据权益”“经济增长”“数据共享”等,表明研究者们开始深入探讨数据的法律属性和权益分配问题。伴随着国家对数字经济的重视程度提高,数据权益保护和利用的议题成为研究的核心,特别是如何通过政策和技术手段来实现数据共享的合理化和权益保护。同时,数据要素对经济增长的促进作用成为学界的热门议题,研究者们聚焦于如何通过数据要素的高效利用来推动国家经济增长,并寻求数据在新兴经济领域的应用机会。
5.3.4. 高峰稳定阶段(2024年):数据监管与规范化管理
截至2024年,数据要素领域的研究已达到一个相对稳定且高峰的状态。该阶段的主要突现词如“数据监管”“数据垄断”等表明,研究重点逐渐转向数据的规范化管理与监管。随着数据作为关键资源在各个领域的广泛应用,如何有效地监管数据的流通、保障数据安全以及应对不同主体之间的数据权属纠纷,成为学术界和政策制定者共同关注的问题。同时,研究者们也关注如何通过数据差异化管理,来应对不同地区和产业之间的数据不均衡现象,从而实现数据资源的公平、高效配置。
6. 结论
从发文时间来看,2016~2024年,我国数据要素领域的研究发文数量呈现显著的增长趋势,大致可分为四个阶段:萌芽阶段、快速增长阶段、加速扩展阶段和高峰稳定阶段。从核心作者来看,我国数据要素研究领域已经形成了由多个高产学者及其团队构成的作者网络群,其中以陈兵、欧阳日辉、杨东等为代表的研究团队在该领域中占据核心地位,显示出强大的学术影响力。从研究机构来看,发文量最多的机构是中国人民大学信息资源管理学院,其次是武汉大学信息管理学院和国家信息中心大数据发展部,显示了这些机构在数据要素领域的研究中的主导地位。从发文期刊来看,发文数量最多的期刊为《电子政务》,其次为《中国金融》和《价格理论与实践》,这三种期刊是数据要素领域研究的重要发表平台。从关键词聚类分析结果来看,我国数据要素研究主要关注以下四个方面:一是对数据要素产业的现状、存在问题以及未来发展趋势的预测和建议;二是对数据确权、数据权益保护及数据价值化过程进行研究;三是对数据安全、数据交易的安全性、以及平台经济中的数据垄断和流通监管问题进行分析;四是对数据要素如何通过创新驱动赋能经济增长进行探索研究。从关键词突现结果来看,我国数据要素研究的关注重点经历了从“数据治理”“数据供给”到“数据权益”再到“数据监管”的演化路径,特别是2022~2024年,研究热点集中在数据权益保护、经济增长与数据监管等方面。
7. 展望
7.1. 破解合作松散难题,构建协同研究网络
针对核心作者网络密度仅0.0047、合作碎片化的问题,建议构建“三层级协同机制”:一是核心团队联动机制,由核心学者牵头,每年围绕“数据监管”“数据确权”等前沿主题组织跨院校闭门研讨会,推动研究思路交叉融合;二是课题牵引合作机制,国家社科基金、自然科学基金设立“数据要素跨学科研究专项”,要求申报团队必须包含法学、信息科学、经济学等至少两个学科背景,强制推动跨领域协作;三是成果共享平台,由中国人民大学信息资源管理学院等核心机构牵头,建立“数据要素研究文献与案例数据库”,开放研究数据与方法工具,降低中小团队协作成本。
7.2. 平衡研究资源分布,强化区域协同发展
针对研究力量集中于少数核心机构的问题,推行“核心–辐射”发展模式:一方面,核心机构与地方院校建立“结对帮扶计划”,如武汉大学信息管理学院向中西部地方院校提供CiteSpace方法培训、共享政策文本数据库,提升区域研究能力;另一方面,鼓励地方院校聚焦特色领域,如沿海地区院校重点研究“数据交易所运营实践”,内陆地区侧重“公共数据赋能乡村振兴”,形成“全国共性研究 + 区域特色研究”的互补格局。
7.3. 深化跨学科融合,对接前沿实践需求
结合聚类分析显示的“多学科参与但协同不足”特征,建议搭建“技术–法律–经济”跨学科研究中心,由信息管理学院负责数据安全技术研发、法学院牵头权益监管制度设计、经济学院聚焦价值量化模型,联合攻克“数据垄断认定标准”“跨区域数据交易定价”等复杂议题。同时,推动“产学研用”深度融合,与上海数据交易所、国家信息中心等机构建立联合实验室,将实践中的“数据交易审计”“公共数据授权运营”等问题转化为研究课题,实现理论与实践的双向赋能。
7.4. 立足国际视野,完善监管与伦理体系
呼应“数据监管”成为前沿热点的趋势,建议加强国际比较研究:重点引进欧盟《通用数据保护条例》(GDPR)的实施经验、美国数据要素市场化监管模式,结合我国“数据二十条”制度框架,构建“中国特色数据监管体系”。同时,针对数据滥用、隐私泄露等风险,需同步推进法律规制与伦理建设,在研究中纳入“数据伦理审查”“算法公平性评估”等维度,填补当前研究中“技术应用”与“社会公平”衔接不足的缺口,为政策制定提供更全面的理论支撑。