1. 引言
在2016年,我国发布的《“十三五”国家信息化规划》和随后的相关政策文件中首次提出了数据作为关键资源的概念,并对数据资产的管理与应用提出了具体要求和建议。随着数据经济的不断发展,数据资产的定义和重要性逐渐得到明确和深化,并在法律、政策、市场等领域获得了越来越多的关注。在明确企业数据资产的范围时,不可避免要考虑数据的可量化、可控制、可变现的性质。基于此,大多学者认为数据资产即是企业拥有或者控制的,在未来能为企业带来预期收益的可计量资产。然而,相较于数据资产的概念和重要性,对于数据资产的价值评估如今尚未形成一套统一的流程和方法。有关数据资产的核算体系亟需构建以及完善。数据资产相关理论和测算工具以及技术需要及时更新和丰富。基于此,本文借助CiteSpace可视化文献分析软件归纳、整理并分析了CNKI中国知网中检索得到的2014~2024年间的952份参考文献,研究了中国数据资产价值评估的研究现状和热点变化趋势,为推动相关理论研究进一步发展,并为我国数据资产价值评估实践提供参考。
2. 数据来源及研究方法
2.1. 数据来源
在2014年我国开启了中关村数海大数据交易平台时代之后,全国各地的数据交易平台都如雨后春笋般涌现,为我国的数据资产发展形成了肥沃的土壤。随着数据资产的普及以及重要性的提升,如何评估数据资产的价值成为了一个难题,目前,对于数据资产价值的评估还没有形成一套标准的体系。因此,本文以“数据资产评估”为主题,检索了中国知网2014年至2024年的文献,并在保证样本数据的准确性与可靠性的基础上剔除如会议征稿、活动记录等无关的样本数据,最终保留了952份文献作为实际研究样本数据。
2.2. 研究方法
知识图谱分析是一种利用知识建模、数据存储、知识抽取、知识分析在大规模、异构、分布式的数据中提取有意义的信息和知识的数据挖掘和分析方法,从而帮助人们更好地理解复杂且大量的数据,并发觉其中隐藏的价值。当前常见的知识图谱分析软件主要有CiteSpace、Bibexcel和Ueinet等[1],其中CiteSpace可以根据用户的需求生成知识图谱以及可视化界面,具有高效率,操作简单等优点。因此,本文运用CiteSpace软件对筛选到的有关我国数据资产评估的文献研究进行可视化分析,从而揭示该研究领域的发展趋势和研究热点。
3. 数据资产评估研究现状概述
3.1. 研究热点分析
在CiteSpace软件中对数据资产评估领域的关键词进行分析后,得到对应的关键词共现图谱,如图1所示:
Figure 1. Co-occurrence map of keywords for data asset value assessment
图1. 数据资产价值评估关键词共现图谱
在图1中,数据资产、价值评估、资产评估、数据治理、数据管理、数据安全、数字经济等关键词的字号较大,说明在本篇被研究的952份文献中,这些关键词出现的频次比较高,是该领域被研究的热点,除此之外,估值、成本法、隐私保护等关键词的字号较小,说明中国学者对这些话题的关注度较低。通过对关键词共现图谱的分析,本文认为国内对数据资产的评估热点主要集中在以下方面:
第一:数据资产概念阐述。以数据资产的基本理论框架为中心,对数据资产、数字资产、数据要素等相关联的概念进行辨析,明晰数据资产在互联网时代对于企业的作用以及重要性,通过厘清数据资产的特征以及与其他资产比如无形资产或者有形资产的区别,为数据资产的评估奠定理论基础。
第二:数据资产价值评估。基于对数据资产概念的辨析,从企业资产中划分出属于数据资产的合理部分,采取相应的资产评估模型或方法对企业所实际拥有或控制的数据资产进行价值评估。
第三:数据资产管理。数据资产评估涉及对企业数据的价值、质量和风险进行评估,以确定其经济和战略意义。这为数据资产管理提供了基础,使得企业能够有针对性地制定管理策略和优化措施。有效的数据资产管理则利用评估结果来进行数据的组织、保护和利用,以最大化其价值并支持业务目标。随着大数据产业的发展和成熟,大部分企业在2000年就开始了数据资产管理,并在2020年以大数据平台为依托完善了管理体系,逐步实现数据的综合运用以及向外运营。李雨霏构建了由数据管理职能、数据运营、技术平台和保障措施四个部分构成的数据资产管理体系[2]。目前虽然数据资产管理体系已经趋于成熟,但随着人工智能时代的来临,数据资产管理也向着智能化管理迈进。
接着本文利用CiteSpace软件将图中的关键词进行聚类,直观地表现出各个聚类下的重要节点和相互之间的结构联系,得到的关键词聚类图谱如图2所示,而图中左上角的数据显示:Q值 = 0.629,S值 = 0.864,说明本次的聚类结果有参考意义,可以令人信服。
Figure 2. Keyword clustering map of data asset value assessment
图2. 数据资产价值评估关键词聚类图谱
Figure 3. Timeline of keywords for data asset value assessment from 2014 to 2024
图3. 2014~2024年数据资产价值评估关键词时间线图谱
将图2上的关键词聚类图谱转变为图3的关键词时间线图谱分析,由此来概括2014~2024年数据资产评估领域出现的热点,并从时间线性角度对这些关键节点进行分析。基于此,本文对图中五个聚类的时间线追溯分析如下:
1) 聚类#0价值评估,数据资产的价值由内外部因素影响,分别是数据资产质量、数据资产成本、数据相关性、市场需求以及科技创新,大部分学者们会参照对无形资产的评估方法来对数据资产价值进行评估,分别是成本法,收益法和市场法三种方法。更深层次地,相较于无形资产来说,数据资产的特殊性质,其对于拥有者的未来收益难以估计,也给数据资产的价值评估带来极大的挑战[3]。对数据资产价值的科学合理评估需要对产权归属和性质转换问题加以考虑。
2) 聚类#1数据治理,在国内,数据资产的数据治理偏向于以国家层面为视角的治理以及大数据治理,是对数据管理的一种超越手段。在此基础上,数据治理分化出了“政府数据的治理”和“企业数据的治理”。目前已有的数据治理技术包括:数据规范、数据清洗、数据交换和数据集成,都能将企业或者政府部门的数据进行收集再加以处理,将其当做一项战略资产进行管理,从而使得该项数据的价值最大化。然而,国内对于数据治理的研究还不够成熟,吴信东等认为大数据治理作为数据治理的新趋势,在此基础上提出了大数据HAO治理模型,该模型的核心是在大数据背景下借助人机协同来使数据治理模块化,并提高了交互的灵活性[4]。
3) 聚类#2数字经济,是我国经济发展中的重要组成部分,也是最为活跃的一部分。赵涛等证实数字经济可以有效促进中国高质量发展[5]。且我国数字经济发展迅速,已从2019年开始与美国一同成为该领域的主要领导者。然而,对于数字经济规模以及影响程度的测量方法还未统一,但主流的测量方法有BEA对数字经济增加值的测算方法与OECD数字经济研究框架[6]。
4) 聚类#3数据管理,该主题包含的关键词有数据要素、数据价值等。在大数据时代下,数据管理的主要矛盾有数据战略与数据边界的不确定性、数据复杂程度提高的同时数据分析技术的落后、数据的隐私与安全问题[7]。以多源异构性为特征的大数据冲击了传统的数据管理模式,在这一挑战下数据管理逐渐趋于制度化、体系化,由此学者们建立了数据管理成熟度模型,即将数据管理成熟度依次划分为可执行级、可管理级、可定义级、可测量级、优化管理级这五个等级,借助大数据的力量推进组织变革,帮助企业改善内部各个构成部分的数据管理实践[8]。
5) 聚类#5风险评估,对于数据资产的风险评估需要在防止企业或政府组织主要网络设备上数据资产泄露或者遗失的基础上评估该数据资产所带来的威胁以及风险。张淼针对数据资产的安全提出了一种数据风险评估模型,将数据资产划分为企业拥有或控制的主机以及网络设备上具备一定价值的数据资源[9]。数据资产的风险分为数据本身风险和主机网络弱点,它们包括访问控制、随机数、缓冲区溢出、输入验证、竞赛条件及口令等问题。在评估标准的指导下对风险进行评估分析,制定应对策略。
3.2. 研究前沿趋势分析
本文借助CiteSpace软件,得到关于数据资产评估的关键词突现图谱如图4所示。在该图谱中,“strength”表示的是对应关键词的突现频率,数字越大说明频率越高,该关键词在研究领域的热度越高。而“begin”、“end”代表着这个关键词成为研究热点的开始和终止年份,即图4中最右边的深色部分所维持的长度。
由图4可知:1) 从关键词的突现频率来看,“大数据”的突现频率最高,数值为12.42,是数据资产评估中热度最高的词,因为数据资产的产生以及随之而来的评估和管理都依托于大数据的存在,对于数据资产的评估离开不了对大数据的分析。2) 从关键词的突现时间来看,“风险评估”和“信息系统”这两个关键词出现的最早,可能因为在2014年的中关村数海大数据交易平台时代开启后,海量数据平台涌现的同时也带来了不少的数据存储和交易的风险以及大量的数据处理工作,这让众多企业和学者开始思考对于数据资产的风险评估以及开始建立专门的信息系统。3) 从关键词的突现持续时间来看,“风险评估”、“信息系统”、“大数据”仍然是最值得关注的词,说明人们花了较长的时间不断地完善数据资产的信息系统,使其更加高效和安全。同时“价值”“数据管理”“评估方法”等词作为热点也持续较长时间,因为在数据资产这一概念的提出后,人们开始专注于制定专有的评估方法来衡量企业所拥有的数据资产的价值并创建新的资产管理体系来规范和控制企业的数据资产。
Figure 4. Keyword emergences of data asset value assessment from 2014 to 2024
图4. 2014~2024年数据资产价值评估关键词突现图谱
4. 研究结论与展望
4.1. 研究结论
本文以中国知网2014~2024年的数据资产价值评估研究文献为对象,利用CiteSpace文献可视化研究软件对其进行筛选、整理、归纳,梳理十年来该研究领域的热点走向趋势,得出的结论如下:
1) 研究热点:近十年来数据资产价值评估的热点主要集中在数据资产概念阐述、数据资产价值评估、数据资产管理等内容上。重点关注如何准确量化数据资产的经济价值,制定统一的评估标准,确保数据在交易和使用中的合法合规。同时,还强调数据资产的管理应兼顾信息安全与隐私保护,防止数据泄露和滥用。这些方面共同推动了数据资产在法律、市场和技术领域的发展。
2) 研究前沿:首先,通过分析关键词突现图谱可知,数据资产质量评估研究前沿趋势主要集中在大数据、数据管理、资产评估上。我国数据资产评估研究现状涵盖了多个重要领域。数据资产的价值认定成为研究的核心,学者们探索如何量化数据的经济价值,包括数据的市场价值、使用价值和潜在价值。评估方法的标准化和系统化逐渐得到关注,目前主要采用的评估方法包括市场法、收入法和成本法,但仍缺乏统一的行业标准。此外,数据安全和隐私保护在数据资产评估中也变得尤为重要,研究者们致力于解决数据泄露和滥用问题,确保数据在评估和应用中的合规性。随着政策和法律环境的不断完善,研究还涉及如何在现有法律框架下进行有效评估,以支持数据资产的合法流通和管理。这些研究为数据资产的有效评估和管理提供了理论支持和实践指导。其次,通过分析关键词时区图谱可知,研究热点随时间演变而发生变化。2014~2018年的研究主要是围绕大数据,信息系统,中关村,数据管理等展开,此时国内数字经济处于初步发展阶段,数据量增长迅速,技术和应用的研发投入开始增加,因此数据的存储、处理和分析挑战也随之来临,人们对数据管理的重视大大提高。2018~2024年研究热点变化为数据资源、数据定价、评估方法等内容,数据作为一项新资源受到重视,数据安全与隐私保护日益重要,数据评估量化方法尚未统一,但处于日益完善阶段当中。
4.2. 研究展望
第一:加强跨机构交流合作研究数据资产价值评估方法。学术研究团队是学界成果发展的主力部分,首先重点促进各个学术研究团队例如高等院校、科研组织、企业等间的交流合作,共同致力于提升数据质量、加快数据处理速度、实现数据共享、研究出一套科学的数据资产价值评估机制等。其次,促进开放的数据共享,建立统一的数据格式标准和协议,使不同团队能够无缝地交换和利用数据。并确保数据共享的安全性和隐私保护,以防止数据泄露或滥用[10]。
第二:推动技术集成和创新提升数据资产管理能力。通过技术整合和创新,提升数据资产的管理能力。采用先进的分析工具和算法,实现数据的深度挖掘和智能分析,进而增强各平台的协同效应。制定数据管理政策,建立清晰的数据管理框架,包括数据标准、数据管理流程和责任分配。制定数据质量管理策略,确保数据准确性、一致性和完整性。
第三:加强数据安全和隐私保护。实施严格的数据安全措施,如数据加密、访问控制和定期安全审计,保护数据免受未经授权的访问和泄露。对数据进行分类和分级,识别数据的重要性和敏感性。根据数据的类型和价值,应用不同的管理措施,以确保关键数据的安全和合规性。