1. 引言
数字经济加速演进的背景下,数据凭借其可复制性、低边际成本、强外部性与网络效应等特征,逐渐从企业经营活动的“副产品”转化为可被治理、可被配置、可被定价的关键生产要素,并在提升组织效率、驱动产品与服务创新、重塑产业分工与供应链协同等方面展现出显著的价值创造潜力。与土地、资本等传统要素不同,数据要素价值的实现高度依赖于确权规则、合规边界、流通机制与安全治理体系:只有当数据在来源合法、权属清晰、质量可控、使用可追溯的制度框架内实现跨主体流动与复用,其经济价值才可能被稳定识别并持续释放。
在国家层面,数据要素的制度供给正在由原则性倡导走向系统化建制。“数据二十条”围绕数据产权、流通交易、收益分配与安全治理等关键环节搭建“四梁八柱”,推动数据要素市场化配置进入可操作、可落地的阶段;政策与市场实践由此共同促进数据要素价值化、资产化与规模化应用。会计与信息披露制度的完善进一步强化了企业“数据资产化”的现实需求:财政部于2023年发布并自2024年起施行的《企业数据资源相关会计处理暂行规定》(下称《暂行规定》)明确了数据资源的确认、计量、列报与披露要求,为“数据入表”提供了制度依据,也在客观上提升了企业对数据资源盘点、分类分级、成本归集与收益匹配的管理要求。配套规则方面,国家标准GB/T 40685-2021为数据资产识别、登记与管理提供了操作性规范,中国资产评估协会发布《数据资产评估指导意见》以统一估值口径与方法边界,从而为“可确认、可计量、可披露”的数据资产形成闭环支撑。
与此同时,产业与金融体系对数据资产的应用探索正在加速扩散。“数据要素×”三年行动计划推动数据与重点行业深度融合,数据交易所、公共数据授权运营平台以及企业数据空间等多元载体不断涌现,强化了数据要素从“资源”向“资产”再向“资本”的转化通道。商业银行与地方交易所围绕数据资产授信、质押增信、挂牌交易与ABS等路径展开试点,直观呈现出数据的可复制性和低边际成本所带来的乘数效应,即同一批数据跨场景、多主体复用所形成的价值放大。然而,在企业微观层面,数据采集、清洗、存储、安全与合规治理均需要持续投入,当数据规模高速扩张而数据质量、治理能力与吸收转化能力相对滞后时,数据资产对企业价值的边际贡献可能不再简单线性增加,而是呈现阶段性变化甚至边际收益递减,这使得数据越多是否一定越有价值成为亟待检验的现实问题。
在此背景下,学术界与实务界围绕“数据资产的内涵与特征–价值创造机制–金融支持与风险约束–会计处理与信息披露–企业创新与供应链外溢效应”的链式议题展开了大量研究与探索,但仍存在若干关键问题有待澄清:其一,数据资源与数据资产的边界与分类口径尚不统一,导致可计量性与可比性不足;其二,数据资产价值实现的路径可能同时经由内部治理能力提升、外部市场机制完善以及金融赋能缓解融资约束等多重渠道,但不同渠道的相对重要性与适用情境缺乏系统检验;其三,“数据入表”与披露强化是否会通过降低信息不对称、改善投资者预期而显著提升企业价值,亦或因确认与计量不确定性带来审慎折价,仍需在制度变迁与市场反应的框架下予以识别;其四,更为关键的是,现有研究大多采用线性设定来刻画数据资产与企业价值的关系,对数据资产是否体现出边际成本递减–边际收益变化的非线性特征缺乏深入讨论与经验证据,尚无法回答数据资产在多大程度上具有持续放大的乘数效应、在何种条件下会出现边际效应递减等问题
基于此,本文以“数据资产赋能企业价值及其路径”为核心研究问题,基于2014~2024年中国A股上市公司年报文本构建企业数据资产度量指标,系统检验数据资产对企业价值的影响及其作用机制,并在此基础上进一步考察数据资产价值效应是否存在非线性边际特征,期望在回答数据资产是否及如何赋能企业价值的同时,揭示其价值效应在规模扩张过程中的边际变化规律,为企业数据治理实践和相关制度设计提供更具针对性的经验证据与政策启示。
2. 文献回顾
2.1. 数据资产的相关研究
随着数字经济的兴起,数据正成为现代企业最重要的资源之一。“数据资产”概念最早被用于指代企业所持有的债券等金融资产[1]。进入互联网时代后,数据所创造的价值日益凸显,“数据资产”的含义也发生了显著变化。一部分研究将数据资产限定为企业内部生成并由企业拥有、控制的数据资源,另一部分研究则采用更广义的界定,认为不仅企业内部数据,公共数据或开放数据只要能为企业提供有价值的信息,同样可以视为企业的数据资产[2]。目前业界也提出了操作性定义,例如《数据资产管理实践白皮书(6.0)》将数据资产界定为:由各组织合法拥有使用权或能够控制的、以电子形式记录的结构化或非结构化数据,能够进行交易并为社会及经济带来直接或间接效益。此外,政府和学界逐渐明确数据从资源到资产再到资本的转化过程,强调数据资产在企业价值创造中的基础性作用。
在会计领域,围绕数据资产是否满足现行资产确认标准形成了较多讨论。有研究认为,只要数据具有明确的经济所有权归属并能带来未来经济收益,即符合资产确认的基本条件[2]。在此基础上,有观点进一步提出,在满足特定条件时,企业可以将数据确认为资产入账[3] [4]。也有研究从统计视角给出更具体的标准,认为凡具有实际应用场景且在生产过程中被反复或持续使用一年以上的数据,可界定为数据资产[5]。同时,有观点指出,数据资产具有不同于传统有形或无形资产的特殊性,例如确权难、计量难和收益不确定等,这给资产确认带来挑战[6]。从会计准则角度的分析表明,现有准则难以准确反映数据的潜在价值,有必要探索新的评估框架来度量数据资产价值[7]。在法律层面,相关研究指出,数据资产化需要同时解决数据确权、入表披露以及估值交易三大核心问题,而目前数据产权界定仍存在法律模糊与争议,这进一步阻碍了数据作为资产的确认和交易[8]。
针对数据资产这一新兴领域,不同学科从各自角度展开了探讨。信息管理领域关注数据的全生命周期管理,重点研究如何从数据的产生、处理、保存到利用的全过程实现价值。经济学领域普遍将数据视为继土地、劳动力、资本之后的新型生产要素,探讨数据要素投入对生产率提升和经济增长的作用机理。会计与财务领域则聚焦于如何对数据资产进行计量、报告以及其带来的经济后果。有研究在综合信息管理学、经济学和会计学视角的基础上,对数据资产的内涵和特征进行了系统梳理,强调需要多学科融合以全面理解数据资产的形成及价值创造过程[9]。
2.2. 数据资产的经济后果研究
随着数据被视为关键资产,研究开始关注数据资产带来的经济后果,即数据资产对企业经营绩效和外部经济环境产生的可观察影响。有研究表明,充分利用数据相关资源能够改善企业的财务绩效[10]。近期的实证研究进一步证实了数据要素对生产效率的促进作用,结果显示,企业的数据资产投入水平与其全要素生产率显著正相关,善用数据资产的企业可以在相同投入下创造更高产出[11]。也有研究利用“宽带中国”政策作为准自然实验,提供了数据要素投入促进企业高质量发展的因果证据,表明数据基础设施提升能够带来企业生产效率和增长质量的提高[12]。由此可见,在微观层面,数据资产驱动的数字化转型能帮助企业改进生产流程、提高经营效率,从而增强竞争力。
数据资产带来的另一类经济后果体现在企业的融资与治理方面。相关研究表明,当企业主动披露有关数据资产的信息时,可以有效降低信息不对称,改善外部对企业价值的认知。研究显示,数据资产相关信息披露有助于外部投资者更充分了解公司的发展潜力和风险状况,从而降低债务融资成本[13]。在公司治理与资本市场语境下,自愿披露数据资产信息常被解读为企业透明度与可信度的外显信号。既有研究指出,主动公开数据相关实践有助于企业声誉累积并获得外部背书[14]。同时亦有证据显示,此类披露可使财务分析师更精准地把握公司动向,进而提升财务报告的价值相关性[15] [16]。更进一步的实证结果表明,数据资产信息披露能够压缩市场中冗余信息的扩散,提升企业特质信息的传导效率,从而降低股价同步性[17]。股价同步性下降意味着个股价格对自身基本面信息的反应更充分,这一变化对资本市场改善企业价值评估具有正向指向。由此可见,借助信息环境与治理机制的优化,数据资产得以间接抬升企业价值并增强投资者信心[18]。
数据资产的经济效应并非仅限于企业内部,也可能沿供应链释放积极的外溢影响。供应链视角的研究发现,当链条中的核心企业积极披露其数据资产信息时,会对供应商形成规范性约束与压力,推动其提高自身的数据资产信息披露水平[19]。这一作用在一定程度上源于数据共享对供应链“长鞭效应”的缓解,使上下游之间的信息透明度得以提升。更为关键的是,客户企业的数据资产披露不仅改善了供应商的信息环境,而且显著抬升了供应商的企业价值与新质生产力水平,例如更高的生产效率[19] [20]。这表明,数据资产所带来的收益可以沿产业链逐级传递,带动整个供应链实现降本增效与价值增值,从而拓展了数据资产经济后果的研究边界:数据要素的价值不仅体现于单个企业之内,也会通过产业协同释放更大的整体经济价值。
3. 理论分析与研究假设
3.1. 数据资产对企业价值的影响研究
数据资产对企业价值的作用,是当前相关研究所聚焦的关键议题之一。企业价值通常体现于公司市值、托宾Q等指标之中,概括了投资者对企业未来盈利能力与成长预期的综合判断。伴随数据上升为战略性资源,学界与业界普遍形成一种推断:数据资产更为充裕且能够有效开发利用的企业,往往会在资本市场获得更高估值。近年的研究已对这一推断给出了初步验证。以中国上市公司样本构建的数据资产水平指标为例,实证结果显示,数据资产水平与企业发展质量及市场价值呈显著正相关关系,并且数据资产积累越充分,企业的市场表现越佳[21]。从信息披露的视角看,主动披露数据资产信息,能够通过提升信息透明度、吸引技术人才并缓解融资约束,进而推动企业价值上行。同时,数据资产相关披露能够增强财务报告的价值相关性并改善公司信息环境,使资本市场对企业价值的识别更为准确,进一步的证据表明,数据资产信息披露还可降低股价同步性,使投资者更易辨识具有数据优势的企业,并据此赋予相应的价值溢价。
然而,数据资产的价值效应并非必然呈线性递增。理论研究指出,数据作为具有非竞争性与可复制性的要素,确实可能带来规模经济与倍增效应,但从长期来看仍可能符合边际产出递减的规律,即新增数据在信息增量、可用性与可转化性方面的边际贡献会逐步下降[22] [23]。与之相呼应的企业层面证据亦显示,数据资产对企业发展的促进作用可能呈现阶段性变化:相关研究在动态趋势分析中发现,数据资产总体上对企业发展具有正向促进作用,但在部分产业样本中呈现总体递减趋势,并提示这种递减特征可能与产业数据资产存量所处阶段及技术承载力约束有关。进一步考虑到数据资源本身具有时效性强、价值易变等属性,当数据规模不断扩张时,数据质量维护、合规治理与安全投入等成本也可能同步上升,从而使数据资产对企业价值的净增量贡献呈现边际递减特征。据此提出如下假设:
H1a:数据资产能够提升企业价值。
H1b:数据资产对企业价值的效应存在边际收益递减的特征。
3.2. 数据资产影响企业价值的机制研究
大量研究与企业实践均显示,数据资产是牵引企业创新的重要动因之一。企业沉淀的海量、异质数据一旦被有效清洗、整合并加以分析,便能为产品研发与商业模式创新提供别具价值的洞察。置于数字化转型的情境之下,数据资产的充分开发有助于更敏锐地捕捉客户潜在需求,为研发取舍与路径选择提供支撑,进而推出更契合市场的新产品与新服务[24]。与此同时,数据分析还能定位业务流程中的短板并推动优化,甚至带动商业模式重塑,例如,通过挖掘设备运行数据实现预测性维护与定制化生产,不仅催生新的服务形态,也同步提升了客户价值。可以说,上述创新实践之所以得以发生,关键正在于对数据资产的深度开掘与有效应用。实证研究进一步表明,基于上市公司年报文本信息所衡量的数据资产水平越高,企业研发投入强度往往越大;这意味着数据更充裕、治理更完善的企业,对研发与创新活动投入意愿更强[25]。其背后的一项重要机制在于数据资产能够降低创新过程中的不确定性并提升研发效率,使数据成为识别市场走向与技术趋势的“燃料”,从而提高创新项目的成功概率。还有研究关注数据资产对人力资本的影响,结果显示,数据资产的积累与利用能够促进企业内部人力资本水平的提升,员工的数据分析能力和数字技能提高后,有助于增强企业的创新能力[26]。由此可见,数据资产通过丰富知识基础、拓展技能和提供决策支持,多层面地催化了企业的技术创新和产品创新。由此提出假设2:
H2:数据资产通过提升企业创新能力正向影响企业价值。
数据资产影响企业价值的另一重要机制是降低成本、提高效率,即“降本增效”。通过对业务数据的深入分析,企业可以优化资源配置和业务流程,减少浪费和冗余,从而降低运营成本。与传统经验驱动的决策相比,数据驱动的决策更加及时、准确和协调,有助于避免各部门各自为政、局部最优而整体低效的情况。有研究指出,过去关于价值创造的讨论往往将企业价值链割裂为研发、生产、销售、售后等环节分别研究,但企业价值并非各环节效益的简单相加,各环节各自最大化可能导致冲突和低效;而数据资产的应用使企业能够从全局出发,以实时数据支撑决策,兼顾各环节的协同性,实现整体效率最优[27]。简言之,数据赋能下的决策可以既快又好:及时获取一线运营数据可以加快响应速度,可靠的数据分析减少决策失误,跨部门数据共享提高协同效率,这些都直接转化为成本的降低和效率的提升,为企业价值创造提供坚实基础。跨国实证结果显示,广泛应用数据资产的企业具有更高的运营效率,如更高的资产周转率和更低的运营成本[28]。在中国情境下,也有研究发现数据资产投入与企业全要素生产率显著正相关,表明数据的有效利用帮助企业以更少的投入产出更多的产品和服务,体现出明显的规模经济和范围经济效应。在供应链管理中,数据共享同样发挥着降本增效的作用。核心企业的数据资产信息披露缓解了供应链中的长鞭效应,使供应商能够根据更准确的需求预测安排生产计划,避免库存过剩或原料短缺等低效现象,同时供应链上下游的信息互通提高了资源利用率,降低了整个链条的运营成本。另一部分研究关注企业内部管理成本,披露数据资产文本信息的企业能够为审计师提供增量信息,缓解融资约束,从而降低审计费用等外部监督成本,这从侧面体现了数据资产提升信息透明度所带来的成本节约效应[29]。由此提出假设3:
H3:数据资产通过降本增效正向影响企业价值。
4. 研究设计
4.1. 数据来源
初始研究样本选取沪深A股的上市公司,考虑到自2013年被视为大数据元年以来,越来越多企业开始在日常经营管理中引入并运用数据资产,随之而来的数据资产相关信息披露也日益丰富、逐步增加,并且存在一定的滞后效应,所以样本期间选定为2014~2024年。由于关键指标缺失企业、金融保险类企业与ST (含*ST)或PT状态企业可能对研究造成特殊样本与极端值的干扰,故将这部分样本剔除,同时对所有连续变量进行了前后1%水平的缩尾处理,最终得到28,021个观测值。所需数据均提取自上市公司披露的年报信息与CSMAR数据库。
4.2. 变量定义
4.2.1. 被解释变量
企业价值(TQ)。由于财务绩效仅能体现企业短期的盈利能力,无法很好地度量企业价值,因此本文将采用托宾Q值对企业价值进行度量,计算公式为“市值”与“资产总计–无形资产净额–商誉净额”之比。
4.2.2. 解释变量
数据资产(DA)。本文基于文本挖掘思路对企业数据资产进行量化刻画。为提升指标的客观性与覆盖面,在既有研究框架上作进一步优化:首先,汇集国家重大战略文件、专题会议纪要、行业白皮书、资产评估协会相关公告及法律法规等材料,构建政策与行业语料库;其次,以“信息”“网络”“数字”“数据”为核心种子词,借助Word2Vec词向量模型并结合深度学习方法进行语义扩展,形成与上述种子词语义邻近的相似词词表;最后,将该相似词词表映射到上市公司年度报告文本中,统计相似词在年报中的累计出现频次,并以此作为企业数据资产(DA)的代理变量,用以反映企业数据资产的总体水平。指标取值越大,表明企业数据资产水平越高。
为检验该指标能否有效刻画企业数据资产,本文引入第三方指标北京大学数字普惠金融指数(PKU_DFIIC),并将其按企业注册地所在地级市–年份进行匹配。将DA与PKU_DFIIC的相关性作为外部效度证据。表1表明DA与地区数字经济指数显著正相关,说明该指标能较好度量企业数据资产水平而非一般披露噪声。
Table 1. External validity test
表1. 外部效度有效性检验
|
PKU_DFIIC |
DA |
PKU_DFIIC |
1.000 |
|
DA |
0.284*** |
1.000 |
4.2.3. 控制变量
在控制变量的选取上,本文主要从企业财务状况与公司治理特征两方面出发,考虑这些因素可能对企业价值带来的影响。借鉴既有文献的做法,研究中对公司规模(Size)、公司年龄(List age)、资产负债率(Lev)、总资产收益率(Roa)、现金净流量(Cashflow)、营业收入增长率(Growth)、总资产周转率(Ato)、独立董事比例(Indep)、前十股东持股比例(Top10)以及是否由四大会计师事务所审计(Big4)等变量进行了控制。
4.2.4. 模型设定
为了验证假设1,本文构建了模型(1)
(1)
此外,为验证可能存在的非线性相关影响,本文构建了模型(2)
(2)
5. 实证结果与分析
5.1. 描述性统计
如表2所示,本研究共得到28,021个观测值。核心解释变量数据资产(DA)的均值为3.303,标准差为0.647,最小值为0,最大值为5.557,说明样本企业在数据资产积累与披露方面整体水平中等,但企业之间存在较为明显的差异,且大多数企业的数据资产水平仍有较大提升空间。被解释变量企业价值(TQ)的均值为2.842,标准差为2.536,最小值为0.605,最大值高达133.1,表明样本公司之间的企业价值差异十分显著,且存在少数企业市值远高于其他公司,企业价值极差较大。总体来看,各变量的描述性统计特征与既有研究大体一致,说明本文样本具有较好的代表性和可比性。
Table 2. Descriptive statistics
表2. 描述性统计
变量名 |
变量定义 |
样本量 |
平均值 |
标准差 |
最小值 |
最大值 |
TQ |
市值/(资产总计 − 无形资产净额 − 商誉净额) |
28,021 |
2.842 |
2.536 |
0.605 |
133.1 |
DA |
ln(年报中披露的关键词总词频 + 1) |
28,021 |
3.303 |
0.647 |
0 |
5.557 |
Size |
总资产的自然对数 |
28,021 |
22.34 |
1.289 |
19.48 |
26.45 |
List age |
ln(当年年份 − 上市年份 + 1) |
28,021 |
1.98 |
0.968 |
0 |
3.47 |
Lev |
总负债/总资产 |
28,021 |
0.386 |
0.190 |
0.0487 |
0.927 |
Roa |
净利润/资产合计期末余额 |
28,021 |
0.0567 |
0.0530 |
−0.416 |
0.255 |
Cashflow |
经营活动产生的现金流量净额/总资产 |
28,021 |
0.0576 |
0.0648 |
−0.195 |
0.266 |
Growth |
(本年营业收入/上年营业收入) − 1 |
28,021 |
0.159 |
0.347 |
−0.673 |
4.474 |
Ato |
营业收入/平均资产总额 |
28,021 |
0.651 |
0.411 |
0.0532 |
2.891 |
Indep |
独立董事/董事人数 |
28,021 |
0.387 |
0.0748 |
0.231 |
0.615 |
Top10 |
前十股东持股数量/总股数 |
28,021 |
0.602 |
0.149 |
0.207 |
0.910 |
Big4 |
如果是四大审计,该变量为1,否则为0 |
28,021 |
0.0654 |
0.247 |
0 |
1 |
5.2. 基准回归分析
表3报告了数据资产对企业价值影响的回归结果。在仅包含数据资产的列(1)中,DA的系数为0.288,已呈现出显著的正向影响;在加入各项公司特征控制变量后,列(2)中DA的系数为0.264,显著性不变,表明数据资产对企业价值的作用并非由其他公司特征所“虚假驱动”;在进一步控制年份和行业固定效应的列(3)中,DA的系数为0.219,依然在1%的统计水平上显著,意味着在其他条件保持不变的情况下,数据资产每提高一个单位,企业价值平均提高约0.219个单位,相当于样本平均企业价值的约7.7%。综合以上结果,可以认为数据资产显著提升了企业价值,假设H1a得到了支持。此外,在列(4)中,加入数据资产二次项后,DA在1%水平上显著为正,而DA2在1%水平上显著为负,表明在样本范围内数据资产对企业价值的边际影响呈递减趋势,即随着数据资产水平提高,其对企业价值的增量贡献逐步减弱。这一结果验证了假设H1b。
Table 3. Data assets and firm value
表3. 数据资产与企业价值
|
(1) |
(2) |
(3) |
(4) |
|
TQ |
TQ |
TQ |
TQ |
DA |
0.288*** |
0.264*** |
0.219*** |
0.627*** |
|
(12.313) |
(12.616) |
(8.344) |
(4.499) |
DA2 |
|
|
|
−0.059*** |
|
|
|
|
(−3.017) |
CVs |
No |
Yes |
Yes |
Yes |
年份固定 |
No |
No |
Yes |
Yes |
行业固定 |
No |
No |
Yes |
Yes |
N |
28,021 |
28,021 |
28,021 |
28,021 |
Adjusted R2 |
0.005 |
0.223 |
0.322 |
0.322 |
***p < 0.01, **p < 0.05, *p < 0.10.
5.3. 数据资产影响企业价值的作用机制
为进一步识别数据资产影响企业价值的作用机制,本文参考江艇[30]提出的“两步法”进行机制检验在一定程度上减轻中介模型潜在内生性带来的偏误。
第一步,检验数据资产对中介变量的影响。表3报告了以研发人员数量占比和营业成本率为被解释变量的回归结果。在纳入公司层面一系列控制变量,并进一步控制年份与行业固定效应后,表4列(1)结果显示,数据资产(DA)的回归系数为3.440,且在1%的显著性水平下呈现显著正向关系,说明数据资产水平越高,企业配置于研发活动的人力资源比例越高,数据资产显著促进企业创新投入。表4列(2)中,以营业成本率为被解释变量时,DA的回归系数为−0.030,在1%的统计水平上显著为负,表明数据资产越丰富,企业的营业成本率越低,意味着数据资产有助于提升运营效率、降低成本支出。
Table 4. Mechanism tests
表4. 作用机制检验
|
创新能力 |
企业成本 |
DA |
3.440*** |
−0.030*** |
|
(21.274) |
(−17.434) |
CVs |
Yes |
Yes |
年份固定 |
Yes |
Yes |
行业固定 |
Yes |
Yes |
N |
18,406 |
18,406 |
Adjusted R2 |
0.431 |
0.612 |
***p < 0.01, **p < 0.05, *p < 0.10.
第二步,结合既有研究,从理论层面论证中介变量与企业价值之间的关系。已有文献普遍认为,较高的研发人员占比有助于增强企业的技术创新能力与知识创造水平,从而提升企业的核心竞争力和长期成长性,进而提高企业价值;而较低的营业成本率意味着企业运营效率更高、资源配置更优,可改善盈利水平和现金流状况,同样有利于企业价值的提升。综合基准回归中“数据资产显著提升企业价值”的结论,以及两步法下“数据资产显著提高研发人员占比、显著降低营业成本率”的实证结果,可以认为数据资产主要通过“促进创新投入”和“改善成本效率”两条机制路径影响企业价值,假设2由此得到支持。
5.4. 内生性检验
5.4.1. 工具变量法
考虑到企业价值较高的公司更有能力和意愿加大数据资产投入,可能导致“企业价值–数据资产”之间存在反向因果,为进一步缓解内生性偏误,本文借鉴已有研究,以“剔除自身后的数据资产在年度—行业层面分组的均值”作为企业数据资产的工具变量,并据此开展两阶段最小二乘(2SLS)回归。直观而言,在相同年度与行业条件下,若其他企业的数据资产水平整体偏高,说明该行业当期在数字化转型、数据要素应用方面更为活跃,本企业面临更强的竞争压力与示范效应,从而更倾向于加大数据资产投入,因此该指标与本企业数据资产高度相关,满足相关性条件。另一方面,在控制年份固定效应、行业固定效应以及企业规模、资本结构、盈利能力、现金流、成长性、营运能力、治理结构和审计质量等因素后,同行企业数据资产水平难以直接影响个别企业的市场价值,其影响企业价值的主要途径在于推动本企业数据资产水平的提升,从而在控制条件下基本满足外生性要求。
回归结果见表5列(1)。工具变量诊断方面,Kleibergen-PaaprkLM统计量为13.458,在1%水平上显著,表明模型不存在欠识别问题;Kleibergen-PaaprkWaldF统计量为13.919,明显大于通常采用的10阈值,弱工具变量检验顺利通过。第二阶段结果显示,在加入各项控制变量及年份、行业固定效应后,数据资产(DA)的2SLS估计系数为4.790,并在1%水平上显著为正,表明在利用工具变量纠正潜在内生性之后,数据资产对企业价值的促进作用依然稳健存在。由此可见,本文关于“提升数据资产水平有助于提高企业价值”的结论在工具变量法检验下仍然成立,具有较强的稳健性。
5.4.2. 控制企业固定效应
本文进一步引入企业、年份和行业三重固定效应,通过多维固定效应模型检验数据资产与企业价值关系的稳健性。一方面,企业固定效应可以控制企业层面随时间不变但难以观测的特征,如管理能力、企业文化等;另一方面,年份和行业固定效应可以过滤宏观冲击及行业景气度变化对企业价值的共同影响,从而在更大程度上缓解遗漏变量导致的内生性问题。
回归结果见表5列(2)。在同时控制企业、年份和行业固定效应以及各项控制变量之后,数据资产对企业价值的正向影响依然稳健存在,有效缓解了由不可观测因素引起的内生性担忧
5.4.3. 滞后自变量
为进一步缓解数据资产与企业价值之间可能存在的反向因果问题,本文在基准模型的基础上,将当期数据资产替换为其滞后一期值L.DA进行回归,以考察数据资产的滞后效应。由于过去期间的数据资产形成于上一期甚至更早的经营决策,相对于当期企业价值冲击而言,其受当前不可观测冲击的影响较小,因此可以在一定程度上弱化“企业价值变化反向推动数据资产调整”的内生性偏误。
回归结果如表5列(3)所示。滞后一期数据资产L.DA的系数为0.619,在1%水平上显著为正,表明在控制其他因素后,上一期数据资产水平的提高能够显著促进当期企业价值,数据资产对企业价值的正向影响依然稳健存在,进一步从动态视角印证了结论,对缓解反向因果导致的内生性问题具有一定的支持作用。
Table 5. Endogeneity tests
表5. 内生性检验
|
(1) |
(2) |
(3) |
|
TQ |
TQ |
TQ |
DA |
5.026*** |
0.104*** |
|
|
(1.905) |
(2.704) |
|
L.DA |
|
|
0.619*** |
|
|
|
(28.434) |
Wald F statistic |
13.919*** |
|
|
LM statistic |
13.458*** |
|
|
CVs |
Yes |
Yes |
Yes |
年份固定 |
Yes |
Yes |
Yes |
行业固定 |
Yes |
Yes |
Yes |
企业固定 |
No |
Yes |
No |
N |
27.981 |
28,021 |
28,021 |
Adjusted R2 |
0.357 |
0.604 |
0.327 |
5.5. 稳健性检验
5.5.1. 替换变量
本文从两个方向进行替代变量回归。其一,在表6列(1)中,将被解释变量由托宾Q (TQ)替换为账面市值比BM (以百为单位),即股东权益账面价值与总市值之比,从账面价值相对市场定价的反向角度刻画企业估值水平,是对托宾Q的经典、互补性的企业价值指标。回归结果显示,数据资产水平DA的系数为−0.499,在1%水平上显著为负,表明数据资产水平越高,企业的BM值显著降低,即企业享有更高的市场估值。其二,在表6列(2)中,继续以TQ为被解释变量,但将核心解释变量替换为数据资产直除比率(DA_rate),即直接使用数据资产关键词总频数除以年报管理层分析与讨论总词数,结果显示DA_rate的系数为1.016,同样在1%水平上显著为正,表明数据资产应用强度越高,企业价值显著提升。总体而言,在更换企业价值指标和数据资产衡量方式后,数据资产相关变量的符号与显著性均保持稳定,进一步验证了“数据资产能够显著提升企业价值”的核心结论具有较强稳健性。
5.5.2. 子样本检验
首先,考虑到国家大数据战略推进具有明显的阶段性,本文从时间维度对样本进行分组。2017年正式发布的《大数据产业发展规划》对大数据基础设施建设、数据资源整合共享以及大数据产业培育作出了更加系统、细化的部署,标志着我国由大数据战略顶层设计阶段逐步进入产业落地和全面推进阶段。本文剔除了2017年之前的研究样本,将样本限定在2017~2024年期间重新回归,结果如表6列(3)所示,数据资产(DA)的回归系数依然在1%的显著性水平下显著为正,从而进一步表明基准回归结论具有稳健性。
其次,根据现有省域数字经济发展指数及相关研究,北京、上海、广东、江苏和浙江在数字基础设施完备程度、数据资源开放共享、数字产业集聚以及配套政策体系等方面长期位居全国前列,代表了我国数字经济和大数据政策环境最为成熟的一类区域。为避免估计结果主要反映“头部地区”的特征,本文在稳健性检验中剔除上述五个省市的样本,仅利用其余地区的数据重新回归。表6列(4)显示,在排除北京、上海、广东、江苏和浙江之后,数据资产系数依然为显著正向,这表明数据资产对企业价值的正向影响并非仅存在于数字经济政策最完善的少数省份,而在其他地区同样具有稳健性。
5.5.3. 替换固定效应
本文还对固定效应的设定进行调整,进一步引入年份 × 行业交互固定效应,以同时吸收不同行业在各年度所面临的共同冲击和制度环境差异。回归结果如表6列(5)所示,在加入年份和行业交互固定效应后,数据资产(DA)的系数为0.637,仍在1%水平上显著为正。这表明,即使在更为严格的固定效应控制下,数据资产对企业价值的正向影响依然稳健存在,结论并不依赖于特定的固定效应设定。
Table 6. Robustness tests
表6. 稳健性检验
|
(1) |
(2) |
(3) |
(4) |
(5) |
|
BM |
TQ |
TQ |
TQ |
TQ |
DA |
−0.499*** |
|
0.610*** |
0.615*** |
0.637*** |
|
(−4.915) |
|
(34.128) |
(18.855) |
(31.175) |
DA_rate |
|
1.016*** |
|
|
|
|
|
(4.591) |
|
|
|
CVs |
Yes |
Yes |
Yes |
Yes |
Yes |
年份固定 |
Yes |
Yes |
Yes |
Yes |
Yes |
行业固定 |
Yes |
Yes |
Yes |
Yes |
Yes |
年份 × 行业固定 |
No |
No |
No |
No |
Yes |
N |
28,018 |
28,018 |
22,762 |
11,471 |
27,981 |
Adjusted R2 |
0.483 |
0.309 |
0.355 |
0.344 |
0.359 |
***p < 0.01, **p < 0.05, *p < 0.10.
5.6. 异质性分析
5.6.1. 按产权性质的异质性检验
鉴于国有企业与非国有企业在治理结构、激励约束机制及数字化转型动机方面存在显著差异,本文进一步依据产权性质将样本划分为非国有企业与国有企业两组分别回归。如表7所示,在非国有企业样本中,数据资产(DA)的回归系数为0.211,且在1%的显著性水平下显著为正;在国有企业样本中,DA的系数为0.060,仅在10%水平边缘显著。整体来看,数据资产在两类企业中均能提升企业价值,但其影响在非国有企业中更为显著,表明在市场化程度更高、经营目标更侧重价值创造的企业中,数据资产的价值释放更为充分。
5.6.2. 按地区金融科技数字化水平的异质性检验
为进一步考察外部金融科技环境对数据资产价值实现的影响,本文参照北京大学数字普惠金融指数对各省份数字普惠金融发展水平的排序,将处于样本期平均水平之上的省份界定为金融科技数字化发展水平较高地区,其余省份界定为金融科技数字化发展水平较低地区,并据此将样本企业划分为两组进行回归。如表7所示,在金融科技数字化水平较高地区,数据资产(DA)的系数为0.207,在1%水平上显著为正;在金融科技数字化水平较低地区,DA的系数为0.196,在10%水平上边缘显著为正。整体来看,数据资产在不同金融科技发展水平地区均能显著提升企业价值,且在数字普惠金融发展基础较好的地区效果更为稳健,说明良好的金融科技和数字化金融基础设施有助于强化数据资产的价值传导机制。
Table 7. Heterogeneity analysis
表7. 异质性分析
|
非国有企业 |
国有企业 |
金融科技数字化水平高 |
金融科技数字化水平低 |
|
TQ |
TQ |
TQ |
TQ |
DA |
0.211*** |
0.060* |
0.207*** |
0.196* |
|
(6.217) |
(1.727) |
(7.685) |
(1.882) |
CVs |
15.961*** |
12.799*** |
14.311*** |
17.700*** |
|
(36.082) |
(34.819) |
(43.570) |
(16.510) |
年份固定 |
Yes |
Yes |
Yes |
Yes |
行业固定 |
Yes |
Yes |
Yes |
Yes |
N |
20,166 |
7850 |
24,701 |
3316 |
Adjusted R2 |
0.310 |
0.348 |
0.338 |
0.270 |
6. 结论
基于2014~2024年我国A股上市公司数据,本文从年报文本出发构建企业数据资产指标,实证检验了数据资产对企业价值的影响。结果表明,数据资产总体上能够显著抬升企业价值,并呈现正向且边际递减的非线性特征;该结论在更换被解释变量、引入多种固定效应以及采用一系列稳健性与内生性检验后依然稳健,说明数据资产已成为提升企业价值的重要新型生产要素。同时,数据资产价值效应在不同情境下存在异质性:在非国有企业中显著强于国有企业,在金融科技数字化水平较高地区表现得更加稳健,表明企业内部治理结构及外部数字金融环境都会影响数据资产向企业价值的转化效率。