1. 引言
党的二十大提出,我国应当加强数字中国建设整体布局,实现经济社会高质量发展,强调了数字经济发展的重要性。2022年1月12日,国务院印发了《“十四五”数字经济发展规划》,到2025年数字经济核心产业增加值占GDP的10%,数字经济迈向全面扩展期。2022年4月9日,《中共中央国务院关于构建数据基础制度更好发挥数据要素作用的意见》(简称“数据二十条”)颁布,强调要加快培育数据要素市场,全面提升数据要素价值。2023年,中国信息通信研究院云计算与大数据研究所发布的《数据资产管理实践白皮书》更新至6.0版,标志着“数据资产”概念已得到广泛认可。在数据市场大发展的同时,如何有效评估、披露和管理数据资产成为一大难题 [1] [2] [3] 。财政部于2023年8月印发《企业数据资源相关会计处理暂行规定》,指出了关于数据资源会计处理适用的准则以及在资产负债表相关列示和相关披露要求。
作为反映资本市场信息效率的重要指标,股价同步性一直是财务与金融领域广泛关注的热点话题 [4] ,学术界一直在尝试寻找股价同步性背后所隐含的形成机理和影响机制。只有在股价同步性的研究中融合其他领域的新概念、新方法和成熟理论,才能更好地认识股价同步性的形成机理和影响机制 [5] 。数据资产信息披露能够向外界投资者传递企业层面的特质信息,以期为投资者提供有效的投资决策信息,缓解内外部信息不对称程度,降低股价同步性。那么数据资产信息披露是能够为投资者提供增量信息,提高市场定价效率?抑或是作为一种噪音,干扰投资者决策,进而降低市场效率?关于这一问题的探讨对深化资本市场改革开放,有效地维护投资者的合法权益,促进我国资本市场的健康发展,显得尤为重要。基于此,本文借助股价同步性衡量资本市场信息传递效率,以数据资产信息披露为突破点,探究了数据资产信息披露对股价同步性的影响及作用机理,并考虑不同信息环境差异引发的异质性影响。
本文的贡献在于:第一,从股价同步性视角检验了数据资产信息披露制度的有效性。根据已有文献,对数据资产的研究主要体现在数据资产的概念 [6] 、确认与计量 [7] [8] 及定价 [9] [10] 等方面,有少数学者从数据资产信息披露的角度考虑,研究其对审计师定价 [11] 、企业价值 [3] 、分析师盈余 [12] 等的影响,但是鲜有学者将数据资产信息披露与资本市场结合起来,研究二者之间的关系。因此本文研究数据资产信息披露与股价同步性之间的关系,丰富了数据资产信息披露的经济后果研究。第二,从数据资产信息披露视角拓展了股价同步性的影响因素研究。与既有大量文献集中于公司的因素 [13] 、外部政策环境 [14] 、信息关注主体 [15] [16] 等对股价同步性的研究不同,本文以企业数据资产这一生产要素为视角,考察了上市公司数据资产信息披露对股价同步性的影响,丰富了股价同步性的影响因素。第三,揭示了数据资产信息披露影响股价同步性的可能路径。本文从分析师跟踪、信息透明度以及数字化转型三个方面探究数据资产信息披露对股价同步性的作用机制,为数据资产相关研究提供了一个新的视角。同时为监管部门进一步完善数据资产信息披露机制、促进资本市场健康发展提供一些参考和借鉴。
2. 文献综述
2.1. 数据资产信息披露的经济后果研究
对于数据资产信息披露的经济后果的研究,主要体现在对企业价值 [3] 、分析师盈余预测 [17] 以及审计师收费 [11] 等的影响上。苑泽明等指出数据资产信息披露能够显著提高企业价值,数据资产信息披露通过提升信息透明度、缓解融资约束、吸引技术型人力资本,进而促进企业价值提升。张俊瑞等指出数据资产信息披露能够显著改善分析师预测的准确度,企业年度报告中数据资产信息披露频率越高,分析师进行盈余预测的准确度越高。牛彪等检验了数据资产信息披露对审计师定价策略的影响。研究结果发现,数据资产信息披露对审计费用具有显著的负向影响,支持了“多说有益论”。
2.2. 股价同步性的影响因素研究
2.2.1. 信息效率观
“信息效率观”,以Morck等为代表的学者认为,股价同步性越高,说明股价中包含的企业特质信息越少,信息效率越低,个股波动与大盘波动之间呈现出较高的同步性。因此,增加公司特质信息可以降低股价同步性,已有文献从公司透明度 [18] 、分析师跟踪网络 [19] 、企业数字化转型 [20] 、税收征管 [21] 、年报语调 [22] 、注册制 [23] 、关键审计事项披露同构效应 [24] 等角度提供了证据,即对股价同步性的影响机制源于行业信息“过载”而非信息“降噪”。
2.2.2. 噪音基础观
“噪音基础观”,以West为代表的学者认为,股价的波动与投资者情绪、非理性投资行为等噪音有关,股价同步性受到噪音交易驱动 [25] 。在待完善的新兴市场,信息透明度与股价同步性的关系受到市场噪声大小的影响 [26] 。有学者从媒体和投资者角度,指出了信息传递者与信息接收者对股价同步性的影响更多是由于其扮演了“噪音推手”而非“价值传递”的角色 [27] 。在充斥着噪声的资本市场中,公司披露的年报风险信息具有信息含量,能够提高信息透明度,降低了噪声对股价的影响,提高股价同步性 [28] 。还有学者提供了股价同步性的影响机制源于噪音的直接证据 [29] 。
3. 理论分析与研究假说
3.1. 数据资产信息披露与股价同步性
股价同步性是指市场上多数股票在某个特定时间内同时出现价格上涨或者下降的现象,反映个股价格波动与市场及行业价格波动之间的关联 [30] 。依据前文对股价同步性影响因素相关文献的梳理,可以发现数据资产信息披露对股价同步性产生何种影响,关键在于是否增加了公司层面的特质信息,抑或是证券市场上的噪音交易。因此,本文将从“信息效率观”和“噪音基础观”两个角度,论述数据资产信息披露对股价同步性的影响。
3.1.1. 信息效率观
数据资产信息披露能否降低信息不对称,关键在于能否为投资者提供有效的增量信息。首先,信息披露能够提高企业和投资者的项目识别效率。资本市场平稳运行的关键因素就是信息效率,而股价同步性与信息的传递呈负相关关系 [31] 。通过增加信息披露,降低公司的信息不对称,让公司的特质信息更多地融入股价,是降低公司股价同步性的重要途径 [30] 。其次,对于高管而言,其自身利益会受到企业财务信息披露的影响。高管为获得更多利益,往往会选择披露能够反映企业自身优势的特质信息。此时,财务信息能够协同公司控制机制,减少高管的机会主义投资决策,向外界传递更具有特质含量信息,有利于投资者做出合理调的投资决策,降低股价同步性。臧秀清等表明分析师在资本市场中起到非常重要的作用 [32] 。企业通过不同信息载体,自愿性向外界尽可能多地披露包含自身的特质信息,引起分析师等的关注度,降低股价同步性。基于上述分析,本文提出假设:
H1a:数据资产信息披露会降低股价同步性。
3.1.2. 噪音基础观
有效市场理论认为,市场参与者都是理性的,股价是市场信息推动的结果。但是在实践中,资本市场股价经常呈现一定的盲目性与规律性。因此新兴的噪音交易理论认为,股价不止反映真实市场信息,还受到市场噪音的推动,甚至有可能噪音的推动作用大于信息。在欠发达资本市场,股价的波动由噪音驱动,较低的股价同步性是噪音交易者误将噪音当作信息进行交易导致的 [21] 。因此,股价同步性与资本市场的信息效率正相关。首先,我国属于典型的新兴市场,法律制度尚不健全 [33] ,上市公司以损害信息质量为代表的盈余管理现象层出不穷 [34] ,严重危害了资本市场信息环境。其次,相比于专业的机构投资者而言,个人投资者往往缺乏搜集和处理信息的能力,进而造成市场上噪音交易逐渐增多 [35] 。综上所述,由于我国资本市场数据资产信息披露尚处于起步阶段,加之市场整体信息环境不佳且个人投资者仍占据市场的绝大多数,因而可能进一步加剧上市公司和投资者之间的信息不对称程度,导致数据资产信息披露无法为投资者提供增量的特质信息,噪音体现进而提高股价同步性。因此,本文提出假设:
H1b:数据资产信息披露会提高股价同步性。
4. 研究设计
4.1. 样本选择与数据来源
本文以2010~2022年我国A股上市公司作为研究样本。数据资产相关数据来源于WinGo (文构)文本数据库,媒体关注度相关数据来源于中国研究数据服务平台(CNRDS),股价同步性等其他数据来源于CSMAR数据库。本文对初始样本进行了如下处理:剔除金融行业企业样本;剔除ST类企业样本;剔除变量存在缺失值的样本。最终样本包含19,820个上市公司的年度观测值。为了缓解异常样本的影响,本文对所有连续变量在上下1%的水平上进行了缩尾处理。
4.2. 变量定义
4.2.1. 被解释变量:股价同步性
根据已有文献,对股价同步性的度量通常采用资本资产定价模型(CAPM)对个股收益与市场收益回归模型的拟合优度(R2)来度量。R2越大,表明个股收益波动被市场收益波动所能解释的部分越大,股价同步性越高。参考王亚平等人的研究 [36] ,同时考虑个股、行业、市场的同步性,运用模型(1)估计个股的R2。
(1)
其中,Ri,t表示公司股票i第t周考虑现金红利再投资的收益率;Rm,t表示市场第t周考虑现金红利再投资的分市场流通市值加权平均收益率;RI,t表示相应行业i在第t周考虑现金红利再投资的流通市值加权平均收益率。
为了控制日数据中可能存在的非同步交易偏差,参考伊志宏等的做法 [30] ,在模型(1)的基础上将市场滞后一期和行业滞后一期的日收益率加入回归方程,得到如下模型(2)并回归得到该模型下的R2。
(2)
对模型(1)和模型(2)中的R2依据模型(3)分别进行对数化处理得到SYN1和SYN2作为股价同步性的两个衡量指标。
(3)
4.2.2. 解释变量:数据资产信息披露
本文运用文本分析技术构建数据资产信息披露的衡量指标。借鉴胡楠等的文本挖掘方法及危雁麟等的指标构建方法 [12] ,对上市公司年度报告中的数据资产信息进行挖掘,并在此基础上构建企业数据资产信息披露指标,评估数据资产信息披露水平。具体来说,本文以“数据资产”和“数据资源”作为种子词,运用Word2Vec神经网络模型对上市公司披露的海量财经文本语料进行训练,得到“数据资产”和“数据资源”在WinGo文本数据库中的深度学习相似词词集。在此过程中,为了保证相似词词集能够真实地反映企业数据资产信息披露,仅保留相似度高于0.5的相似词。本文运用如下模型来计算企业数据资产信息披露频率,并以此度量数据资产信息披露(DataAsset):
(4)
其中:FREitj为相似词词集中第j个词汇在公司i第t年年度报告中的词频;Total FREit为公司i第年年度报告的总词频。
4.2.3. 控制变量
对于控制变量的选择,本文选取三类控制变量,第一类为公司特征类,包括公司规模(Size)、资本结构(Lev)、账面市值比(Bm)、净资产收益率(Roe)、净利润(Loss);第二类为公司治理变量,股权集中度(Top1)、董事会规模(Board)、两职合一(Dual);第三类为审计相关变量,如是否四大审计师事务所审计(Big4)。具体变量定义见表1。
4.3. 模型设定
构建如下回归模型对文章提出的假设进行检验:
(5)
其中,controls为控制变量,industry和year分别为行业和年度固定效应,i,t分别为企业和时间,ε为随机干扰项,其他变量见上文。
5. 实证结果分析
5.1. 描述性统计
表2显示了主要变量的描述性统计结果,根据表2可知,股价同步性(SYN)的最小值分别为−4.061和−3.112,最大值分别为1.332和1.426,平均值分别为−0.669和−0.463,表明不同公司股价同步性存在一定的差异;数据资产信息披露(DataAsset)的最小值为0,最大值为0.0259,平均值为0.00168 (发表的三篇论文的平均值都是0.005,说明咱们数据比较小),说明不同公司的数据资产信息披露也不同。
5.2. 实证结果分析
表3列示了数据资产信息披露与股价同步性的回归结果。列(1)和列(2)是在不控制行业和年份的回归结果,在不同股价同步性的衡量方式下,数据资产信息披露的回归系数分别为−23.770和−22.369,均在1%水平上显著;列(3)和列(4)是在控制行业和年份的回归结果,数据资产信息披露的回归系数分别为−13.265和−12.768,仍在1%水平上显著。因此,验证了假设H1a,即数据资产信息披露能够降低股价同步性。

Table 3. Regression results of data asset information disclosure and stock price synchronization
表3. 数据资产信息披露与股价同步性的回归结果
Robust t-statistics in parentheses; ***p < 0.01, **p < 0.05, *p < 0.1.
5.3. 稳健性检验
5.3.1. 替换解释变量
按照数据资产信息是否披露,将数据资产信息披露取值为0和1,即披露为1,没有披露为0。表4的第(1)列和第(2)列分别列示了数据资产信息是否披露对股价同步性的回归结果,其回归系数均在1%水平上显著,说明数据资产信息披露降低了股价同步性。
5.3.2. 滞后解释变量
将数据资产信息披露滞后一期,研究滞后一期的数据资产信息披露是否对股价同步性产生影响。表4的第(3) (4)列列示了回归结果,数据资产信息披露滞后一期的回归系数均在1%水平上显著。
5.3.3. 双向固定效应检验
为了排除公司个体差异对结论的干扰,本文对主回归进行双向固定效应模型检验,检验结果如表4的第(5) (6)列所示,数据资产信息披露的检验系数分别在5%和1%的置信水平上显著,进一步说明本文结论具有稳健性。

Table 4. Regression results of substitution explanatory variables, lagged explanatory variables, and two-way fixed-effect tests
表4. 替换解释变量、滞后解释变量和双向固定效应检验的回归结果
Robust t-statistics in parentheses; ***p < 0.01, **p < 0.05, *p < 0.1.
5.3.4. 准自然实验
本文以2016年“中华人民共和国国民经济和社会发展第十三个五年规划纲要”(以下简称“十三五”规划纲要)的发布作为外生事件,通过准自然实验再次检验了本文的假设。“十三五”规划纲要在“大数据”相关论述中明确强调了农业、医疗、制造、物流等行业与大数据的融合和运用,因此,在这些行业中的企业更有可能受到产业政策的影响,在企业运营中推动数据资源应用,并增加定期报告中数据资源信息披露的频率,也会影响到股价同步性。本文将事件后时间窗口为2016~2022年度,Post赋值为1;而事件前时间窗口为2010~2015年度,Post赋值为0。同时,本文将农业、医疗、制造、物流行业的上市公司作为实验组,Treat赋值为1,其余赋值为0。检验结果如表5的列(1)和列(2)所示,交乘项Post*Treat的检验系数分别为−0.140和−0.105,且在1%的置信水平上显著,检验结果进一步支持了主要研究结论。

Table 5. Regression results of quasi-natural experiments and propensity score matching
表5. 准自然实验以及倾向得分匹配的回归结果
Robust t-statistics in parentheses; ***p < 0.01, **p < 0.05, *p < 0.1.
5.3.5. 倾向得分匹配
为了缓解样本自选择问题的影响,本文采用倾向得分匹配法进行重新估计。倾向得分匹配的具体步骤是:首先,将数据资产信息按照是否披露赋值为0和1,即披露为1,未披露为0。其次,以公司规模(Size)、资本结构(Lev)、是否被四大会计师事务所审计(Big4)、账面市值比(Bm)、净资产收益率(Roe)、净利润(Loss)、股权集中度(Top1)、董事会规模(Board)、两职合一(Dual)等为协变量进行Logit估计,计算倾向得分。最后,按照1:1最近邻匹配法保留倾向得分最接近的样本作为匹配样本,同时要求满足共同支撑假设和平衡性假设,设定卡尺为0.05。表6列示了倾向得分匹配前后的平衡性检验结果,可以看出匹配前两组样本存在较大差异,而匹配后两组样本不存在明显差异,说明总体匹配效果较好。表5的第(3) (4)列列示了采用倾向得分匹配法筛选样本后的回归结果,可以看出,在考虑样本自选择问题后,本文的主要结论依旧稳健。
5.4. 影响机制检验
数据资产信息披露对股价同步性的抑制作用在前文得到验证,但是数据资产信息披露是如何抑制股价同步性的?为此,本文从分析师跟踪、信息透明度和企业数字化转型三个方面进行机制分析。从分析师跟踪角度来看,伊志宏等通过研究报告文本分析,发现分析师报告中有关上市公司的特质信息含量能降低股价同步性 [30] 。从信息透明度来看,数据资产信息披露能够缓解信息不对称,提高企业信息透明度,降低股价同步性。从数字化转型角度来看,数据资产信息披露能够加快数字化转型,进而降低股价同步性。有学者研究证实了企业数字化转型会降低股价同步性 [20] 。
本文选取分析师跟踪(ANC)、公司信息透明度(Opaque)、数字化转型(DCG)作为中介变量。分析师跟踪(ANC)借鉴米蕊的做法 [37] ,用对企业进行过跟踪分析的分析师团队数量加1后的自然对数来衡量。信息透明度(Opaque)借鉴王亚平等的做法 [38] ,使用公司过去三年操控性应计项目绝对值之和(Opaque)来衡量,其中,操控性应计项目由修正的Jones模型估计而来,Opaque越大,公司信息透明度越低。数字化转型(DCG)参考吴非等的做法 [39] ,通过上市企业公布的年度报告中的“数字化转型相应关键词”进行词频测度,对同一企业同一年度年报中的各关键词词频加总,进一步加1并取对数处理。影响机制检验结果具体见表7。

Table 7. Influence mechanism analysis test results
表7. 影响机制分析检验结果
Robust t-statistics in parentheses. ***p < 0.01, **p < 0.05, *p < 0.1.
表7的(1) (2)列为分析师跟踪机制的检验结果,数据资产信息披露均在1%水平上显著。其Sobel Z值为1.908,在10%水平上显著;列(3)和列(4)为信息透明度机制的检验结果,数据资产信息披露和信息透明度分别在5%和1%水平上显著;列(5)和列(6)为数字化转型机制的检验结果,数据资产信息披露分别在10%和1%水平上显著,进一步地,进行了Sobel检验,发现数字化转型这一中间变量的Z值统计量为−3.601,在1%水平上显著。因此,数据资产信息披露能够促进分析师跟踪、提高信息透明度、加快数字化转型,进而降低股价同步性。
6. 异质性分析
6.1. 媒体关注度
有学者对媒体发挥信息中介作用进行了研究 [30] 。发现信息中介(如新闻媒体、微博)通过向市场传递更多的公司层面特质信息而非噪声影响股价同步性影响 [40] 。因此,本文认为媒体关注度显著强化数据资产信息披露与股价同步性之间的负相关关系。本文采用上市公司当年累计被新闻报道的次数加1取自然对数来进行衡量媒体关注度,并根据媒体关注度的中位数将其划分为0和1变量,高于中位数取1,低于中位数取0。表8第(1)列和第(2)列列示了媒体关注度的异质性检验结果,媒体关注度高的数据资产信息披露的系数在5%水平上显著为负,媒体关注度低的数据资产信息披露均不显著,说明媒体关注度对数据资产信息披露与股价同步性的影响具有强化作用。
6.2. 行业竞争程度
为了进一步从行业内企业竞争程度角度进行异质性分析,本文根据企业在年度、行业的赫芬达尔–赫希曼指数HHI-C均值高低划分,若高于均值说明行业集中度越高,则为0;低于均值说明竞争度越激烈,则为1。表8第(3) (4)列列示了行业竞争程度对数据资产信息披露与股价同步性影响的回归结果,行业竞争程度强时,数据资产信息披露的系数为−6.918,并在5%水平上显著,行业竞争程度弱时,数据资产信息披露不显著。因此,验证了行业竞争度对数据资产信息披露与股价同步性负相关关系的强化作用。

Table 8. Heterogeneity test results
表8. 异质性检验结果
Robust t-statistics in parentheses; ***p < 0.01, **p < 0.05, *p < 0.1.
6.3. 内部控制质量
内部控制制度作为企业管理的重要抓手,对实体披露的信息质量影响重大。内部控制质量高的企业内部制度实施更加规范,管理运行机制更加成熟,这有助于外部利益相关者监督管理层,这为数据资产信息披露的提供好的内部治理环境。高质量的内部控制能够抑制企业应计盈余管理,提高财务报告的透明度。基于上述分析,本文预测与内部控制质量低的企业相比,数据资产信息披露对股价同步性的降低作用在内部控制质量高的企业中更显著。参考牛彪等的做法 [11] ,本文使用迪博大数据研究中心的内部控制指数来表示企业的内部控制质量,按照内部控制指数的中位数划分为内部控制质量高组和内部控制质量低组。回归结果如表8第(5) (6)列所示,从中看出,数据资产信息披露的回归系数在内部控制质量高组中显著为负,而在内部控制质量低组中不显著。这说明,数据资产信息披露对股价同步性的降低作用在内部控制质量高的企业中更显著。
7. 结论与建议
7.1. 结论
本文通过股价同步性衡量资本市场信息传递效率,以数据资产信息披露为切入点,研究了数据资产信息披露对股价同步性的影响和作用机理,以及媒体关注度、行业竞争程度和内部控制质量的异质性,研究发现:数据资产信息披露能够降低股价同步性。中间机制分析发现;数据资产信息披露可以促进分析师跟踪、提高企业信息透明度以及加快企业数字化转型,从而降低股价同步性。异质性分析发现:数据资产信息披露对股价同步性的抑制作用在媒体关注度高、行业竞争力强以及内部控制质量高的企业更显著。
7.2. 建议
通过研究数据资产信息披露对股价同步性的影响,结合以上结论,提出以下建议:
第一,相关部门加大数据要素政策指引,引导开展数据资产化实践。本文从股价同步性这一视角入手,探究数据资产信息披露是否会对股价同步性产生影响,研究表明数据资产信息披露会降低股价同步性。随着企业数据资源相关会计处理暂行规定的实施,数据资产信息披露从自愿性披露到强制性披露,更能有效提高企业数据资产信息披露水平,有利于资本市场长期健康发展。
第二,强化监管部门对企业数据资产信息披露的监管力度。在各级政府积极推行数字化经济的国家战略下,企业数据资产信息披露作为热门话题,引发投资者和资本市场的广泛关注。因此,监管部门需要对上市公司披露的数据资产相关信息进行规范和监督,增强信息传递效率,推动了我国资本市场的良性运行。
第三,增强上市公司对数据资产信息披露的可理解性、完整性、可靠性,打通资本市场信息传递的“堵点”,主动按照企业会计准则的披露要求,提高数据资产信息披露水平,减弱投资者与上市公司间信息不对称,有利于资本市场行稳致远。