1. 引言
随着数字经济的快速发展,企业数字化转型已成为推动我国经济高质量增长的重要动力。近年来,人工智能、云计算、大数据等数字技术在企业生产、管理与研发活动中的广泛应用,使数字化逐渐成为企业提升创新能力与资源配置效率的关键路径[1]。现有研究普遍认为,数字化转型能够通过优化信息处理、提升组织协同、降低创新成本等机制促进企业创新活动[2]。然而,多数文献主要关注创新投入或创新产出,较少从“创新效率”视角系统评估数字化对企业创新绩效的影响。此外,数字化转型的效果在不同数字经济生态下可能存在显著差异。一方面,地区电商渗透水平体现了数字基础设施和消费数字化程度,可能影响企业获取市场信息、开展数据驱动创新的能力[3]。另一方面,数据要素的发展水平决定了企业在数字环境中使用数据、整合数据并将其转化为创新资源的效率[4]。现有研究对数字化与外部数字经济环境的交互作用关注不足,相关调节机制尚未得到系统论证。
基于此,本文以2013~2022年中国A股上市公司为研究对象,构建双向固定效应模型,探讨企业数字化转型对创新效率的影响,并进一步考察电商渗透水平与数据要素发展水平的调节效应。本研究的创新点主要体现在:(1) 从创新效率视角重新评估数字化转型的创新激励作用,弥补以往研究仅关注投入或产出的局限;(2) 引入电商渗透与数据要素发展水平两类地区数字经济指标,揭示数字化效果的外部环境差异;(3) 通过稳健性与异质性检验,从不同企业特征与区域数字生态出发深化对数字化影响机制的理解。
2. 理论分析与研究假设
2.1. 数字化转型对企业创新效率的影响
数字化转型是当前企业提升竞争力和创新能力的关键战略方向[5]。大量国内外研究均指出,数字技术能够通过多重机制促进企业创新效率。(1) 数字化提升资源配置效率。数字技术通过自动化与智能化流程提高企业内部资源配置效率,加快研发链条响应速度。(2) 数字化能够降低信息不对称,缓解融资约束。企业创新具有高不确定性与高风险特征。企业数字化水平提升能显著缓解融资约束,从而推动创新投入和产出的提高。(3) 数字化促进知识获取和创新协同。数字平台使企业更容易整合跨界知识,形成新的技术组合,提高创新效率。基于现有文献与理论,本研究认为数字化转型能够通过提升信息透明度、改善资源配置和强化知识共享进而提升企业创新效率。
H1:企业数字化转型能够提升企业创新效率
2.2. 电商渗透率调节作用
尽管数字化转型对创新效率具有积极作用,但其效果并非独立形成,而是嵌入在特定的外部数字环境之中。电商渗透率作为地区数字基础设施完善程度与数字商业生态成熟度的重要表征,在很大程度上影响企业数字化能力的边际产出。基于资源替代理论,当外部环境已能够提供企业内部数字化建设所试图获得的关键资源或能力时,内部数字化投入的边际效用将随之下降。在电商高度发达的地区,企业能够依托大型电商平台获得高频、系统化的消费者行为数据与市场反馈信息,从而减弱内部数字系统在市场识别、产品迭代与需求预测中的功能性价值。此外,根据边际收益递减规律,当外部平台已广泛供给创新活动所需的信息资源与技术支持时,企业在内部数字化建设上的追加投入难以产生同等规模的增量创新效益。因此,电商渗透率的提升可能削弱数字化转型对企业创新效率的促进作用,使内部数字能力的创新贡献呈现递减趋势。基于上述理论逻辑,提出以下假设:
H2:电商渗透水平提高负向调节数字化转型对创新效率的影响
2.3. 数据要素发展水平调节作用
数据要素作为数字经济时代的重要生产要素,其发展水平决定了外部数据资源的可获取性及其对企业创新活动的支持能力。在数据基础设施完善、数据供给体系成熟的地区,企业能够以较低成本从外部获取结构化的数据资源及其分析服务,从而减少内部数字化系统在信息收集、处理与知识整合方面的必要性。根据资源替代理论,外部数据能力的增强将对企业内部数字能力形成替代,使内部数字化投入在创新活动中的边际产出下降。此外,边际收益递减规律表明,当外部环境已能提供大部分创新活动所需的数据支持时,企业在内部数字系统上的追加建设难以有效提升创新效率。在此情境下,数据要素发展水平越高,数字化转型对企业创新效率的促进作用越弱,其创新效应呈现显著的弱化趋势。据此,提出如下假设:
H3:数据要素发展水平负向调节数字化转型对创新效率的影响
3. 研究设计
3.1. 样本选择与数据来源
考虑到2015年《中国制造2025》的发布将制造业发展的焦点从规模扩张转向质量提升和提高技术创新能力并首次提出了数字化转型,本文以2013年为起点收集数据,以截止2022年12月底沪深A股上市制造业企业作为初始样本,同时参照已有研究对数据进行了如下处理:第一、剔除金融保险企业和ST、*ST企业;第二、剔除主要变量缺失的样本。最终筛选获得了16,146个公司–年度观测值。相关变量原始数据来源于国泰安数据库。为避免异常值的干扰,本文对连续变量进行了1%和99%分位上的缩尾处理。
3.2. 变量定义
3.2.1. 被解释变量
参考曹春方(2020) [6]的构建方式,以企业下一期的专利申请数量加1的自然对数衡量。为了消除量纲凸显效率,本文将企业的创新效率(
)用专利申请数量/研发支出加1的自然对数表示,并根据专利种类不同,构建依照3:2:1的权重加权专利申请数量/研发支出加1的自然对数表示的企业创新效率(
)。具体数据见表1。
3.2.2. 核心解释变量
企业数字化转型。本文参考赵宸宇等(2021) [7]使用文本分析法和专家打分法构建企业的数字化转型指数。通过python提取经营情况分析部分的文本,通过人工判断方式抽取一定数量数字化转型较为成功企业样本,对选定样本进行分词处理和词频统计筛选出与数字化转型相关的高频词语,从“数字运用”、“互联网商业模式”、“智能制造”、“现代信息系统”四个维度构建数字化转型指数,整合既有文献对提取关键词进行补充,形成分词词典。基于自建分词词典。使用Jieba功能对样本进行分词处理,从上述四个维度统计关键词的披露次数,以此反应企业在各方面转型程度,再对词频数据进行标准化处理,使用熵值法确定各指标权重,最终得到数字化转型Digital指数。具体数据见表1。
3.2.3. 控制变量
参考前人研究,本文控制变量包括、资产负债率(
)、总资产净利润率(
)、托宾q值(
)、营业收入增长率(
)、股权集中度(
)、机构投资者持股比例(
)、管理层持股比例(
)、企业年龄(
)。并在回归中控制了行业虚拟变量和年份虚拟变量。具体数据见表1。
3.2.4. 调节变量
基于阿里研究院公布的电子商务数据,构建各省份2013~2022跨境电子商务发展水平指数(
);使用熵值法构建省级数据要素发展水平指数(
)。
3.3. 模型选取
为系统检验企业数字化转型对企业创新效率的影响,本文构建如下基准回归模型:
其中,
分别以创新效率和综合加权创新效率两种方式度量,
为企业数字化转型水平,
为控制变量集合,
表示个体固定效应,控制企业不可观测的时间不变特征;
表示年份固定效应,控制宏观经济与制度环境的共同冲击,
为随机扰动项。本文采用双向固定效应模型进行估计,并在公司层面聚类稳健标准误,以控制异方差与组内相关性。
同时为了探讨电商渗透水平与数据要素发展水平的调节作用,构建调节效应模型:
其中,
为依照阿里研究院公布电子商务数据构建的跨境电子商务发展水平指数,
为使用熵值法构建省级数据要素发展水平指数(
)。
Table 1. Descriptive statistics
表1. 描述性统计
变量 |
样本量 |
均值 |
标准差 |
最小值 |
中位数 |
最大值 |
Inno_eff1 |
16,146 |
0.1849 |
0.0737 |
0 |
0.1928 |
0.337 |
Inno_eff2 |
16,146 |
0.2261 |
0.0794 |
0 |
0.2374 |
0.3785 |
DT |
16,146 |
0.0134 |
0.0195 |
0 |
0.0074 |
0.3173 |
Lev |
16,146 |
0.3805 |
0.1781 |
0.0573 |
0.3747 |
0.8525 |
ROA |
16,146 |
0.0446 |
0.0577 |
-0.216 |
0.0424 |
0.1917 |
TobinQ |
16,146 |
2.1275 |
1.2293 |
0.8256 |
1.7362 |
7.5409 |
Growth |
16,146 |
0.1647 |
0.3139 |
-0.5235 |
0.1161 |
1.65 |
Top1 |
16,146 |
0.3291 |
0.1398 |
0.0812 |
0.3079 |
0.74 |
Inst |
16,146 |
0.3958 |
0.2502 |
0.0029 |
0.4043 |
0.9111 |
Mshare |
16,146 |
0.1749 |
0.2056 |
0 |
0.0675 |
0.6835 |
Age |
16,146 |
2.0123 |
0.7451 |
0.6931 |
2.0794 |
3.4012 |
4. 实证结果与分析
4.1. 基准回归分析
表2表明了企业数字化水平(DT)对创新效率(Inno_eff1与Inno_eff2)的基准回归结果。模型均控制了年份固定效应与企业个体固定效应,标准误采用企业层面聚类稳健标准误。从核心解释变量来看,DT在列(1)中对Inno_eff1的系数为0.1120,在10%显著性水平上显著;在列(2)对Inno_eff2的系数为0.1094,在10%水平上显著。证明企业数字化程度越高,其创新效率越显著提升,数字化有助于强化知识获取、优化资源配置并提高创新产出效率。
在控制变量方面,Lev和ROA在列(1)中分别以10%水平显著为正,说明适度的负债水平与较高的盈利能力均有助于提升企业创新活动。TobinQ在两列中均显著为负(p < 0.01),意味着市场估值较高并不必然带来更高创新效率,可能反映企业短期业绩压力抑制创新投入。Inst与Mshare在两个模型中均显著为正(p < 0.01),表明机构投资者持股及管理层持股均能发挥治理效应,促进企业创新产出。Age在两列中也均显著为正(p < 0.01),说明企业随发展阶段成熟化,其创新能力更为稳定。
Table 2. Baseline regression
表2. 基准回归表
变量 |
(1) Inno_eff1 |
(2) Inno_eff2 |
DT |
0.1120* (0.0585) |
0.1094* (0.0627) |
Lev |
0.0121* (0.0071) |
0.0112 (0.0078) |
ROA |
0.0229* (0.0125) |
0.0191 (0.0145) |
TobinQ |
−0.0023*** (0.0007) |
−0.0026*** (0.0008) |
Growth |
0.0011 (0.0016) |
0.0014 (0.0018) |
Top1 |
−0.0061 (0.0141) |
−0.0080 (0.0151) |
Inst |
0.0224*** (0.0079) |
0.0230*** (0.0088) |
Mshare |
0.0221*** (0.0082) |
0.0243*** (0.0091) |
Age |
0.0124*** (0.0032) |
0.0138*** (0.0036) |
常数项 |
0.1468*** (0.0090) |
0.1862*** (0.0090) |
年份固定 |
Yes |
Yes |
个体固定 |
Yes |
Yes |
N |
16,146 |
16,146 |
调整R2 |
0.0628 |
0.0562 |
注:***、**、*分别表示在1%、5%、10%的水平上显著,括号内为企业层面聚类稳健标准误。
4.2. 调节效应
4.2.1. 基于地区电商渗透水平的调节效应分析
为进一步探究外部数字经济环境是否会影响数字化转型对企业创新效率的作用机制,本文引入省级电商渗透指数(EC)并构造交互项DT × EC,检验电商环境在其中的调节效应。表3展示了调节效应模型的回归结果,其中(1)列和(2)列分别以发明型创新效率(Inno_eff1)与综合创新效率(Inno_eff2)为被解释变量。
首先,从核心解释变量DT的系数来看,无论是否加入交互项,其系数依然保持显著正值:在列(1)中系数为0.2291,在1%水平上显著,在列(2)中为0.2402,在5%水平上显著。这说明即使在考虑外部电商环境差异后,企业数字化转型仍然显著提升创新效率,进一步增强了基准回归的稳健性。
其次,关注交互项DT × EC。结果显示:对发明型创新效率(表3列1),交互项系数为−0.0031,在10%水平上显著;对综合创新效率(表3列2),交互项系数为−0.0034,同样在10%水平上显著。表明:电商渗透水平越高,数字化转型对企业创新效率的促进作用越弱。
Table 3. Moderation regression based on e-commerce penetration level
表3. 基于电商渗透水平调节效应回归
变量 |
(1) Inno_eff1 |
(2) Inno_eff2 |
DT |
0.2291*** (0.0877) |
0.2402** (0.0943) |
DT × EC |
−0.0031* (0.0017) |
−0.0034* (0.0019) |
常数项 |
0.1469*** (0.0091) |
0.1864*** (0.0100) |
控制变量 |
Yes |
Yes |
年份固定 |
Yes |
Yes |
个体固定 |
Yes |
Yes |
N |
15,853 |
15,853 |
调整R2 |
0.0667 |
0.0598 |
注:***、**、*分别表示在1%、5%、10%的水平上显著,括号内为企业层面聚类稳健标准误。
4.2.2. 基于数据要素的调节效应分析
在外部数字经济环境中,数据要素投入程度可能影响数字化转型的创新产出绩效。因此,本文进一步引入省级数据要素配置指数(DE),构建交互项DT × DE,以检验数据要素发展水平是否会调节数字化转型对企业创新效率的作用。表4展示了以发明型创新效率(Inno_eff1)与综合创新效率(Inno_eff2)为被解释变量的调节效应回归结果。
从主效应来看,数字化转型(DT)在两类创新指标回归中均保持显著正向的发明型创新效率,DT系数为0.2707,在5%水平上显著;对综合创新效率,DT系数为0.2877,在5%水平上显著。这说明即便在外部数据要素投入水平差异的背景下,数字化转型依旧显著提升企业创新绩效,表明其作用机制稳健存在。
进一步关注交互项DT × DE的估计结果:在发明型创新效率回归中,交互项系数为−0.4323,在10%水平上显著;在综合创新效率回归中,交互项系数为−0.4830,同样在10%水平上显著。负向且显著的交互项表明:数据要素配置水平越高,数字化转型促进创新效率的作用反而越弱。
Table 4. Moderation regression based on data-factor development level
表4. 基于数据要素发展水平调节效应回归
变量 |
(1) Inno_eff1 |
(2) Inno_eff2 |
DT |
0.2707** (0.1135) |
0.2877** (0.1219) |
DT × EC |
−0.4323* (0.2619) |
−0.4830* (0.2854) |
常数项 |
0.1457*** (0.0093) |
0.1856*** (0.0103) |
控制变量 |
Yes |
Yes |
年份固定 |
Yes |
Yes |
个体固定 |
Yes |
Yes |
N |
16,146 |
15,853 |
调整R2 |
0.0654 |
0.0572 |
注:***、**、*分别表示在1%、5%、10%的水平上显著,括号内为企业层面聚类稳健标准误。
4.3. 稳健性检验
为验证基准回归结果的稳健性,本文将核心解释变量由数字化转型指数DT替换为非标准化的文本数字化指数DT2,并重新进行双向固定效应回归。DT2参考吴非[8]的构建方式,基于企业年报文本中数字技术相关关键词构建自有相关关键词库并提取指数,能够从信息披露角度更直接反映企业数字化建设水平。因此,使用DT2作为替代变量能够有效检验基准回归是否依赖于特定的数字化测度指标。结果如表5所示,实证结果表明,替换核心解释变量后,数字化转型对企业创新效率的促进作用依然显著,说明本文实证结论并不依赖于特定的数字化测度方式,具有较强的稳健性。
Table 5. Robustness test
表5. 稳健性检验表
变量 |
(1) Inno_eff1 |
(2) Inno_eff2 |
DT2 |
0.0016** (0.0008) |
0.0017* (0.0008) |
常数项 |
0.1463*** (0.0090) |
0.1857*** (0.0099) |
控制变量 |
Yes |
Yes |
个体固定 |
Yes |
Yes |
年份固定 |
Yes |
Yes |
N |
16,146 |
16,146 |
调整R2 |
0.0637 |
0.0570 |
注:***、**、*分别表示在1%、5%、10%的水平上显著,括号内为企业层面聚类稳健标准误。
4.4. 异质性检验
4.4.1. 地区电商渗透水平
电商环境代表了区域数字基础设施与数字商业生态的发展程度,是企业数字化能力外生的重要环境因素。在电商渗透程度较低的地区,数字化基础设施相对薄弱,企业进行数字化转型往往能够弥补外部环境不足,带来更加显著的边际创新收益;而在电商渗透程度较高的地区,企业能够从完善的数字经济生态中获得更多外部数字资源,数字化转型的边际创新增益反而可能降低。基于省级电商指数的中位数,将样本划分为高、低电商渗透两组。回归结果如表6列(1)所示:在高电商渗透地区,数字化转型的系数不显著;而在低电商渗透地区,数字化转型的系数为0.2462,并在1%水平显著。
4.4.2. 地区数据要素发展水平
数据要素是数字化转型的重要支撑,其发展水平反映了区域数据资源供给能力、数据治理体系以及数据基础设施建设状况[9] [10]。理论上,在数据要素发展水平较弱的地区,企业内部数字化建设能够提供更多“替代性”效应,从而获得更高的创新收益;而在数据要素发展水平较高的地区,企业能够从外部环境获得完善的数据资源,数字化转型的边际创新效应可能递减。依据数据要素指数的中位数将样本划分为高、低两组。回归结果如表6列(2)显示:在高数据要素地区,数字化转型的影响不显著;而在低数据要素地区,数字化转型的系数为0.2261,并在5%水平显著。
Table 6. Heterogeneity test
表6. 异质性检验表
|
(1) 地区电商发展水平 |
(2) 数据要素水平发展水平 |
高电商渗透 |
低电商渗透 |
高数据要素 |
低数据要素 |
DT |
0.0229 (0.0787) |
0.2462*** (0.0954) |
0.0701 (0.0796) |
0.2261** (0.0984) |
常数项 |
0.1686*** (0.0125) |
0.1345*** (0.0153) |
0.1638*** (0.0127) |
0.1385*** (0.0152) |
控制变量 |
Yes |
Yes |
Yes |
Yes |
个体固定 |
Yes |
Yes |
Yes |
Yes |
年份固定 |
Yes |
Yes |
Yes |
Yes |
N |
8157 |
7696 |
8229 |
7917 |
调整R2 |
0.0565 |
0.0401 |
0.0633 |
0.0422 |
注:***、**、*分别表示在1%、5%、10%的水平上显著,括号内为企业层面聚类稳健标准误。
5. 结论与政策建议
5.1. 研究结论
本文基于2013~2022年沪深A股制造业上市公司数据,利用企业年报文本构建数字化转型指数(DT),系统检验数字化转型对企业创新效率的影响,并进一步考察电商渗透水平与数据要素发展的调节作用。主要结论如下:
(1) 企业数字化转型能够显著提升创新效率
无论以发明型创新效率(Inno_eff1)还是综合创新效率(Inno_eff2)作为被解释变量,DT的主效应均显著为正。说明数字化转型通过改善信息处理能力、提高资源配置效率、强化创新协同与技术吸收能力,有效促进了企业的创新产出效率。
(2) 电商渗透水平发挥显著负向调节作用
外部数字环境的成熟程度会削弱数字化转型的创新效应。电商渗透水平与数字化转型的交互项显著为负,说明在数字基础设施完善、线上用户数据易得的地区,数字化能力呈现更强的“外部供给”特征,使企业无需依赖内部数字化系统即可获取关键创新资源,从而导致内部数字化对创新效率的边际提升作用下降。进一步地,成熟的数字商业生态还意味着更密集的数字竞争环境。在电商渗透率较高的地区,企业在数字渠道、用户触达、数据处理等方面面临更激烈的竞争,同质化数字能力更难带来差异化创新优势,使数字化转型获得超额创新收益的空间被显著压缩。
(3) 数据要素发展水平同样对数字化转型产生负向调节
数据显示,随着外部数据要素供给体系的完善,企业可以通过数据服务平台、公共数据资源等低成本方式获取创新所需的信息,使内部数字化建设在数据收集和分析环节的独特性减弱,从而使其创新效应呈现边际递减。此外,在数据要素高度发达的环境中,企业之间的数据能力差异缩小,基于内部数字化的创新优势更容易被竞争者复制,导致数字化收益趋向同质化,不利于企业持续形成创新超额回报。
5.2. 政策建议
基于上述实证结论,本文提出以下政策启示:
(1) 推动企业深化数字化建设,不同数字环境下采取差异化发展战略
在数字基础设施相对薄弱的地区,企业内部数字化建设具有明显的创新收益空间,应优先支持企业在研发、供应链管理、生产运营等环节推进数字化改造,加快构建数字创新能力体系。而在数字环境高度成熟地区,应引导企业将数字化转型重点从“基础能力建设”转向“差异化能力提升”,如强化数据治理、发展算法优势、推进智能制造创新场景应用,以避免陷入数字化同质化竞争。
(2) 政府应实施地区差异化的数字化扶持政策,避免“一刀切”
对于电商渗透率和数据要素发展水平较低的地区,应加大数字基础设施投入力度,特别是在物流、云计算、工业互联网节点建设等方面进行政策倾斜,加强公共数据资源开放,提升中小制造业企业数字化转型能力,缩小区域创新差距。
对于数字环境高度发达的地区,则应避免简单扩大基础数字设施供给,而应重点推动数字技术的深层次应用创新,如支持企业开展人工智能辅助研发、数据资产化试点和跨行业数据流通机制建设,以帮助企业在激烈的数字竞争中构建稀缺性数字优势。
(3) 完善数据要素市场建设,提高高水平地区企业数字化创新边际效益
在数据要素高度发达的地区,企业内部数字化创新效应下降的关键原因在于数据资源同质化和数据能力的易复制性。因此政策应着力优化数据流通质量而非数量,例如推动高质量工业数据共享机制、建立可信的数据确权体系、提升专业化数据服务供给能力,并鼓励企业构建自有数据资产体系,以增强企业数字化能力的不可复制性,从而提高数字化对创新的增量贡献。