1. 引言
2024年2月,习近平总书记在主持中共中央政治局第十二次集体学习时强调,要推动新能源高质量发展,为中国式现代化建设提供安全可靠的能源保障。锂电行业是新能源产业的关键支柱,作为一个资本和技术密集型产业,其投资规模庞大,投资效率成为评价行业发展水平和企业核心竞争力的重要指标。近年来数字化转型是大势所趋,国家也出台很多鼓励和引导政策,但是不同企业的投资驱动因素和投资方向各不相同,进而导致投资效率有显著差异[1]。因此,当前政策的细化迫在眉睫,进而从数字化转型驱动力上入手,优化投资决策和资源配置的方向,提升企业投资效率。
近年来,很多学者进行了相关研究,最初是从技术层面切入的,例如确定了数字化技术的引入从而提升企业的运营效率[2],然后从优化信息流动、降低信息不对称以及抑制代理问题的原理来解释这一现象[3],因为这可以改善企业投资决策质量[4]。另一个主要研究脉络是从投资角度深入的,例如认为这一过程强化了企业资源的合理配置,在降低投资不足和抑制过度投资方面表现突出,其基本原理是可以提高运营效率、降低管理费用,从而提升投资效率[5]。上述研究已充分认知影响机理的重要性并展开讨论,例如研究发现数字化转型的影响并非线性增长且对投资效率的影响呈“倒U型”特征,表明当前多数企业的数字化水平尚未达到最优状态等[6]。这必然涉及到调节和优化问题,从现有的研究成果看:企业的产权性质、高管认知能力等对数字化转型效果有显著调节作用[7]。
综上所述,现有成果为本文的研究问题提供了重要参考,但存在以下不足:① 研究逻辑为:影响因素–数字化水平–投资效率,但对其驱动因素的作用机制与路径不深入,进而对政策细化以及企业运营的参考不足;② 研究方法主要为多元线性回归等静态方法,对于以时间为主线的数据缺乏过程中决策思维变化为主的深入分析,而机器学习算法可以有效弥补这一不足,但具体哪一种算法更合适缺少深入探讨。
本研究采用机器学习算法比较多种驱动因素的预测效果,旨在探讨数字化转型驱动因素如何通过预测企业的外部因素和内部因素,进而改善投资效率的作用机理,找到关键影响因素和影响路径。讨论如何通过优化资源配置、提高管理效率以及降低风险,为锂电行业的高效投资决策提供支持,为行业政策制定者提供理论依据,进而推动新能源产业的高质量发展。
2. 研究设计
2.1. 研究思路
本研究致力于揭示数字化转型驱动因素对企业投资效率的多维影响机理,通过筛选重要驱动因素和中介变量建立路径机制,深入探究“驱动因素–中介变量–企业投资效率”之间的预测模式,即随着驱动因素的数值变化,对中介变量以及企业投资效率的影响发生怎样的变化,进而分析其原因和对策。
数字化转型驱动因素对企业投资效率的影响并非简单的因果关系,变量之间也并非简单的线性相关,特别是能获得的信息随时间而动态变化,间接反映了决策者的随内外部环境影响而变化的学习和思维过程,因此机器学习算法更擅长分析此类问题。
因为现有的机器学习算法较多,难以直接找到最适合的研究方法,故本文首先评估多种主流机器学习算法在本研究中的性能,根据相关指标选取最优的算法。然后,把影响路径分为内外两条,选择外部ESG表现和内部控制水平为中介变量,比较两者在预测企业投资效率时的重要性,分析影响程度及其内在的原因。ESG是指对企业环境(Environment)、社会责任(Social)和公司治理(Government)三个方面进行综合评价。内部控制水平是指企业为实现其经营目标而建立并实施的一系列制度、流程、政策与措施的综合质量与有效性。
进而,在关联了企业基本特征变量的基础上,分别研究各数字化转型驱动因素对两个中介变量的影响并进行重要性排序,从而选择重要的驱动因素并分析其对中介变量预测模式。结合上述研究结论,综合得出数字化转型驱动因素和企业投资效率之间的影响路径和机理,并通过稳健性检验加以验证。理论框架见图1。
Figure 1. Theoretical framework diagram
图1. 理论框架图
2.2. 研究方法
本文采用机器学习算法通过对大数据特征的分析,从多维度探究变量之间的内在联系,并考察在新数据集上的预测能力。具体算法选择参考陈运森等[8]和于淼等[9]的研究设计,以Lasso回归、决策树、随机森林、XGBoost等机器学习算法作为主要可选研究方法,以传统计量方法–多元线性回归作对比参照,根据机器学习性能从中优选。
优选指标的选取分两个层面:① 机器学习的性能是指在特定任务中完成目标的能力及其综合表现,因此选择算法的预测精度和解释能力两个方向;② 每个方向,从样本内外两方面参考最新研究成果分别确定不同的指标。具体来说:
预测精度反映了算法在预测时的准确度,主要体现为预测误差,本文借鉴了陈运森等[10]的研究方法,通过样本外均方误差
来衡量实际值与预测值之间的偏离程度,并认为样本外均方误差值越小,表明算法的预测精度越高。同时,本文还采用样本外平均绝对误差
和样本外绝对中位差
来评估算法预测的精度,前者减少了离群值对评估结果的影响,后者考察了预测误差的中位数。
解释能力反映了算法在预测时样本内外的拟合程度,本文参考Bertomeu et al. [11]相关文献,选取样本内决定系数
来评估算法样本内的训练表现,认为决定系数越高,样本内拟合程度越高,算法训练效果越好。同时,采用样本外决定系数
和样本外可解释方差
来评估算法的样本外拟合程度。预测值和实际观测值的拟合程度越高,算法的泛化能力越强。以上评估指标的定义和计算方法见表1。
Table 1. Definition and calculation method of evaluation indicators
表1. 评估指标定义及计算方法
评估指标 |
指标定义 |
计算方法 |
|
训练集中预测值和实际值的拟合程度 |
|
|
测试集中预测值和实际值的拟合程度 |
|
测试集中预测值变异程度对实际值变异程度的拟合程度 |
|
|
样本外预测值和实际值之差平方的期望值 |
|
|
样本外预测值和实际值之差绝对值的期望值 |
|
|
样本外预测值和实际值之差绝对值的中位数 |
|
3. 数据来源和变量说明
3.1. 数据来源与处理
数字化转型概念在2015年左右被首次提出,但不少企业在此之前就展开布局。基于此,本文选择2013~2023年A股上市公司,参考申银万国行业分类2021修订版,筛选出锂电和锂电专用设备上市企业,剔除ST企业,获得五十家企业的样本数据,剔除非效率投资的缺值数据,最终保留的数据量为192个。本文的企业财务治理数据、非投资效率数据来自国泰安数据库(CSMAR),ESG表现数据来自华证ESG评级体系,内部控制数据来自DIB迪博数据库披露的内部控制指数。
为了使数据集更适合应用于多种机器学习算法,特别是那些依赖于距离计算或正态分布的算法,本文对特征数据进行标准化处理,使得处理后的数据均值为0,单位方差为1,并使用8:2划分训练集与测试集。
3.2. 变量选取与测度
Table 2. Variable selection and measurement
表2. 变量选取与测度
变量性质 |
变量名称 |
变量符号 |
变量测度 |
被预测变量 |
企业投资效率 |
Inv |
Richardson非效率投资模型 |
预测变量 |
研发投入强度 |
RD |
研发投入占营业收入的比例 |
技术员工占比 |
Tech |
专业技术职称人员人数占总人数的比重 |
创新能力 |
Patent |
专利申请总数加1取自然对数 |
本科学历人员占比 |
Degree |
本科及以上学历人数占总人数的比重 |
高管数字化背景 |
CEO_Dig |
高管中有数字化背景为1,否则为0 |
高管持股比例 |
Hold |
董监高持股数量占总股数的比例 |
行业竞争强度 |
HHI |
赫芬达尔指数 |
区域GDP增长指数 |
GDP |
GDP增长指数-100 |
数字化基础建设 |
Int |
互联网普及率 |
中介变量 |
ESG表现 |
ESG |
华证ESG评级 |
内部控制 |
DIB |
DIB内部控制指数 |
基准变量 |
企业规模 |
Size |
公司总资产的自然对数 |
资产负债率 |
Lev |
总负债/总资产 |
资产收益率 |
ROA |
净利润/总资产 |
两权合一 |
Dual |
董事长与总经理是同一个人为l,否则为0 |
前五大股东持股比例 |
Top5 |
前五股东持股数量/总股数 |
托宾Q值 |
TobinQ |
托宾Q |
产权性质 |
SOE |
是否国有企业,国有为1,非国有为0 |
企业成立年限 |
FirmAge |
当年年份–公司成立年份 + 1 |
本研究的变量分为4类(见表2):被预测变量、预测变量、中介变量和基准变量。其中:中介变量为外部ESG表现和内部控制水平,因为二者已被证明这在数字化转型与企业投资效率之间起到中介作用[12];被预测变量为企业投资效率;预测变量为数字化转型驱动因素;基准变量为企业基本特征。变量选取与测度的逻辑如下:
被预测变量,企业投资效率(Inv)。本文分析中用Richardson模型进行测度,该模型由Richardson [13]于2011年首次提出,后来经过众多学者的验证能够较好地反应企业的投资效率水平。在稳健性检验中,本文采用了Chen et al. [14]提出的Chen模型测度企业投资效率,作为被预测变量的替换。这样能够从多角度验证结果,确保研究结论不依赖于单一指标的偶然性选择,从而提升研究的科学性和说服力。
预测变量,数字化转型驱动因素。本文的选取逻辑是:在企业数字化进程中,技术赋能依托数字技术优化内部资源配置与决策精准度;组织变革通过结构柔性整合ESG要素和内部治理,实现内外协同增效;外部环境借政策规制与行业竞争,形成外生约束与生态共振。因此,本文从技术角度选择了研发投入强度[15]、技术员工占比[16]和创新能力[17];从组织角度,选择了本科学历人员占比[18]、高管数字化背景[19]和高管持股比例;从环境角度,选择了行业竞争强度[20]、区域GDP增长指数[21]和数字化基础建设[22]。
基准变量,企业基本特征。相关研究发现企业的基本特征也会影响企业投资效率。因此,本文将其作为关联变量处理,并参考吴非等[23]、赵宸宇等[24]学者的研究,将表明企业发展状况的企业规模(Size)、资产负债率(Lev)、资产收益率(ROA)、两权合一(Dual)、前五大股东持股比例(Top5)、托宾Q值(TobinQ)、产权性质(SOE)、企业成立年限(FirmAge)等变量作为基准变量进行控制。
4. 实证结果与分析
4.1. 机器学习算法的选取
表3展示了不同机器学习算法在拟合效果方面的对比情况。从样本内拟合效果来看,XGBoost、随机森林和多元线性回归的样本内决定系数
显著高于Lasso回归和决策树,其中XGBoost的
值最高,且显著优于其他算法,这表明机器学习算法在样本内拟合效果上优于线性统计方法。
在模型的泛化能力方面,XGBoost在样本外决定系数
和可解释方法
方面均表现最佳,随机森林次之,而多元线性回归的泛化能力相对较弱。这说明机器学习算法不仅在训练集数据拟合上更具优势,在预测企业投资效率水平方面也表现出更好的泛化能力。
从预测误差方面看,各模型的样本外均方误差
普遍较低,差异不大,但是XGBoost的平均绝对误差
较低,绝对中位差
位于平均水平。
综合以上分析,XGBoost算法在样本内外的拟合效果以及预测误差控制等方面均表现出较高的适用性。因此,后续分析将基于XGBoost算法展开,并将验证之。
Table 3. The fitting effects of different machine learning algorithms
表3. 不同机器学习算法的拟合效果
|
|
|
|
|
|
|
多元线性回归 |
0.1269 |
(0.0345) |
(0.0290) |
0.0029 |
0.0439 |
0.0316 |
Lasso回归 |
0.0624 |
0.0410 |
0.0512 |
0.0031 |
0.0402 |
0.0339 |
决策树 |
0.0245 |
0.0520 |
0.0587 |
0.0032 |
0.0404 |
0.0295 |
随机森林 |
0.1596 |
0.0621 |
0.0792 |
0.0029 |
0.0413 |
0.0353 |
XGBoost |
0.7240 |
0.1432 |
0.0949 |
0.0009 |
0.0390 |
0.0339 |
4.2. 内外部中介因素对投资效率影响分析
4.2.1. 不同中介因素对企业投资效率的预测重要性分析
Figure 2. Summary chart of mediating factors
图2. 中介因素摘要图
本文借助摘要图比较不同中介因素对企业投资效率预测的重要性(见图2)。摘要图中,每个点代表样本的特征值及其对应的SHAP值,颜色深浅表示特征值大小。SHAP值基于Shapley值,用于量化各特征对模型预测结果的贡献。图的横轴表示特征对预测的贡献程度,正值表示促进预测结果提升,竖轴按特征重要性排序。
从图2不难看出,内部控制水平的重要性高于ESG表现。DIB的SHAP值分布较广,高值多集中在正向区域,表明高水平的内部控制显著提升投资效率,而低水平可能导致资源浪费或决策失误。相比之下,ESG的SHAP值分布较窄,影响力较温和,高ESG值对投资效率有提升作用,但低值影响有限。
内部控制(DIB)对投资效率影响显著,主要因其直接性和及时性。优化董事会结构、提高治理透明度和加强内部监督,可快速识别和规避投资风险,提高资源利用率和战略执行力,使投资规划更高效精准。而ESG表现影响较温和,因其间接性和长期性。ESG涉及多维度,改进周期长,虽能提升长期竞争力和声誉,但短期内对投资效率的直接作用有限,特别是对ESG观念尚未普及的市场环境,其对投资效率的作用受限,所以总体影响不及内部控制(DIB)。
4.2.2. 不同中介因素对企业投资效率的预测模式
Figure 3. ESG performance ALE chart
图3. ESG表现ALE图
Figure 4. Internal control ALE chart
图4. 内部控制ALE图
进一步地,本文利用累计局部效应图(Accumulated Local Effects Plot, ALE)分析中介因素对企业投资效率的预测模式。分析结果如图3和图4所示,图中横坐标分别为ESG表现和内部控制(DIB)的特征值,后者数量级显著高于前者,这是因为二者度量的计值方式不同,如同五分制和百分制,纵坐标指ALE的值,该值越大说明影响越显著。图中不难发现二者对企业投资效率的预测影响存在显著差异。
ESG的ALE曲线呈缓慢单边上升趋势,表明其正向作用渐进且平稳,对应前文分析,其临界点为3.5,低于此对投资效率产生负面影响,反之亦然。所以良好的ESG表现有助于提升企业声誉和市场认可度,吸引投资并降低潜在风险,但其正向效应通常需较长时间显现,且在较高水平时可能因边际收益递减而趋缓。
DIB的ALE曲线呈现复杂的非线性关系,当内部控制水平评分较低时对投资效率基本没有影响,但ALE超过一定值后其影响迅速上升,尤其在700以上时,其促进作用尤为显著。特别注意的是当区间为600~700其影响为负,因此这是关键区间。结合李万福等[25]研究的深入分析,其主要原因可能是组织结构发生变化,其内控管理体系尚未成熟,对信息不对称和代理问题的抑制有限,对投资效率的促进效应尚不明显。根据权变理论,组织结构变化时,内部控制体系需适应新环境,否则可能抑制投资效率。同时,代理理论指出,当内控体系不成熟时,管理者可能追求个人利益,损害公司整体效率。
4.3. 不同驱动因素对外部中介因素影响分析
在理清ESG表现和内部控制(DIB)与企业投资效率之间的内在关联之后,本文将重点研究不同数字化转型驱动因素如何预测ESG表现和内部控制(DIB),同时加入企业的基本特征进行变量控制,进而揭示数字化转型驱动因素与企业投资效率之间的影响机理。
4.3.1. 不同驱动因素对预测ESG表现的重要性分析
首先,采用SHAP值来衡量不同驱动因素和基准因素对预测ESG表现的重要程度,并将SHAP值前十的因素按照从大到小排序,结果如表4所示。为了区分不同因素的类型,本文将表4中驱动因素用*标记,未用*标记的为企业的基本特征。排序结果显示,在预测ESG表现中,创新能力(Patent)、研发投入强度(RD)、本科学历人员占比(Degree)、区域GDP增长(GDP)和高管持股比例(Hold)排在重要性的前五位,表明这些是影响企业ESG表现的重要驱动因素。
Table 4. Ranking of driver importance (ESG performance)
表4. 驱动因素重要性排序(ESG表现)
排序 |
变量 |
SHAP值 |
1 |
Size |
0.1585 |
2 |
Patent* |
0.0775 |
3 |
Lev |
0.0714 |
4 |
ROA |
0.0697 |
5 |
RD* |
0.0603 |
6 |
Degree* |
0.0471 |
7 |
Top5 |
0.0336 |
8 |
GDP* |
0.0326 |
9 |
Hold* |
0.0297 |
10 |
Int* |
0.0267 |
注:用*标记的为数字化转型驱动因素,未用*标记的为企业基本特征。
4.3.2. 关键驱动因素对ESG表现的预测模式
进一步地,本文选择SHAP值排名前二的“创新能力”和“研发投入强度”作为数字化转型关键驱动因素深入分析。由于累计局部效应图排除了特征间相关性的影响,侧重于探讨单一特征对模型预测的作用,因此可分析其对企业ESG表现的影响变化趋势。
(1) 创新能力(Patent)
Figure 5. Innovation capability ALE chart
图5. 创新能力ALE图
根据表2,创新能力(Patent)主要看专利数量,图5结果显示,对于该行业而言,总体呈现“先负后正”的变化趋势,重要的专利数量转折区间在4~5。具体来说,当专利数量处于较低水平时,企业的创新处于初期阶段,研发多集中于基础技术,尚未有效促进环境保护、社会责任和公司治理,因此对ESG表现为负。当专利数量增加至5以上时,新型技术增加并逐步应用于资源利用效率、碳排放降低和治理结构改进等领域,技术积累在清洁技术、绿色制造和社会公益等方面起到正向显著作用。
可以进一步讨论的是,当专利数量增加到4时,其负面作用反而加强,但作用微弱。结合ESG的原理和企业访谈认为,其原因可能是多方面的,有待进一步探索,但本研究至少发现了这是一个关键节点。
(2) 研发投入强度(RD)
Figure 6. R&D investment intensity ALE chart
图6. 研发投入强度ALE图
依据表2,本文的“研发投入强度”是指研发投入占营业收入的比例,一定程度上反应了企业对数字化研发的重视程度。图6结果显示,从总体来看,该行业的研发投入占比越高越好,但这也有一定的合理区间,或者说超越此区间其边际效应更明显。研究认为5%~6%可能是关键区间或是分水岭,低于此则表现为负,高于此则迅速上升。
从原理来看,这是因为企业的技术积累和创新成果已经显著提升,更加重视高质量可持续性的技术研发,这也符合《高新技术企业认定管理办法》的基本要求。因此,有更多创新成果应用于绿色技术、清洁生产和社会公益项目,推动ESG表现持续改善。
4.4. 不同驱动因素对内部中介因素影响分析
4.4.1. 不同驱动因素对预测内部控制的重要性分析
在分析驱动因素对外部中介因素-ESG表现的影响之后,本文继续分析驱动因素对内部中介因素–内部控制的影响。同样地,本文采用SHAP值来衡量不同驱动因素和基准因素对预测内部控制的重要程度,并将SHAP值前十的因素按照从大到小排序,结果如表5所示。
为了区分表5中不同因素的类型,同样将驱动因素用*标记,未用*标记的为企业基本特征。根据排序结果显示,在不同驱动因素预测内部控制时,研发投入强度(RD)、市场竞争强度(HHI)、技术人员占比(Tech)、本科学历人员占比(Degree)和区域GDP增长(GDP)排在重要性的前五位,表明这些是影响企业内部控制的重要驱动因素。
Table 5. Ranking of driving factor importance (Internal control)
表5. 驱动因素重要性排序(内部控制)
排序 |
变量 |
SHAP值 |
1 |
ROA |
24.3475 |
2 |
Top5 |
7.4245 |
3 |
Lev |
3.9140 |
4 |
RD* |
3.2511 |
5 |
HHI* |
2.5802 |
6 |
Size |
2.2741 |
7 |
Tech* |
2.1904 |
8 |
Degree* |
1.9492 |
9 |
GDP* |
1.9213 |
10 |
Patent* |
1.8592 |
注:用*标记的为数字化转型驱动因素,未用*标记的为企业基本特征。
4.4.2. 关键驱动因素对内部控制的预测模式
同样,本文依旧借助累计局部效应图研究重要驱动因素对企业内部控制的影响变化趋势。结合上述研究结果,本文选择了SHAP值前二的研发投入强度和创新能力作为关键驱动因素进行进一步分析。
(1) 研发投入强度(RD)
图7结果显示,研发投入强度与内部控制之间存在“M”形变化的非线性关系。当研发投入强度在2%~9%的区间时,对内部控制的影响都是正向的,并且在4%时达到峰值。这说明企业将研发投入控制在这个区间是较为合理,但也要注意超过4%之后的边际递减效应。
Figure 7. R&D investment intensity ALE chart
图7. 研发投入强度ALE图
其中,当研发投入强度在2%~4%时,企业资源分配较为均衡,适度的研发投入能够提升管理效率,推动技术在内部控制中的应用,从而对其产生显著的“由负传正”的影响。但随着研发投入强度增加,尽管仍对内部控制有正向影响,但边际递减效益。当研发投入强度超过9%时,企业可能因过度集中资源于研发而忽视内部管理和控制,也有可能因为技术转型的需要,企业的组织模式和工作方式发生变革,内部管理难度提升,进而影响企业的内部控制水平。根据资源基础观点,适度研发投入能优化资源配置,提升管理效率,但过度投入可能导致资源错配。
(2) 行业竞争强度(HHI)
Figure 8. Industry competition intensity ALE chart
图8. 行业竞争强度ALE图
行业竞争强度(HHI值)是一个综合指标,主要的计算依据是市场份额,能够侧面反应出一个企业的发展环境和竞争压力。图8结果显示,其关键点在0.1和0.2,因为其峰值为0.1且影响为正,自此之后持续出现边际递减效应,但在0.2以上仍影响为正,超过该值边际递减效应减弱但持续影响为负。
这是因为企业在面临较大的市场压力时,为了提高竞争力,管理层会更加重视优化内部控制,提高资源利用效率和决策透明度,对内部控制表现产生显著的正向作用。然而,随着竞争强度减弱,行业逐渐转向集中化,企业可能因市场地位稳固而产生“惰性效应”,导致正向作用减弱。
4.5. 稳健性检验
4.5.1. 替换预测变量
在实证分析部分,本文采用Richardson模型计算企业非效率投资,并将其作为预测变量。同时,为进一步提升研究的普适性,采用Chen模型测度的投资效率模型计算企业投资效率,作为替代性预测变量。投资效率取值越低,表示企业的投资效率越高。根据表6的结果,随机森林和XGBoost模型的拟合效果仍优于多元线性回归,研究结论保持一致。
Table 6. The Chen model replaces the predictor variables
表6. Chen模型替换预测变量
|
|
|
|
|
|
|
多元线性回归 |
0.1378 |
(0.2890) |
(0.2890) |
0.0034 |
0.0437 |
0.0351 |
随机森林 |
0.1660 |
0.0202 |
0.0233 |
0.0025 |
0.0363 |
0.0282 |
XGBoost |
0.1370 |
0.0446 |
0.0446 |
0.0025 |
0.0374 |
0.0301 |
4.5.2. 变更训练集和测试集比例
在本文的实证分析部分,本文采用了8:2的比例随机划分训练集和测试集。为避免因样本划分方法而导致的结果偏误,本文还使用了以下样本划分方法重新拟合模型:① 按7:3的比例随机划分训练集和测试集;② 按9:1的比例随机划分训练集和测试集。由表7和表8可以看出,变更样本划分方法后,以随机森林和XGBoost为代表的集成学习方法对于企业投资效率的拟合效果仍显著高于多元线性回归,本文的研究结论保持不变。
Table 7. The ratio of the training set to the test set is 7:3
表7. 划分训练集和测试集比例为7:3
|
|
|
|
|
|
|
多元线性回归 |
0.1459 |
(0.1267) |
(0.1210) |
0.0038 |
0.0480 |
0.0395 |
随机森林 |
0.4605 |
0.0336 |
0.0406 |
0.0017 |
0.0427 |
0.0322 |
XGBoost |
0.5787 |
0.0392 |
0.0429 |
0.0013 |
0.0420 |
0.0335 |
Table 8. The ratio of the training set to the test set is 9:1
表8. 划分训练集和测试集比例为9:1
|
|
|
|
|
|
|
多元线性回归 |
0.1262 |
(0.2260) |
(0.2183) |
0.0030 |
0.0447 |
0.0366 |
随机森林 |
0.1821 |
0.0225 |
0.0398 |
0.0024 |
0.0387 |
0.0337 |
XGBoost |
0.7186 |
0.0529 |
0.0540 |
0.0023 |
0.0355 |
0.0286 |
4.5.3. 替换XGBoost模型参数
在本文的实证分析部分采用的XGBoost模型参数中,n_estimators设定为200,max_depth设定为5。为了检验模型的稳定性,将模型中的n_estimators设定为{100, 150, 250, 300},max_depth设定为{4, 6},另外构成了2 × 4 = 8个参数组合再次进行计算。由表9可以得出,XGBoost模型的拟合效果仍显著高于多元线性回归,因此本文的研究结论保持不变。
Table 9. The simulation fitting effects of different parameters
表9. 不同参数的模拟拟合效果
|
|
|
|
|
|
|
多元线性回归 |
0.1269 |
(0.0345) |
(0.0290) |
0.0029 |
0.0439 |
0.0316 |
{100, 4} |
0.4385 |
0.0772 |
0.0838 |
0.0029 |
0.0393 |
0.0319 |
{100, 6} |
0.5207 |
0.0923 |
0.0979 |
0.0029 |
0.0386 |
0.0313 |
{150, 4} |
0.5698 |
0.1087 |
0.1145 |
0.0028 |
0.0386 |
0.0327 |
{150, 6} |
0.6633 |
0.1245 |
0.1292 |
0.0027 |
0.0380 |
0.0312 |
{250, 4} |
0.7354 |
0.1261 |
0.1311 |
0.0028 |
0.0384 |
0.0310 |
{250, 6} |
0.8248 |
0.1532 |
0.1573 |
0.0027 |
0.0376 |
0.0287 |
{300, 4} |
0.7849 |
0.1328 |
0.1380 |
0.0027 |
0.0384 |
0.0327 |
{300, 6} |
0.8701 |
0.1554 |
0.1601 |
0.0026 |
0.0378 |
0.0307 |
4.5.4. 小样本分析
在小样本条件下,本文采用支持向量回归(SVR)模型进行分析。SVR基于结构风险最小化原则,通过在有限样本下平衡经验误差与模型复杂度,从而提升模型的泛化能力[26]。相较于传统线性模型,SVR具有更强的非线性拟合能力与正则化特性,尤其适用于样本量较小、高维特征或噪声较大的数据环境[27]。已有研究表明,在地质预测[28]、医学诊断[29]以及金融市场预测[30]等小样本情境中,SVR均表现出优于神经网络和传统回归的稳健性与泛化性。
从表10中结果可见,SVR模型在样本内拟合效果较好,但在样本外的预测表现略低于XGBoost,总体预测误差指标MSE、MAE、MedAE与多元线性回归接近,表明其在有限样本下保持了较高的稳定性。相比之下,XGBoost在样本外拟合方面略有优势,但SVR模型在不同评价指标下的表现差异较小,说明研究结论并非依赖于特定算法设定,而在小样本条件下具有一定的稳健性。
Table 10. Small sample conditional analysis
表10. 小样本条件分析
|
|
|
|
|
|
|
多元线性回归 |
0.1269 |
(0.0345) |
(0.0290) |
0.0029 |
0.0439 |
0.0316 |
XGBoost |
0.7240 |
0.1432 |
0.0949 |
0.0009 |
0.0390 |
0.0339 |
SVR |
0.8560 |
0.0018 |
0.0240 |
0.0031 |
0.0436 |
0.0351 |
5. 研究结论与启示
5.1. 研究结论
数字化转型是锂电企业提高投资效率水平,提升竞争力的重要途径。本文基于2013~2023年中国A股锂电行业上市公司的数据,探讨了数字化转型驱动因素如何通过影响企业的内外部中介因素,进而影响投资效率的机理。① 研究发现:根据驱动因素重要性排序,“研发投入强度–内部控制–投资效率”和“创新能力–ESG表现–投资效率”是主要的数字化转型驱动因素影响投资效率的路径。② 对于预测企业ESG表现,创新能力、研发投入占比、本科学历人员占比、区域GDP增长和高管持股比例等驱动因素的重要性最高。其中:创新能力越强越好,具体表现为专利数量且关键转折区间在4~5;研发投入占比存有一定的合理区间,研究认为5%~6%是关键分水岭,超越此区间其边际效应明显。③ 对于预测企业内部控制,研发投入占比、市场竞争强度、技术人员占比、本科学历人员占比和区域GDP增长等驱动因素的重要性最高。其中:研发投入强度在2%~9%的区间时,对内部控制的影响均为正,在4%时达到峰值,自此之后其边际效应递减;行业竞争强度的关键点在0.1和0.2,其峰值为0.1且影响为正,自此之后持续出现边际递减效应,在0.2以后边际递减效应减弱但持续影响为负。④ 作为中介变量,企业ESG表现和内部控制都能够预测企业投资效率,但后者强于前者,并且不同数字化转型驱动因素对二者影响的重要程度也存有差异。⑤ 在众多机器学习算法中,XGBoost对企业投资效率的预测效果最佳,且样本内解释能力和样本外泛化能力显著优于多元线性回归。
5.2. 行业启示和政策建议
5.2.1. 加强人工智能的投入和在管理上的应用
人工智能在企业发展中存有巨大潜力,锂电行业在数字化转型过程中应将其与企业战略管理相结合,提高内部控制和外部监测的水平,开发预测型智能决策系统,这样可以从内外两条影响路径上同时起作用,以提高企业的竞争力、敏感性与适应性。
5.2.2. 提高人才的协同创新能力
人力资源是锂电企业发展的基础,特别是在数字化转型过程中尤其重要。企业应确保技术人员和高学历人才的占比,特别是建立“数字技术 + 行业知识”复合型人才培养和协同创新体系,这样才能充分保障数字化技术的落地和应用,持续在不同领域产生成果,进而提升ESG表现。
5.2.3. 构建双轨投资优化路径
正确的优化路径是企业在数字化转型中提高投资效率的关键。研究揭示了“研发投入–内部控制”与“创新能力–ESG”这两条重要的投资效率传导路径。企业应建立研发–创新资源动态平衡机制,控制研发投入强度在2%~4%的区间,尽量不要超过5%,如果超过9%则要十分慎重,同时尽可能保障有效专利数量大于5,以此达到内部控制与ESG表现共同优化的目的,进而提升企业的投资效率。企业应建立研发投入的动态监控与评估机制,当投入超过某一阈值时,需配套加强内部审计与风险控制资源,根据自身发展阶段和战略重点,动态调整对内部控制和ESG表现的侧重。
5.2.4. 提高行业监管水平,控制合理竞争强度
在对锂电行业进行监管时,有关部门一方面可以构建“ESG–内部控制”双维监管体系,根据行业特征调整两者的指标权重(锂电行业应侧重于内部控制),另一方面同时建立“激励–约束”协同控制机制。对双维体系评级优良的企业实施优惠政策,对突破风险的企业进行重点监管与惩罚,这样可以使一些潜力较大的企业在竞争环境中健康成长,也可以使优秀企业避免产生“惰性效应”,从而保障锂电行业的高质量发展。
基金项目
国家自然科学基金面上项目“基于概念漂移的边缘服务运行时可靠性异常检测方法及关键技术研究”(62372239)。