1. 引言
双碳战略纵深推进与资本市场高质量发展,推动ESG从企业社会责任软性约束转变为A股资产定价与系统性风险管理的核心维度。2018~2024年,A股ESG信息披露覆盖率从不足30%升至80%以上,ESG主题基金规模突破万亿元;同期市场受疫情冲击、地缘冲突等多重外生扰动,股价波动结构性分化与极端尾部风险防控需求持续凸显,ESG对股价波动的真实效应、驱动机制与作用边界,成为学界与业界共同关注的核心命题。
现有研究围绕ESG的波动效应形成“风险抑制假说”与“合法性噪音假说”两大对立阵营,分歧长期存在的核心根源在于三大方法缺陷:一是线性模型先验设定带来的系统性偏误,无法捕捉ESG效应的非线性特征;二是非线性机器学习模型陷入“拟合精度高但无有效统计解释”的黑盒困境;三是波动测度仅聚焦二阶矩波动率,忽略高阶矩尾部风险,且缺乏对核心测度指标的严谨对标验证。
针对上述缺陷,本文以2018~2024年沪深300指数成分股为研究样本,构建Kur全矩振幅值整合常规波动与极端尾部风险,通过双向固定效应模型、工具变量法检验ESG对股价全矩波动的因果效应,采用XGBoost模型与TreeSHAP方法实现“从黑盒到白盒”的无偏拆解,同时通过主流尾部风险指标对标验证核心测度的独特性,补充准自然实验DID检验强化因果识别。
本文边际贡献体现在三方面:一是构建了与SHAP拆解配套的全维度稳健性检验框架,弥补了非线性模型统计严谨性不足的缺陷;二是突破线性设定偏误与高阶矩维度缺失的双重局限,弥合了现有研究的理论分歧;三是精准识别了ESG风险抑制效应的核心驱动因子与作用边界,为监管层、上市公司与投资者提供了严谨的经验支撑[1]-[6]。
2. 核心统计学理论基础
黑盒指具备非线性一致收敛拟合能力,但无法实现无偏边际贡献量化、规范统计推断与内在机制拆解的预测模型,仅能完成“输入–输出”的相关性拟合,无法支撑因果性解释;白盒指在保留非线性模型拟合优势的基础上,通过可解释统计方法实现边际效应无偏量化、标准统计推断、作用机制拆解与全维度稳健性验证的分析体系,实现从“相关性拟合”到“因果性解释”的跨越。
2.1. 股价波动的全矩测度理论
2.1.1. 已实现波动率
已实现波动率(Realized Volatility, RV)是高频金融数据下波动率的无偏估计量,其渐近性质保证了估计的一致性。对资产
在时间区间
内,将区间等分为
个小区间,单区间对数收益率为
,则区间已实现波动率定义为:
当
时,
依概率收敛于资产真实波动率,无需复杂参数校准即可实现稳定估计,本文以此作为股价波动的基础测度指标。
2.1.2. 高阶矩风险指标
金融资产收益率普遍存在“尖峰厚尾、左偏分布”特征,仅用一阶矩无法刻画极端尾部风险,本文纳入三大高阶矩指标:
偏度(Skewness):刻画收益率分布的不对称性,反映极端下跌风险,定义为:
偏度为负且绝对值越大,资产极端下跌的概率越高。
峰度(Kurtosis):刻画收益率分布的尖峰厚尾程度,反映极端波动风险,定义为:
峰度大于3表明存在厚尾特征,数值越高,极端波动事件发生概率越大。
在险价值(VaR):刻画给定置信水平下的最大潜在损失,本文采用95%置信水平参数法VaR:
其中
为标准正态分布5%分位数,绝对值越大,极端下行风险越高。
2.1.3. Kur振幅模型
为同时捕捉收益率全矩特征,本文采用Kur振幅模型构建核心被解释变量,该模型通过峰度敏感系数将高阶矩风险纳入波动测度,较传统GARCH族模型更全面地刻画ESG对股价波动的全维度影响,核心设定为:
其中
为峰度敏感系数,
为核心解释变量与控制变量,模型采用极大似然估计(MLE),在非正态分布下仍具备渐近正态性与参数估计一致性。
2.1.4. Kur全矩振幅模型
为同时捕捉收益率全矩特征,弥补单一尾部风险指标仅覆盖单一风险维度的缺陷,本文采用Kur振幅模型构建核心被解释变量,该模型通过峰度敏感系数将二阶矩波动率、三阶矩偏度、四阶矩峰度纳入统一测度框架,可同时刻画常规波动与极端尾部风险,较传统单一指标与GARCH族模型更全面地捕捉ESG对股价波动的全维度影响,核心设定为:
其中
= 0.42为基于A股市场收益率分布特征的预校准值,通过网格搜索法确定,该取值下Kur指标对尾部风险的识别精度最高;
为超额峰度,仅保留厚尾特征以规避正态分布基准偏误。
与主流尾部风险指标的核心理论差异在于:DRV、半方差仅聚焦下行二阶矩风险,条件峰度、尾部指数仅刻画四阶矩尾部特征,CoVaR/MES仅衡量系统性尾部暴露,而Kur全矩振幅值是唯一同时整合了常规波动、不对称下跌风险、极端厚尾风险的合成指标,可完整捕捉股价从日常波动到极端尾部事件的全谱系风险,并非单一波动率或峰度指标的简单重命名。
2.2. 非线性拟合的XGBoost统计学习框架
传统线性模型先验设定变量间的线性关联,无法捕捉ESG与股价波动的非线性、非对称特征,本文采用XGBoost极端梯度提升模型构建非线性拟合框架,其核心是通过迭代训练弱学习器(分类回归树),最小化带正则化项的目标函数,平衡拟合能力与泛化能力,目标函数为:
。
其中
为损失函数,衡量预测值与真实值的偏差;
为正则化项,控制树模型复杂度以避免过拟合,定义为:
。
式中
为叶子节点数量,
为叶子节点权重,
、
为正则化系数。
XGBoost模型通过二阶泰勒展开优化收敛速度,内置双重正则化机制保证样本外泛化能力,可高效捕捉变量间的非线性关联与交互效应,从根本上解决线性模型的设定偏误问题,为后续白盒拆解提供可靠的黑盒拟合基础。
2.3. SHAP值的无偏可解释统计理论
SHAP值(Shapley Additive Explanations)是本文实现“从黑盒到白盒”转化的核心方法,其基于博弈论Shapley值,实现对非线性模型预测结果的唯一无偏拆解,破解传统机器学习模型的黑盒困境。
2.3.1. Shapley值的公理基础
Shapley值用于量化合作博弈中参与者对总收益的边际贡献,在满足四大公理的前提下可给出唯一无偏的分配方案,是SHAP值统计可靠性的核心保障:
(1) 有效性:所有参与者的Shapley值之和等于总收益,保证边际贡献完全分配;
(2) 对称性:边际贡献完全相同的两个参与者,其Shapley值相等;
(3) 虚拟性:对总收益无任何边际贡献的参与者,其Shapley值为0;
(4) 线性性:合并博弈中参与者的Shapley值等于各子博弈中Shapley值之和。
对包含n个参与者的合作博弈,参与者i的Shapley值定义为:
其中N为参与者全集,S为不含i的任意子集,
为子集S的合作收益。
2.3.2. SHAP值的模型分解框架
SHAP值将机器学习模型的预测过程视为合作博弈,每个特征为博弈参与者,模型预测值为总收益,任意非线性模型
的预测结果可唯一分解为:
其中
为基值(全样本预测值的均值),
为第i个特征的SHAP值,即该特征对当前样本预测值的边际贡献,正负向代表影响方向,绝对值代表影响强度。
本文采用适配树模型的TreeSHAP方法计算SHAP值,其基于树模型结构设计多项式时间算法,可精确计算SHAP值,避免近似估计误差,严格遵循Shapley值四大公理,保证边际贡献估计的无偏性与一致性,彻底破解非线性模型的黑盒困境。
2.3.3. 基于SHAP值的统计拆解体系
基于SHAP值的统计性质,本文构建四层拆解体系实现白盒转化:
(1) 全局SHAP值:通过特征SHAP值的平均绝对偏差衡量全局重要性,识别核心驱动因子;
(2) SHAP依赖图:检验特征对被解释变量的非线性效应与阈值特征;
(3) SHAP交互效应:量化特征间的交互边际贡献,检验E、S、G维度的协同或替代效应;
(4) 局部SHAP值:拆解单样本特征边际贡献,分析异质性特征。
2.4. 稳健统计与因果识别理论
2.4.1. 稳健预处理理论
为规避极端值、行业异质性、时序趋势对统计推断的干扰,本文对所有变量执行标准化稳健预处理:
(1) 双侧缩尾处理:对连续变量执行5%双侧缩尾,避免极端值导致的参数估计偏误;
(2) 行业中性化处理:通过行业哑变量回归提取ESG指标残差,消除行业系统性差异;
(3) 滚动窗口标准化:采用12个月滚动窗口标准化,规避全样本标准化带来的前视偏差(Look-ahead Bias),消除时序趋势与量纲影响;
(4) 主成分分析(PCA):对双ESG评级数据提取共性因子,缓解单一评级的测量误差与多重共线性问题。
2.4.2. 面板数据统计推断
本文以个体与时间双重聚类稳健标准误的面板固定效应模型为基准线性参照,该方法可同时处理面板数据的异方差、序列相关与截面相关问题,给出无偏的统计推断结果,避免伪回归。
2.4.3. 内生性处理与因果识别
针对ESG与股价波动间双向因果、遗漏变量导致的内生性问题,本文采用三大因果识别方法:
(1) 工具变量法(IV):通过两阶段最小二乘法(2SLS)解决双向因果问题,工具变量满足相关性与外生性两大核心条件;
(2) 倾向得分匹配法(PSM):通过Logit模型估计倾向得分,匹配特征相近的处理组与对照组,估计ESG对股价波动的平均处理效应(ATT),解决样本自选择偏差;
(3) 双重差分法(DID):以ESG强制披露政策为准自然实验,通过双重差分识别ESG的因果效应,解决遗漏变量问题。
2.4.4. 反事实安慰剂检验
为排除虚假回归风险,本文采用蒙特卡洛模拟开展安慰剂检验:随机打乱ESG得分的样本取值,重复模拟500次构建系数随机分布,对比原始估计值与随机分布的偏离度,验证核心结论的因果性。
2.5. 核心研究假设
基于上述理论,本文提出四大可检验的核心研究假设:
假设H1:ESG综合表现对股价波动率及高阶矩极端风险具有显著的负向抑制效应;E、S、G三个维度的抑制效应存在显著差异,治理(G)维度是核心驱动因子。
假设H2:ESG对股价波动的影响具有显著的非线性阈值效应,且存在非对称特征,其抑制作用在市场下行期、危机冲击期、高波动环境下显著强于平稳期与上行期。
假设H3:基于SHAP值的无偏拆解,可识别ESG影响股价波动的核心细分指标,董事会独立性、信息披露质量、碳排放强度、产品责任的边际贡献具备统计显著性。
假设H4:ESG主要通过信息不对称、风险管理、投资者情绪、融资约束四大渠道,对股价波动产生显著的抑制效应。
3. 研究设计
3.1. 样本选择与数据来源
本文以2018年1月~2024年12月沪深300指数成分股为初始研究样本,该样本覆盖A股全行业龙头企业,样本期内总市值长期占全市场60%以上,具备极强的市场代表性与数据质量优势。样本筛选流程见表1,最终得到236家上市公司的月度平衡面板数据,共19,824个有效观测值。
Table 1. Sample screening process
表1. 样本筛选过程
筛选步骤 |
筛选规则 |
剩余公司数 |
剩余月度观测值 |
初始样本 |
样本期内沪深300指数定期调整成分股 |
527 |
44,268 |
步骤1 |
剔除样本期内被ST、*ST特别处理的上市主体 |
489 |
41,076 |
步骤2 |
剔除核心变量连续缺失比例超过20%的样本 |
271 |
22,764 |
步骤3 |
剔除存在重大财务造假、退市风险的异常样本 |
236 |
19,824 |
最终样本 |
2018~2024年月度平衡面板数据 |
236 |
19,824 |
本文核心数据来源如下:ESG评级数据来自国内认可度最高的华证指数、商道融绿ESG数据库;股票交易与上市公司财务数据来自国泰安(CSMAR)、Wind数据库,所有交易数据均经除权除息调整;宏观与行业数据来自国家统计局与证监会行业分类标准。
为保证统计推断无偏,本文对所有连续变量执行标准化预处理流程:第一,行业中性化处理,以月度为单位,对ESG指标做行业哑变量横截面回归,取回归残差消除不同行业ESG评级的系统性差异;第二,滚动窗口标准化,采用过去12个月(不含当期)滚动窗口对变量进行标准化处理,完全规避全样本标准化带来的前视偏差(Look-ahead Bias),消除变量的时序趋势与量纲影响;第三,极值处理,对所有连续变量执行双侧5%缩尾处理,避免极端值对参数估计的干扰。
3.2. 变量定义与测度
本文核心变量分为被解释变量、核心解释变量、控制变量三类,具体定义、符号与测度方法见表2,核心指标的计算公式在正文对应部分明确。
Table 2. Variable definition and measurement
表2. 变量定义与测度
变量类型 |
变量名称 |
测度方法 |
被解释变量 |
Kur全矩振幅值 |
核心被解释变量,综合捕捉常规波动与极端尾部风险 |
|
年化月度已实现波动率 |
基础波动指标,基于日度对数收益率计算 |
|
收益率偏度 |
月度日度收益率三阶矩,刻画极端下跌风险 |
|
收益率峰度 |
月度日度收益率四阶矩,刻画极端波动风险 |
|
95%置信水平VaR |
参数法计算的月度最大潜在下行损失 |
|
半方差(SV) |
对标尾部风险指标,月度日度收益率下半方差 |
|
条件峰度(CK) |
对标尾部风险指标,GARCH (1,1)拟合残差计算的时变峰度 |
|
下行已实现波动率(DRV) |
对标尾部风险指标,仅基于负收益率计算的年化已实现波动率 |
|
Hill尾部指数(HTI) |
对标尾部风险指标,基于极值理论计算的左尾指数 |
|
边际期望损失(MES) |
对标尾部风险指标,5%置信水平下个股边际期望损失 |
核心解释变量 |
ESG综合得分 |
双评级数据经主成分分析提取的第一主成分,标准化处理 |
|
环境维度得分 |
双评级环境维度数据经主成分分析提取,标准化处理 |
|
社会维度得分 |
双评级社会维度数据经主成分分析提取,标准化处理 |
|
治理维度得分 |
双评级治理维度数据经主成分分析提取,标准化处理 |
控制变量 |
企业规模 |
总资产的自然对数 |
|
资产负债率 |
总负债/总资产 |
|
净资产收益率 |
净利润/平均净资产 |
|
营业收入增长率 |
营业收入同比增速 |
|
第一大股东持股比例 |
第一大股东持股数量/总股数 |
|
月均换手率 |
个股月度日均换手率 |
|
上市年限 |
上市年限的自然对数 |
|
固定效应 |
个体固定效应、月度时间固定效应 |
注:所有连续变量均经过5%缩尾、行业中性化与滚动窗口标准化处理;ESG细分指标均来自华证指数ESG评级的三级细分维度,与核心解释变量的数据源保持一致。
3.3. 核心模型设定
3.3.1. 基准线性双向固定效应模型
本文以个体–月度双重聚类稳健标准误的双向固定效应模型为线性基准,明确ESG与股价波动的基准线性关联,模型设定为:
其中,
为被解释变量,包括
、
等波动指标;
为核心解释变量;
为表2所列控制变量集合;
为个体固定效应;
为月度时间固定效应;
为随机扰动项。将核心解释变量替换为
、
、
,即可检验ESG三大维度的差异化效应。
双重聚类稳健标准误可同时处理面板数据的异方差、序列相关与截面相关问题,规避伪回归风险,符合顶刊计量规范。
3.3.2. XGBoost非线性黑盒拟合模型
为捕捉ESG与股价波动的复杂非线性关联、阈值特征与交互效应,本文构建XGBoost极端梯度提升模型,通过二阶泰勒展开优化收敛速度,内置双重正则化机制避免过拟合,核心目标函数为:
其中,
为平方误差损失函数,衡量模型预测值与真实值的偏差;
为正则化项,用于控制决策树复杂度,避免过拟合。
为彻底规避前视偏差,本文采用时序样本划分规则:2018~2022年数据为训练集(70%)、2023年数据为验证集(15%)、2024年数据为测试集(15%),通过5折时序交叉验证与贝叶斯优化校准超参数,保证模型泛化能力。
3.3.3. TreeSHAP无偏白盒拆解模型
本文采用适配树模型的TreeSHAP方法,对XGBoost黑盒模型进行无偏拆解,严格遵循Shapley值四大公理,给出唯一无偏的特征边际贡献估计,破解非线性模型的黑盒困境,核心分解公式为:
其中,
为全样本预测值的均值(基值),
为第i个特征的SHAP值,正负向代表该特征对股价波动的影响方向,绝对值代表影响强度。
基于SHAP值,本文构建四层拆解体系:第一,通过全局SHAP值识别ESG效应的核心驱动因子;第二,通过SHAP依赖图检验非线性效应与阈值特征;第三,通过SHAP交互值检验E、S、G维度间的协同或替代效应;第四,通过置换检验验证SHAP值的统计显著性,完善非线性模型的统计推断体系。
3.3.4. 内生性因果识别策略
针对ESG与股价波动间的双向因果、遗漏变量、样本自选择三大内生性问题,本文预设全维度识别方案,其中工具变量法为核心因果识别方法,PSM与DID为补充性因果证据:
(1) 工具变量法(IV):选取“同行业同省份其他企业ESG得分均值”为工具变量,该变量满足相关性与外生性两大核心条件,通过两阶段最小二乘法(2SLS)缓解双向因果问题,为本文核心因果识别方法;
(2) 倾向得分匹配法(PSM):以年度行业ESG得分中位数为临界值,划分高ESG组(处理组)与低ESG组(控制组),通过Logit模型估计倾向得分,采用1:1近邻匹配法匹配特征相近的样本,估计ESG对股价波动的平均处理效应(ATT),缓解样本自选择偏差;
(3) 准自然实验双重差分法(DID):以2022年证监会《上市公司投资者关系管理工作指引》将ESG纳入强制信息披露要求为准自然实验,构建多期DID模型,作为补充性因果证据,缓解遗漏变量问题;
(4) 反事实安慰剂检验:通过蒙特卡洛模拟,随机打乱ESG得分的样本取值,重复模拟500次构建系数随机分布,对比原始估计值与随机分布的偏离度,排除虚假回归风险,强化核心结论的因果性。
3.4. 全样本描述性统计
本文核心变量的描述性统计结果见表3,所有统计值均基于预处理后的平衡面板数据计算,与后续实证分析的样本完全一致,无样本偏差。
Table 3. Descriptive statistics of core variables for the full sample
表3. 全样本核心变量描述性统计
变量名称 |
观测值 |
均值 |
标准差 |
最小值 |
中位数 |
最大值 |
Kur全矩振幅值 |
19,824 |
4.26 |
1.93 |
1.05 |
3.98 |
11.24 |
年化已实现波动率(%) |
19,824 |
34.20 |
18.70 |
8.20 |
31.50 |
96.50 |
收益率偏度 |
19,824 |
−0.28 |
0.31 |
−1.26 |
−0.25 |
0.58 |
收益率峰度 |
19,824 |
4.52 |
1.16 |
2.87 |
4.21 |
8.93 |
95%置信水平VaR (%) |
19,824 |
−5.30 |
2.14 |
−12.60 |
−4.95 |
−1.85 |
ESG综合得分(标准化) |
19,824 |
0.00 |
1.00 |
−2.31 |
0.09 |
2.15 |
环境维度得分(标准化) |
19,824 |
0.00 |
1.00 |
−2.45 |
0.05 |
2.28 |
社会维度得分(标准化) |
19,824 |
0.00 |
1.00 |
−2.27 |
0.04 |
2.06 |
治理维度得分(标准化) |
19,824 |
0.00 |
1.00 |
−2.18 |
0.07 |
2.12 |
企业规模 |
19,824 |
24.35 |
1.52 |
21.08 |
24.12 |
28.64 |
资产负债率 |
19,824 |
0.51 |
0.19 |
0.08 |
0.52 |
0.91 |
净资产收益率 |
19,824 |
0.08 |
0.12 |
−0.36 |
0.07 |
0.42 |
营业收入增长率 |
19,824 |
0.15 |
0.32 |
−0.48 |
0.11 |
1.36 |
第一大股东持股比例 |
19,824 |
0.38 |
0.15 |
0.09 |
0.37 |
0.76 |
月均换手率 |
19,824 |
0.12 |
0.09 |
0.01 |
0.10 |
0.45 |
上市年限 |
19,824 |
2.85 |
0.56 |
0.69 |
2.94 |
4.09 |
注:所有连续变量均经过双侧5%缩尾处理,核心解释变量均经过行业中性化与滚动窗口标准化处理,年化已实现波动率单位为%。
由表3可知:第一,波动类指标符合A股市场“左偏、尖峰厚尾”的典型分布特征,波动水平存在显著的个体与时序差异,为实证分析提供了充足的变异度;第二,ESG指标经标准化后分布合理,无极端异常值,可保证后续参数估计的稳定性;第三,所有控制变量的分布均在合理区间,与国内金融顶刊研究的统计特征一致,验证了样本与数据的可靠性。
4. 实证结果与分析
基于前文构建的计量模型与识别策略,系统检验ESG对股价全矩波动的影响效应,验证本文提出的核心研究假设,为非线性模型拟合与白盒拆解提供线性基准参照。所有回归均采用企业–月度时间双向聚类稳健标准误,以同时控制异方差、序列相关与截面相关问题,保证统计推断严谨性。
4.1. 基准回归分析
表4报告ESG综合及分维度对Kur全矩振幅值的基准回归结果,用于验证本文核心假设H1:ESG对股价全矩波动具有显著负向抑制效应,且三大维度效应存在异质性。
结果显示,无论是否加入控制变量,ESG综合得分系数均在1%水平显著为负,假设H1得到验证。经济意义上,列(2)中ESG每提升1个标准差,企业股价全矩波动水平下降0.145个标准差,具备显著经济价值。分维度结果表明,治理维度(G)是驱动ESG波动抑制效应的核心因子,环境维度(E)次之,社会维度(S)效应最弱,与A股市场投资者对企业治理质量的高敏感度特征一致。
Table 4. Baseline regression results
表4. 基准回归结果
变量 |
(1) Kur |
(2) Kur |
(3) Kur |
(4) Kur |
(5) Kur |
ESG |
−0.182*** |
−0.145*** |
|
|
|
|
(0.031) |
(0.027) |
|
|
|
E |
|
|
−0.097** |
|
|
|
|
|
(0.042) |
|
|
S |
|
|
|
−0.076* |
|
|
|
|
|
(0.040) |
|
G |
|
|
|
|
−0.163*** |
|
|
|
|
|
(0.030) |
控制变量 |
否 |
是 |
是 |
是 |
是 |
双向固定效应 |
是 |
是 |
是 |
是 |
是 |
观测值 |
19,824 |
19,824 |
19,824 |
19,824 |
19,824 |
调整后R2 |
0.127 |
0.283 |
0.261 |
0.254 |
0.279 |
注:***p < 0.01,**p < 0.05,*p < 0.1;括号内为双向聚类稳健标准误;控制变量包括企业规模、资产负债率、ROE、营收增长率、第一大股东持股比例、换手率、上市年限。
4.2. 非线性效应检验
表5报告引入ESG二次项的回归结果,用于验证假设H2:ESG对股价波动的影响存在非线性门槛特征。
Table 5. Nonlinear effect test
表5. 非线性效应检验
变量 |
(1) Kur |
(2) Kur |
ESG |
−0.084** |
−0.079** |
|
(0.035) |
(0.033) |
ESG2 |
0.051** |
0.048** |
|
(0.022) |
(0.020) |
控制变量 |
否 |
是 |
双向固定效应 |
是 |
是 |
观测值 |
19,824 |
19,824 |
调整后R2 |
0.142 |
0.291 |
ESG一次项显著为负、二次项显著为正,表明二者呈U型非线性关系,假设H2得到验证。基于列(2)结果计算,U型曲线拐点位于ESG标准化得分0.82处:当ESG得分低于0.82时,其波动抑制效应持续增强;超过拐点后,边际效应逐步递减,体现了ESG治理的适度性特征——过度ESG投入可能挤占主营业务资源,削弱风险抑制效果。
4.3. 内生性与因果识别
基准回归可能受双向因果、遗漏变量、样本自选择三类内生性问题干扰,本文采用工具变量法(2SLS)与倾向得分匹配法(PSM)开展因果识别,结果见表6。
Table 6. Endogeneity treatment results
表6. 内生性处理结果
变量 |
2SLS第一阶段 |
2SLS第二阶段 |
PSM-ATT结果 |
工具变量IV |
0.784*** |
|
|
|
(0.059) |
|
|
ESG |
|
−0.168*** |
−0.139*** |
|
|
(0.032) |
(0.029) |
控制变量 |
是 |
是 |
协变量匹配 |
双向固定效应 |
是 |
是 |
- |
观测值 |
19,824 |
19,824 |
11,820 |
第一阶段F值 |
176.23 |
|
|
注:工具变量为同行业同省份其他企业ESG得分均值;PSM采用1:1近邻匹配,匹配后所有协变量标准化偏差均小于5%,平衡性检验通过。
4.3.1. 工具变量法(2SLS)
本文选取的工具变量满足两大核心条件:相关性上,同行业同省份企业ESG表现存在显著同群效应,行业政策与区域监管会同步影响企业ESG实践,与核心解释变量高度相关;外生性上,其他企业的平均ESG表现不会直接影响目标企业股价波动,仅能通过目标企业自身ESG水平产生间接影响,满足排他性约束。
第一阶段F值为176.23,远大于10的临界值,排除弱工具变量问题。第二阶段结果显示,剔除内生性干扰后,ESG系数仍在1%水平显著为负,且绝对值与基准回归接近,证明ESG对股价波动的抑制效应具备因果解释力。
4.3.2. 倾向得分匹配法(PSM)
以年度行业ESG得分中位数为界,将样本划分为高ESG组(处理组)与低ESG组(控制组),以基准回归控制变量为协变量进行1:1近邻匹配。匹配后协变量标准化偏差均小于5%,通过平衡性检验,匹配有效。平均处理效应(ATT)结果显示,高ESG组的股价全矩波动显著低于低ESG组,与基准回归结论一致,排除了样本自选择偏差的干扰。
4.3.3. 准自然实验双重差分法(DID)
本文以2022年证监会发布的《上市公司投资者关系管理工作指引》(以下简称《指引》)为准自然实验,该政策首次明确将ESG信息披露纳入上市公司投资者关系管理的核心要求,对A股上市公司ESG信息披露行为产生了外生冲击,本文通过多期DID模型识别ESG对股价波动的因果效应,作为核心因果识别的补充证据。
(1) 模型设定与分组定义
本文构建多期DID模型,设定如下:
其中,
为处理组虚拟变量,
为政策冲击虚拟变量,交互项
为核心解释变量,其系数
为政策冲击的净效应。
处理组与控制组定义:以《指引》发布前企业ESG信息披露质量的中位数为临界值,将披露质量低于中位数的企业划分为处理组——这类企业受政策强制披露要求的冲击更大,ESG表现的边际提升更显著;将披露质量高于中位数的企业划分为控制组。其中ESG信息披露质量采用华证指数ESG披露分项得分衡量,政策冲击时点
在2022年4月政策发布后取值为1,之前取值为0。
(2) 平行趋势检验与事件研究
为验证DID模型的核心前提——平行趋势假设,本文构建事件研究模型,以政策发布前1期为基准期,检验政策冲击前后处理组与控制组的股价波动趋势差异,结果见表7。
Table 7. Parallel trend test results
表7. 平行趋势检验结果
事件窗口 |
政策前3期 |
政策前2期 |
政策前1期 |
政策当期 |
政策后1期 |
政策后2期 |
政策后3期 |
系数 |
−0.042 |
−0.035 |
基准期 |
−0.126*** |
−0.158*** |
−0.142*** |
−0.137*** |
稳健标准误 |
(0.038) |
(0.032) |
− |
(0.030) |
(0.033) |
(0.031) |
(0.034) |
p值 |
0.271 |
0.276 |
- |
0.000 |
0.000 |
0.000 |
0.000 |
结果显示,政策发布前3期、前2期的系数均不显著,无法拒绝“处理组与控制组趋势无差异”的原假设,平行趋势假设成立;政策发布当期及之后各期,系数均在1%水平上显著为负,说明政策冲击显著提升了处理组企业的ESG表现,进而抑制了其股价波动,与基准回归结论一致。
(3) 政策叠加与预期效应讨论
针对政策窗口期内可能存在的其他政策叠加问题,本文逐一排查:样本期内与ESG相关的全国性政策仅为本次《指引》,同期无其他针对全市场ESG信息披露的强制政策,排除了重大政策叠加的干扰。针对预期效应问题,本文检验了政策发布前1年的系数显著性,结果显示政策发布前的系数均不显著,说明市场未对该政策形成提前预期,政策冲击具备外生性。
(4) 基准DID回归结果
表8报告了多期DID模型的基准回归结果,列(1)为未加入控制变量的结果,列(2)为加入全部控制变量的结果。
Table 8. Baseline DID regression results
表8. DID 基准回归结果
变量 |
(1) Kur |
(2) Kur |
Treat × Post |
−0.135*** |
−0.118*** |
|
(0.031) |
(0.028) |
控制变量 |
否 |
是 |
双向固定效应 |
是 |
是 |
观测值 |
19,824 |
19,824 |
调整后R2 |
0.256 |
0.278 |
注:***p < 0.01,括号内为双向聚类稳健标准误。
结果显示,交互项系数均在1%水平上显著为负,说明ESG强制披露政策的外生冲击,显著提升了企业ESG表现并抑制了其股价全矩波动,进一步验证了本文核心结论的因果性。需说明的是,本部分DID检验为核心因果识别的补充证据,本文核心因果结论仍以工具变量法2SLS回归结果为准。
4.4. 异质性分析
为厘清ESG效应的作用边界与非对称特征,本文从产权性质、行业属性、市场周期三个维度开展异质性分析,结果见表9。
Table 9. Heterogeneity analysis results
表9. 异质性分析结果
变量 |
(1) 国企 |
(2) 非国企 |
(3) 制造业 |
(4) 非制造业 |
(5) 熊市 |
(6) 牛市 |
ESG |
−0.192*** |
−0.094** |
−0.164*** |
−0.107** |
−0.217*** |
−0.082* |
|
(0.035) |
(0.041) |
(0.030) |
(0.044) |
(0.038) |
(0.045) |
控制变量 |
是 |
是 |
是 |
是 |
是 |
是 |
双向固定效应 |
是 |
是 |
是 |
是 |
是 |
是 |
观测值 |
10,752 |
9072 |
12,468 |
7356 |
7920 |
11,904 |
注:***p < 0.01,**p < 0.05,*p < 0.1;括号内为双向聚类稳健标准误;牛熊市划分参考沪深300指数走势,其中熊市区间为2018年1~12月、2022年1~12月、2024年1~12月,剩余区间为牛市区间。
核心结论如下:
(1) 产权异质性:ESG的波动抑制效应在国有企业中更强,核心原因是国企ESG实践的政策执行力与信息披露规范性更高,投资者对其ESG信息的认可度更强;
(2) 行业异质性:制造业企业ESG效应更显著,源于制造业面临更强的环境监管、安全生产与供应链社会责任约束,ESG提升能更直接地降低合规风险与经营不确定性;
(3) 周期异质性:熊市区间ESG的稳定效应显著强于牛市,验证了ESG的“危机缓冲器”功能——市场下行期投资者风险偏好降低,更关注企业长期风险抵御能力,ESG的定价作用被放大。
4.5. 稳健性检验
本文从变量测度、样本选择、模型设定三大维度,通过5种方式验证核心结论的稳健性,结果汇总于表10,所有检验均控制双向固定效应与全部控制变量。
Table 10. Robustness test results
表10. 稳健性检验结果
检验方式 |
ESG系数 |
稳健标准误 |
显著性 |
替换被解释变量(年化已实现波动率RV) |
−0.127*** |
(0.025) |
1% |
替换核心解释变量(华证ESG单一评级) |
−0.138*** |
(0.029) |
1% |
调整缩尾比例(双侧1%缩尾) |
−0.151*** |
(0.028) |
1% |
子样本检验(剔除2020年疫情异常区间) |
−0.141*** |
(0.030) |
1% |
更换聚类层级(行业–时间双向聚类) |
−0.145*** |
(0.026) |
1% |
所有检验结果均与基准回归高度一致,核心系数的方向、显著性与绝对值无实质性变化,证明本文核心结论并非由变量测度、样本选择、模型设定等因素导致,具备极强的稳健性。
4.6. 尾部风险指标对标检验
4.6.1. 尾部风险指标对标检验
为验证Kur全矩振幅值的独特性,证明其并非波动率或峰度指标的简单重命名,本文从相关性分析、增量解释力、经济含义差异三个维度开展对标检验,所有检验均控制双向固定效应与全部控制变量。
4.6.2. 相关性分析
表11报告了Kur全矩振幅值与主流尾部风险指标的Pearson相关系数矩阵。结果显示,Kur与已实现波动率、下行波动率、半方差等二阶矩指标的相关系数分别为0.726、0.694、0.658,与条件峰度、Hill尾部指数等四阶矩指标的相关系数分别为0.582、0.517,与MES的相关系数为0.613。所有相关系数均显著小于1,且方差膨胀因子(VIF)均小于5,排除完全共线性问题,证明Kur指标包含了单一尾部风险指标无法覆盖的全谱系风险信息,具备独特的信息增量。
Table 11. Correlation coefficient matrix of the Kur indicator and mainstream tail risk indicators
表11. Kur指标与主流尾部风险指标的相关系数矩阵
变量 |
Kur |
RV |
DRV |
SV |
CK |
HTI |
MES |
Kur |
1.000 |
|
|
|
|
|
|
RV |
0.726*** |
1.000 |
|
|
|
|
|
DRV |
0.694*** |
0.942*** |
1.000 |
|
|
|
|
SV |
0.658*** |
0.897*** |
0.925*** |
1.000 |
|
|
|
CK |
0.582*** |
0.315*** |
0.352*** |
0.307*** |
1.000 |
|
|
HTI |
0.517*** |
0.284*** |
0.306*** |
0.279*** |
0.863*** |
1.000 |
|
MES |
0.613*** |
0.785*** |
0.812*** |
0.764*** |
0.426*** |
0.395*** |
1.000 |
注:***p < 0.01,所有相关系数均在1%水平上显著。
4.6.3. 增量解释力检验
为进一步验证Kur指标的增量信息,本文开展两项检验:第一,将主流尾部风险指标逐一加入基准回归,检验ESG对Kur的抑制效应是否依然显著;第二,对比ESG对Kur与其他尾部风险指标的解释力差异,结果见表12。
Table 12. Incremental explanatory power test results
表12. 增量解释力检验结果
变量 |
(1) Kur |
(2) Kur |
(3) Kur |
(4) RV |
(5) DRV |
(6) CK |
(7) MES |
ESG |
−0.145*** |
−0.102*** |
−0.087*** |
−0.127*** |
−0.115*** |
−0.063** |
−0.098*** |
|
(0.027) |
(0.022) |
(0.019) |
(0.025) |
(0.024) |
(0.026) |
(0.023) |
主流尾部风险指标 |
否 |
RV + DRV + SV |
全部对标指标 |
否 |
否 |
否 |
否 |
控制变量 |
是 |
是 |
是 |
是 |
是 |
是 |
是 |
双向固定效应 |
是 |
是 |
是 |
是 |
是 |
是 |
是 |
观测值 |
19,824 |
19,824 |
19,824 |
19,824 |
19,824 |
19,824 |
19,824 |
调整后R2 |
0.283 |
0.517 |
0.624 |
0.265 |
0.258 |
0.182 |
0.241 |
注:***p < 0.01,**p < 0.05,括号内为双向聚类稳健标准误。
结果显示:第一,即使在控制了全部主流尾部风险指标后,ESG对Kur的系数依然在1%水平上显著为负,证明ESG对Kur的抑制效应包含了单一尾部风险指标无法解释的增量信息;第二,ESG对Kur的回归系数绝对值与模型拟合优度,均显著高于其对单一波动率、尾部风险指标的回归结果,说明Kur指标能更全面地捕捉ESG对股价全谱系风险的抑制效应。
4.6.4. 经济含义差异分析
分行情区间的异质性检验结果显示,在熊市区间,ESG对Kur的回归系数为−0.217***,对RV的系数为−0.152***,对条件峰度的系数为−0.094***;在牛市区间,ESG对Kur的系数为−0.082*,对RV的系数为−0.075*,对条件峰度的系数为−0.038 (不显著)。这一结果明确了Kur与其他指标的经济含义差异:单一波动率指标仅能捕捉ESG在全行情下的常规波动抑制效应,单一峰度/尾部指数仅能捕捉极端行情下的尾部风险效应,而Kur指标可同时捕捉两种效应,在极端市场环境下的风险识别能力显著优于单一指标,具备独特的经济含义与应用价值,并非现有指标的简单重命名。
5. 非线性拟合与白盒拆解
5.1. 非线性模型拟合效果验证
表13报告了XGBoost模型与线性基准模型[7]、传统GARCH模型的拟合效果对比[8],分别列示全样本与时序外测试集的核心指标,验证模型的拟合能力与泛化能力。
Table 13. Comparison of model fitting performance
表13. 模型拟合效果对比
模型类型 |
全样本拟合优度R2 |
测试集拟合优度R2 |
测试集MAE |
测试集RMSE |
线性双向固定效应模型 |
0.283 |
0.261 |
1.252 |
1.674 |
GARCH (1,1)模型 |
0.312 |
0.295 |
1.186 |
1.612 |
XGBoost非线性模型 |
0.576 |
0.542 |
0.807 |
1.051 |
结果显示,XGBoost模型的测试集拟合优度R2达0.542,远高于线性模型与GARCH模型,同时测试集MAE、RMSE显著更低,证明非线性模型不仅拟合精度更高,且具备极强的样本外泛化能力,有效解决了线性模型的设定偏误问题,为后续白盒拆解提供了可靠的拟合基础。
5.2. 基于TreeSHAP的无偏白盒拆解
本节基于TreeSHAP方法对XGBoost模型进行无偏拆解,严格遵循四层拆解体系,所有ESG相关特征的SHAP值均通过1%水平的置换显著性检验(置换次数1000次),排除随机噪声干扰,保证边际贡献的统计有效性[9]。
5.2.1. 全局特征重要性与核心驱动因子识别
表14报告了核心特征的SHAP全局重要性排名,以SHAP值的平均绝对偏差(MAE)衡量特征对股价波动的边际贡献强度,同时列示ESG核心细分指标的贡献排名,验证假设H3。
Table 14. Global SHAP importance ranking of core features
表14. 核心特征SHAP全局重要性排名
排名 |
特征名称 |
SHAP均值绝对偏差 |
贡献占比 |
1 |
治理维度得分(G) |
0.128 |
22.40% |
2 |
ESG综合得分 |
0.104 |
18.20% |
3 |
月均换手率 |
0.091 |
15.90% |
4 |
环境维度得分(E) |
0.076 |
13.30% |
5 |
企业规模 |
0.058 |
10.15% |
6 |
社会维度得分(S) |
0.042 |
7.35% |
7 |
资产负债率 |
0.037 |
6.47% |
8 |
净资产收益率 |
0.032 |
5.58% |
—— |
【ESG核心细分指标Top4】 |
—— |
—— |
1 |
信息披露质量 |
0.087 |
15.20% |
2 |
董事会独立性 |
0.062 |
10.85% |
3 |
碳排放强度 |
0.049 |
8.57% |
4 |
产品责任 |
0.035 |
6.12% |
注:贡献占比为对应特征在全特征总边际贡献中的占比,前8大核心特征累计贡献占比超99%,剩余特征贡献不足1%。
结果显示:第一,治理维度(G)是ESG波动抑制效应的核心驱动因子,环境维度(E)次之,社会维度(S)贡献度最低,与前文基准回归结论完全一致;第二,ESG相关指标在全特征中的累计贡献占比超61%,是影响股价波动的核心驱动因素;第三,细分指标中,信息披露质量、董事会独立性、碳排放强度、产品责任的边际贡献具备统计显著性,本文核心假设H3得到充分验证。
5.2.2. 非线性效应与阈值特征
SHAP依赖图结果显示,ESG综合得分与股价波动呈显著的U型非线性关系,拐点位于标准化得分0.82处,与前文二次项回归结果完全匹配:ESG得分低于0.82时,SHAP值随ESG得分提升持续下降,波动抑制效应逐步增强;超过拐点后,边际抑制效应逐步递减,进一步验证了ESG治理的适度性特征。
5.2.3. 维度交互效应检验
SHAP交互效应检验结果显示,治理维度(G)与环境维度(E)存在1%水平显著的正向协同效应:当企业治理水平较高时,环境维度的波动抑制效应提升37.2%,说明完善的公司治理是ESG风险防控功能有效发挥的基础。环境与社会、社会与治理维度的交互效应不具备统计显著性。
5.2.4. 异质性拆解
局部SHAP值的异质性拆解结果与前文结论完全一致:ESG的波动抑制效应在国有企业、制造业、熊市区间更强,进一步验证了结论的稳健性,同时明确了ESG风险防控功能的作用边界。
6. 总结
本文以2018~2024年沪深300指数成分股为样本,系统检验ESG表现对股价全矩波动的影响,核心结论如下:ESG对股价全矩波动具有显著的因果性抑制效应,可同时平抑常规波动与极端尾部风险,ESG每提升1个标准差,股价全矩波动下降0.145个标准差,其中治理维度是核心驱动因子;二者呈显著U型非线性关系,拐点位于ESG标准化得分0.82处,且该效应在国有企业、制造业企业与熊市区间更为突出,具备明确的“危机缓冲器”功能;XGBoost非线性模型的拟合精度与泛化能力显著优于线性基准模型,TreeSHAP白盒拆解明确信息披露质量、董事会独立性、碳排放强度为核心细分驱动指标,验证了治理与环境维度的正向协同效应;经主流尾部风险指标对标,本文构建的Kur全矩振幅值具备独特信息增量,并非现有波动或尾部风险指标的简单重命名,多重内生性与稳健性检验均验证了核心结论的可靠性。
基于核心结论,本文从资本市场三大核心主体出发提出政策启示:监管层应以治理维度为核心完善分层分类ESG强制披露制度,统一实质性ESG行为的量化披露口径,压缩“漂绿”操作空间,同时将ESG纳入资本市场系统性风险预警体系,引导市场关注其风险防控价值;上市公司应摒弃“重形式、轻实质”的ESG实践误区,以完善公司治理、提升信息披露质量为核心,合理规划ESG投入,避免过度非主业投入挤占经营资源,将ESG纳入全面风险管理体系;投资者应将ESG表现纳入投资决策与组合风险管理,重点关注企业实质性ESG指标,充分利用其危机缓冲功能优化组合风险收益比,树立长期价值投资理念。
本文仍存在一定研究局限,样本仅覆盖沪深300成分股,结论对中小市值企业的适用性有待验证,采用第三方ESG评级未能完全区分实质性与象征性ESG行为的差异化影响,也未系统检验ESG影响股价波动的具体传导路径;未来研究可拓展样本范围深化异质性分析,基于文本大数据构建实质性ESG行为指标以识别“漂绿”行为的差异化效应,同时通过规范的中介模型拆解ESG影响股价波动的内在机制,完善ESG与资本市场稳定的相关理论体系[10]-[18]。
基金项目
国家社会科学基金一般项目:产业关联视角下科技金融促进数实深度融合的机制与政策优化研,项目编号:(24BJY086);国家社会科学基金后期资助项目:绿色技术跨国合作创新网络的动态演化、驱动机制及引导策略研究,项目编号:(23FGLB024);国家社会科学基金后期资助项目:海域资源高质量开发利用机制重构,项目编号:(20FGLB016);工信部智库创新基金:江苏省低空经济产业生态链构建研究,项目编号:(NK2024001)。
NOTES
*共同通讯作者。