1. 引言
当前企业集团因股权关联密集,违约风险易在内部扩散形成现实挑战,而传统的结构模型、简化模型等违约预测模型多聚焦单一企业,忽略公司间违约相关性,难以刻画集团内的风险传导效应。在风险传染机制研究方面,袁欣等(2020) [1]借助复杂网络理论将企业集团转化为网络图,从风险修复、风险传染及环境干扰三方面刻画集团成员违约风险的演变过程并构建传染变量;纳鹏杰等(2017) [2]研究发现集团控股上市公司的风险会通过股权关联在内部传递形成联动效应;李冰清等(2023) [3]以网络结构视角发现企业集团的股权层级与关联密度直接影响风险传导效率,核心企业在风险传染中扮演枢纽角色;李霖婷(2020) [4]聚焦传染路径以三胞集团为例分析了债务违约通过业务关联、担保关联的传染路径;余彦茜(2022) [5]以神雾集团为案例指出企业集团债务违约风险存在基于股权关系、关联担保链和关联交易的三类传染路径;马壮等(2025) [6]则发现独立董事连锁网络会传播财务违规经验进而加剧财务违规传染。在违约预测模型研究方面,陈庭强等(2014) [7]基于复杂网络构建信用风险传染模型,但未结合企业集团的股权特性进行针对性优化;胡心瀚等(2013) [8]运用Copula方法分析信用风险与市值变化的相关性,但未结合风险在集团内部的动态传导过程。
在此背景下,本文参考文献[1]通过构建股权网络,从风险修复、风险传染及环境干扰三个部分描述违约风险的演变过程,来构建传染变量,以此度量公司在企业集团内部的风险,验证文献[1]模型在更长周期、更大样本下的适用性,检验原研究结论稳健性。本文以2009~2021年集团控股上市公司为样本开展实证。
2. 相关理论基础
企业集团的核心联系是股权关联形成的层级结构,本质是资源共享、风险联动的利益共同体。信用风险传染理论指出集团内股权密集导致违约风险非单一企业孤立事件,核心企业违约易通过股权控制拖累子公司,子公司困境也会通过股权收益减值反哺核心企业;复杂网络理论以“节点”代表集团内企业,以“有向边”代表持股关系,以“权重”代表持股比例,通过密度、中心性量化风险传递能力;信息不对称理论指出集团内外部信息差异引发市场过度反应,加速局部风险向整体扩散;同时,集团违约风险存在滞后性,模型通过“生存时间”与“条件违约概率”,捕捉风险随股权关联动态演变的过程。
3. 实证研究
3.1. 实证基础和数据筹备
本文基于国泰安数据中心2009~2021年我国沪深A股上市公司的股权数据、财务数据以及2011~2023年的ST公告数据进行验证国泰安数据中心。本文仅考虑上市公司的股权关联,且考虑到企业集团股权结构稳定性与违约事件观测的完整性,将2009~2019年的数据作为训练样本,2020年和2021年的数据作为测试样本。参考文献[1],为保证样本数量本文的违约的标志为因财务状况异常而被特殊处理(ST)的上市公司,并借助t年的财务数据对公司是否会在t + 2年发生违约进行预测,2009至2021年我国A股上市公司违约情况的细节见表1:
Table 1. Defaults of China’s A-share listed companies (2009~2021)
表1. 2009~2021年我国A股上市公司违约情况
年份(t) |
公司总数 |
ST公司数量(t + 2) |
违约比例(%) |
2009 |
1696 |
40 |
2.36% |
2010 |
2041 |
25 |
1.22% |
2011 |
2320 |
25 |
1.08% |
2012 |
2472 |
41 |
1.66% |
2013 |
2468 |
46 |
1.86% |
2014 |
2592 |
56 |
2.16% |
2015 |
2808 |
67 |
2.38% |
2016 |
3034 |
80 |
2.64% |
2017 |
3467 |
80 |
2.31% |
2018 |
3567 |
80 |
2.24% |
2019 |
3760 |
80 |
2.13% |
2020 |
4140 |
53 |
0.97% |
2021 |
4603 |
47 |
0.96% |
3.2. 数据预处理
在变量的预处理与选择上,为规避异常值和缺失值对模型结果的影响,本文于每个时间截面对财务杠杆系数、净利润增长率、净资产收益率、营业利润率这四个用于刻画公司经营发展状况的指标,分别用绝对离差中位数法处理异常值,以均值填补缺失值;同时将一年期存款利率作为宏观变量纳入分析。经共线性检验,变量间相关系数均低于0.5,方差膨胀因子均小于1.5,不存在共线性问题,可用于建模。预处理后5个变量的统计特征见表2:
Table 2. Statistical characteristics of sample variables
表2. 样本所用变量的统计特征
|
财务杠杆系数 |
净利润增长率 |
净资产收益率 |
营业利润率 |
利率 |
最小值 |
0.5750 |
−125.3650 |
−9.0340 |
−12.2620 |
1.500 |
中位数 |
1.0680 |
9.9840 |
7.9050 |
8.5460 |
1.500 |
均值 |
1.1270 |
11.6160 |
8.3830 |
8.9510 |
1.973 |
最大值 |
2.5650 |
172.0340 |
26.6310 |
31.7990 |
3.500 |
标准差 |
0.2330 |
42.0560 |
5.6210 |
7.2010 |
0.695 |
3.3. 数学模型
本文核心数学模型以刻画企业集团风险传导规律和提升违约概率预测精度为目标,以复杂网络[1]为传染研究路径研究核心,融合复杂网络理论与离散危险率模型,解析集团内违约风险的演变与影响机制,传染变量和离散危险率模型表示如下[1]:
1) 传染变量[1]
本文把发生违约的企业定义为风险传染源,以此构建传染变量
,
表示t时刻企业网络中a公司的风险量;其中
为非负数,若
表示a公司在t时刻无风险,反之存在风险。
为了使传染变量更好的匹配实际数据,我们用测试集,依照AIC最小化原则,对参数
展开优化,优化结果为
;本文对模型估计前,采用SMOTE [9]方法处理样本中违约数据正负例严重失衡的状况。综上,传染变量公式为:
(1)
对于不存在于股权网络的公司,我们假设其只有自我修复机制与环境的干扰。此时传染变量表达式为:
(2)
① 风险修复能力
(3)
其中,
,
,
,
表示企业网络控股a公司的公司数量;
为a公司在
时刻的风险水平。若
,表示该公司无其他企业持有其股份仅具备自我修复能力。
② 风险传染能力
(4)
其中,
是非线性函数,
。
指持有a公司股份的企业集合,
指a公司控股的企业集合;
指b公司对a公司的持股占比,
指a公司对k公司的持股占比。为平衡风险需求,
取0.8,表示违约公司传染的初始风险量;
为1时,表示b公司在t时刻违约,反之为0。
③ 环境干扰
环境干扰项
用于捕捉公司面临的不可观测随机因素对风险量的影响,包括宏观经济波动、行业政策变化等外部环境的不确定性和公司自身发展中的未知因素;由于此类因素无规律且难以观测,本文假定其服从均匀分布
。
2) 离散危险率模型[1]
在传染变量量化风险的基础上,构建离散危险率模型预测公司违约概率,该模型能有效处理“生存时间数据”,并整合公司特定变量、宏观变量、传染变量三类影响因素。假设
为样本观测时间,且公司违约发生在这些时间点中。具体设计如下:
① 离散危险率模型
(5)
其中,
、
、
、
是模型参数。
是危险率函数,用来刻画第a个公司在
时刻违约的概率;
指公司生存时间。
② 似然函数
(6)
其中,
指公司首次公开募股的时间,若公司首次公开募股的时间早于
,则
;
指样本时期内公司最后一次被观测到的时间,若其发生违约的时间在
之后,则
;
指在样本时期内公司是否违约,若其在样本观测期内违约,则
,否则
;
指特定变量,刻画公司经营发展状况;
指构建的传染变量;
指宏观变量。
3.4. 传染变量统计特征
经计算后的传染变量统计特征见表3:
Table 3. Statistical characteristics of the contagion variables
表3. 传染变量的统计特征
最小值 |
中位数 |
均值 |
最大值 |
标准差 |
0.000000 |
0.000181 |
0.000217 |
0.062346 |
0.000907 |
4. 结果论证
通过对传染变量与公司实际违约情况展开深入分析,我们发现当传染变量增大时,公司发生违约的可能性相应提升,即传染变量可反映公司当下的风险状况。我们选取两家违约公司,用黑色叉号代表该公司在两年后违约,展示其传染变量随时间的变化过程。如图1:
Figure 1. Evolution of contagion variables for two companies prior to default
图1. 两家公司在发生违约前传染变量的变化过程
从图1可知,两家公司违约前传染变量均显著上升,即它们受到了相邻公司的风险传染。000005 (世纪星源)的传染变量2018年激增,因其关联企业(香港)中国投资有限公司当年违约;后传染变量降低,显示其在化解危机、降低风险。000033 (新都酒店)的传染变量2011年明显变化,系其关联企业深圳市瀚明投资有限公司同年违约所致。
我们通过于训练样本中对含传染变量和不含传染变量的模型展开估计,从预测精度与拟合优度两维度进行评价,以此研究传染变量对违约概率的影响。计算结果见表4:
Table 4. Parameter estimation results for two models
表4. 两模型参数估计结果
|
不含传染变量 |
含传染变量 |
变量 |
系数 |
标准差 |
系数 |
标准差 |
常数项 |
−0.465*** |
0.01 |
−0.4659*** |
0.0101 |
财务杠杆 |
0.4336*** |
0.009 |
0.4358*** |
0.009 |
利率 |
0.3404*** |
0.0091 |
0.341*** |
0.0091 |
净利润增长率 |
0.5015*** |
0.0083 |
0.5022*** |
0.0083 |
净资产收益率 |
−0.5732*** |
0.0109 |
−0.5741*** |
0.0109 |
营业利润率 |
−0.1315*** |
0.011 |
−0.1297*** |
0.011 |
传染变量 |
- |
- |
0.0288*** |
0.0091 |
AIX |
70753.96 |
70735.43 |
注:***表示1%的显著性水平。
Figure 2. ROC curves for two model types
图2. 两类模型ROC曲线
表4中两类模型的变量系数均在1%显著性水平下显著,且含传染变量模型的AIX值(70735.43)低于不含传染变量模型(70753.96),拟合效果更优。利率、财务杠杆等在两类模型中系数稳定且显著,构成了违约风险的基础财务与宏观驱动因素;而传染变量的正系数说明该变量能有效捕捉企业间风险传导对违约的作用——传染变量越低,企业风险水平越低,违约概率也越低,从而使模型对违约概率的解释从“财务–宏观”层面延伸至企业网络风险互动层面。图2是两类模型的ROC曲线,可知传染变量的危险率模型的预测准度较好。综上,含传染变量的危险率模型对公司违约概率的预测表现更优。
为分析引入传染变量后模型拟合效果的变化,本文采用似然比检验探究传染变量的统计显著性。研究拟合四个模型就对公司违约的影响展开对比:简单模型仅探究公司特定变量方面;加入宏观变量的模型同时探究公司特定变量与宏观变量两方面;加入传染变量的模型探究结合公司特定变量与传染变量方面;全模型全面探究综合公司特定变量、宏观变量及传染变量三个方面。上述四种模型的具体表达式见表5:
Table 5. The four fitting models
表5. 四种拟合模型
模型 |
参数限制 |
危险率模型 |
简单模型 |
|
|
加入宏观变量的模型 |
|
|
加入传染变量的模型 |
|
|
全模型 |
无 |
|
对上述四种模型开展似然比检验,结果(见表6)表明:含传染变量的模型比仅考虑公司特定变量的简单模型拟合效果明显更优;含传染变量的全模型比纳入公司特定变量与宏观变量的模型拟合效果更优。结合检验的p值均在1%显著性水平下显著的结果,可见在控制公司特定变量和宏观变量后,传染变量对公司违约的影响在经济逻辑和统计显著性层面均十分显著。
Table 6. Likelihood ratio test results
表6. 似然比检验的结果
基准模型 |
简单模型 |
简单模型 |
加入宏观变量的模型 |
替代模型 |
加入传染变量的模型 |
全模型 |
全模型 |
自由度 |
1 |
2 |
1 |
p-value |
0.00886*** |
<1e−10*** |
0.000006*** |
注:***表示1%的显著性水平。
5. 结论
本研究以2009~2021年中国沪深A股集团控股上市公司为样本,结合复杂网络理论与离散危险率模型,探究企业集团违约风险传染效应及预测优化路径,核心结论如下:
基于“风险修复–风险传染–环境干扰”三机制的传染变量,可精准捕捉企业间股权关联引发的风险互动;纳入该变量的离散危险率模型,拟合优度与预测逻辑均优于不含传染变量的传统模型。模型整合公司特定变、宏观变量、传染变量三类因素,将违约风险解释从“财务–宏观”层面延伸至企业网络风险互动层面,丰富了分析维度;企业集团的股权层级结构也决定风险传导效率与路径。但本研究样本局限于上市企业,未纳入业务关联、担保关联等其他路径。未来更改为债务网络、纳入非上市企业样本,完善风险传染度量体系,提升模型适用范围。