1. 引言
在当前经济全球化背景下,各国金融市场联系密切,国内外形势错综复杂。同时,我国正在推进构建以国内大循环为主体、国内国际双循环相互促进的新发展格局[1]。在此情形下,内循环会使中国金融市场之间的联系更为密切,风险传染形势也将更加严峻。此时研究我国不同行业股票之间的投资组合,进行投资风险管理,具有重要的学术与现实意义[2]。金融数据经常出现“尖峰厚尾”的特征,学术界普遍使用GARCH模型来估计单个资产的分布函数,而Copula模型不仅能够将多种边缘分布函数连接在一起,而且能够捕捉到投资组合中不同资产的相依关系,尤其是尾部相关关系,在金融问题上的运用越来越广泛。从现有研究来看,虽然利用股票投资组合工具的研究较为丰富,但还是存在一定的局限性,主要体现在现有研究仅限于一个或两个金融市场,很少关注多个市场之间的具体依赖结构,如何测量不同行业之间的相关关系,现有文献对此探讨并不充分,另外,已有研究较少使用t-Copula模型来刻画股票资产间的相依结构。
因此,本文将t- Copula模型与GARCH模型相结合,建立Copula-GARCH模型,并在该模型基础上运用Monte Carlo技术在不同的置信水平下估计出该多资产组合的风险VaR值。考虑到行业分散可以减低投资组合的风险,本文从沪深300 A股中选取五支典型行业股票的代表构成投资组合:轻工业代表:贵州茅台、能源行业代表:黔源电力、银行业代表:贵阳银行、保险业代表:中国平安、通讯行业代表:中国移动。文章使用Python对数据进行描述性统计、平稳性检验、正态性检验以及ARCH效应检验,然后采用t-GARCH模型来拟合所选股票的收益率序列的边缘分布,接着使用t-Copula对股票之间的相依关系进行描述,最后根据蒙特卡罗模拟方法求得投资组合VaR。
本文的主要贡献在于:第一,选取不同行业的五家公司股票收益率来研究多个金融市场间的相依结构,了解这五种股票资产的相关关系,可以为相关部门以及广大投资者提供理论建议;第二,丰富了t-Copula模型相关内容,并利用t-Copula对资产间的相依关系进行描述,进而对投资组合的在险价值进行测度;第三,本文选取的投资组合风险测度研究主要以贵州本地产业进行研究,对贵州当地经济发展具有一定意义。
2. 文献综述
已有关于t-Copula GARCH模型的投资组合风险测度的研究主要集中在以下两个方面:
一是金融市场间的关联性,通常用Copula函数来表示。国外学者关于Copula函数的发展已有较多研究。Sklar (1959)最先提出Copula函数,用以刻画各个变量之间相依结构[3]。Embrechts (1999)在此基础上将Copula函数应用在金融领域,使得该理论得以广泛应用到金融风险管理、金融市场相依关系等方面[4]。Embrechts,Lindskog和McNeal (2003)比较了不同Copula函数模型,指出t-Copula相对于Gumbel Copula具有更大的灵活性[5]。Sun和Fabozzi (2008)初次引入了skst Copula函数,构建了skst-Copula-GARCH模型,该模型较为准确的刻画了德国不线性、不对称权益资产的相关关系[6]。国内也有许多学者对Copula函数进行了相关研究。在国内最早介绍Copula模型的学者是张尧庭(2002),他指出Copula能够描述出金融变量相依结构[7]。高江(2013)指出基于t-Copula、Clayton-Copula等Copula模型能够更好描述资产的尾部分布特征,从而可以更好的预测多金融资产组合的VaR值[8]。葛亮(2016)利用Copula-GARCH模型对新兴产业与上证指数的相互依存度进行分析,并采用检验拟合优度的方法确定了t-Copula模型为最优模型,拟合效果最好[9]。
二是资产边缘分布模型的相关研究。国外学者Engle (1982)提出了自回归条件异方差(ARCH)模型,该模型可以较好的拟合变量的事件序列的波动性变化[10]。Bollerslev (1986)提出广义条件异方差模型(GARCH模型),在ARCH模型的基础上引入对异方差的估计[11]。Zakoian (1994)提出了TGARCH模型,通过在GARCH模型中引入一个示性函数,同样使得金融时间的“杠杆效应”得到刻画[12]。国内学者吴玉宝等(2016)用ARFIMA-GARCH-Copula模型对上海深圳的股市间的相关结构与相同权重的投资组合风险值VaR进行研究[13]。冯媞等(2020)运用VaR—GARCH模型对金融市场汇率风险进行了实证研究。发现不同于正态分布和t分布,当假定收益率序列满足GED分布时,才能最有效的度量五种汇率风险[14]。
通过梳理已有文献,从中可以发现:一方面,现有研究仅限于一个或两个金融市场,很少关注多个市场或多个行业之间的具体依赖结构,如何定量刻画多个行业之间的动态依赖关系,现有文献对此探讨并不充分;另一方面,已有研究较少使用t-Copula GARCH模型来刻画股票资产间的相依结构。基于此,本文可能的边际贡献有:一是通过构建不同行业之间的股票组合,从而进一步丰富多行业之间的相依关系;二是利用t-Copula模型对资产间的相依结构进行了有效刻画。
3. 模型介绍
3.1. 边缘分布模型
首先需要对每种股票的边际分布进行建模。由于金融时间序列的特点是“尖峰厚尾”、异方差性以及波动聚集性,同时,GARCH模型能够较好捕捉时间序列的波动性特征,因此,本文采用GARCH模型构建金融资产边缘分布模型。
通过以前学者的研究,发现t分布可以较好地描述金融时间序列波动项的尖峰厚尾的特点,因此可选择GARCH-t(1,1)模型来描述投资组合中的资产收益率序列的边缘分布。假设某投资组合包含n个资产,令其中第i个资产收益率序列的一组观察值为
,考虑如下的GARCH-t(1,1)模型[15]:
(1)
其中,
、
、
为参数,
表示资产收益率序列波动性,
为收益率无条件均值,
为自由度为d的t分布。参数
越大,则波动性越强烈,
表示波动的持续性。
3.2. Copula模型
n维随机向量
的联合分布概率密度函数表示为:
(2)
其中,
表示n维的Copula密度函数,
代表边缘密度函数。从式子中可以看出多元联合密度函数包含两部分内容:单个资产的边缘密度函数和投资组合变量间的相依结构,此外,不同的Copula函数有不同的尾部敏感性。
3.3. Copula-GARCH模型
Copula-GARCH模型不限制其变量边缘分布的选择,对资产的走势刻画的更加全面,因此在运用中比较灵活,与现实情况更为接近。多元Copula-GARCH模型的一般形式为[16]:
(3)
(4)
其中Ct(,...,|.)为任意的一个N元Copula分布,Fn(∙)为t-分布或GED-分布的边缘分布函数,由各种金融资产的价格波动性决定。It−1为t − 1时刻的信息集,ht为
的条件方差。
3.4. 在险价值
1. VaR定义
VaR方法(Value at Risk,简称VaR),即在险价值方法,该模型表示在将来一段时间内,在给定的置信水平下,金融资产投资组合在不同投资比例下的最大损失值。可用数学公式表示为:
(5)
其中,P表示投资组合,Δt表示持有期,x为风险因子,ΔP表示投资组合在持有期间的(
)置信度水平下的资产价值变化,VaR表示给定的置信水平
下的资产组合风险损失的上限。
2. 蒙特卡罗模拟方法求投资组合VaR:
(1) 生成包含N个服从[0, 1]独立均匀分布的变量的随机数序列
;
(2) 根据递归式生成服从指定N元Copula函数
的随机数序列
;
(3) 设Pit表示第i个资产在t时刻的价格,资产收益率为Rit,投资组合在持有期
内的损失为[17]:
(6)
(4) 给定置信水平
,容易从损失Lt+1的经验分布中求出持有期
内给定投资组合VaR值:
(7)
其中,
表示在持有期
内,
置信度下的VaR值。
4. 实证分析
4.1. 数据选取与描述性统计
秉持着不同的行业分散投资可以降低风险的原则,本文从沪深300A股中选取五支典型行业股票的代表构成投资组合,分别为贵州茅台(轻工业)、黔源电力(能源行业)、贵阳银行(银行业)、中国平安(保险业)、中国移动(通讯行业)。数据区间为2019年1月1日~2023年6月1日,数据来源为同花顺iFind数据库。
首先对数据进行预处理,由收盘价计算五只股票的收益率,公式如下:
(8)
其中
表示资产i在第t天的收益率,
表示资产i在第t天的收盘价。去除缺失值后经计算得到1070组收益率数据,其描述性统计如表1所示。可以看到,五组数据峰度均大于3,且偏度均不为0,表明收益率数据存在明显的尖峰厚尾特征,符合金融数据的一般规律。变量描述性统计结果如表1所示:
Table 1. Descriptive statistics of variables
表1. 变量描述性统计
变量 |
样本 |
均值 |
标准差 |
最小值 |
最大值 |
贵州茅台 |
1070 |
0.001131 |
0.019598 |
−0.079046 |
0.095041 |
黔源电力 |
1070 |
0.000343 |
0.022991 |
−0.283921 |
0.100283 |
贵阳银行 |
1070 |
−0.000443 |
0.016486 |
−0.310905 |
0.100260 |
中国平安 |
1070 |
0.000015 |
0.017761 |
−0.069230 |
0.100022 |
中国联通 |
1070 |
0.000159 |
0.019402 |
−0.099115 |
0.100446 |
4.2. 数据特征检验
1. 平稳性检验
采用ADF检验来判断收益率序列的平稳性。将5支股票收益率的ADF统计量和给定显著性水平下的ADF统计量临界值进行比较,如表2所示,发现各ADF统计量均比临界值小,p值均为0,即拒绝该序列存在单位根的原假设,该五支股票收益率的序列是平稳的。收益率序列平稳性检验结果如表2所示:
Table 2. ADF test results of yield series
表2. 收益率序列ADF检验结果
变量 |
ADF统计量 |
各显著水平下ADF统计量的临界值 |
p值 |
平稳性 |
1% |
5% |
10% |
贵州茅台 |
−33.340295 |
−3.436 |
−2.864 |
−2.568 |
0.000000 |
平稳 |
黔源电力 |
−33.760987 |
−3.436 |
−2.864 |
−2.568 |
0.000000 |
平稳 |
贵阳银行 |
−33.872950 |
−3.436 |
−2.864 |
−2.568 |
0.000000 |
平稳 |
中国平安 |
−33.322544 |
−3.436 |
−2.864 |
−2.568 |
0.000000 |
平稳 |
中国联通 |
−33.692595 |
−3.436 |
−2.864 |
−2.568 |
0.000000 |
平稳 |
2. 正态性检验
采用Johansen-Bessel检验来判断收益率序列的正态性。如表3所示,J-B检验结果显示每组日收益率数据都在1%显著性水平下拒绝正态分布假设。收益率序列正态性检验结果如表3所示:
Table 3. J-B test results of yield series
表3. 收益率序列J-B检验结果
变量 |
JB统计量 |
p值 |
贵州茅台 |
145.79 |
0.000 |
黔源电力 |
294.82 |
0.000 |
贵阳银行 |
657.87 |
0.000 |
中国平安 |
511.15 |
0.000 |
中国联通 |
227.34 |
0.000 |
3. ARCH效应检验
对收益率序列进行ARCH检验来判断其是否存在异方差性。如表4所示,五支股票收益率的测试统计量均较大,p值、F统计量的p值均接近于0,因此该收益率序列存在ARCH效应。收益率序列ARCH效应检验结果如表4所示:
Table 4. ARCH effect test results of yield series
表4. 收益率序列ARCH效应检验结果
变量 |
测试统计量 |
p值 |
F统计量 |
F统计量的p值 |
贵州茅台 |
57.675946 |
0.000000 |
6.036178 |
0.000000 |
黔源电力 |
38.312895 |
0.000033 |
3.933712 |
0.000028 |
贵阳银行 |
60.091363 |
0.000000 |
3.009042 |
0.000000 |
中国平安 |
29.788954 |
0.000927 |
3.033224 |
0.000852 |
中国联通 |
99.408006 |
0.000000 |
10.855701 |
0.000000 |
4.3. GARCH模型建立
通过数据特征以及GARCH族的特点分析,本文采用t-GARCH模型来拟合所选股票的收益率序列的边缘分布,如表5所示。L-BQ检验表明该收益率数据没有显著的自相关性,另一方面,K-S检验的
Table 5. t-GARCH model fitting results
表5. t-GARCH模型拟合结果
参数 |
贵州茅台 |
黔源电力 |
贵阳银行 |
中国平安 |
中国联通 |
μ |
0.000652 |
−0.000029 |
−0.000294 |
−0.000936 |
−0.000847 |
ω |
0.000012 |
0.000008 |
0.000026 |
0.000015 |
0.000005 |
α |
0.071600 |
0.152202 |
0.167823 |
0.055980 |
0.124661 |
β |
0.902062 |
0.846798 |
0.743004 |
0.900657 |
0.874338 |
ν |
5.295823 |
3.986325 |
3.047245 |
4.697957 |
3.761082 |
L-BQ (10) |
7.709 (0.6572) |
10.031 (0.4378) |
8.3215 (0.5975) |
15.604 (0.1116) |
28.581 (0.001456) |
K-S |
0.99021 (0.0000) |
0.91023 (0.0000) |
0.97009 (0.0000) |
0.97008 (0.0000) |
0.97755 (0.0000) |
结果显示该收益率数据与正态分布之间的拟合度较好,没有显著的异方差性。t-GARCH模型拟合结果如表5所示。
4.4. Copula函数的估计
采用t-Copula对股票之间的相依关系进行描述,将这五只股票进行编号:1. 贵州茅台、2. 黔源电力、3. 贵阳银行、4. 中国平安、5. 中国移动。表6列出了贵州茅台与其他各个股票之间的尾部相依关系。
表示第i支股票与第j支股票之间的关系,可以看出这种相依关系是非对称的。
Table 6. Copula function estimation results
表6. Copula函数估计结果
参数 |
parameter1 |
parameter2 |
tau |
|
−0.69 |
8.14 |
−0.48 |
|
−0.68 |
10.04 |
−0.47 |
|
0.94 |
4.93 |
0.79 |
|
0.94 |
3.32 |
0.78 |
4.5. 在险价值的计算
得到copula函数的相关参数后,即可根据计算得到投资组合资产收益的分布函数,采用蒙特卡罗模拟法产生服从相应分布的随机数,以模拟市场因子或资产收益未来的可能情景,再对于给定的置信度
,计算得到相应情况下的VaR,如表7所示。可以看到,copula函数形式下的投资组合风险与均值相比显著降低。
Table 7. Calculation results of value at risk (VaR)
表7. 在险价值VaR计算结果
变量 |
10% |
5% |
1% |
贵州茅台 |
0.0206 |
0.0294 |
0.0490 |
黔源电力 |
0.0201 |
0.0295 |
0.0649 |
贵阳银行 |
0.0143 |
0.0197 |
0.0369 |
中国平安 |
0.0200 |
0.0258 |
0.0363 |
中国联通 |
0.0183 |
0.0266 |
0.0472 |
均值 |
0.0187 |
0.0262 |
0.0469 |
投资组合VaR |
0.0122 |
0.0145 |
0.0243 |
5. 研究结论与政策启示
5.1. 研究结论
本文以不同行业的五家公司股票,运用t-Copula GARCH模型,来对投资组合的在险价值VaR进行测度研究。研究发现:(1) 收益率数据存在尖峰厚尾的特征,与正态分布之间的拟合度较好,t-GARCH模型较为适合描述单个资产的边缘分布;Copula模型能够将边缘分布函数连接在一起,且能够显示出股票之间的相依关系。因此,t-Copula GARCH模型具有刻画真实的金融资产分布的能力。(2) 采用t-Copula对股票之间的相依关系进行分析发现:贵州茅台与本省的其他两家公司尾部相关性较强,两家省外公司尾部相关性较弱,表明不同资产之间的相依关系是非对称的。(3) 在求得copula函数的相关参数后,进而得出投资组合资产收益的分布函数,再采用蒙特卡罗模拟法求出在不同的置信水平下的VaR,结果显示在不同的置信水平下,copula函数形式下的投资组合风险都显著低于均值形式下的投资组合风险。
5.2. 政策启示
为了提高我国股市的抗风险能力,以及基于本文的研究结论,从监管部门和投资者的角度提出如下建议:1. 监管部门应制定更为完善的法律法规与相关政策,加强风险预警。一方面,监管部门应当在充分了解各行业相关关系的基础上,对其中的运行机理进行深入研究,从而制定相应的法律法规或相关政策来规避其中存在的风险。另一方面,监管部门根据各行业间的相依关系,对处于相对比较重要的地位的行业进行重点关注,防止某一行业股票的暴跌对整个市场造成严重影响。2. 投资者在选取投资行业时,应充分考虑到各行业间相依性的强弱以及相依结构的特点进行理性的投资,可以选择相依性较弱的行业进行投资组合的构建,或在投资组合中引入相应的条件行业,从而做到分散投资,降低投资组合的风险,得到更高的收益。3. 投资者在完成投资组合的构建后,可以利用本文构建的t-Copula GARCH模型对投资组合VaR进行有效的预测,并将自身的风险偏好与预测结果相结合,对投资组合进行适当的调整。