沪深股市收益率的Copula模型及参数估计
Copula Model and Parameter Estimation about Shanghai and Shenzhen Stock Market Returns
DOI: 10.12677/SA.2021.105096, PDF, HTML, XML, 下载: 339  浏览: 1,495  科研立项经费支持
作者: 李晓康:陕西理工大学,陕西 汉中
关键词: 收益率相关性GPD分布Copula函数Rate of Return Correlation GPD Distribution Copula Function
摘要: 沪深股市对数收益率具有较强的相关性。使用GPD分布描述其边际分布,对其阀值采用Hill矩法进行估计,对其参数使用极大似然估计给出,并求其数值解。对其相关结构的描述采用二元正态Copula和二元t-Copula,并将其相关参数与样本进行比较。结果表明:二元t-Copula能够较好地描述其相关结构,与样本数据拟合较好。
Abstract: There is a strong correlation between the logarithmic return of Shanghai and Shenzhen stock markets. The GPD distribution is used to describe its marginal distribution, the hill moment method is used to estimate its threshold, the maximum likelihood estimation is used to estimate its parameters, and the numerical solution is obtained. For the description of the correlation structure, the binary normal copula and binary t-copula are used, and compare the correlation parameters with the samples. The results show that the binary t-copula can describe its correlation structure well and fit the sample data well.
文章引用:李晓康. 沪深股市收益率的Copula模型及参数估计[J]. 统计学与应用, 2021, 10(5): 916-928. https://doi.org/10.12677/SA.2021.105096

1. 引言

股市是市场经济的产物,在资源配置(特别是资本配置)中发挥着关键性作用。随着改革开放和市场经济的发展,我国股市经历了从无到有、有小到大的发展。1990年12月19日上海证券交易所开始正式营业。1990年12月1日,深圳证券交易所试营业。三十年来,沪深股市对我国的改革开放事业和市场经济的发展发挥了非常重要的作用。但是,沪深股市也面临着许多问题,主要表现在:我国股市是一个典型的主力交易者占主导地位的市场;绝大多数投资者非理性;缺乏衍生市场。按照效率市场理论的观点,我国股市是一个无效市场,即没有达到弱势有效 [1]。

股票市场的变化(股票价格、市场指数)受许多因素的影响,是一个随机过程。描述市场变化规律对指导投资者理性投资、促进市场健康有效发展具有十分重要的意义。股市的暴涨暴跌使投资者面临着极大的风险。极值理论是描述这类现象的有力工具,并且,在金融、环境、气象等许多方面取得了成功应用 [2] [3] [4] [5] [6]。

本文将应用极值分布对沪深股市的暴涨、暴跌进行建模,对极值分布参数进行估计,利用Copula函数对其进行相关性分析。

2. 极值分布简介

样本数据的选取通常有两种:

第一种是区间选取法,也称为块方法(block method),它是将样本数据按照时间顺序分为若干个区间,从每个区间选取一个极(大、小)值,从而得到极值样本。

第二种是超阀值法(peak over threshold),也称为POT法,它是按照某种方法确定一个阀值,将超过阀值的数据作为样本。

基于不同的样本数据选取,极值分布通常有两种:广义极值分布(GEV)与广义帕累托分布(GPD)。

2.1. GEV分布

广义极值分布(GEV)的分布函数为:

H u , ξ , σ ( x ) = { exp { [ 1 + ξ x u σ ] 1 / ξ } , ξ 0 exp { exp ( x u σ ) } , ξ = 0

其中,u为位置参数, σ 为尺度参数, ξ 为形状参数。

2.2. GPD分布

广义帕累托分布(GPD)的分布函数为:

G u , ξ , σ ( x ) = { 1 [ 1 + ξ x u σ ] 1 / ξ , ξ 0 1 exp ( x u σ ) , ξ = 0

其中,u为位置参数, σ 为尺度参数, ξ 为形状参数,随形状参数 ξ 由小到大(由负值变为正值),尾部逐渐变厚。

二者具有如下关系:

G ( x ) = 1 + ln H ( x )

即:GPD分布的分布函数可以看做GEV分布的分布函数的一个单增变换。

本文采用超阀值法选取极值样本,利用GPD分布描述极值样本的分布。

3. 参数估计

GPD分布的参数估计方法主要有极大似然估计与分布估计。

3.1. 极大似然估计

按照极大似然原理,对给定样本,所求参数估计应使得似然函数或对数似然函数达到极大,此即极大似然估计(MLE)。

GPD分布的密度函数为:

g ( x ) = 1 σ ( 1 + ξ x u σ ) 1 / ξ 1 , ξ 0

似然函数(样本联合密度)为:

L ( x 1 , , x n ) = i = 1 n g ( x i ) = i = 1 n 1 σ ( 1 + ξ x i u σ ) 1 / ξ 1 = ( 1 σ ) n i = 1 n ( 1 + ξ x i u σ ) 1 / ξ 1

对数似然函数为:

l ( x 1 , , x n ) = n ln σ ( 1 + 1 ξ ) i = 1 n ln ( 1 + ξ x i u σ )

由极值原理,所求极大似然估计应满足如下正规方程组:

{ l u = 0 l ξ = 0 l σ = 0

即:

{ l u = ( 1 + ξ ) i = 1 n 1 σ + ξ ( x i u ) = 0 l ξ = 1 ξ 2 i = 1 n ln ( 1 + ξ x i u σ ) ( 1 + ξ ) i = 1 n x i u σ + ξ ( x i u ) = 0 l σ = n σ + ( 1 + ξ ) i = 1 n x i u σ 2 ( 1 + ξ x i u σ ) = 0

可求上述方程组的解析解,即得参数极大似然估计,在实际应用中,可使用数值方法求上述方程组的数值解。

3.2. 分布估计

对GPD分布的参数估计可以分两步进行:

第一步:估计位置参数u (见下节);

第二步:按极大似然法估计形状参数与尺度参数,即选取 ξ ^ , σ ^ ,使:

ξ ^ , σ ^ = arg max l ( X 1 , , X n , ξ , σ )

3.3. 位置参数的估计

位置参数(阈值)的估计有两种方法:

第一种是样本超阈值函数法。

样本超阈值函数定义为:

M E F ( u ) = i = 1 n ( X i u ) i = 1 n I X i > u

其中: I X i > u ( ) 为示性函数,当 X i > u 时,其值为1,否则为0。

MEF的含义为所有大于阈值的量的平均值。阈值的选取为样本超阈值函数图中由水平向正斜率变化的 u 的值。

第二种是Hill矩法。

X ( 1 ) > X ( 2 ) > > X ( n ) 为独立同分布降序统计量。Hill统计量定义如下:

H k , n = 1 k l = 1 k ln X ( l ) X ( k )

Hill图为点 { ( k , H k , n 1 ) , 1 k n 1 } 的集合。阈值选取为Hill图中稳定区域起始点的横坐标k对应的 X k

4. Copula函数

Copula函数是联系多维随机变量联合分布与各自边缘分布的桥梁,能够很好地描述多维随机变量的相关结构 [7] [8] [9] [10] [11]。Copula函数的定义如下:

定义1 若多维随机变量 X 1 , , X p 的联合分布为 F ( x 1 , , x p ) ,各自的边缘分布为 F 1 ( x 1 ) , , F p ( x p ) ,存在多元函数 C ( ) 满足: F ( x 1 , , x p ) = C ( F 1 ( x 1 ) , , F p ( x p ) ) ,称 C ( ) 为Copula函数。

本文采用二元Copula函数描述沪、深股市收益率极端情况的相关结构。

常用的Copula函数有以下几种:

1) 正态Copula函数

正态Copula分布函数形式如下:

C ( u 1 , , u N ; ρ ) = Φ ρ ( Φ 1 ( u 1 ) , Φ 1 ( u 2 ) , , Φ 1 ( u N ) )

其中: ρ 为N元标准正态分布的相关系数阵, Φ ρ ( ) 表示相关系数阵为 ρ 的N元标准正态分布分布函数, Φ 1 表示标准正态分布的逆函数。即正态Copula是由标准正态分布的逆函数和多元正态分布函数组合而成。

对二元情形,若变量间线性相关系数为 ρ ,则二元正态Copula函数为:

C ( u , v ; ρ ) = 1 2 π 1 ρ 2 Φ 1 ( u ) Φ 1 ( v ) exp [ s 2 2 ρ s t + t 2 2 ( 1 ρ 2 ) ] d s d t

2) t-Copula函数

t-Copula分布函数形式如下:

C ( u 1 , , u N ; ρ , k ) = t ρ , k ( t k 1 ( u 1 ) , t k 1 ( u 2 ) , , t k 1 ( u N ) )

其中: ρ 为自由度为k的N元标准t分布的相关系数阵, t ρ , k 表示相关系数阵为 ρ 、自由度为k的N元标准t分布的分布函数, t k 1 表示自由度为k的一元标准t分布的逆函数。即t-Copula是由标准t分布的逆函数和多元t分布分布函数组合而成。

对二元情形,若变量间线性相关系数为 ρ 、自由度为k,则二元t-Copula函数为:

C ( u , v ; ρ , k ) = 1 2 π 1 ρ 2 t k 1 ( u ) t k 1 ( v ) [ 1 + s 2 2 ρ s t + t 2 k ( 1 ρ 2 ) ] ( k + 2 ) / 2 d s d t

5. 实证分析

本文选取上证指数与深证成指每日收盘价历史数据(2010.1.4~2018.12.28),对数据采用对数变换,得对数收益率,即:

r i + 1 = ln X i + 1 ln X i = ln X i + 1 X i , i = 1 , , n 1

对沪深股市对数收益率的极端值(暴涨、暴跌)利用极值分布(GPD分布)进行建模,以此为边际分布,利用二元Copula函数描述其相关结构,并对相关参数进行估计,以此为根据,对沪深股市相关性进行定量分析。

5.1. 数据的描述性统计分析

对以上数据进行描述性统计分析,可得以下结果:

Table 1. Descriptive statistics of logarithmic returns about Shanghai and Shenzhen stock markets

表1. 沪深股市对数收益率描述性统计表

由上表1可以看出,沪深股市对数收益率具有明显的尖峰(峰度大于3)、偏态(偏度小于0)分布特征,为非正态分布。

图1图2可以看出,深证指数收盘价和对数收益率具有明显的变化趋势及阶段特征,呈现出明显的波动性和聚集性。

Figure 1. Logarithmic yield of Shanghai stock index

图1. 上证指数对数收益率

Figure 2. Logarithmic yield of Shenzhen composite index

图2. 深证成指对数收益率

图3图4可以看出,沪深股市对数收益率具有明显的非正态分布、尖峰、厚尾特征。

Figure 3. Log return histogram of Shanghai stock index

图3. 上证指数对数收益率直方图

Figure 4. Log return histogram of Shenzhen stock index

图4. 深证成指对数收益率直方图

对沪深股市对数收益率数据分别进行正态性检验,结果如图5图6

图5图6可以看出,沪深股市对数收益率不服从正态分布。

为考查沪深股市对数收益率的相关性,计算其相关系数,结果如表2

Figure 5. Test chart for normality of log return of Shanghai stock index

图5. 上证指数对数收益率正态性检验图

Figure 6. Test chart for normality of log return of Shenzhen stock index

图6. 深证成指对数收益率正态性检验图

Table 2. Table of linear correlation coefficient of log return in Shanghai and Shenzhen stock markets

表2. 沪深股市对数收益率线性相关系数表

由上表可以看出,沪深股市对数收益率具有高度的相关性,可采用合适的Copula函数描述其相关性。

表2图7可以看出,沪深股市对数收益率具有高度相关性(线性相关系数为0.928238),呈现出明显的线性相关性。

Figure 7. Relationship between log return of Shenzhen composite index and log return of Shanghai composite index

图7. 深证成指对数收益率与上证指数对数收益率关系图

基于以上特征及分析,下面采用GPD分布对沪深股市对数收益率的极端情况进行建模,描述其边际分布。

5.2. GPD分布阈值的确定

按照2.3节介绍的方法,使用Hill统计量:

H k , n = 1 k l = 1 k ln X ( l ) X ( k )

确定阈值。

为此,选取沪深股市对数收益率大于0 (上涨)的数据,将其由大到小排序,计算Hill统计量值,并绘制Hill图(点 { ( k , H k , n ) , 1 k n 1 } 的集合)。选取Hill图中稳定区域起始点的横坐标k对应的 X k 为相应GPD分布的阈值。Hill图如下:

Figure 8. Hill chart of log return of Shanghai stock index

图8. 上证指数对数收益率Hill图

Figure 9. Hill chart of log return of Shenzhen stock index

图9. 深证成指对数收益率Hill图

由上图8图9可以看出:对上证指数对数收益率大于0的样本数据,当u = 0.0002时,Hill图基本稳定;对深证成指对数收益率大于0的样本数据,当u = 0.0006时,Hill图基本稳定。故选取阈值如下表3

Table 3. GPD distribution threshold table of log return in Shanghai and Shenzhen stock markets

表3. 沪深股市对数收益率GPD分布阈值表

5.3. 沪深股市对数收益率的GPD分布及参数估计

选取样本数据中对数收益率为正(上涨)的数据,利用matlab统计工具箱中的函数ecdf绘制经验分布函数图形如图10图11

Figure 10. Empirical distribution function of log return about Shanghai stock index

图10. 上证指数对数收益率经验分布函数图

Figure 11. Empirical distribution function of log return about Shenzhen stock index

图11. 深证成指对数收益率经验分布函数图

利用GPD分布对沪深股市对数收益率数据进行描述,使用matlab统计工具箱的函数gpfit进行参数估计,得如下结果(表4):

Table 4. GPD distribution parameters of log return in Shanghai and Shenzhen stock markets

表4. 沪深股市对数收益率GPD分布参数表

上证指数对数收益率分布如下:

G h u s h i ( x ) = 1 [ 1 + 0.1827 x 0.0002 0.0104 ] 1 / 0.1827

深证成指对数收益率分布如下:

G s h e n g s h i ( x ) = 1 [ 1 + 0.0817 x 0.0006 0.0133 ] 1 / 0.0817

5.4. 沪深股市对数收益率的二元Copula模型

利用二元Copula函数描述沪深股市收益率的相关性,即在二元Copula函数族中寻找一个合适的Copula函数,使其能够很好的描述沪深股市的相关性。

首先,根据沪深股市对数收益率样本数据绘制二元频率直方图如图12

图12可以看出,其尾部基本对称,故可选取二元正态Copula或二元t-Copula函数来描述其尾部及相关结构。

下面利用二元正态Copula和二元t-Copula对沪深股市对数收益率进行描述。

首先对二元Copula模型的参数进行估计。利用MATLAB统计工具箱中的copulafit、copulastat、copulaparam、copulapdf、copulacdf等函数对二元正态Copula模型的相关参数、Kendall秩相关系数、Spearman秩相关系数、密度函数值、分布函数值等进行计算,结果如下(表5):

Figure 12. Binary frequency histogram of log return in Shanghai and Shenzhen stock markets

图12. 沪深股市对数收益率二元频率直方图

Table 5. Correlation coefficient table of Copula function of logarithmic rate of return in Shanghai and Shenzhen stock markets

表5. 沪深股市对数收益率Copula函数相关系数表

由以上结果可以得出,对应的二元正态Copula为:

C ( u , v ; ρ ) = 1 2 π 1 0.9234 2 Φ 1 ( u ) Φ 1 ( v ) exp [ s 2 2 × 0.9234 s t + t 2 2 ( 1 0.9234 2 ) ] d s d t

对应的二元t-Copula为:

C ( u , v ; ρ , k ) = 1 2 π 1 0.9289 2 t k 1 ( u ) t k 1 ( v ) [ 1 + s 2 2 × 0.9289 s t + t 2 4 ( 1 0.9289 2 ) ] ( 4 + 2 ) / 2 d s d t

由上表可以看出,线性相关系数为0.9289、自由度为4的二元t-Copula更能反映沪深股市对数收益率间的尾部相关性。其尾部相关系数由下式计算:

λ ^ u p = λ ^ l o = 2 2 t k + 1 ( k + 1 1 ρ 1 + ρ ) = 0.6856

以上结果说明,沪深股市对数收益率具有正的上、下尾相关性,即在上涨和下跌阶段具有同步变化的关系。

由上表的秩相关系数可以看出,二元正态Copula的秩相关系数为0.7492,与样本秩相关系数更加接近,能更好反映沪深股市对数收益率间的秩相关性。

5.5. 模型评价

为评价两个模型的优劣,下面定义经验Copula,利用经验copula与模型的距离来进行度量。

经验Copula 若 ( x i , y i ) ( i = 1 , 2 , , n ) 为来自总体 ( X , Y ) 的样本,X的经验分布函数为 F n ( x ) ,Y的经验分布函数为 G n ( y ) ,称

C ^ n ( u , v ) = 1 n i = 1 n I F n ( x i ) u I G n ( y i ) v , u , v [ 0 , 1 ]

为经验Copula。其中: I F n ( x i ) u 为示性函数,当 F n ( x i ) u 时, I F n ( x i ) u = 1 ,否则 I F n ( x i ) u = 0

平方欧式距离 称所有样本的经验Copula和模型的差的平方和为平方欧式距离,定义如下:

d 2 = C ^ n ( u , v ) = i = 1 n [ C ^ n ( u i , v i ) C ( u i , v i ) ] 2

其中: u i = F n ( x i ) , v i = G n ( y i )

利用如上的平方欧式距离可以度量模型与样本的拟合程度。对二元正态Copula和二元t-Copula,平方欧式距离分别为0.023和0.014。由此可见,二元t-Copula能够更好拟合沪深股市对数收益率观测数据。

6. 结论

沪深股市收益率变化具有较强的相关关系和长期系统的一致变化趋势。通过以上分析可以看出,二元正态Copula和二元t-Copula都从不同侧面描述了沪深股市对数收益率的相关关系。二元t-Copula的线性相关系数与样本相关系数更加接近,更能反映沪深股市对数收益率间的尾部相关性。二元正态Copula的秩相关系数与样本秩相关系数更加接近,能更好反映沪深股市对数收益率间的秩相关性。从平方欧式距离来看,二元t-Copula更小,能够更好拟合沪深股市对数收益率观测数据。

基金项目

本课题由陕西省教育厅自然科学基金项目(18JK0141)资助。

参考文献

[1] 张元萍. 数理金融[M]. 北京: 中国金融出版社, 2004: 244-248.
[2] 佘笑荷, 艾蔚, 袁芳英, 徐吟川. 基于尾部相依视角的证券业系统性风险度量[J]. 统计与决策, 2019, 35(17): 162-165.
[3] 王娜, 任燕燕. 基于固定效应面板数据的Copula分位数回归及模拟[J]. 统计与决策, 2019(19): 82-86.
[4] 韦艳华. Copula理论及其在金融分析上的应用[M]. 北京: 清华大学出版社, 2008.
[5] 李强, 周孝华. 基于Copula的我国台湾和韩国股票市场相关性研究[J]. 管理工程学报, 2014(2): 100-107.
[6] 李强. 基于Copula理论和GPD模型的金融市场风险测度研究[D]: [博士学位论文]. 重庆: 重庆大学, 2012.
[7] 华祖林, 汪靓, 顾莉, 褚克坚. 基于门限极值理论的湖泊水质参照状态的确定[J]. 中国环境科学, 2004(12): 3215-3222.
[8] 陈思柳. 基于MRS Copula模型的沪港股市相依关系研究[J]. 浙江金融, 2018(11): 43-49.
[9] 张建伟. 基于极值理论的股票市场风险度量[D]: [硕士学位论文]. 南京: 南京财经大学, 2018.
[10] 蒋涛, 李政宵. 我国银行业系统性风险结构度量——基于尾部依赖视角[J]. 合肥学院学报(综合版), 2016(4): 17-23.
[11] 马锋, 魏宇, 黄登仕. 基于vine copula方法的股市组合动态VaR测度及预测模型研究[J]. 系统工程理论与实践, 2015, 35(1): 26-36.