一类多元函数系数GARCH-M模型研究
Research on a Class of Multivariate Function Coefficient GARCH-M Model
DOI: 10.12677/sa.2024.136210, PDF, HTML, XML,   
作者: 王思宇, 张兴发:广州大学经济与统计学院,广东 广州
关键词: 函数系数GARCH-M模型波动率Functional Coefficient GARCH-M Model Volatility
摘要: 本文将函数系数GARCH-M模型推广到多元情形,研究了一类多元函数系数GARCH-M模型,旨在把序列之间的交互作用引入到风险厌恶的研究上。文章给出了函数系数和模型参数的估计方法。数值模拟的结果表明,该方法的估计效果良好。实证分析基于上证综合指数和深证综合指数的日收益率数据,研究结果表明,多元函数系数GARCH-M模型能够更好地拟合所考虑的数据。
Abstract: In this paper, the GARCH-M model of function coefficients is extended to multivariate cases, and a class of GARCH-M model with multivariate function coefficients is studied, aiming at introducing the interaction between sequences into the study of risk aversion. The estimation methods of function coefficients and model parameters are given in this paper. Numerical simulation results show that the proposed method is effective. The empirical analysis is based on the daily return data of Shanghai Composite Index and Shenzhen Composite Index, and the research results show that the multivariate function coefficient GARCH-M model can better fit the considered data.
文章引用:王思宇, 张兴发. 一类多元函数系数GARCH-M模型研究[J]. 统计学与应用, 2024, 13(6): 2170-2178. https://doi.org/10.12677/sa.2024.136210

1. 引言

金融资产收益序列中波动率的聚集现象是金融时间序列分析的主要特征之一。在资产定价和风险管理等金融决策过程中,精确地描述这种聚集效应具有极其重要的意义。金融时间序列的波动性一般通过条件方差的变化反映出来,条件方差被看作是投资风险或市场风险的度量。Engle (1982) [1]提出的ARCH模型以及Bollerslev (1986) [2]提出的GARCH模型就是分析这种风险,在实际的金融市场中,收益往往与风险相关,高收益往往会伴随着较高的风险,Engle等人(1987) [3]为反映风险溢价现象,将条件方差引入到均值方程中,提出了ARCH-M模型。针对GARCH-M模型,国内外学者做了一系列的研究,Chou等人(1992) [4]将ARCH-M模型应用于风险厌恶度量,基于CAPM模型的均衡理论,提出股票指数波动性遵循GARCH模型的观点;张华高(2010) [5]采用了非参数GARCH-M模型来探讨金融市场的波动性特征。上述所讨论的(G)ARCH类模型的条件方差中误差具有不可观测性,模型的统计推断成为该类模型研究的一大难点,Bent等人(2008) [6]假设条件方差为 h t = ω 0 +a y t1 2 +b h t1 ,用可观测序列 { y ti , i1 } 替代不可观测序列 { ε ti , i1 } ,这样 h t 就是可观测序列 { y ti , i1 } 的函数;很多学者在研究GARCH模型时也都采用了这样的假设,例如Ling (2004) [7];Christensen等人(2012) [8]在Ling [7] [9]研究的双自回归(DAR)模型的基础上,研究了半参数GARCH-M模型;Zhang等人(2016) [10]针对风险厌恶可能随时间变化且与利率、通货膨胀等经济指标相关的现象,提出了一类函数系数GARCH-M模型:

{ y t =m( U t ) h t + ε t ε t = e t h t ,  e t i.i.d.( 0,1 ) h t =υ( y t1 ,ϕ )+β h t1 , (1)

其中 U t 为影响波动系数的可观测解释变量序列,可以是 y t 的滞后项,也可以是外生变量或潜变量;且当 ts 时, ( y s , U s ) { e t } 无关; υ(   ,ϕ ) 是一个已知的正函数。

基于函数系数GARCH-M模型,许多学者做了进一步的研究。例如Song等人(2016) [11]基于函数系数GARCH-M模型,将视为潜在变量,并假定 m( U t ) 具有线性关系;Xiong等人(2014) [12]探讨了一类单指标ARCH-M模型,并利用截面似然方法进行了统计推断,同时检验了模型中的ARCH效应。

虽然一元(G)ARCH模型在刻画一元时间序列波动率方面有着强大的解释和预测功能,但只是考虑了单个资产或市场的波动率问题,没有考虑不同资产或市场之间波动率的关系,因此很多学者将一元GARCH模型推广到了多元情形。Bollerslev等人(1988) [13]率先将一元GARCH模型推广到多元情形,提出了VEC模型;随后Bollerslev (1990) [14]、Baba (1995) [15]、Engle (2000) [16]等人对多元GARCH模型进行进一步的研究;朱华锋等人(2018) [17]在半参数GARCH-M模型的基础上,研究了一类多元部分线性GARCH-M模型。

时间序列模型的多元情形可以考虑不同资产与市场之间的波动关系,因此本文将Zhang等人(2016)的一元函数系数GARCH-M模型推广到多元,把序列之间的交互作用引入到风险厌恶的研究上,研究了一类条件协方差阵由可观测序列驱动的多元函数系数GARCH-M模型,模型的形式如下:

Y t =diag( m 1 ( U 1t ), m 2 ( U 2t ),  , m k ( U kt ) ) h t + ε t , (2)

ε t = H t 1/2 e t , (3)

h t =W+A( Y t1 Y t1 )+B h t1 , (4)

其中,

Y t = ( y 1t , ,  y kt ) τ h t = ( h 1t , ,  h kt ) τ ε t = ( ε 1t , ,  ε kt ) τ

H t =diag( h 1t , ,  h kt ) e t = ( e 1t , ,  e kt ) τ

Y ti Y ti = ( y 1,ti 2 , ,  y k,ti 2 ) τ W= ( ω 1 , ,  ω k ) τ

这里 τ 表示向量或矩阵的转置, H t 1/2 =diag( h 1t , ,  h kt ) A= ( a ij ) k×k B= ( b ij ) k×k k×k 的矩阵,

e t 是均值为 0 k×1 ,方差为 I ( k×k 单位矩阵)的独立同分布随机向量。 { y it } t=1 n 为可观测序列, { U it } t=1 n 为影响波动系数的可观测解释变量序列, m i ( ) 是未知的光滑函数, i=1, 2, , k 。假设当 ts 时, ( Y s , U s ) { e t } 无关。定义 θ= ( W τ , Vec ( A ) τ , Vec ( B ) τ ) τ 为待估参数,其中 Vec( ) 为将 k×k 矩阵按列展开构成一个 k 2 ×1 的向量算子。 t1 表示为 t1 时刻的信息集。

本文的后续结构的安排如下:第二部分将探讨模型中函数系数部分和参数部分的估计方法;第三部分和第四部分分别进行数值模拟和实证分析;第五部分是对全文的总结。

2. 估计

多元函数系数GARCH-M模型的估计分为两部分,一个是函数系数部分,另一个是参数部分,这一小节将从这两部分进行介绍。

2.1. 函数系数估计

未知函数系数部分的估计利用的局部线性回归估计的方法,定义 θΘ Θ 是模型的参数空间,假设参数 θ 已知,则 h it ( θ ) 在给的 y i0 h i0 的条件下视为一个可观测的量,所以(2)式可看作是函数系数回归模型,根据Zhang等人[10]的方法,给出均值方程中 m( u ) 的估计量为:

m ^ i ( u,θ )= E 0 τ ( Z iθ τ W i Z iθ ) 1 Z iθ τ W i Y i , (5)

其中

Y i = ( y i1 , ,  y in ) τ E 0 = ( 1, 0 ) τ Z iθ =( h i1 ( θ ) h in ( θ ) h i1 ( θ )( U i1 u b ) h in ( θ )( U in u b ) ) W i =diag( 1 n K b ( U i1 u ) 1 n K b ( U in u ) )

b>0 是随样本量 n 变化的窗宽, K b = 1 b K( b ) ,其中 K( ) 是紧支撑的对称核函数。在本文中,所选用的核函数为 K( x )=0.75( 1 x 2 )I( | x |1 )

2.2. 参数估计

参数部分是利用的是拟极大似然函数进行估计。在给定 θ ,得到 m ^ i ( u, θ ) 之后,接下来给出 θ 的估计。令 ε ^ it ( θ )= y it m ^ i (   ,θ ) h it ( θ ) ,考虑如下关于 θ 的拟对数似然函数:

L ^ n ( θ )= 1 n t=1 n { log| H t ( θ ) |+ ε ^ t τ ( θ ) H t ( θ ) 1 ε ^ t ( θ ) } , (6)

其中 H t ( θ )=diag( h 1t ( θ ), ,  h kt ( θ ) ) ε ^ t ( θ )= ( ε ^ 1t ( θ ), ,  ε ^ kt ( θ ) ) τ

于是, θ 的估计可表示为: θ ^ n = argmin θΘ L ^ n ( θ )

因此,在得到参数估计量 θ ^ n 后,在(5)式的基础上,可得到函数系数 m i ( u ) 的估计量为 m ^ i ( u,  θ ^ n )

3. 数值模拟

在这一节中,将通过研究参数估计量的偏差和标准差,对参数估计量的表现进行检验。其中序列 { Y t } 是由以下模型生成的:

( y 1t y 2t )=( m 1 ( U 1t ) 0 0 m 2 ( U 2t ) )( h 1t h 2t )+( h 1t 0 0 h 2t )( e 1t e 2t ) (7)

{ m 1 ( U 1t )=0.5sin( π U 1t ) m 2 ( U 2t )=0.75cos( 10 U 2t ) (8)

( h 1t h 2t )=( 0.01 0.02 )+( 0.12 0.1 0.1 0.15 )( y 1t1 2 y 2t1 2 )+( 0.3 0.15 0.1 0.2 )( h 1t1 h 2t1 ) (9)

其中 e kt N( 0, 1 ) U kt = y kt1 k=1,2 。在模拟过程中,设置样本容量为 n=1000 n=1500 ,并且重复500次。

对于参数估计,模拟结果展示在表1表2所示,表中列出了参数 θ 的估计值的偏差(Bias)、经验标准差(SD)、20%的经验分位数(Q20)以及80%的经验分位数(Q80)。

Table 1. When n = 1000, Bias, SD, Q20, Q80 of the parameter estimator

1. n = 1000时,参数估计量的Bias、SD、Q20、Q80

𝜃

Bias

SD

Q20

Q80

ω 1 =0.01

−0.0008

0.0060

0.0025

0.0144

ω 2 =0.02

−0.0005

0.0072

0.0132

0.0257

a 11 =0.12

−0.0332

0.0465

0.0449

0.1261

a 12 =0.1

−0.0065

0.0471

0.0509

0.1303

a 21 =0.1

−0.0078

0.0344

0.0620

0.1205

a 22 =0.15

−0.0364

0.0462

0.0786

0.1538

b 11 =0.3

−0.0346

0.2269

0.0010

0.4478

b 12 =0.15

0.0697

0.2278

0.0010

0.3435

b 21 =0.1

0.0747

0.2358

0.0010

0.4797

b 22 =0.2

−0.0241

0.1971

0.0010

0.3481

Table 2. When n = 1500, Bias, SD, Q20, Q80 of the parameter estimator

2. n = 1500时,参数估计量的Bias、SD、Q20、Q80

𝜃

Bias

SD

Q20

Q80

ω 1 =0.01

−0.0011

0.0049

0.0044

0.0126

续表

ω 2 =0.02

0.0002

0.0055

0.0157

0.0251

a 11 =0.12

−0.0212

0.0375

0.0664

0.1287

a 12 =0.1

−0.0060

0.0372

0.0606

0.1255

a 21 =0.1

−0.0095

0.0278

0.0672

0.1138

a 22 =0.15

−0.0239

0.0384

0.0957

0.1580

b 11 =0.3

−0.0481

0.2137

0.0010

0.4682

b 12 =0.15

0.0489

0.1856

0.0010

0.3184

b 21 =0.1

−0.0869

0.2267

0.0010

0.4601

b 22 =0.2

−0.0312

0.1767

0.0010

0.3287

根据上面两个表的结果,可以观察到估计量的偏差普遍较小,并且均位于[Q20, Q80]的区间内。随着样本大小n的增加,几乎所有的标准差都在变小。这表明,在样本数量有限的情况下,参数估计的效果良好。

对于函数系数估计部分,给出了两种样本量下,绘制了函数系数 m 1 ( ) m 2 ( ) 的估计曲线和真实曲线,如图1图2所示,图1为样本量 n=1000 时的对比图,图2为样本量 n=1500 时的对比图。从图中可以看出,估计的函数系数可以捕捉到真实的趋势。为了进行比较,在图3,给出了 n=1000, 1500 时RMSE序列的箱型图(从左到右),当样本量n增大时,均方误差的箱型图有更好的拟合效果,说明在有限的样本容量下,函数系数的估计表现效果良好。

Figure 1. (a) m 1 ( ) 500 simulations of the estimated curve (dashed line) and the real curve (solid line) when n = 1000; (b) m 2 ( ) 500 simulations of the estimated curve (dashed line) and the real curve (solid line) when n = 1000

1. (a) n = 1000时, m 1 ( ) 500次模拟得到的估计曲线(虚线)和真实曲线(实线)图;(b) n = 1000时, m 2 ( ) 500次模拟得到的估计曲线(虚线)和真实曲线(实线)图

Figure 2. (a) m 1 ( ) 500 simulations of the estimated curve (dashed line) and the real curve (solid line) when n = 1500; (b) m 2 ( ) 500 simulations of the estimated curve (dashed line) and the real curve (solid line) when n = 1500

2. (a) n = 1500时, m 1 ( ) 500次模拟得到的估计曲线(虚线)和真实曲线(实线)图;(b) n = 1500时, m 2 ( ) 500次模拟得到的估计曲线(虚线)和真实曲线(实线)图

Figure 3. (a) RMSE sequence box plot for the m 1 ( ) and m 2 ( ) estimates when n = 1000; (b) RMSE sequence box plot for the m 1 ( ) and m 2 ( ) estimates when n = 1500

3. (a) n = 1000时, m 1 ( ) m 2 ( ) 估计值的RMSE序列箱形图;(b) n = 1500时, m 1 ( ) m 2 ( ) 估计值的RMSE序列箱形图

4. 实证研究

在本节中,我们将用2015年1月5日至2024年5月31日的上证综合指数和深证综合指数的日对数收益率数据,对于模型(2)~(4)进行实证研究,其中 k 被设定为2。使用公式 y kt =100×( ln P kt ln P kt1 )( k=1, 2 ) 计算对数收益率,其中 P 1t P 2t 分别表示上证综合指数和深证综合指数第t日的收盘价, y kt 为对数收益率,最终得到有效数据2287组。下图4描绘了上证综合指数和深证综合指数收益率序列的线性图,可以看出收益率序列围绕着零上下波动,并且呈现出明显的波动性和集聚性。

在这里令 U kt = y kt1 ( k=1, 2 ) ,用一元模型(1)分别对 y 1t y 2t 进行拟合,结果如下:

y 1t = m 1 ( y 1t1 ) h 1t + ε 1t ,  ε 1t = e 1t h 1t h 1t =0.0156+0.0763 y 1t1 2 +0.9133 h 1t1 (10)

y 2t = m 2 ( y 2t1 ) h 2t + ε 2t ,  ε 2t = e 2t h 2t h 2t =0.0363+0.0634 y 2t1 2 +0.9196 h 2t1 (11)

然后用多元模型(2)~(4)对 y 1t y 2t 进行拟合,结果如下:

( y 1t y 2t )=( m 1 ( y 1t1 ) 0 0 m 2 ( y 2t1 ) )( h 1t h 2t )+( h 1t 0 0 h 2t )( e 1t e 2t ), (12)

( h 1t h 2t )=( 0.0119 0.1374 )+( 0.0643 0.0010 0.0541 0.0558 )( y 1t1 2 y 2t1 2 )+( 0.9243 0.0010 0.2928 0.6587 )( h 1t1 h 2t1 ), (13)

为了比较两个模型的拟合效果,分别计算了 y 1t y 2t 的均方根误差(RMSE)和平均绝对误差(MAE),并将结果汇总到了表3

Figure 4. The logarithmic returns of Shanghai composite index and Shenzhen composite index from 2015 to 2024

4. 2015~2024上证综合指数和深证综合指数的对数收益率

Table 3. Comparison of fitting effect between monadic model and multivariate model

3. 一元模型和多元模型的拟合效果比较

模型

RMSE

MAE

一元

1.2343

0.8265

1.5596

1.0898

多元

1.2340

0.8262

1.5589

1.0895

表3的结果可以看出,对于 y 1t 来说,多元模型的RMSE值要比一元模型的RMSE值小0.0003,MAE值也小0.0003;对于来说,多元模型的RMSE值要比一元模型的RMSE值小0.0007,MAE值小0.0003。这说明多元函数系数GARCH-M模型的拟合效果比一元的效果好一些。

5. 小结

本文在一元函数系数GARCH-M模型的基础上,进一步研究了一类多元函数系数GARCH-M模型,通过局部线性回归和拟极大似然函数的方法,对模型中函数系数和参数进行了估计。相比于一元函数系数GARCH-M模型,所提出的多元函数系数GARCH-M模型的优势在于考虑了不同收益序列条件期望和方差的影响。数值模拟的结果表明,估计方法表现良好。实证研究的结果也显示,多元模型在拟合效果上优于一元模型,从而证明我们所提出的模型有一定的应用价值。

参考文献

[1] Engle, R.F. (1982) Autoregressive Conditional Heteroscedasticity with Estimates of the Variance of United Kingdom Inflation. Econometrica, 50, 987-1007.
https://doi.org/10.2307/1912773
[2] Bollerslev, T. (1986) Generalized Autoregressive Conditional Heteroskedasticity. Journal of Econometrics, 31, 307-327.
https://doi.org/10.1016/0304-4076(86)90063-1
[3] Engle, R.F., Lilien, D.M. and Robins, R.P. (1987) Estimating Time Varying Risk Premia in the Term Structure: The Arch-M Model. Econometrica, 55, 391-407.
https://doi.org/10.2307/1913242
[4] Chou, R., Engle, R.F. and Kane, A. (1992) Measuring Risk Aversion from Excess Returns on a Stock Index. Journal of Econometrics, 52, 201-224.
https://doi.org/10.1016/0304-4076(92)90070-8
[5] 张华高. 基于非参数GARCH-M模型的金融市场波动性研究[D]: [硕士学位论文]. 上海: 复旦大学, 2010.
[6] Conrad, C. and Mammen, E. (2008) Nonparametric Regression on Latent Covariates with an Application to Semiparametric Garch-in-Mean Models. SSRN Electronic Journal.
https://doi.org/10.2139/ssrn.1192082
[7] Ling, S. (2003) Estimation and Testing Stationarity for Double-Autoregressive Models. Journal of the Royal Statistical Society Series B: Statistical Methodology, 66, 63-78.
https://doi.org/10.1111/j.1467-9868.2004.00432.x
[8] Christensen, B.J., Dahl, C.M. and Iglesias, E.M. (2012) Semiparametric Inference in a Garch-in-Mean Model. Journal of Econometrics, 167, 458-472.
https://doi.org/10.1016/j.jeconom.2011.09.028
[9] Ling, S.Q. (2007) A Double AR(p) Model: Structure and Estimation. Statistic Sinica, 17, 161-175.
[10] Zhang, X., Wong, H. and Li, Y. (2015) A Functional Coefficient GARCH-M Model. Communications in StatisticsTheory and Methods, 45, 3807-3821.
https://doi.org/10.1080/03610926.2014.906615
[11] Song, Z., Zhang, X., Li, Y. and Xiong, Q. (2016) A Linear Varying Coefficient ARCH-M Model with a Latent Variable. Science China Mathematics, 59, 1795-1814.
https://doi.org/10.1007/s11425-016-5151-4
[12] Xiong, Q., Li, Y. and Zhang, X. (2014) The Profile Likelihood Estimation for Single-Index Arch(p)-M Model. Mathematical Problems in Engineering, 2014, 1-17.
https://doi.org/10.1155/2014/189426
[13] Bollerslev, T., Engle, R.F. and Wooldridge, J.M. (1988) A Capital Asset Pricing Model with Time-Varying Covariances. Journal of Political Economy, 96, 116-131.
https://doi.org/10.1086/261527
[14] Bollerslev, T. (1990) Modelling the Coherence in Short-Run Nominal Exchange Rates: A Multivariate Generalized Arch Model. The Review of Economics and Statistics, 72, 498-505.
https://doi.org/10.2307/2109358
[15] Engle, R.F. and Kroner, K.F. (1995) Multivariate Simultaneous Generalized ARCH. Econometric Theory, 11, 122-150.
https://doi.org/10.1017/s0266466600009063
[16] Engle, R.F. (2000) Dynamic Conditional Correlation—A Simple Class of Multivariate GARCH Models. SSRN Electronic Journal.
https://doi.org/10.2139/ssrn.236998
[17] 朱华锋, 李元, 张兴发. 一类多元部分线性GARCH-M模型研究[J]. 数理统计与管理, 2018, 37(5): 843-849.