1. 引言
金融资产收益序列中波动率的聚集现象是金融时间序列分析的主要特征之一。在资产定价和风险管理等金融决策过程中,精确地描述这种聚集效应具有极其重要的意义。金融时间序列的波动性一般通过条件方差的变化反映出来,条件方差被看作是投资风险或市场风险的度量。Engle (1982) [1]提出的ARCH模型以及Bollerslev (1986) [2]提出的GARCH模型就是分析这种风险,在实际的金融市场中,收益往往与风险相关,高收益往往会伴随着较高的风险,Engle等人(1987) [3]为反映风险溢价现象,将条件方差引入到均值方程中,提出了ARCH-M模型。针对GARCH-M模型,国内外学者做了一系列的研究,Chou等人(1992) [4]将ARCH-M模型应用于风险厌恶度量,基于CAPM模型的均衡理论,提出股票指数波动性遵循GARCH模型的观点;张华高(2010) [5]采用了非参数GARCH-M模型来探讨金融市场的波动性特征。上述所讨论的(G)ARCH类模型的条件方差中误差具有不可观测性,模型的统计推断成为该类模型研究的一大难点,Bent等人(2008) [6]假设条件方差为
,用可观测序列
替代不可观测序列
,这样
就是可观测序列
的函数;很多学者在研究GARCH模型时也都采用了这样的假设,例如Ling (2004) [7];Christensen等人(2012) [8]在Ling [7] [9]研究的双自回归(DAR)模型的基础上,研究了半参数GARCH-M模型;Zhang等人(2016) [10]针对风险厌恶可能随时间变化且与利率、通货膨胀等经济指标相关的现象,提出了一类函数系数GARCH-M模型:
(1)
其中
为影响波动系数的可观测解释变量序列,可以是
的滞后项,也可以是外生变量或潜变量;且当
时,
与
无关;
是一个已知的正函数。
基于函数系数GARCH-M模型,许多学者做了进一步的研究。例如Song等人(2016) [11]基于函数系数GARCH-M模型,将视为潜在变量,并假定
具有线性关系;Xiong等人(2014) [12]探讨了一类单指标ARCH-M模型,并利用截面似然方法进行了统计推断,同时检验了模型中的ARCH效应。
虽然一元(G)ARCH模型在刻画一元时间序列波动率方面有着强大的解释和预测功能,但只是考虑了单个资产或市场的波动率问题,没有考虑不同资产或市场之间波动率的关系,因此很多学者将一元GARCH模型推广到了多元情形。Bollerslev等人(1988) [13]率先将一元GARCH模型推广到多元情形,提出了VEC模型;随后Bollerslev (1990) [14]、Baba (1995) [15]、Engle (2000) [16]等人对多元GARCH模型进行进一步的研究;朱华锋等人(2018) [17]在半参数GARCH-M模型的基础上,研究了一类多元部分线性GARCH-M模型。
时间序列模型的多元情形可以考虑不同资产与市场之间的波动关系,因此本文将Zhang等人(2016)的一元函数系数GARCH-M模型推广到多元,把序列之间的交互作用引入到风险厌恶的研究上,研究了一类条件协方差阵由可观测序列驱动的多元函数系数GARCH-M模型,模型的形式如下:
(2)
(3)
(4)
其中,
,
,
,
,
,
,
。
这里
表示向量或矩阵的转置,
,
,
为
的矩阵,
是均值为
,方差为
(
单位矩阵)的独立同分布随机向量。
为可观测序列,
为影响波动系数的可观测解释变量序列,
是未知的光滑函数,
。假设当
时,
与
无关。定义
为待估参数,其中
为将
矩阵按列展开构成一个
的向量算子。
表示为
时刻的信息集。
本文的后续结构的安排如下:第二部分将探讨模型中函数系数部分和参数部分的估计方法;第三部分和第四部分分别进行数值模拟和实证分析;第五部分是对全文的总结。
2. 估计
多元函数系数GARCH-M模型的估计分为两部分,一个是函数系数部分,另一个是参数部分,这一小节将从这两部分进行介绍。
2.1. 函数系数估计
未知函数系数部分的估计利用的局部线性回归估计的方法,定义
是模型的参数空间,假设参数
已知,则
在给的
和
的条件下视为一个可观测的量,所以(2)式可看作是函数系数回归模型,根据Zhang等人[10]的方法,给出均值方程中
的估计量为:
(5)
其中
,
,
,
,
是随样本量
变化的窗宽,
,其中
是紧支撑的对称核函数。在本文中,所选用的核函数为
。
2.2. 参数估计
参数部分是利用的是拟极大似然函数进行估计。在给定
,得到之后,接下来给出
的估计。令,考虑如下关于
的拟对数似然函数:
(6)
其中
,。
于是,
的估计可表示为:
。
因此,在得到参数估计量
后,在(5)式的基础上,可得到函数系数
的估计量为。
3. 数值模拟
在这一节中,将通过研究参数估计量的偏差和标准差,对参数估计量的表现进行检验。其中序列
是由以下模型生成的:
(7)
(8)
(9)
其中
,
,
。在模拟过程中,设置样本容量为
和
,并且重复500次。
对于参数估计,模拟结果展示在表1和表2所示,表中列出了参数
的估计值的偏差(Bias)、经验标准差(SD)、20%的经验分位数(Q20)以及80%的经验分位数(Q80)。
Table 1. When n = 1000, Bias, SD, Q20, Q80 of the parameter estimator
表1. n = 1000时,参数估计量的Bias、SD、Q20、Q80
𝜃 |
Bias |
SD |
Q20 |
Q80 |
|
−0.0008 |
0.0060 |
0.0025 |
0.0144 |
|
−0.0005 |
0.0072 |
0.0132 |
0.0257 |
|
−0.0332 |
0.0465 |
0.0449 |
0.1261 |
|
−0.0065 |
0.0471 |
0.0509 |
0.1303 |
|
−0.0078 |
0.0344 |
0.0620 |
0.1205 |
|
−0.0364 |
0.0462 |
0.0786 |
0.1538 |
|
−0.0346 |
0.2269 |
0.0010 |
0.4478 |
|
0.0697 |
0.2278 |
0.0010 |
0.3435 |
|
0.0747 |
0.2358 |
0.0010 |
0.4797 |
|
−0.0241 |
0.1971 |
0.0010 |
0.3481 |
Table 2. When n = 1500, Bias, SD, Q20, Q80 of the parameter estimator
表2. n = 1500时,参数估计量的Bias、SD、Q20、Q80
𝜃 |
Bias |
SD |
Q20 |
Q80 |
|
−0.0011 |
0.0049 |
0.0044 |
0.0126 |
续表
|
0.0002 |
0.0055 |
0.0157 |
0.0251 |
|
−0.0212 |
0.0375 |
0.0664 |
0.1287 |
|
−0.0060 |
0.0372 |
0.0606 |
0.1255 |
|
−0.0095 |
0.0278 |
0.0672 |
0.1138 |
|
−0.0239 |
0.0384 |
0.0957 |
0.1580 |
|
−0.0481 |
0.2137 |
0.0010 |
0.4682 |
|
0.0489 |
0.1856 |
0.0010 |
0.3184 |
|
−0.0869 |
0.2267 |
0.0010 |
0.4601 |
|
−0.0312 |
0.1767 |
0.0010 |
0.3287 |
根据上面两个表的结果,可以观察到估计量的偏差普遍较小,并且均位于[Q20, Q80]的区间内。随着样本大小n的增加,几乎所有的标准差都在变小。这表明,在样本数量有限的情况下,参数估计的效果良好。
对于函数系数估计部分,给出了两种样本量下,绘制了函数系数
和
的估计曲线和真实曲线,如图1和图2所示,图1为样本量
时的对比图,图2为样本量
时的对比图。从图中可以看出,估计的函数系数可以捕捉到真实的趋势。为了进行比较,在图3,给出了
时RMSE序列的箱型图(从左到右),当样本量n增大时,均方误差的箱型图有更好的拟合效果,说明在有限的样本容量下,函数系数的估计表现效果良好。
Figure 1. (a)
500 simulations of the estimated curve (dashed line) and the real curve (solid line) when n = 1000; (b)
500 simulations of the estimated curve (dashed line) and the real curve (solid line) when n = 1000
图1. (a) n = 1000时,
500次模拟得到的估计曲线(虚线)和真实曲线(实线)图;(b) n = 1000时,
500次模拟得到的估计曲线(虚线)和真实曲线(实线)图
Figure 2. (a)
500 simulations of the estimated curve (dashed line) and the real curve (solid line) when n = 1500; (b)
500 simulations of the estimated curve (dashed line) and the real curve (solid line) when n = 1500
图2. (a) n = 1500时,
500次模拟得到的估计曲线(虚线)和真实曲线(实线)图;(b) n = 1500时,
500次模拟得到的估计曲线(虚线)和真实曲线(实线)图
Figure 3. (a) RMSE sequence box plot for the
and
estimates when n = 1000; (b) RMSE sequence box plot for the
and
estimates when n = 1500
图3. (a) n = 1000时,
和
估计值的RMSE序列箱形图;(b) n = 1500时,
和
估计值的RMSE序列箱形图
4. 实证研究
在本节中,我们将用2015年1月5日至2024年5月31日的上证综合指数和深证综合指数的日对数收益率数据,对于模型(2)~(4)进行实证研究,其中
被设定为2。使用公式
计算对数收益率,其中
和
分别表示上证综合指数和深证综合指数第t日的收盘价,
为对数收益率,最终得到有效数据2287组。下图4描绘了上证综合指数和深证综合指数收益率序列的线性图,可以看出收益率序列围绕着零上下波动,并且呈现出明显的波动性和集聚性。
在这里令
,用一元模型(1)分别对
和
进行拟合,结果如下:
(10)
(11)
然后用多元模型(2)~(4)对
和
进行拟合,结果如下:
(12)
(13)
为了比较两个模型的拟合效果,分别计算了
和
的均方根误差(RMSE)和平均绝对误差(MAE),并将结果汇总到了表3。
Figure 4. The logarithmic returns of Shanghai composite index and Shenzhen composite index from 2015 to 2024
图4. 2015~2024上证综合指数和深证综合指数的对数收益率
Table 3. Comparison of fitting effect between monadic model and multivariate model
表3. 一元模型和多元模型的拟合效果比较
模型 |
RMSE |
MAE |
一元 |
1.2343 |
0.8265 |
1.5596 |
1.0898 |
多元 |
1.2340 |
0.8262 |
1.5589 |
1.0895 |
从表3的结果可以看出,对于
来说,多元模型的RMSE值要比一元模型的RMSE值小0.0003,MAE值也小0.0003;对于来说,多元模型的RMSE值要比一元模型的RMSE值小0.0007,MAE值小0.0003。这说明多元函数系数GARCH-M模型的拟合效果比一元的效果好一些。
5. 小结
本文在一元函数系数GARCH-M模型的基础上,进一步研究了一类多元函数系数GARCH-M模型,通过局部线性回归和拟极大似然函数的方法,对模型中函数系数和参数进行了估计。相比于一元函数系数GARCH-M模型,所提出的多元函数系数GARCH-M模型的优势在于考虑了不同收益序列条件期望和方差的影响。数值模拟的结果表明,估计方法表现良好。实证研究的结果也显示,多元模型在拟合效果上优于一元模型,从而证明我们所提出的模型有一定的应用价值。