1. 引言
金融资产波动率往往具有时变性、聚集性等波动特性。人民币汇率作为一种典型金融资产,其波动对我国的出口外贸、投资都会产生重要影响,分析和预测人民币汇率的波动特征具有一定的现实意义。GARCH族模型是研究波动性的主流模型。
将条件方差设定为过去残差平方的函数,Engle (1982) [1] 提出ARCH模型来拟合波动性。Bollerslev (1986) [2] 将高阶ARCH模型扩展为低阶GARCH模型,将条件方差设定为过去残差平方及过去条件方差的函数。Engle和Bollerslev (1986) [3] 随后又建立IGARCH模型,反映波动冲击的持续性。考虑到负冲击与正冲击影响差异性不同,Nelson (1991) [4] 提出了指数GARCH模型(EGARCH)模型,Glosten、Jagannathan、Runkle (1993) [5] 提出了门限GARCH模型(TGARCH)等非对称模型来反映这种差异。本文使用GARCH、IGARCH、EGARCH三种模型进行样本内、样本外建模分析,评价其预测效力。
GARCH模型即广义自回归条件异方差模型(Generalised Autoregressive Conditional Heteroscedasticity),一阶GARCH(1, 1)模型如下:
其中,rt为均值方程,σt2为波动方程。扰动项εt的条件方差σt2主要取决于常数项ω、滞后扰动项平方εt − 1 (ARCH项)和上一期预测方差σt − 1 (GARCH项)。
IGARCH模型又称移动平滑模型(Exponential Weighted Moving Average, EWMA),其模型如下:
GARCH模型的εt − i系数与σt − i系数之和接近1,表明冲击具有持续影响。该模型刻画了冲击影响的持续性 [6] 。
EGARCH (Exponential Generalised Autoregressive Conditional Heteroscedasticity)是从GARCH衍生出的模型,可用于解释杠杆效应。其模型形式如下:
其中,α和是γ实常数。εt和(|εt| − E|εt|)都分别是零均值独立同分布白噪声,分布为连续分布。由此可见的g(εt)分布是非对称的。
2. 模型数据
本文的人民币汇率是2022年1月3日~2023年7月18日美元人民币(香港)的每日收盘价,数据资料来自于https://www.chinamoney.com.cn/。2022年1月3日至2022年6月30日共378个样本内数据,用于建模,2023年7月3日至2023年7月21日数据共15个样本外数据,用于评价检验模型预测的准确性。
给定人民币/美元价格,其波动性即收益率用以下公式计算:
其中,ri是RMB/USD的百分比变化即每日收益率,Ei、Ei − 1分别是RMB/USD的当天和前一天的收盘价格。
人民币每日收益率的描述性统计见表1。模型的所有检验与图形都是利用R-4.0.5和S-plus 8.0软体。

Table 1. Descriptive statistics of the daily return rate of RMB/USD
表1. 人民币美元汇率日收益率的统计描述

Figure 1. Time series plot of daily return of RMB/USD
图1. 人民币美元汇率的日收益时间序列图
人民币每日收益率平均为0.0330,标准差为0.4237,最小值低至−2.1025,最大值高至1.3433。偏度−0.7303和超额峰度3.2924显示数据非正态分布,而是尖峰厚尾,符合金融数据分布的一般特征。时间序列(图1)显示收益率有聚集现象,表明是可以预测的。
3. 模型建立
3.1. 平稳性检验和ARCH效应检验
为了应用GARCH,需要对数据进行平稳性检验。用ADF检验的结果显示见表2。ADF test显示样本数据是一平稳过程。

Table 2. Augmented Dickey Fuller test
表2. 增广Dickey Fuller检验
注:在5%显著水平上的临界值,数据来源于作者用R软体的计算。

Figure 2. Squared series of the percentage changes in exchange rates
图2. 汇率变化百分数的平方序列

Figure 3. ACF plot of daily return series
图3. 日收益率序列的ACF图

Figure 4. Partial ACF plot of daily return squared series
图4. 日收益率平方序列的PACF图
图2是人民币汇率日收益率平方的时间序列图,从2022年1月3日至2022年6月30日共378个数据。图形显示样本数据时间序列平稳中有大的波动。图3是收益率的样本ACF图,显示序列没有相关性。图4是收益率平方的PACF图,显示有大的spikes,表明收益率的平方是序列相关的,有一定的ARCH效应。收益率Ljung-Box Q(m)检验(表3) P-value都是大于0.05,显示序列是不存在显著的相关性,所以可以直接用于ARCH效应的检验。Ljung-Box Q2(m)和LM的ARCH效应检验统计量的P-value都接近于0,说明序列有很强的ARCH效应,故可以建立GARCH模型。

Table 3. ARCH effect test of the RMB/USD daily return rate
表3. 人民币美元汇率日收益率ARCH效应的检验
3.2. 参数估计

Table 4. Parameter estimation of the model
表4. 模型的参数估计
用四种模型对样本数据进行拟合。首先,拟合GARCH-M模型,均值方程和波动方程的系数在5%水平下都是显著的,注意到ARCH项系数与GARCH项系数估计值之和为0.982接近于1,认为波动率受冲击影响持久,考虑建立IGARCH模型。拟合IGARCH模型,同样均值方程和波动率方程的系数在5%水平下也都是显著的。考虑可能存在杠杆效应,最后拟合EGARCH模型,杠杆系数值为0.277,并且5%水平下是显著的,说明波动方程存在杠杆效应。三种模型的无论是均值方程系数还是波动方程系数在5%水平下都是显著的(SIGNIFICANCE),说明模型都是充分和适当的。GARCH-M、IGARCH、EGARCH三种模型的系数估计结果如表4所示。
极大似然值(LLF)和AIC是评价模型拟合程度最常用的二类指标。计算了三种模型的LLF及AIC值,以判断与比较模型的拟合程度。EGARCH模型的LLF值最低,但AIC值最高。GARCH-M与IGARCH的LLF、AIC差别很小。从综合指标来看,认为IGARCH模型应为最合适。三种模型的极大似然值(LLF)和AIC值如下所示(表5)。
对上述模型的标准化残差序列进行Ljung-Box Q检验与ARCHLM检验、NORMAL检验。对标准化残差序列进行Ljung-Box Q检验,统计量的P-value都是大于0.05,说明均无显著自相关性。对标准化残差平方序列进行Ljung-Box Q检验及ARCHLM检验,P-value也都是大于0.05,反映出ARCH效应已消除。各模型均能刻画收益率序列的ARCH效应,模型都是充分和适当的。JB检验拒绝正态分布,反映收益分布的尖峰厚尾特性(表6)。
基于以上充分的三种模型和估计的系数,分别计算出GARCH-M、IGARCH、EGARCH模型样本内数据的波动均方差的拟合值,并与真实值进行作图比较(图5),从图形上看,拟合较好。

Figure 5. True value and estimated value of daily volatility within the sample (3 January, 2022~30 June, 2023)
图5. 样本内日波动率真实值与估计值(2022年1月3日~2023年6月30日)
3.3. 模型预测能力评价
为准确评价上述模型的预测效果,按照预测误差最小原则,进行模型预测能力评价。样本外预测最常用的有四种方法:样本内回测(Back Testing)、样本外静态预测(Static Forecasting)、样本外滚动预测(Rolling Forecasting)、样本外迭代预测(Recursive Forecasting)。样本外滚动预测(Rolling Forecasting),就是用样本内数据作为初始训练集,估计模型并向前预测下一个条件方差,对于样本外数据,以后每次将样本观测窗口向样本外移动一期、保持样本容量不变,重估模型并进一步预测,共重估和预测15次,得到样本外数据的条件方差预测值。本文采用这种方法,分别计算出GARCH-M、IGARCH、EGARCH模型样本外数据2023年7月3日至2023年7月21日数据共15个波动均方差的预测值,与真实值进行作图比较(图6蓝色虚线右)。

Figure 6. True value and predicted value of daily volatility within the sample (3 July, 2023~21 July, 2023)
图6. 样本内日波动率真实值与预测值(2023年7月3日~2023年7月21日)
为做出准确判断,使用平均绝对误差MAD、均方根误差RMSE、平均绝对百分比误差MAPE等三项指标作为预测能力评价指标,越小表明预测值与观测值之间的差异越小,预测精度越高。

Table 7. Statistical error results of out-of-sample data (3 July, 2023~21 July, 2023)
表7. 样本外数据统计误差结果(2023年7月3日~2023年7月21日)
从指标来看,无论是平均绝对误差MAD、均方根误差RMSE,还是平均绝对百分比误差MAPE,IGARCH模型都取得了最优的预测效果(表7),另外IGARCH模型AIC值在三种模型中也是最低的。IGARCH模型是数据拟合模型最优的,反映了人民币离岸价格收益波动率受冲击影响持久。
4. 结论
首先,从模型的合适性与充分性上看,三类模型的系数都是高度显著的,EGARCH的杠杆系数也是显著的,残值都无自相关与ARCH效应,即三类模型都是合适与充分的。
其次,样本外滚动预测,IGARCH模型即EWMA,AIC值最小与LLF值也比较好,样本外预测准确度指标MAD、RMSE、MAPE是最好的。IGARCH模型取得了最优的预测效果。主要是由于IGARCH模型实质为EWMA模型,能更好地刻画波动冲击的持续与衰减特性。
最后,此三类波动率模型都只适合短期预测,预测的期数时间越长,越不够准确,即随着时间的增长,预测能力下降,在应用波动率模型时应加以注意。