1. 引言
股市波动率不仅反映了市场的风险与不确定性,还与宏观经济因素、政策变动及投资者情绪密切相关[1]。近年来,如何对金融波动率进行准确建模成为学术研究的热点。其中,经济政策不确定性(EPU)被视为影响股市波动的重要因素之一。经济政策的不确定性往往通过改变投资者预期与市场情绪而加剧股价波动,这一效应在经济环境剧烈变动时期尤为显著。因此,准确识别并量化EPU对股市波动的影响,已成为金融研究的重要课题[2]。
在现有波动率建模方法中,由Bollerslev [3]提出的广义自回归条件异方差(GARCH)模型最具代表性,并被广泛采纳[4] [5]。尽管GARCH类模型在金融时间序列波动率预测中表现良好,但它通常受限于数据频率,难以引入如经济政策不确定性等外生解释变量,从而无法充分刻画波动率的动态特征,导致模型在拟合与预测方面存在局限。为此,Engle等[6]在GARCH模型框架基础上提出了GARCH-MIDAS模型。该模型将波动率分解为短期与长期成分,通过引入低频宏观经济变量,有效融合高频金融数据与低频宏观信息,从而提升了波动率预测的准确性。此后,该模型在股市波动率预测中得到广泛应用。例如,Yu [7]运用GARCH-MIDAS模型,将低频EPU指数与高频股票收益直接结合,对股指波动率进行建模与预测,实证结果表明该模型能够显著提升预测性能。Wang [8]则将随机波动率(SV)模型与t分布下的混合数据抽样(MIDAS)结构结合,构建SV-MIDAS-t模型,用以研究经济政策不确定性对中国股市波动的影响,发现EPU指数的上升显著增加了波动率的长期成分,且该影响存在滞后效应。
尽管GARCH-MIDAS模型在实证研究中表现优越,但既有研究大多忽略了股指收益率分布的时变高阶矩特征,从而限制了对极端波动的刻画能力。大量研究表明,股指收益率序列普遍呈现偏态、尖峰厚尾等非正态特性,且其偏度与峰度随时间变化,表现出明显的时变高阶矩特征[9]。例如,柯睿[10]构建DRD模型对股指收益率进行实证分析,结果显示收益率序列具有显著的高阶矩动态性。Kumar与Liu [11]在GARCH模型中引入时变偏度与峰度,提出GARCH-SK模型,发现该模型不仅具有良好的拟合与预测效果,而且具有较好的稳健性。因此,在波动率建模中纳入时变高阶矩特征,对于提升股市波动率的刻画与预测能力具有重要意义。
为弥补现有研究的不足,本文提出一种改进的波动率模型。首先,基于Gram-Charlier展开式(GCE)构建包含时变高阶矩的GARCH-MIDAS-SK模型;进而,引入中国经济政策不确定性指数(CEPU),形成GARCH-MIDAS-SK-CEPU模型。该模型通过融合高阶矩动态特征与宏观经济变量,旨在更精确地揭示经济政策不确定性对中国股市波动的影响机制。
2. 模型构建
2.1. GARCH-MIDAS-SK-CEPU模型
为研究时变高阶矩及经济政策不确定性对中国股市风险的影响,本文构建了GARCH-MIDAS-SK-CEPU模型。假设第
期内第
天的股票收益
服从以下过程
,
, (1)
其中,
是条件均值,假设条件残差
服从变换后的GCE分布,该分布通过对原始GCE密度进行平方变换构造,以保证其满足概率密度函数的非负性与积分为1的正定性条件。即
,
为第
期中第
天的可用信息集,
表示经平方变换后得到的有效密度函数定义如下
. (2)
其中
为标准正态密度函数,
定义如下
,
.
为短期波动成分服从GARCH(1,1)过程
, (3)
其中
,
且
。
为长期波动成分建模如下
, (4)
. (5)
其中,
为第
期的已实现波动率,
为最大滞后阶数,
为第
期中交易日的数目,
为第
期CEPU指数的对数差分。m为常数项代表长期波动的基准水平,
和
分别为已实现波动率RV和CEPU对长期波动成分
的影响系数,
,
分别为对过去
期RV和CEPU加权平均的Bata非线性滞后权重函数。
并假设时变偏度和峰度有条件地取决于收益率新息
及其过去值,服从GARCH(1,1)过程,具体形式如下
, (6)
. (7)
由此,式(1)-(7)定义了GARCH-MIDAS-SK-CEPU模型。
2.2. GARCH-MIDAS类模型
为了进一步探讨时变高阶矩和CEPU对中国股市风险的影响,本文还在Engle等[6]提出的GARCH-MIDAS模型基础上,考虑以下规范的长期波动成分
,构建不同的基准模型进行对比分析。
. (8)
. (9)
其中,在GARCH-MIDAS模型框架下,分别以式(8)和(9)为长期成分的模型被称为GARCH-MIDAS-RV模型和GARCH-MIDAS-CEPU模型;此外,本文还将由式(1)~(4)和(6)~(8)定义的模型称为GARCH-MIDAS-SK模型。
3. 数据和描述性统计
沪深300指数作为反映A股市场整体走势的核心基准,覆盖了A股市场300家规模大、流动性好的代表性企业,能够反映股市整体表现与波动。经济政策不确定性指数则是常用于衡量政策环境变化及其对宏观经济与金融市场影响的重要指标。为探究政策不确定性对股票市场波动的影响机制,本文选取沪深300指数日度收盘价,以及Baker等人[12]构建的中国月度经济政策不确定性指数作为研究样本。样本周期分别为2010年1月4日至2023年6月30日,分别包含3279个日度数据和162个月度数据,数据来源于Wind数据库及经济政策不确定性网站(http://www.policyuncertainty.com/chinamonthly.html)。日收益率定义为
(10)
其中
表示第
天的收盘价,CEPU指数的变化率表示为其对数差分。
Table 1. Descriptive statistics of the sample data
表1. 样本数据的描述性统计
变量 |
均值 |
标准差 |
偏度 |
峰度 |
J-B |
LQ(12) |
PP(9) |
ARCH(12) |
CSI300 |
0.000 |
0.014 |
−0.642 |
7.775 |
3338.969*** |
33.898*** |
−55.979*** |
165.824*** |
CEPU |
0.011 |
0.437 |
−0.132 |
5.457 |
40.978*** |
63.550*** |
−22.037*** |
|
注:***、**和*分别表示该序列在1%、5%、10%显著性水平下拒绝原假设。
图1和图2分别给出了深沪300指数的日收益率时序图和月度CEPU指数的时序图。从图中可以看出收益率具有波动率时变性和聚集性特征。CEPU指数捕捉到了欧债危机(2011~2012),中国经济恐慌(2015~2016),中美贸易战(2017~2018),COVID-19疫情(2020)和俄乌冲突(2022)等重要经济事件,以及相应的股市高波动性。总体上,CEPU指数变化与中国及国际整体经济运行情况紧密相关。
Figure 1. CSI 300 index return series
图1. 沪深300指数收益率序列
Figure 2. CEPU index logarithmic difference series
图2. CEPU指数对数差分序列
由表1可知,偏度、峰度及JB检验显示序列呈现尖峰厚尾的特征,显著偏离正态分布;LQ检验表明存在自相关性,而PP检验显示序列平稳。在1%显著性水平下,沪深300指数日收益率的ARCH检验拒绝无异方差性原假设,表明序列存在显著的异方差效应,这为采用GARCH类模型来刻画其波动特征提供了实证依据。
4. 实证分析
4.1. 模型参数估计
采用GARCH-MIDAS-SK-CEPU模型对沪深300指数日收益率数据进行样本内拟合,并以GARCH、GARCH-MIDAS-RV、GARCH-MIDAS-CEPU及GARCH-MIDAS-SK四种模型作为基准进行对比分析。为简便,将上述模型分别记为GARCH、GM-RV、GM-EPU、GM-SK和GM-SKEPU模型。样本区间选取2010年1月4日至2021年7月9日(共2800个交易日),用于模型参数的样本内估计。参数估计采用极大似然法,各模型估计结果详见表2。
Table 2. Estimation results of parameters
表2. 参数估计结果
参数 |
GARCH |
GM-RV |
GM-EPU |
GM-SK |
GM-SKEPU |
|
0.0004*** |
0.0003 |
0.0003 |
0.0003* |
0.0004** |
|
0.1000*** |
0.0879*** |
0.0665*** |
0.0830*** |
0.0796*** |
|
0.8800*** |
0.8988*** |
0.9335*** |
0.8995*** |
0.9203*** |
|
0.0000*** |
0.0001*** |
1.1764*** |
0.0001*** |
0.0421*** |
|
-- |
0.0451*** |
-- |
0.0232*** |
0.3461 |
|
-- |
-- |
0.68098** |
-- |
0.0434*** |
|
-- |
14.9992*** |
7.7181*** |
15.0002*** |
13.0136** |
|
-- |
18.0013*** |
8.7066*** |
20.9999*** |
14.9829*** |
|
-- |
-- |
-- |
-- |
8.0321*** |
|
-- |
-- |
-- |
-- |
8.9576*** |
|
-- |
-- |
-- |
−0.0558** |
−0.0374* |
|
-- |
-- |
-- |
0.0315 |
0.1459 |
|
-- |
-- |
-- |
0.0649*** |
0.0553** |
|
-- |
-- |
-- |
1.9225*** |
3.0971*** |
|
-- |
-- |
-- |
0.3918** |
0.0826 |
|
-- |
-- |
-- |
0.3141*** |
0.1750** |
LLF |
8170.81 |
8174.05 |
8189.06 |
8265.04 |
8280.45 |
AIC |
−16333.61 |
−16334.10 |
−16364.11 |
−16504.09 |
−16528.90 |
注:表中为各模型的参数估计结果,LLF表示对数似然值,AIC表示Akaike信息准则,***、**和*分别表示在1%、5%、10%显著性水平下显著。
表2显示,各模型的短期波动系数
和
估计值均在1%水平下显著,且系数之和接近1,表明股市波动存在聚集效应,且模型能够有效捕捉波动的持续性特征。其次,在GM-RA和GM-SK模型中,
估计值均在1%水平下显著大于零,而在GM-EPU与GM-SKEPU模型中,
估计值分别在5%和1%水平下显著为正。表明RV与CEPU对沪深300指数的波动率具有显著正向作用,反映了市场对外部冲击及政策不确定性的敏感性较高。在GM-SK和GM-SKEPU模型中,偏度方程系数
均显著;在GM-SK模型中,峰度方程系数
和
显著;在GM-SKEPU模型中,峰度方程系数
同样显著。表明沪深300指数收益率分布具有时变高阶矩特征,且两模型能够有效刻画高阶矩的动态变化。此外,在两模型中,
和
显著为正,为EPU影响市场风险形态提供了直接证据。理论上,EPU会通过投资者情绪和融资约束等渠道强化市场对负面信息的反应,导致收益率分布呈现负偏态,并显著提升尾部风险表现为峰度上升。该系数的显著性验证了EPU会推高市场峰度的预期,表明政策不确定性的增加会加剧股市的极端尾部风险。最后,从模型拟合效果来看,GM-RV模型的LLF和AIC均优于传统GARCH模型,表明引入长期波动成分有助于提升模型拟合能力。与GM-RV模型相比,GM-EPU和GM-SK模型均进一步改善了样本内拟合效果,说明CEPU,尤其是时变高阶矩的引入对提升模型拟合效果具有显著作用。值得注意的是,GM-SKEPU模型在所有模型中拟合最佳(LLF值最大和AIC值最小),验证了同时纳入CEPU与时变高阶矩对提高股票收益率样本内拟合精度的重要性。
4.2. 样本外预测
Figure 3. The trend chart of real volatility versus predicted volatility
图3. 真实波动率和预测波动率趋势图
本文采用滚动窗口算法,将窗口长度设置为两年(500个数据点),预测区间为2021年7月12日至2023年6月30日,共478天,对沪深300指数的波动率进行预测,并采用均方误差(MSE)、平均绝对误差(MAE)、平均绝对百分比误差(MAPE)和拟似然损失(QLIKE)四种损失函数,通过比较日波动率的实际序列和预测序列计算损失函数来评估各模型的波动率预测性能。
(11)
(12)
(13)
(14)
其中,
为实际的收益率,用股指收益率的平方作为其代理变量,
为各模型估计出来的条件方差。MSE、MAE、MAPE、QLIKE的值越小,表明预测值与实际值的差异越小,模型的预测性能越好。
Table 3. Volatility forecasting evaluation results
表3. 波动率预测评价结果
模型 |
MSE |
MAE |
MAPE |
QLIKE |
GARCH |
6.1338e−08 |
1.4313e−04 |
4.9398e+00 |
1.4467e+00 |
GM-RV |
6.0562e−08 |
1.4129e−04 |
4.7632e+00 |
1.4242e+00 |
GM-EPU |
6.0285e−08 |
1.3986e−04 |
4.7934e+00 |
1.3884e+00 |
GM-SK |
5.9918e−08 |
1.3452e−04 |
4.5360e+00 |
1.3952e+00 |
GM-SKEPU |
5.8417e−08 |
1.1975e−04 |
3.0759e+00 |
1.3880e+00 |
图3展示了真实波动率与各模型预测波动率的趋势对比。可以看出,各模型的预测效果存在差异,其中传统GARCH模型的预测结果较为平缓,对极端波动识别能力较弱,与真实波动率的偏离较大;相比之下,融合长期波动成分与时变高阶矩的模型表现更为优异,其对市场变化的敏感度和适应性更强。表3给出了波动率的样本外预测评价结果,从表中可以看出,GARCH-MIDAS类模型在各种评价指标下的损失函数值均小于GARCH模型,即GARCH-MIDAS类模型对股指波动率的预测效果优于传统GARCH模型。此外,GM-EPU模型和GM-SK模型相比GM-RV模型均具有较低的损失函数值,表明引入CEPU指数和时变高阶矩能够改善模型对股指波动率的预测性能。最后,综合所有结果来看,GARCH-SKEPU模型的损失函数值要低于所有基准模型,即GARCH-SKEPU模型具有最优的预测性能。说明在股指波动率预测的过程中同时考虑时变高阶矩与经济政策不确定性影响具有重要意义。
4.3. DM检验
为从统计意义上评估各模型的预测精度差异,本文采用Diebold-Mariano (DM)检验[13]对样本外预测结果进行显著性检验与比较分析。DM检验通过比较两个模型的预测误差损失函数差异来评估其预测性能是否具有统计显著性差异。具体而言,定义损失差异序列为
(15)
其中
为选定的损失函数,
和
分别为模型A和模型B在时间
的样本外预测误差。DM检验统计量可表示为
(16)
其中,
为损失差异的样本均值,
为
的长期方差的一致估计量,
为样本外预测期数。检验的原假设为两模型预测精度无显著差异,即
。故本文以GARCH模型为参照函数,采用MSE、MAE、MAPE、QLIKE作为损失函数进行DM检验。
Table 4. The DM test results for each model
表4. 各模型的DM检验结果
模型 |
MSE |
MAE |
MAPE |
QLIKE |
GARCH |
0 |
0 |
0 |
0 |
GM-RV |
2.1445*** (0.0000) |
1.4779*** (0.0000) |
1.6873*** (0.0000) |
2.2561*** (0.0000) |
GM-EPU |
2.7667*** (0.0000) |
2.0111*** (0.0000) |
1.4601*** (0.0000) |
5.1469*** (0.0000) |
GM-SK |
6.4315*** (0.0000) |
2.1542*** (0.0000) |
1.7175*** (0.0000) |
5.8358*** (0.0000) |
GM-SKEPU |
7.7593*** (0.0000) |
2.3382*** (0.0000) |
1.8639*** (0.0000) |
5.8702*** (0.0000) |
注:表中为DM检验统计量的值,括号内为DM检验的P值,***表示在1%显著性水平下显著。
根据表4中各模型样本外预测的DM检验结果可知,在1%显著性水平下,所有DM统计量都显著拒绝预测性能相等的原假设,并且所有统计量都是正值,表示所考虑的模型均优于GARCH模型。其中GM-EPU、GM-SK、GM-SKEPU模型的DM统计量均大于GM-RV模型,说明在刻画股指波动与其长期成分时,经济政策不确定性与时变高阶矩相比于已实现波动率包含更多有价值的补充信息,且在所有检验中GM-SKEPU模型的DM检验统计量最大,表明GM-SKEPU模型在预测股指波动率方面具有显著的优越性,即CEPU指数与时变高阶矩的同时引入能够显著改善模型的波动率预测精度。
5. 结论
本文在GARCH-MIDAS模型框架内融合了时变高阶矩与低频宏观经济政策不确定性指数(EPU),构建了扩展的波动率预测模型,以考察中国股市收益率分布的动态高阶矩特征及经济政策不确定性对股市波动的影响机制。以沪深300指数为样本进行的实证研究发现,样本内估计结果表明经济政策不确定性对股市波动具有显著正向作用,且收益率分布的时变高阶矩特征较为显著;样本外预测结果显示,该模型在DM检验中优于基准模型,验证了引入CEPU和时变高阶矩对提升波动率预测精度的有效性。本研究不仅从方法论层面拓展了GARCH-MIDAS类模型的建模维度,也为理解政策不确定性对股市波动的影响机制提供了新的实证支持。研究结论对投资机构与监管部门识别市场风险、构建稳健的风险管理体系具有参考价值,同时也为后续结合宏观政策环境与收益率分布动态特征的市场风险研究提供了可扩展的理论框架。
基金项目
重庆理工大学研究生创新项目(项目编号:gzlcx20253363);重庆理工大学项目概率分布的若干变换研究及应用(项目编号:2020CCZ046);重庆市教委科学技术研究项目(项目编号:KJQN202502003)。
NOTES
*通讯作者。