1. 引言
我国的证券市场已经成为了国民经济中一个重要的组成部分,在现代经济发展和国家经济建设上发挥着举足轻重的作用。当前股票市场投资也成为了一个大众理财的工具,走进了千家万户的视野。越来越多的股民开始热衷于股票市场高回报的同时,也应该关注股票市场的高风险。随着股票市场规模的扩大,股票价格趋势预测也成为基本的关注对象,在此背景下,股价走势成为学者们重要的研究方向。本文选取股票指数中较为代表的上证指数基于GARCH模型建立股票指数价格预测模型,再结合VaR模型进行金融风险预测。
2. 文献综述
罗琰、谷政(2021) [1] 利用VaR工具,在委托代理框架下,研究了科技保险风险补偿合同问题,阐述了科技保险风险补偿的理论依据。在对称信息与非对称信息情形下,获得了风险补偿合同的闭式解。结论得到,合同中固定补偿将起主导作用,最优边际补偿系数可正可负,且随保险公司置信水平增加而递减。陈倩文(2015) [2] 基于互联网理财产品的推行,引用GARCH模型对互联网理财收益率进行风险分析,得到当时互联网金融产品的市场风险仍处于可控范围内,波动性较小。王向翠和董佳慧(2009) [3] 对VaR准确性检验的失败检验法进行了分析,提出了一种新的失败检验法,即贝叶斯检验法。并与传统的正态近似法和Kupiec检验法进行了比较,说明了贝叶斯检验法的合理之处。
郑文通(1997) [4] 具体分析金融风险管理中的VaR模型在国外兴起的具体使用,包括期初在国外银行经营与管理中的应用。刘瑾、施建准(2008) [5] 将残差项服从t分布的ARCH类模型应用于我国外汇风险的计量,通过美元对人民币汇率日波动率VaR值的实证发现;ARCH类模型预测得到的VaR值能很好拟合美元对人民币的汇率日波动率,其中以TARCH-M(1,1)模型计算结果最为理想。
艾兴(2023) [6] 选取城市商业银行历史数据中的汇率波动和股票价格波动为研究对象,将GARCH模型推广到汇率风险领域,得到无论是汇率风险还是股票价格风险的量化分析,GARCH模型适用范围均要广于TGARCH和EGARCH模型,并得到城市商业银行的股票价格风险远大于汇率风险。
何雷雨航(2021) [7] 针对2018年至2020年“招商中证白酒指数”基金的收益率作为训练集,利用多种VaR模型分析其收益率的波动性质。得到MCMC-GARCH-VaR模型精确度更高,为投资者提供更准确的基金风险信息,以便选择更合适的投资方案。徐伟民、肖坚(2022) [8] 以“碳达峰”、“碳中和”为政策指引,为进一步提升中国碳市场发展水平,结合国内六大交易所交易价格数据,采用GARCH-VaR模型预测了中国碳金融交易价格风险水平。研究发现,中国碳交易价格总体来说风险水平较高,六个交易市场金融交易价格风险从大到小依次是上海、北京、深圳、福建、广东和湖北;应进一步明确碳金融交易的价格风险的监管重点。
本文参考前人文献对模型选择和VaR值计算方式选择做出合理判断,结合前人文献和具体研究对象数据结选择合适的回归模型。也根据前人文献中对数据判断的空白做出补充,将上证指数在具体回归前的数据检测内容较为完整的补充还原。前期的数据预处理对后期模型回归的真实性、可靠性有着重要的说服力,前人文献专注于对不同研究对象的模型还原和拟合效果的好坏,在此之上,本文依据研究对象上证指数具体的价格数据出发,进行多项数据检验,为后期数据模型回归拟合效果做出铺垫。
3. 模型介绍
GARCH模型被称为广义自回归条件异方差模型,是Engle (1982) & Bollerslev (1986)提出并发展的,该模型主要适用于金融研究领域中批量数据的量化预测问题,特别适用于大量金融时间序列数据的波动分析。式(1)和式(2)显示了该模型的基本方程形式,其中x为待分析序列,µ为序列x的期望均值,ɛ为残差,σ为序列x的波动方差。
α、β、γ为待估计系数,p和q代表了前期方差和前期残差的最大滞后阶数,此时称式(2)为GARCH(p,q)模型,即分别含有p个GARCH项和q个ARCH项。式(2)的含义是,序列x第t期的方差受到不变方差α、前期方差估计值
和前期新信息残差
的共同影响。这说明如果序列x第
期的方差
较大时,交易者会对下一期方差
估计的更大,即金融时间序列数据往往表现出波动集群特征。如果式(2)中p和q同时等于1,则方程(2)变为方程(3)为GARCH(1,1)模型,即模型中含一个ARCH项和一个GARCH项。
(1)
(2)
(3)
在金融时间序列分析中应用最多的模型为GARCH(1,1)模型,该模型平稳的充分必要条件是式(3)中
。
为了评估企业、证券或投资组合的风险,人们可以使用各种衡量标准,如标准差、方差、贝塔值、夏普比率。但是,大多数公司的高管喜欢简单的数值。常用的一个衡量指标是在险价值,它可被定义为“在预定时期内,在某一置信水平上,最大的损失”。金融市场中有几种类型的风险,其中三个主要类别的金融风险时信用风险、流动性风险和市场风险。VaR主要讨论市场风险,但是它也可以应用于其他类型的风险。VaR是在某个风险范畴中的机构的头寸在一个给定持有期间内可以会由于一般的市场运动而降低所带来的损失的统一估计。VaR值的计算有三种最常用的方法:参数法、历史模拟法、蒙特卡洛模拟法。基于收益为正态分布,利用均值、方差、协方差进行参数估计,样本数据多且独立,对于不服从正态的风险因子也能适用。
4. 数据选取和描述性统计
本文选取2000年1月1日至2022年11月28日以来所有交易日的上证指数波动情况进行分析,利用Eviews10.0软件进行GARCH模型拟合,寻找到最优拟合回归模型;再利用EVIEWS中的Forest和已经建立的GARCH模型结合,最后建上证指数的VaR金融风险预测值模型,对上证指数金融风险进行量化预测。本文数据全部通过wind数据库获取。
由于金融时间序列的条件分布具有高峰、厚尾、时变、偏斜、波动群集等特征,GARCH模型的峰度比正态分布更高,因此出现极端值的可能性更高。只有在椭圆分布情况下相关系数表示随机变量之间的相关性,但是在实践中多元椭圆分布假定很难满足。因此相依性往往是错的,而GARCH模型可以分开相依结果和边缘分布。

Figure 1. Log-difference statistical chart of Shanghai Stock Exchange Index
图1. 上证指数对数差分统计图
从图1中可以看出,上证指数对数差分得到的统计图中的均值为0.000143%,标准差为0.015184,说明有较小程度的偏离;因为偏离程度为−0.346022,从而说明价格分布呈现一定程度上的左偏,峰度为8.128371大于3,说明其呈现“尖峰后尾”的特征,从JB检验统计量为6664.651的伴随概率为零,这个情况说明,统计结果拒绝原先的假设,也就是说,上证指数收益序列是不服从正态分布的。
5. 平稳性检验(单位根检验)
本文采用ADF单位根检验序列的平稳性,由图2可以看出上证指数收益序列的ADF的统计量为−75.64599,并且伴随概率为0.0001小于1%~10%的置信水平的ADF值,所以在置信水平1%的情况下拒绝上证指数收益序列有1个单位根的原假设,即从2022年1月1日至2022年11月1日以来的交易日上证指数收益序列是平稳的。研究对象上证指数收益序列数据平稳,通过单位根检验,可以继续进行后续数据模型检验操作。

Figure 2. Unit root test *MacKinnon (1996) one-sided p-values
图2. 单位根检验
6. ARCH效应的自相关函数检验
ARCH效应的自相关函数检验的方法主要是根据残差平方序列的自相关图和自相关函数值计算的Q统计量判定是否存在ARCH效应。如果残差平方序列的自相关图出现“拖尾现象”,则说明原序列存在ARCH效应,如果残差平方序列的Q统计量的伴随概率都小于显著性水平,则说明原序列存在ARCH效应,由自相关函数检验结果可以看出自相关函数图呈现衰减态势。
由图3可知研究对象上证指数收益序列数据自相关性存在2阶截尾,偏自相关性存在“拖尾”现象。则选取建立MA(2)模型,又由图3可知上证指数收益序列存在序列自相关性,以此可以引入ARMA项在回归方程中,并继续进行下面ARCH-LM检验。
7. GARCH效应的ARCH-LM检验
对上证指数收益序列进行自相关检验,发现存在序列自相关,因此在均值方程中加入ARMA项,并且再次基础上对两个序列的残差项进行ARCH-LM检验。ARCH-LM检验主要是通过输出的F统计量以及卡方统计量来判断是否存在ARCH效应,检验结果如图4所示。
观测上面图中数据残差序列F统计量和卡方统计量的伴随概率P值都小于0.05,接受残差序列存在ARCH效应的原假设,因此ARCH-LM检验结果认为残差序列存在ARCH效应,即两个序列均具有条件异方差特征,由此可以建立GARCH模型。
8. GARCH模型的建立
本文建立上证指数收益序列2000年1月3日至2022年11月28日时间序列,对自身滞后性回归的AR模型,根据单位根检验的结果最终建立上证指数收益波动序列的GRACH模型,GARCH模型:
(4),对GARCH、EARCH、TARCH模型参数选取的下表。为了确定模型以及模型中的参数,在建立模型前需要对参数取值进行多次拟合,以得到拟合效果尚好的模型。判断拟合效果的方法为AIC准则,即AIC的值越小,拟合效果越好。为了弥补AIC准则的不足之处——AIC准则拟合效果会受到数据大小的影响,本文通过AIC (赤池信息准则)、BIC (贝叶斯信息准则)最小准则来确定GARCH模型中的参数取值,AIC和BIC的平均值越小,模型拟合的效果越好。

Table 1. GARCH model fitting comparison table
表1. GARCH模型拟合对比表
经过上表1的拟合结果对比,对2000年到2022年11月28日上证指数收益波动模型参数选取决定构建ARMA(2,2)、GARCH(1,1)模型,利用EVIEWS构建均值模型结构如下图5。
由下图5可知,本文中建立的自回归模型回归因子系数的伴随概率P值均等于零,表明参数的结果是非常显著地,上证指数收益波动序列具体的回归方程如下:
(4)
(5)
其中,Rt为第t天的对数差分,
为第t天的方差。从估计结果可以看出,所建立的GARCH(1,1)模型中,
,因此GARCH(1,1)过程是平稳的,条件方差ARCH和GARCH项都属于高度显著地,因此,对数差分序列具有明显的波动集簇性。

Figure 5. Results of mean model construction
图5. 均值模型构建结果
对构建好的均值方程再进行ARCH-LM检验,结果如下图6。F统计量和卡方统计量的伴随概率P值都大于0.05,不接受残差序列存在ARCH效应的原假设,因此ARCH-LM检验结果认为均值方程残差序列不存在ARCH效应,即构建好的均值方程不具有条件异方差特征,模型拟合良好。
9. 基于GARCH模型下的VaR模型
在我国股票市场迅速发展中,上证指数可以大致描述上海证券交易所内全部股票形势的大致状况。本文通过网易财经平台选取上证指数作为研究对象,选取的时间为2000年1月1日至2022年11月28日以来的所有交易日情况,22年的数据样本能够更全面地分析股票波动情况。
VaR指的是在一定的置信区间下的风险价值,常用来衡量金融风险及金融资产在未来某一时间内所面临的最大损失。主要由三种计算方法:历史模拟法、方差–协方差法、蒙特卡洛模拟法。方差–协方差法建立在多种因素因子条件下,也可以简化VaR值计算,所以本文选取方差–协方差法进行上证指数收益序列金融风险值的计算。基于上述建立的模型计算出方差的预测值,对处理好的数据计算VaR和实际损失,损失值的计算前一天的收盘价减去后一天的收盘价,即
。本文采用的计算方法是基于GARCH模型计算的VaR值,由
(7),其中,
是
天的股票收盘价,Za为置信水平下分位数,显著性水平95%,计算得到
,σt是对数差分的标准差,部分结果显示如下表2所示。

Table 2. Partial prediction results based on VaR model
表2. 基于VaR模型的部分预测结果
依据GARCH-VaR模型进行预测未来上证指数收益价格序列,得到如上表2结果,可以观测得到2022年一月份至十一月份底的上证指数收益预测情况。将模型预测结果与实际数据进行对比发现,误差在合理范围内。证明本模型的准确性和科学性,可以根据具体研究对象的不同进行灵活应用。
10. 结论
基于国内外已有的模型研究成果,本文研究了基于GARCH模型计算上证指数的VaR风险值。通过对未来上证指数价格的变化趋势以及评估潜在的投资损失,判断上证指数何时能以低风险获得高利润。在95%的置信水平下所建立GARCH(1,1)-VaR模型,实证分析结果表明,由于解决对称的序列并且使用方差–协方差法计算上证指数收益序列的金融风险VaR值,GARCH模型更适合模型预测。投资者在选择投资组合时,可以把所预测的风险值作为整个组合潜在风险的参考。此模型适用于不同的股票收益序列,在一定程度上可以提前预测股票价格的波动范围,评估可能的投资损失,更好地掌握股票走势,获得投资盈利。
基于上述研究结论,本文就上证指数收益序列风险管理突出以下建议。第一,充分发挥市场风险管理部门的作用,加强对上证指数的实时监控,及时做出风险管理决策;第二,VaR模型方式预测股指价格本身存在一定的局限性,因此要具体结合市场动态实际情况,综合判断市场风险大小,不可过度依赖模型预测结果。