1. 引言
自从2008年金融危机爆发以来,广大投资者和研究者都希望金融市场能具有提醒投资者和管理者抵抗非预期风险的能力。随着我国资本市场的进一步开放,我国的金融机构面临的风险将更加复杂,金融市场管理、金融监管原则和技术都要和国际接轨 [1] 。VaR方法作为国际上衡量金融风险的领先技术,必将给我国的风险管理工作带来一定的借鉴,在风险管理的实践中产生很大的现实意义。
1994年JP Morgan公布了Riskmetrics体系,对VaR模型的原理和计算方法进行了系统的总结,由于VaR计算简单,易于理解及其合理性,很快受到推崇和研究。Riskmetrics在第一版技术文件中对VaR的原理做了详细的阐述,包括历史模拟法、参数法、蒙特卡罗模拟法等具体模型原理的说明 [2] ;在第二版技术文件中,对非线性期权头寸的风险计量方法与如何处理实际分布的非正态性进行了补充 [3] ;后又分别对理论界与实务界提出的问题与建议进行了研究和改进工作 [4] 。2001年,巴塞罗那委员会正式指定VaR方法作为银行风险度量的标准。新Basle协议依据VaR方法对跨国银行的市场风险提出了具体的监管措施,使VaR方法成为金融风险管理的国际标准和理论基础。Zhang等在研究投资组合风险时,引入连接函数(Copula)方法,并与历史模拟法、均值-方差法、DCC-GARCH方法进行了比较 [5] 。Foroni在混合频率VaR中引入状态转换方法和马尔科夫模型,提出了MSMF-VaR,通过实证表明在国民生产总值和经济预测方面效果较好 [6] 。Marcucci通过比较不同的GARCH模型在持有期为一天到一个月内对股市波动率的预测能力,发现在短于一星期的持有期内,具有马尔科夫结构转换的GARCH模型(MRS-GARCH模型)比单一结构的GARCH模型对股市的VaR的估计效果更准确 [7] 。
国内对VaR方法的研究起步较晚,最早研究是郑文通的《金融风险管理的VaR方法及其应用》。我国许多学者主要应用波动模型来描述金融市场的波动性,估计VaR值,对我国的金融市场风险进行深入分析。主要采用的波动模型包括GARCH模型、EGARCH模型、MRS-GARCH模型等 [8] 。范英通过对VaR方法的深入研究,并对股票市场在不同置信水平下的风险值得实例计算,表明将VaR方法用于我国股票市场的投资风险分析是可行的 [9] 。魏捷等以我国上证指数为例探讨了用GARCH模型计算VaR的新方法 [10] 。郭名媛和张世英提出了基于MRS-GARCH模型的VaR方法,并对上海股票市场的风险进行了实证分析,结论证明MRS-GARCH模型计算VaR值更加有效 [11] 。罗健英等针对中国钢铁期货市场波动率具有的结构突变特征,使用MRS-GARCH模型对其波动率建模,实证结果表明基于MRS-GARCH模型下的VaR方法能够有效地测度出钢铁期货市场的风险变化 [12] 。
这些模型大都没有考虑波动结构变化,MRS-GARCH模型考虑了结构波动变化,在一定程度上可以对波动率结构发生突变前后的不同状态进行建模,从而得到不同状态下的定量模型,但是MRS-GARCH模型在进行参数估计时需要先用GARCH模型对时间序列的数据进行模拟估计波动率,再根据波动率大致的范围主观确定一个基准对波动率状态进行划分,最后用MRS-GARCH模型对样本数据再进行一次模拟。此种划分方法难免存在主观性差异,影响模型对样本数据模拟的精确度。
因此本文采用隐马尔科夫结构转换GARCH模型,即HMM-GARCH模型(Hidden Markov regime switching GARCH model)来度量我国金融市场的波动,并估计VaR值,希望为相关领域的研究提供一个参考方案。
2. 波动率模型及其估计方法
2.1. GARCH模型
GARCH模型是由Bollerslev [13] 基于ARCH模型提出的一个推广形式,广义ARCH模型。由于GARCH模型能够捕捉金融时间序列中一些重要的特征,例如,随时间变化的异方差性和波动率聚集性,使其成为波动率研究中一个标准方法。
一般的GARCH模型:
(1)
其中
表示金融时间序列,
是均值为0、方差为1的独立同分布随机变量序列,
是条件方差,即条件波动率。
,
(这里对
,对
)。对
的限制条件是保证
的无条件方差是有限的,同时条件方差
是随时间变化的。通常假定
服从标准正态分布或标准化的学生-t分布或广义误差分布(GED)。
2.2. MRS-GARCH模型
由于GARCH模型在对波动率进行预测时,假设条件波动率在整个时期只有一个机制,没有考虑到突发事件和预期的改变等冲击可能会使影响金融资产价格的结构发生显著变化,前后往往表现出不同的特征,为了反映这种结构性变化,将马尔科夫状态转换方法引入波动率模型中,刻画了金融资产在不同状态下的特征及其转换行为。MRS-GARCH模型的形式为:
(2)
表示
在
时刻的状态,
都是依赖于
时刻状态为
的参数。
状态之间的转移服从一阶马尔科夫过程:
(3)
表示状态
到状态
的一步转移概率。
表示状态的个数。本文只考虑两个状态。则转移概率矩阵为:
且有
。
对于MRS-GARCH模型的估计一般使用极大似然估计,待估参数为
。为得到样本的对数似然函数,需要进行滤波过程。对数似然函数为
,其中
,
表示
时刻的信息集。通过计算可以得到极大似然估计
。
2.3. HMM-GARCH模型
2.3.1. 隐马尔科夫模型的理论知识
隐马尔科夫模型是由两个随机过程组成的一个双随机过程,用来描述一个含有未知参数的马尔科夫过程。主要从可观察到的变量中确定该过程的隐含参数,然后再用这些参数进行下一步分析。
隐马尔科夫模型可以由一个五元组
表示,其中:
表示隐含状态数量。隐含状态之间满足马尔科夫性质,是马尔科夫模型中实际隐含的状态。
表示可观察状态数目。可观察状态在模型中与隐含状态相关联,可通过直接观察得到,可观察状态数目
不一定要和隐含状态数目
一致。
表示隐含状态转移概率矩阵。可以表示为
,
表示在
时刻从状态
转移到
的概率,其中
。
表示观察状态概率矩阵。
,
表示在
时刻从状态
中选择观察特征为
的概率,其中,
。
:表示初始状态的概率分布,
,
,
表示在
时刻选择状态
的概率,其中,
表示
时刻的状态,
。
2.3.2. HMM-GARCH模型
由于HMM-GARCH模型与MRS-GARCH模型都是基于GARCH模型对市场结构突变发生前后不同状态的波动率进行估计,只是两者对状态的分类方法不同。因此两者的波动率模型相同,具有相同的表达式:
(4)
表示
在
时刻的状态,
都是依赖于
时刻状态为
的参数。并且状态之间的转移服从马尔科夫状态转移概率矩阵
。
2.3.3. HMM-GARCH模型
HMM模型的参数估计通常使用Baum-Welch算法。具体思想是:首先给定一个观察序列,调整模型参数
,使其产生观察序列的概率
最大,再利用迭代过程确定模型的参数。实际中,在给定的观察序列有限时,不存在一个最佳的方法来估计
,只可能找到某些方法,让参数
在特定的几个性能上有较强的优势。在这种情况下,Baum-Welch算法利用递推的思想,使得条件概率局部最大,最后得到模型参数的最终估计值。具体步骤如下:
首先在给出模型参数和观察序列的前提下,定义
表示t时刻的状态为
,
时刻的状态为
的概率,
表示t时刻的状态值,即
(5)
根据向前和向后变量的定义,可以将
写成下面的形式:
(6)
其中,分子为
。定义
为t时刻状态为
的概率,则
(7)
将
关于t求和,得到
,为从状态
转移出去的期望次数,将
关于t求和,得到
,为从
转移到
的期望次数。
模型的参数
也可表示为:
(8)
其中,
表示
时刻状态
出现的概率。即把原来的参数
更新为
,Baum [14] 证明了一般情况下
,即
更接近于优化目标,因此经反复迭代就可以得到
的极大似然值,而且满足
。
在实际应用中,常常假设观察序列服从连续分布,建立连续HMM模型,参数
为观测概率密度函数,可近似的表示为多个混合正态分布的组合。连续概率密度函数为:
(9)
是混合分布的个数,
是在隐状态
时第
个混合分布的权重,且
。
其中使用最多的是高斯分布,且均值是
,协方差是
,那么
。
当隐状态为
时,第
个正态分布产生的显状态的均值和协方差为
(10)
多个混合正态分布的函数可表示为
时,
(11)
首先随机产生几组数值,包括初始状态的概率分布
、状态转移矩阵
、可近似表示为混合正态分布的观测概率密度函数
,运用Baum-Welch算法对数据集进行训练,经过多次迭代后,当达到设定的阈值时,停止计算,参数逐渐趋于最优值。
通过这些计算可以得到波动率状态的划分结果,为建立结构突变前后不同状态的波动率模型提供基础。
3. VaR方法及其检验
3.1. VaR方法
VaR表示处于风险中的价值,是指在市场正常波动下,某一金融资产或证券组合面临的最大可能损失。根据Jorion [15] 定义,VaR是在一定置信水平下,某一金融资产或证券组合在未来特定的一段时间内的最大预期损失,可用公式表示为:
(12)
上式表示资产价值损失小于等于可能损失上限的概率,其中,
表示某一金融资产在一定持有期
的价值损失额,
为置信水平。
根据VaR的定义,首先假设金融资产的初始价值为
,收益率
服从正态分布
,
为正态分布下置信水平为
的标准正态分布的分位数,则在
概率水平下,有
(13)
若持有期为
,可得均值和标准差为
和
,公式可以写为
。因此在假设下,只要估计出金融资产的波动率
,则可求出其VaR值,在本文的VaR估计中,波动率
将通过GARCH模型、MRS-GARCH模型和HMM-GARCH模型估计,在实证中假设只考虑1天的持有期,令
。
同理可知道 [16] ,当金融资产收益率服从学生t分布或GED分布时,可得到VaR的计算公式:
学生t分布:
(14)
表示自由度为
的学生t分布的
分位数,
表示滞后一期的股票收盘价格。
GED分布:
(15)
表示滞后一期的股票收盘价格,
表示在置信水平
下的分位数。
3.2. VaR检验
本文采用Kupiec提出的失败频率检验法对VaR的估计结果进行检验,即是考察实际损失超过VaR的概率。实际损失计算公式为
,即当期收益率与当期价格乘积 [17] 。
用
表示样本总数,
表示样本中实际损失大于VaR值的个数,即失败的次数,且有
,则
表示失败率。Kupiec提出的似然比检验的原假设是基于样本期计算得到的失败率与估计的VaR的左尾概率无显著性差异,原假设
。检验统计量为:
(16)
在原假设成立的情况下,统计量LR服从自由度为1的
分布,其非拒绝域为:
(17)
4. 实证研究
农业属于第一产业,在我国的经济建设中具有战略性的地位,农业的健康发展是推动工业文明不断前进和建设社会主义和谐社会的重要基础和物质保障,其发展状况直接关系到我国改革开放和现代化建设全局。随着农业产业化经营的发展以及中国股票的建立,农业上市公司开始顺应农业现代化的要求而不断出现;2004年至2014年连续11年中央“一号文件”中农业新政策的提出,为农业经济发展在宏观方面创造了条件,对于农业上市公司来说也提供了新的发展机遇。因此本文基于农业上市公司的股票,建立基于状态转换的GARCH类模型来度量我国金融市场的波动,并估计VaR值,希望为农业方面的研究与发展提供一个参考方案。
4.1. 样本选取与数据预处理
为了研究农业上市公司股票价格的波动特征,本文数据选择北大荒股票(600598)每日的收盘价为研究对象,考虑到中共中央在2004年1月至2014年月连续11年发布农业、农村和农民为主题的中央一号文件,同时考虑到我国从2001年开始实施股票交易制度的新规则,方便以后研究国家农业经济政策对农业上市公司股票价格波动的影响,选取时间范围是从2005年1月4日至2017年4月11日,样本数量为2881,数据来源于同花顺股票软件。本文将数据分为样本内和样本外两部分,其中样本内数据:2005年1月4日到2016年11月11日共2781个,用于模型的建模;样本外数据:2016年11月12日到2017年4月11日共100个数据,用于检验模型的预测效果。选取的这段时间是全球受金融危机影响,在这段时间我国股市也受其影响,波动现象严重,因此适合于考察中国股票市场收益率的波动特征。本文的数据处理均采用R3.3.2软件进行处理。
为了研究北大荒股票的股票价格波动和风险价值,先对其数据的基本统计特征进行分析。通过统计分析,我们可以了解北大荒公司的收益率是否具有“尖峰后尾”分布特征,观察收益率序列是否服从正态分布的假设,是否可以利用GARCH模型对股票数据价格波动进行估计。
在对日收益率的处理上采用对数收益率
,其中,
表示
时刻北大荒的日收盘价,通过计算可以得到2780个收益率。
4.2. ARCH效应检验
4.2.1. 农业上市公司股票价格波动的统计特征分析
图1是北大荒股票2780个收益率的时序图。从图1可知,收益率在0处上下波动,而且较大的波动
后面会跟着一个较大的波动,同时较小的波动后面会跟着一个较小的波动,这说明北大荒日收益率具有集群性特征。这也验证了收益率的方差与时间有关,具有异方差性,即过去的收益率波动会影响未来的收益率波动。
图2给出了收益率序列的直方图。由计算结果可知,北大荒对数收益率序列均值为0.000224,表明整体收益是大于0的;标准差为0.032538,偏度为−0.452,小于0,说明序列分布有较长的左拖尾。峰度

Figure 1. Day logarithmic yield sequence
图1. 日对数收益率序列

Figure 2. The histogram of return sequence
图2. 收益率序列直方图
为3.197,高于正态分布的峰度值3,说明收益率序列具有“尖峰后尾”的特征。Jarque-Bera统计量为1281.1599,远大于在5%的显著性水平下的临界值5.99,P值为0.000000,拒绝该对数收益率序列服从正态分布的假设。从其正态Q-Q图也可进一步得出收益率序列的非正态性,图3中可以看出收益率序列在正态直线外散布有大量的点,数据点组成的线呈曲线状,左右尾均有明显的摆动,说明实际分布两侧具有后尾现象。所以,可以判断该收益率不服从正态分布。
4.2.2. ARCH效应检验
(1) 对收益率
序列进行平稳性检验
通过计算可得,ADF统计量为−37.7574,均显著小于1%、5%和10%下的临界值,因此,北大荒收益率序列是平稳的,可用于建模。
(2) 对样本收益率的自回归进行检验
为了确定其均值方程,对收益率序列采用最小二乘估计,得到最优模型是ARMA(1,1),具体均值方程表达式为:
。
经检验ARMA模型中估计参数所对应的P值显示均显著,表明该模型是可靠的。并且上述模型的每个统计检验结果都通过检验。对模型的残差以及残差的平方的自相关系数进行分析,经检验得出残差序列不存在序列相关性。
(3) ARCH效应检验
对上述均值方程的残差序列进行ARCH-LM检验,验证结果如图4。
由图4可以看出在高阶时P值仍为0,说明该序列具有高阶的ARCH效应,因此可以考虑建立GARCH(p,q)模型。
4.3. GARCH类模型的建立
由于对数收益率序列拒绝了正态分布的假设,本文则建立了基于广义误差分布(GED)下的GARCH

Figure 4. The test result of ARCH effect
图4. ARCH效应检验结果
模型,暂不考虑学生t分布。
4.3.1. GARCH模型
对收益率序列建立ARMA-GARCH,使用R软件进行参数估计,可得出ARMA-GARCH模型的均值方程和方差方程表达式:
GED的自由度为1.242,小于2,说明GED分布相对于标准正态分布有厚尾。
4.3.2. MRS-GARCH模型
通过对北大荒的股票收益率建模,得到的MRS-GARCH模型可表示为:
当
时,即正常波动状态下模型为:
当
时,即异常波动状态下建立的模型为:
得到状态的一步转移概率矩阵为
表明正常状态的稳定性高于异常状态,这一点与实际相符。基于马尔科夫的GARCH模型,
,
均小于1,说明基于马尔科夫建立条件异方差模型有助于降低波动的持续性,提高模型的可预测性。
4.3.3. HMM-GARCH模型
首先对时间序列建立隐马尔科夫模型,将股票市场分为正常状态与异常状态。假设初始时刻为正常状态的概率为1,异常状态为2。运用R3.3.2软件,用Baum-Welch算法估算模型的参数,再采用Viterbi算法给出隐状态序列的最佳估计。大幅度的波动存在重要的信息,在处理时我们选择保留。小幅度的波动看作噪声,具有干扰的作用,不具有分析和预测价值,因此,在处理时只选择将小幅波动的噪声去除,保留有用信息,防止信号过度失真。
通过分析正常状态与异常状态下的数据,分别建立GARCH模型。
当
时,即正常波动状态下的模型为:
当
时,即异常波动状态下的模型为:
得到一步状态转移概率矩阵为:
表明正常状态的稳定性高于异常状态,与实际相符。在基于隐马尔可夫模型的GARCH模型中,
,
,均小于1,说明基于隐马尔科夫模型建立条件异方差模型有助于降低波动的持续性,提高模型的可预测性。
4.4. VaR的计算与检验
根据建模得到波动率方程,可以计算出波动率
的估计值,从而利用VaR的计算公式可以算出北大荒股票收盘价的日VaR值,由于经检验北大荒股票数据拒绝了正态分布,本文研究的是基于GED分布下的情况,因此VaR的计算公式为
。
本文采用估计的GARCH-GED模型、MRS-GARCH-GED模型、HMM-GARCH-GED模型对北大荒股票的日VaR值进行了计算,分别计算了左尾概率为1%和左尾概率为5%时的VaR值。其失败频率检验结果见表1。
根据表1的检验结果,可以得到以下结论:
1) 对于不同的波动率模型计算VaR值,基于GARCH模型与MRS-GARCH模型估计的VaR值全部通过了检验,而HMM-GARCH模型估计的VaR值在置信水平为95%时未通过检验,说明对于北大荒股票数据,基于GARCH模型与MRS-GARCH模型的VaR估计方法优于HMM-GARCH模型的VaR估计方法。
2) 在95%和99%的置信水平下,HMM-GARCH模型的失败率均小于GARCH模型与MRS-GARCH模型的失败率,并且在99%的置信水平下,HMM-GARCH模型的失败率为0,估计VaR值比另外两个模型估计的VaR值更接近实际损失,其估计最理想。因此,基于HMM-GARCH模型的VaR方法优于GARCH模型与MRS-GARCH模型的VaR方法。
3) 置信水平越高,各种方法计算的VaR值越大,并且失败率越小。
总结以上结论,对于北大荒股票数据,虽然HMM-GARCH-VaR方法在置信水平为95%时未通过检验,但是其失败天数明显少于其他两个模型,并且在99%的置信水平下,失败率为0,估计效果很好,

Table 1. The statistical results of VaR failure frequency test
表1. VaR失败频率检验统计结果
则说明基于HMM-GARCH模型的VaR方法比基于GARCH模型与MRS-GARCH模型的VaR方法能更好的描绘和预测该股票的风险。
5. 结论
本文主要研究了基于状态转换GARCH模型的VaR实证分析。首先简单介绍了状态转换GARCH模型和其参数估计方法。再利用R3.3.2软件对北大荒股票数据进行基本统计分析,包括正态性检验、平稳性检验、异方差检验,选取拟合较好的GARCH模型,分别在95%、99%置信水平下计算VaR值,利用Kupiec提出的失败频率检验法检验模型的准确性和精度。
经过对北大荒的股票收盘价统计分析,其收益率序列具有尖峰后尾性,因此拒绝正态分布的假设,则本文研究了基于广义误差分布(GED)下的波动率模型,分别建立了ARMA(1,1)-GARCH(1,1),MRS-GARCH(1,1),正常状态下的HMM-GARCH(1,1),异常状态下的HMM-ARMA(2,3)-GARCH(1,1)。结果表明基于隐马尔科夫模型的条件异方差模型可以有效降低GARCH模型高估波动持续性的问题,较好的刻画了波动的集聚性、时变性和波动的结构性转变等特点。然后利用估计的波动率模型分别计算了置信水平为95%和99%的VaR值,用Kupiec-失败频率检验法对估计的VaR值进行检验。实验结果表明对于本文所选的股票,基于HMM-GARCH模型的VaR方法比基于GARCH模型与MRS-GARCH模型的VaR方法能更好的描绘和预测该股票的风险。
致谢
本工作受到国家自然科学基金和北京市教委面上项目资助。同时,罗路和常欣欣同学在Baum-Welch算法推导过程中给予了宝贵的指导,卢静会、王晓繁同学等在软件编程方面提供了协助,在此一并致谢!
基金项目
国家自然科学基金资助项目(71401124);北京市教委面上项目资助(KM201510017002)。