基于数据驱动的DD-EWMA模型在港股市场上的金融风险预测
Financial Risk Prediction in Hong Kong Stock Market Based on Data-Driven DD-EWMA Model
DOI: 10.12677/fin.2024.145181, PDF, HTML, XML,   
作者: 汤敏岚*, 梁译匀, 梁 曌:长沙理工大学数学与统计学院,湖南 长沙
关键词: DD-EWMA模型VaRES点预测区间预测回溯测试DD-EWMA Model VaR ES Point Forecast Interval Forecast Backtesting
摘要: 金融风险预测是关于波动性、风险价值(VaR)、期望损失(ES)的预测。本文利用传统的GARCH模型、基于数据驱动的指数加权移动平均(DD-EWMA)模型和数据驱动的神经网络波动率模型来对港股市场进行金融风险预测比较。除此之外,本文还运用了滚动DD-EWMA模糊波动率模型、滚动神经网络模糊波动率模型以及滚动GARCH模型来预测VaR和ES。最后,对滚动预测出的VaR和ES分别进行回溯测试,比较这三个模型优劣。模型证明,与GARCH模型相比,DD-EWMA模型具有无偏性。与利用传统估计量样本标准差来估计波动率相比,DD-EWMA模型具有稳定性。实证也表明,这三种模型预测具有高峰度特性的数据的VaR和ES,DD-EWMA波动率模型预测效果最好。
Abstract: Financial risk prediction is a prediction of volatility, value at risk (VaR) and expected loss (ES). In this paper, the traditional GARCH model, the data-driven index weighted moving average (DD-EWMA) model and the data-driven neural network volatility model are used to forecast and compare the financial risks of the Hong Kong stock market. In addition, this paper also uses rolling DD-EWMA fuzzy volatility model, rolling neural network fuzzy volatility model and rolling GARCH model to predict VaR and ES. Finally, the VaR and ES predicted by rolling are backtested to compare the advantages and disadvantages of these three models. The model proves that the DD-EWMA model is unbiased compared with the GARCH model. The DD-EWMA model is stable compared with the traditional estimator sample standard deviation. The empirical results also show that the volatility models of VaR, ES and DD-EWMA have the best prediction effect on the data with peak degree characteristics.
文章引用:汤敏岚, 梁译匀, 梁曌. 基于数据驱动的DD-EWMA模型在港股市场上的金融风险预测[J]. 金融, 2024, 14(5): 1782-1794. https://doi.org/10.12677/fin.2024.145181

1. 引言

金融市场不确定性最常见的度量方式就是波动率,波动率在金融市场中定义为金融资产的波动程度,在计量经济学和经济预测中成为最活跃和最成功的研究领域之一。VaR目前是金融行业中衡量风险的主要方法,而且VaR是可用风险度量中最支持使用的风险计量指标。ES的提出则是为了克服VaR中的次可加性并且提供更多尾部信息。VaR常用的预测模型有历史模拟(HS)、移动平均(MA)、指数加权平均(EWMA)、极值理论(EVT)、广义自回归方差(GARCH)。本文使用参数方法来预测VaR和ES,通过确定对数收益率 r t 的适当分布并预测波动率,参数方法有更高的精确性和稳定性。假设 f( x ) 是对数收益率的条件分布密度函数, F r 1 ( p ) 表示在重尾概率为p时,对数收益率 r t 的可逆累计分布函数。 σ ^ t+1 表示的是 t+1 时刻预测的波动率,它是根据过去t时刻所有的观测值预测的。最后用下列式子对VaR和ES进行一步向前的短期预测:

Va R t+1 ( p )= σ ^ t+1 F r 1 ( p ). (1)

E S t+1 ( p )= σ ^ t+1 p F r 1 ( p ) x f( x )dx. (2)

因此,在金融中想要得到波动率才能计算出风险价值(VaR)和期望损失(ES),一般情况,我们会使用股票价格的对数收益率的标准差作为波动率,而在统计学中,波动率由模型计算出的条件方差开方得到。

D. Ruppert [1]和J. Danielsson [2]使用GARCH模型估计和预测对数收益率 r t 和条件方差 σ 2 ,波动率模型使用的是去均值收益率。这会导致直接使用波动率 σ 预测VaR和ES时偏差较大,而DD-EWMA模型估计结果具有无偏性,会更加有优势。研究[3]表明一些金融数据是遵循重尾分布例如自由度小于4的student-t分布,尤其是科技股有时会出现明显的价格波动,GARCH模型面对这种极端值的处理效果差。A. Thavaneswaranetal认为t-garch模型不能用来预测理论上具有无限锋度的对数收益 r t 的波动率,然后提出了这种新的基于中心对数回归时变波动率的广义数据驱动的EWMA (DDEWMA)预测模型,并与EWMA模型在美股风险市场上进行实证研究的比较,表明DD-EWMA更适合估计具有较大峰度股票收益率的波动率 σ 。后续Y. Liang [4]等人对文献[1]提出的DD-EWMA模型进行正则化,发现使用正则化(包括岭回归、套索回归、弹性网络)后的数据结果更具有稳定性。神经网络(NN)模型是近似多元非线性函数的最常见的方法之一,它可以均匀和精确地逼近邻域上任何实数非线性函数。J. Frank [5]和M. Sing [6]等人都使用了前馈神经网络波动率模型和区间预测方法进行研究。文献[5]中主要是研究讨论金融数据的VaR预测,而文献[6]则是主要研究股票的模糊期权定价方法。[5]详细介绍了前馈神经网络波动性模型,并第一次把R程序forecast包中nnetar函数可以运用到金融股票数据中来预测股票收益率的波动率,结构表明在高科技股票数据预测和估计波动率中,使用A. Thavaneswaranetal提出的新型的前馈神经网络波动率模型具有较小的均方误差(RMSE),并且预测的VaR区间会更窄,更具稳定性。Zhang [7]等人分别提出了在正态分布下、偏态t分布下和其他分布下的分数驱动的指数加权移动平均模型(Score-driven EWMA)预测波动率的表达式。并在实证研究中比较三个不同分布下SD-EWMA的模型,使用6个汇率数据和6个代表行业现状的股票数据对VaR进行预测,最后使用回溯测试对这三种模型进行比较,发现具有时变波动性、自由度和偏度参数的倾斜sudent-t分布的SD-EWMA模型在不同的时序序列和不同水平的置信度下,对VaR的预测总体表现最好。R. Hyndman [8]不仅提出了数据驱动型的模糊布林带方法,并且研究了夏普比率(SR)的模糊估计和预测。Y. J. Lyu [9]测试了7种广义自回归条件异方差模型(GARCH)和混合数据采样(midas)模型的风险价值(VaR)预测精度,通过从市场上捕获不同形式的混合频率信息,提供比传统GARCH模型更优越的预测精度。

虽然神经网络的许多模型已经广泛的应用于金融领域,但多数都是对美国市场或是欧洲市场的一个分析,少有对港股的研究。同时部分文献在构建金融模型时未考虑模型的稳定性,基于这样的背景,本文提出利用DD-EWMA模型对港股进行研究预测。本文的组织部分如下,第二部分我们介绍了理论部分,即如何使用DD-EWMA模型、GARCH模型和神经网络波动率模型点预测和区间预测VaR和ES,并滚动数据对VaR和ES进行滚动预测及它们的区间预测,第三部分介绍了对滚动预测的VaR和ES进行回溯测试的理论知识;第四部分我们进行了实证研究。

2. 基于数据驱动的VaR和ES的估计和预测

2.1. 基于静态数据驱动的VaR和ES估计

由于大量的文献基本都是在美股市场上进行VaR和ES的预测,因此,我们想选取在港股市场上具有高峰度特性数据的股票预测VaR和ES最佳的模型。我们使用2015年1月1日至2021年6月30日时间段的数据,选取TCL、金山软件、中兴、阿里健康、国美零售、中国中铁这六支股票的对数收益率 r t =log P t log P t1 的VaR和ES进行点预测和区间预测的计算。六项资产每日对数收益率数据特性见表1。一般来说,由于我们使用的是金融股票数据,它遵循重尾分布,所以假设这些金融股票数据服从student-t分布。

表1所示,这些股票的对数收益率趋于零,且峰度较大。根据一阶滞后自相关系数,对数收益率绝对值 | r t | 的一阶滞后自相关性和对数收益率的平方 r t 2 一阶滞后相关性非常明显。根据 ρ ^ 计算出的自由度可以确定这些数据的分布,df小于4 (样本符号相关性 ρ ^ 小于0.79)的这些科技股对数收益率的波动率预测相较于传统样本标准差估计量,更适应于DD-EWMA模型,因为这些技术股票在理论上具有无限的峰度,因而导致使用DD-EWMA模型估计的波动率比使用样本标准差估计的波动率稳定性更好,利用与文献[1]中相似的方法可以计算两种方法波动率的渐近方差,结果见表2。并从中可知使用DD-EWMA模型,其系数都小于2,尤其体现在峰度较大的股票收益率,比如中兴和阿里健康股票数据使用传统的样本标

准差估计波动率的方差有 10.13 σ 2 n 10.58 σ 2 n

Table 1. Summary statistics of daily logarithmic returns of all assets

1. 所有资产的每日对数收益汇总统计

asset

mean

SD

k

sk

lag 1

r t

sample

| r t |

acf

r t 2

ρ ^

df

TCL

0.0003

0.0298

7.7779

0.3338

0.0099

0.1841

0.1625

0.6749

3.4046

金山软件

0.0007

0.0338

5.6161

0.1666

0.0284

0.0737

0.033

0.7011

3.8592

中兴

0.0004

0.0359

38.5184

−1.9919

−0.0358

0.1209

0.0324

0.6318

2.9618

阿里健康

0.0008

0.0384

40.3183

2.8163

−0.0185

0.1957

0.0582

0.6359

2.9945

国美零售

−0.0001

0.0328

14.7165

1.3033

0.0012

0.3238

0.2297

0.627

2.9258

中国中铁

−0.0002

0.0211

6.7291

0.7203

0.0859

0.2494

0.1305

0.6795

3.4711

SD:标准差;k:峰度;sk:对数收益率; | r t | :对数收益率的绝对值; r t 2 :对数收益率的平方; ρ ^ :样本符号相关性;df:由 ρ ^ 得出的自由度。

Table 2. DD-EWMA model and asymptotic variance of volatility estimated by sample standard deviation

2. DD-EWMA模型和样本标准差估计的波动率渐近方差

AS.Var.con

AS.Var.ewma

AS.Var.con

AS.Var.ewma

TCL

2.44 σ 2 n

1.20 σ 2 n

阿里健康

10.58 σ 2 n

1.47 σ 2 n

金山软件

1.90 σ 2 n

1.03 σ 2 n

国美零售

4.18 σ 2 n

1.54 σ 2 n

中兴

10.13 σ 2 n

1.51 σ 2 n

中国中铁

2.18 σ 2 n

1.17 σ 2 n

根据数据的特性,我们可知每个资产的形状分布,并使用GARCH、DD-EWMA、神经网络波动率模型这三种模型对数据进行拟合估计和预测,再比较这三种模型的均方误差(RMSE)、运行时间、VaR和ES区间预测的宽度。我们使用算法3和算法2并利用最近的1000个每日对数收益率数据分别对对GARCH(1,1)模型和神经波动率模型进行拟合;然后使用算法1并利用500个数据对DD-EWMA模型进行训练,估计和预测窗口为1000天,每个股票价格的当前头寸值为1000港元。

我们通过模型拟合估计的波动率 σ ^ 和文献[1]中的方程(4)计算得到的波动率来计算每个模型中每支股票的均方误差(RMSE)。对于VaR和ES的区间预测,可先计算出波动率的区间预测,再计算VaR和ES的区间预测。使用DD-EWMA模型、GARCH模型和神经网络波动率模型这三种模型的波动率的区间预测为

σ( α )=( L L σ ,U L σ )= σ ^ ±c v α sd ( σ ^ )/ n

其中 c v α 表示 α 的临界值。

2.2. 基于动态数据驱动的滚动VaR和ES的预测

表1所示对数收益率的绝对值样本自相关性比较显著,这表明时变波动性模型更适合于VaR和ES的预测。基于过去对数收益率的数据,我们计算得出样本符号相关性 ρ ^ 和观测到的波动率。DD-EWMA的最优平滑参数 α 可通过最小化一步向前的预测误差平方和(FESS)得出。并利用最优 α ,我们递归计算平滑值 S t ,然后计算出最后一天最优的平滑值作为波动率预测。对于一个发生时间变化的波动率 σ t ,在时间为t时的平滑统计量 S t 等于最近的波动率观测值 σ t 和之前的平滑值 S t1 的加权平均:

S t =α σ t +( 1α ) S t1 ,0<α<1.

算法1. 使用DD-EWMA模型对VaR和ES进行点预测

Require: 对数收益率 r t t=1,2,,n from r t = P t P t1

1: ρ ^ Corr( r t r ¯ ,sign( r t r ¯ ) ) (计算样本相关性)

2: Z t | r t r ¯ |/ ρ ^ (计算观测到的对数收益率的波动率)

3: S 0 Z ¯ k (使用前k个观测值来表示初始的波动率预测)

4: α( 0.01,0.8 ) ) by 0.01 (设置 α 的范围)

5: S t α Z t +( 1α ) S t1 , t=1,2,,n

6: α opt mi n α t=k+1 n ( Z t S t1 ) 2 (通过最小均方FESS选取最优 α )

7: S t α opt Z t +( 1 α opt ) S t1

8: σ ^ r,DD S n (基于n个观测值,使用DD-EWMA方法计算对数收益率 r t 一步向前的波动率预测)

9: RMS E r,DD t=k+1 n ( Z t S t1 2 )/ ( nk ) (计算最小均方RMSE)

10: vSolve2 v2 = ρ ^ ( v1 )β[ v/2 ,1/2 ] (计算对数收益率 r t 的条件分布的自由度)

11: Va R n+1 r,DD σ ^ r,DD F r 1 ( p ) (VaR预测)

12: E S n+1 r,DD σ ^ r,DD p F r 1 ( p ) x f( x )dx (ES预测)

13: Return α opt , σ ^ r,DD ,RMS E r,DD ,Va R n+1 r,DD ,E S n+1 r,DD

第一次k个观测值作为初始平滑值S0

S 0 = 1 k i=1 k | r t r ¯ | ρ ^ .

波动率预测的均方误差(RMSE)计算:

t=k+1 n ( σ ^ t S t1 ) 2 nk .

算法2. 使用神经网络波动率模型对VaR和ES进行点预测

Require: 对数收益率 r t , t=1,2,,n from r t = P t P t1

1: ρ ^ Corr( r t r ¯ ,sign( r t r ¯ ) ) (计算样本相关性)

2: vo l t | r t r ¯ |/ ρ ^ (计算对数收益率 r t 观测到的波动率)

3: Vol.nnetnnetar( Vol ) (使用R语言函数nnetar计算神经网络模型对数收益率 r t 的波动率)

4: σ ^ r,DD forecast( Vol.nnet,h=1 )\$mean (使用神经网络模型计算一步向前的波动率预测)

5: RMS E r,NN mean( ( vo l t Vol.nnet$fitted ) 2 ) (计算均方误差RMSE)

6: Va R n+1 r,NN σ ^ r,NN F r 1 ( p ) (VaR预测)

7: E S n+1 r,NN σ ^ r,NN p F r 1 ( p ) x f( x )dx (ES预测)

8: Return σ ^ r,DD ,RMS E r,NN ,Va R n+1 r,NN ,E S n+1 r,NN

神经网络波动率模型同样使用文献[1]中的方程(5)获得观测到的股票对数收益率,并把其作为输入值进行拟合估计和预测。我们使用R程序forecast包中nnetar函数计算神经网络波动率预测。我们使用GARCH族模型中GARCH(1,1)来估计股票对数收益率的条件方差,然后开方得到波动率的估计,最后一天拟合估计的条件方差通过 σ t+1 2 =ω+ α 1 r t 2 + β 1 σ t 2 递归方程开方得出波动率的预测。上述方法计算得出的滚动的每日波动率预测,最后根据方程(1)和方程(2)计算出滚动的每日VaR和ES预测。得到滚动的每日VaR和ES预测后,我们可以通过所有滚动窗口的每日VaR和ES预测来计算滚动窗口VaR和ES的区间估计,即

算法3. 使用GARCH模型对VaR和ES进行点预测

Require: 对数收益率 r t , t=1,2,,n from r t = P t P t1

1: ggarchFit( ~garch( 1,1 ), r t ,cond.dist="std" ,

include.mean=FALSE,trace=FASLE )

(使用R语言函数 garchFit 把对数收益率 r t 进行GARCH(1,1)模型拟合)

2: ωg@fit$matcoef[ 1,1 ]; α 1 g@fit$matcoef[ 2,1 ]; β 1 g@fit$matcoef[ 3,1 ]

(得到GARCH(1,1)模型参数)

3: dfg@fit$matcoef[ 4,1 ] (得到由GARCH(1,1)模型拟合出的对数收益率 r t 的条件分布的自由度)

4: vol.garc h t g@sigma.t (得到GARCH(1,1)模型的估计的波动率)

5: σ ^ r,GG ω+ α 1 r t 2 + β 1 σ 2 t (计算使用GARCH(1,1)模型的波动率预测)

6: vo l t | r t r ¯ |/ ρ ^ (计算对数收益率 r t 观测到的波动率)

7: RMS E r,GG mean( ( vol.garc h t vo l t ) 2 ) (计算均方误差RMSE)

8: Va R n+1 r,GG σ ^ r,GG F r 1 ( p ) (VaR预测)

9: E S n+1 r,GG σ ^ r,GG p F r 1 ( p ) x f( x )dx (ES预测)

10: Return σ ^ r,GG ,RMS E r,GG ,Va R n+1 r,GG ,E S n+1 r,GG

Daily.VaR( α ) ¯ =( L L Daily.VaR ,U L Daily.VaR )=mean( Daily.Va R i )±c v α sd ( Daily.Va R i )/ n . (4)

Daily.ES( α ) ¯ =( L L Daily.ES ,U L Daily.ES )=mean( Daily.E S i )±c v α sd ( Daily.E S i )/ n . (5)

算法4. 使用三种模型对VaR和ES进行区间预测

Require: 对数收益率 r t , t=1,2,,n from r t = P t P t1

1: σ ^ σ ^ r,DD (使用算法1中DD-EWMA方法计算对数收益率 r t 波动率预测)

2: σ ^ σ ^ r,NN (使用算法2中神经网络方法计算对数收益率 r t 波动率预测)

3: σ ^ σ ^ r,GG (使用算法3中GARCH(1,1)模型计算对数收益率 r t 波动率预测)

4: α cut of σ ( L L σ ,U L σ )= σ ^ ±c v α sd ( σ ^ )/ n

(基于 σ ^ r,DD , σ ^ r,NN and σ ^ r,GG (计算对数收益率 r t 的波动率区间预测))

5: α cut of VaR ( L L σ F r 1 ( p ),U L σ F r 1 ( p ) ) (使用三种方法计算VaR区间预测)

6: α cut of ES ( L L σ p F r 1 ( p ) x f( x )dx, U L σ p F r 1 ( p ) x f( x )dx ) (使用三种方法计算ES区间预测)

7: Return α cut of σ , α cut of VaR, α cut of ES

3. VaR和ES的回溯测试

要评估滚动预测的VaR和ES不同方案的性能,最常用的是使用回溯测试。我们将置信水平为 ( 1α ) VaR= r α 定义为

r α =sup{ r * |p( r< r * )α }.

Chen和Lu (2010)认为 r α 的值是高度依赖于 r t 的分布假设, r α 分布的肥尾性和波动性的变化之间是存在着平衡。当 r t 为student-t分布时,波动率的变化与正态分布相比,对极端实际的收益率反应会更低。因此,使得计算出的VaR对突变波动率的变化的反应减弱。因此,与正态分布相比之下,如果有偶然的尾部观察,基于student-t分布的模型在预测窗口期间提供了一个更好和更稳健的波动率。此外,与固定置信水平的高斯分布相比,基于student-t分布的VaR在置信水平为 ( 1α ) 下的尾部位置更远。这些平衡导致了不同的预测方法的相对性能,这只能通过不同置信水平 ( 1α ) 和不同的数据集进行实证研究。

为了评估三种模型估计的滚动每日VaR结果的优劣,我们考虑了一些尾部概率预测质量的标准检验:UC测试(无条件覆盖检验)、IN测试(独立性检验)和CC测试(覆盖率测试和独立性测试的联合测试)。所有的这些检验都是基于似然比(LR)的检验。一个良好的VaR模型应该是一致的,因为VaR偏离的比例,即事件 { r t <Va R t } 在大样本中应该等于 α 。定义VaR偏离的指标为

I t =P{ r t <Va R t }.

在时间段T内VaR的偏离次数为 N= T t=1 I t 。一个良好的VaR模型应该产生连续独立的 I t 。我们的后置

测试方法都与良好的覆盖率、序列的独立性或两者都相关。Kupiec (1995)测试为VaR模型的无条件覆盖率测试(UC测试),我们根据上述VaR的偏离次数,假设VaR偏离的概率在第t天为 η t 。因此,我们对VaR偏离的原假设为

H 0 :ηB( p ).

B表示为伯努利分布。伯努利的分布密度为

( 1p ) 1 η t p η t , η t =0,1.

概率p可以估计为

p ^ = v 1 W T .

那么似然函数为

L U ( p ^ )= t= W E +1 T ( 1 p ^ ) 1 η t p ^ η t = ( 1 p ^ ) v 0 p ^ v 1 .

其中,在 W E +1 T时间段内为预测测试窗口。这个似然函数的值可以无穷大,因此,我们为了限制它,让估计的概率 p ^ 比上概率p。在原假设 H 0 下, p= p ^ ,所以,概率p的似然函数为

L R ( p )= t= W E +1 T ( 1p ) 1 η t p η t = ( 1p ) v 0 p v 1 .

并且,我们使用似然比去测试 L R = L U

LR=2( log L U ( p )log L U ( p ^ ) ) =2log ( 1 p ^ ) v 0 ( 1 p ^ ) v 1 ( 1p ) v 0 p v 1 ~ asymptotic χ 2 ( 1 ) (6)

如果选择5%作为测试的显著性水平,那么原假设的拒绝域为 LR>3.84 ,但是在绝大多数情况下我们只需要计算和比较p值。并且显著性水平的选择影响着测试的性能,显著性水平低,第一类错误会变低,则意味着第二类错误更高。这个对VaR的回溯测试是不需要参数的,也就是说对所有的分布都可以使用它进行测试。

Christoffersen (1998)提出了VaR的偏离指标 I t 的独立性测试(IN测试)。因为我们不仅对VaR的覆盖率感兴趣,也对VaR偏离的集聚性有兴趣。我们需要计算在之前VaR没有偏离时,VaR连续偏离和偏离的两种概率,即

p ij =P( η t =i| η t1 =j ).

其中,ij表示为0或1。

相应的一阶马尔可夫链的转移矩阵为

Π 1 =[ 1 p 01 p 01 1 p 11 p 11 ].

那么上述转移矩阵的似然函数为

L R ( Π 1 )= ( 1 p 01 ) v 00 p 01 v 01 ( 1 p 11 ) v 10 p 11 v 11 .

其中, v ij 表示为从i转移到j的观测数。通过求 L R ( Π ) 最大化,得到最大似然估计值(ML)为:

Π ^ 1 =[ v 00 v 00 + v 01 v 01 v 00 + v 01 v 10 v 10 + v 11 v 11 v 10 + v 11 ].

原假设为VaR偏离没有集聚性,那么则意味着VaR今天偏离的概率不决定VaR明天偏离的概率。那么, p 01 = p 11 =p ,转移矩阵的估计可以写为

Π 0 =[ 1 p ^ p ^ 1 p ^ p ^ ].

其中

p ^ = v 01 + v 11 v 00 + v 10 + v 01 + v 11 .

根据原假设,使用估计转移矩阵得出的似然函数为

L U ( Π ^ 0 )= ( 1 p ^ ) v 00 + v 10 p ^ v 01 + v 11 .

那么,似然比为

LR=2( log L U ( Π ^ 0 )log L R ( Π ^ 1 ) ) ~ asymptotic χ 2 ( 1 ). (7)

并且这个独立性测试(IN测试)的值并不取决于真实p值。

我们也可以把这两个测试联合起来,既有VaR的覆盖率测试也有VaR偏离指标 I t 的独立性测试。下列是UC测试的统计量

LR( joint )=LR( coverage )+LR( independence )~ χ 2 ( 2 ). (8)

相对于VaR的回溯测试,ES的回溯测试更难,因为我们测试的是期望而不是一个分位数。但我们可以用一个简单的方法对ES进行回溯测试。假设在T这段时间,VaR是偏离的,那么标准话损失 N S t 可以计算为

N S t = y t E S t .

其中, E S t 表示为在第t天观测到的ES。根据ES的定义,当VaR是偏离的, y t 的期望为

E( Y t | Y t <Va R t ) E S t =1.

因此,均值NS记为 NS ¯ ,应该等于1。因此,我们原假设为

H 0 : NS ¯ =1.

通过计算每个模型的均值NS,若数值越接近于1,则表示模型计算ES越准确。

4. 实证研究

我们利用算法1、算法2和算法3中的DD-EWMA方法、神经网络波动率模型、GARCH模型计算VaR和ES的点预测并得到表3表4表5。在这些表格中还分别提供了上述三种模型的波动率点预测、均方误差(RMSE)以及每支股票使用此方法需要的时间。此外,DD-EWMA模型的最优平滑参数 α 是根据后1000个数据最小化一步向前的预测误差平方和(FESS)得出,见表3第一列。而VaR和ES是利用方程(1)和(2)在p = 0.01计算得出的。金山软件、国美零售拥有较高的VaR和ES预测,而TCL和中国中铁的VaR和ES是最低的。根据表3表4表5数据发现,神经网络波动率模型的均方误差(RMSE)最小,DD-EWMA模型的均方误差次之,使用GARCH模型的均差误差最大。但是DD-EWMA模型和神经网络波动率模型这两个模型的RMSE相差较小,相差0.0005左右。我们再从运行时间角度比较,使用DD-EWMA模型的运行时间非常短,可以瞬间出来结果;使用神经网络波动率模型在这三个模型当中运行时间最长。并且DD-EWMA模型有公式能具体表达出来,但是神经网络波动率模型是一个黑匣子,没有具体的公式。综上所述,使用DD-EWMA模型对 r t 的波动率进行点预测是最好的。

Table 3. Using DD-EWMA asset risk prediction

3. 使用DD-EWMA资产风险预测

asset

α

RMSE

Vd

VaR

ES

time

TCL

0.0600

0.0313

0.0246

65.3109

95.7393

0.0000

金山软件

0.0300

0.0332

0.0322

85.4928

120.3320

0.0100

中兴

0.1000

0.0492

0.0231

60.4831

93.8246

0.0000

阿里健康

0.0500

0.0336

0.0262

68.5852

105.8650

0.0000

国美零售

0.1300

0.0357

0.0343

89.5233

139.6614

0.0000

中国中铁

0.0400

0.0166

0.0126

33.5642

48.8666

0.0200

Table 4. Using neural network volatility model asset risk prediction

4. 使用神经网络波动率模型资产风险预测

asset

RMSE

Vol

VaR

ES

time

TCL

0.0307

0.0164

43.6481

63.9838

14.9100

金山软件

0.0295

0.0316

83.9183

118.1159

2.1200

中兴

0.0428

0.0358

93.6388

145.2576

1.0300

阿里健康

0.0330

0.0168

43.9752

67.8781

7.9400

国美零售

0.0352

0.0385

100.4152

156.6534

5.8000

中国中铁

0.0166

0.0143

37.9924

55.3136

2.4300

Table 5. Using GARCH(1,1) model asset risk prediction

5. 使用GARCH(1,1)模型资产风险预测

asset

RMSE

Vol

VaR

ES

time

TCL

0.0353

0.0248

65.8396

95.0365

0.2600

金山软件

0.0347

0.0291

76.7797

105.4605

0.1900

中兴

0.0638

0.0224

56.7130

92.0744

0.2000

阿里健康

0.0398

0.0262

69.5813

97.2839

0.1400

国美零售

0.0398

0.0411

109.2095

55.6520

0.1100

中国中铁

0.0211

0.0123

32.7023

45.4319

0.1700

利用算法4,VaR和ES在 α=0.05 的区间预测并生成表6表7表8。根据三种模型提供的VaR和ES的区间预测,我们发现使用DD-EWMA模型和GARCH(1,1)模型除了预测国美零售港股股票的VaR和ES区间宽度较长,为6左右;其余5支股票预测VaR和ES的置信区间都比较窄,区间宽度为3左右。其中,相较于GARCH(1,1)模型,使用DD-EWMA模型预测的VaR和ES的区间宽度略短一些。并且使用神经网络模型预测的VaR和ES置信区间最长,为6左右。因此,我们可知上述三种模型预测VaR和ES都比较稳健,但是使用DD-EWMA模型预测的风险度量在预测具有高峰度特性的股票市场上是三种模型稳健的。与上述表3表4表5的点预测结合来看,使用DD-EWMA方法预测VaR和ES的效果最好。此外,它们还提供了使用三种模型的每日平均波动率估计量。

Table 6. Using DD-EWMA model of 0.05-cuts to predict VaR and ES

6. 使用DD-EWMA模型的0.05-cuts的VaR和ES预测

asset

DD-EWMA

0.05-cut of vol

0.05-cut of VaR

0.05-cut of ES

TCL

0.0292

(0.0239, 0.0252)

(63.6261, 66.9956)

(93.2696, 98.2090)

金山软件

0.0334

(0.0318, 0.0327)

(84.2773, 86.7082)

(118.6212, 122.0428)

中兴

0.0362

(0.0222, 0.0240)

(58.1498, 62.8163)

(90.2051, 97.4441)

阿里健康

0.0353

(0.0257, 0.0267)

(67.2341, 69.9363)

(103.7794, 107.9505)

国美零售

0.0305

(0.0333, 0.0354)

(86.7690, 92.2775)

(135.3647, 143.9582)

中国中铁

0.0197

(0.0124, 0.0129)

(32.9122, 34.2162)

(47.9172, 49.8159)

Table 7. VaR and ES prediction of 0.05-cuts using neural network volatility mode

7. 使用神经网络波动率模型的0.05-cuts的VaR和ES预测

asset

DD-EWMA

0.05-cut of vol

0.05-cut of VaR

0.05-cut of ES

TCL

0.0300

(0.0152, 0.0176)

(40.4409, 46.8553)

(59.2824, 68.6853)

金山软件

0.0348

(0.0312, 0.0321)

(82.7625, 85.0740)

(116.4891, 119.7427)

中兴

0.0403

(0.0351, 0.0366)

(91.6368, 95.6409)

(142.1519, 148.3632)

阿里健康

0.0333

(0.0158, 0.0178)

(41.4242, 46.5262)

(63.9405, 71.8157)

国美零售

0.0311

(0.0373, 0.0397)

(97.3262, 103.5042)

(151.8344, 161.4724)

中国中铁

0.0170

(0.0141, 0.0145)

(37.4020, 38.5828)

(54.4541, 56.1732)

Table 8. Using GARCH(1,1) model of 0.05-cuts to predict VaR and ES

8. 使用GARCH(1,1)模型的0.05-cuts的VaR和ES预测

asset

DD-EWMA

0.05-cut of vol

0.05-cut of VaR

0.05-cut of ES

TCL

0.1722

(0.0242, 0.0254)

(64.2729, 67.4062)

(92.7751, 97.2978)

金山软件

0.1884

(0.0287, 0.0295)

(75.7199, 77.8394)

(104.0049, 106.9161)

中兴

0.2113

(0.0203, 0.0245)

(51.3927, 62.0334)

(83.4367, 100.7121)

阿里健康

0.1821

(0.0258, 0.0267)

(68.4933, 70.6693)

(95.7627, 98.8050)

国美零售

0.1685

(0.0403, 0.0419)

(107.1996, 111.2193)

(152.7874, 158.5166)

中国中铁

0.1319

(0.0121, 0.0126)

(32.1432, 33.2614)

(44.6552, 46.2087)

图1表示的是这三种模型对中兴股票对数收益率的波动率的估计和预测以及观测到的波动率的图形。其中,黑色线条表示观测到的波动率,红色线条表示的是DD-EWMA模型对中兴股票对数收益率的波动率的估计,绿色线条是神经网络波动率模型对波动率的拟合,蓝色线条是GARCH(1,1)模型对波动率的估计,紫色线条则是观测到的波动率的标准差。

Figure 1. Comparison of the estimated and observed volatility of the SP500

1. SP500估计的和观测到的波动率比较

而图中特殊符号“X”表示的是这三种模型对波动率的预测。可以看出,GARCH(1,1)模型对波动率的预测与其他两种模型(DD-EWMA)模型和神经网络波动率模型)相差很大,DD-EWMA模型和神经网络波动率模型对波动率的预测是非常接近的。

Figure 2. Comparative forecast of the range of SP500 volatility

2. SP500波动率的区间预测比较

图2显示的是DD-EWMA模型、神经网络波动率模型和GARCH(1,1)模型这三种模型对中兴股票对数收益率的波动率的区间预测,黑色线条、红色线条、蓝色线条分别表示的是使用神经网络波动率模型、DD-EWMA模型和GARCH(1,1)模型对波动率的区间预测,我们利用方程(3)在p = (0, 0.5)的区间下计算波动率的区间估计。图2中,很明显使用这三种模型预测的波动率的置信区间都很窄,宽度不超过0.01可以认为DD-EWMA模型、GARCH(1,1)模型和神经网络波动率模型对波动率的预测是稳健的。其中,神经网络波动率模型波动率的区间宽度最窄,为0.002;再是DD-EWMA模型波动率的区间宽度为0.003;这说明两个模型在港股市场上预测具有高峰度特性数据的股票稳健性差不多。而$GARCH(1,1)$模型波动率的区间宽度为0.006。从而得出在这个数据特性中使用GARCH模型与其他两个模型相比并没有优势。

5. 结论

VaR目前已成为金融行业中衡量风险的主要方法,而且VaR是可用风险度量之间的最佳平衡,是最支持最实用的风险模型。而ES则克服了VaR中的次可加性并且提供更多 r t 的尾部信息。波动率预测在投资者和金融中介机构的资产估值和风险管理中起着重要作用。本文使用DD-EWMA模型、神经网络波动率模型和GARCH(1,1)模型这三种模型对波动率、VaR和ES进行点预测、区间预测和滚动预测的比较。模型证明,相比较GARCH模型,DD-EWMA模型预测金融数据的波动率具有无偏性。而相较使用传统估计量样本标准差来估计波动率,DD-EWMA模型预测高科技股票数据的波动率具有稳定性。在实证研究中也发现这三种模型预测具有高峰度特性的数据的VaR和ES,DD-EWMA波动率模型预测效果是最好的。

NOTES

*通讯作者。

参考文献

[1] Ruppert, D. and Matteson, D.S. (2015) Risk Management. In: Springer Texts in Statistics, Springer New York, 553-579.
https://doi.org/10.1007/978-1-4939-2614-5_19
[2] Danielsson, J. (2011) Financial Risk Forecasting: The Theory and Practice of Forecasting Market Risk with Implementation in R and Matlab. Wiley, 76-91.
[3] Thavaneswaran, A., Paseka, A. and Frank, J. (2019) Generalized Value at Risk Forecasting. Communications in StatisticsTheory and Methods, 49, 4988-4995.
https://doi.org/10.1080/03610926.2019.1610443
[4] Liang, Y., Thavaneswaran, A., Zhu, Z., Thulasiram, R.K. and Hoque, M.E. (2020). Data-Driven Adaptive Regularized Risk Forecasting. 2020 IEEE 44th Annual Computers, Software, and Applications Conference (COMPSAC), Madrid, 13-17 July 2020, 1296-1301.
https://doi.org/10.1109/compsac48688.2020.00-77
[5] Thavaneswaran, A., Thulasiram, R.K., Zhu, Z., Hoque, M.E. and Ravishanker, N. (2019). Fuzzy Value-at-Risk Forecasts Using a Novel Data-Driven Neuro Volatility Predictive Model. 2019 IEEE 43rd Annual Computer Software and Applications Conference (COMPSAC), Milwaukee, 15-19 July 2019, 221-226.
https://doi.org/10.1109/compsac.2019.10210
[6] Thavaneswaran, A., Thulasiram, R.K., Frank, J., Zhu, Z. and Singh, M. (2019). Fuzzy Option Pricing Using a Novel Data-Driven Feed Forward Neural Network Volatility Model. 2019 IEEE International Conference on Fuzzy Systems (FUZZ-IEEE), Orleans, 23-26 June 2019, 1-6.
https://doi.org/10.1109/fuzz-ieee.2019.8858826
[7] Lucas, A. and Zhang, X. (2016) Score-Driven Exponentially Weighted Moving Averages and Value-at-Risk Forecasting. International Journal of Forecasting, 32, 293-302.
https://doi.org/10.1016/j.ijforecast.2015.09.003
[8] Hyndman, R., Athanasopoulos, G., Bergmeir, C., et al. (2018) Package Forecast—The Comprehensive R Archive Network.
https://cran.r-project.org/web/packages/forecast/forecast.pdf
[9] Lyu, Y., Kong, M., Ke, R. and Wei, Y. (2021) Does Mixed Frequency Information Help to Forecast the Value at Risk of the Crude Oil Market? SSRN Electronic Journal, 29, 139-141.
https://doi.org/10.2139/ssrn.3774891