基于GARCH-VaR模型的上证指数风险测度

doi:10.12677/ecl.2024.1341421

期刊菜单

基于GARCH-VaR模型的上证指数风险测度
Risk Measurement of Shanghai Composite Index Based on GARCH-VaR Model

DOI: 10.12677/ecl.2024.1341421, PDF, HTML, XML,
作者: 杨智灵：贵州大学经济学院，贵州贵阳
关键词: GARCH类模型；GARCH-VaR模型；ARIMA-LSTM模型；注册制；GARCH Type Models； GARCH-VaR Model； ARIMA-LSTM Model； Registration System

摘要: 本文以上证指数的日收益率为样本，对上证指数建立GARCH-VaR模型，比较不同分布假定下GARCH类模型对上证指数波动率的拟合效果，计算并检验上证指数VaR值的预测结果对实际损失的覆盖情况。分析的结果表明，TARCH模型与EGARCH模型更适合测度上证指数条件方差，且在t分布下，模型能够更好地反映上证指数收益率扰动项的分布特征。进一步，为克服ARMA-GARCH模型在中长期预测中出现的较大误差，使用ARIMA-LSTM模型结合GARCH类模型预测指数波动率，有效提高了GARCH-VaR模型的预测准度。最后，通过TARCH模型，初步检验了我国股市注册制全面推行对上证指数波动率所产生的影响，发现该政策的实施显著降低了上证指数的波动幅度。

Abstract: This article takes the daily return of the Shanghai Composite Index as a sample, establishes a GARCH-VaR model for the Shanghai Composite Index, compares the fitting effect of GARCH models on the volatility of the Shanghai Composite Index under different distribution assumptions, calculates and tests the coverage of actual losses by the predicted VaR value of the Shanghai Composite Index. The analysis results indicate that the TARCH model and EGARCH model are more suitable for measuring the conditional variance of the Shanghai Composite Index, and under the t-distribution, the model can better reflect the distribution characteristics of the disturbance term of the Shanghai Composite Index return. Furthermore, to overcome the significant errors in medium- and long-term forecasting caused by the ARMA-GARCH model, the ARIMA-LSTM model combined with GARCH class models was used to predict index volatility, effectively improving the prediction accuracy of the GARCH-VaR model. Finally, through the TARCH model, the impact of the comprehensive implementation of the registration system in China’s stock market on the volatility of the Shanghai Composite Index was preliminarily examined, and it was found that the implementation of this policy significantly reduced the volatility of the Shanghai Composite Index.

文章引用：杨智灵. 基于GARCH-VaR模型的上证指数风险测度[J]. 电子商务评论, 2024, 13(4): 2490-2503. https://doi.org/10.12677/ecl.2024.1341421

1. 引言

得益于全球金融经济一体化与金融科技发展的不断深入，全球范围内的资本市场在过去的几十年间飞速发展，如今股票市场和金融衍生品市场交易规模远超上世纪90年代的规模，我国沪深两市日成交额多次突破了万亿的水平。各国金融市场间交易活动联系日益紧密，不仅带来了更多的投资机遇，也使得金融资产价格波动的风险更具威胁且易于扩散。我国股市中散户投资者占比较大，且容易出现“追涨杀跌”等非理性投资行为，因此，有效预测与防范金融市场风险，特别是股票市场风险，对保障我国投资者金融资产安全有重要意义。在测度金融市场风险的方法中，风险价值(Value-at-Risk，简记VaR)是管理市场风险时运用最普遍的工具之一。风险价值即在险价值，是指市场正常波动下，某一金融资产或证券组合的最大可能损失，VaR的计算方法主要有回溯模拟法、蒙特卡罗模拟法，以及方差–协方差法等方法。GARCH-VaR模型基于资产历史数据，通过GARCH (Generalized Autoregressive Conditional Heteroskedasticity)模型得到均值方程，方差方程和预测标准差，并在一定置信水平下，根据VaR计算方法，预测特定交易日资产的风险价值。中国上海证券交易所发布的上证指数是我国股票市场的主要指数之一，该指数综合反映了沪市A股，B股的价格变动情况，并作为衡量我国股票市场整体表现和变化趋势的参考指数之一而被广泛应用。本文使用GARCH-VaR模型测度上证指数收益率的波动性与每日风险价值。考虑到金融收益率序列的分布可能存在“不对称性”以及“尖峰厚尾”等特征，本文在三种不同分布假设(Normal, t, GED)下对GARCH类模型的计算结果进行对比，并预测上证指数的每日风险价值用于后续检验。此外，本文研究方法上的创新性体现在，传统GARCH-VaR模型预测风险价值的方法通过ARMA-GARCH (AutoRegressive Moving Average-GARCH Model)模型捕捉时间序列数据的线性关系实现预测，但ARMA模型难以有效利用序列数据的非线性关系以及长期依赖关系所提供的有效信息，部分研究表明，该方法在中长期预测中会出现较大误差。因此，本文使用ARIMA-LSTM (Autoregressive Integrated Moving Average-Long Short-Term Memory Model)模型，该混合模型旨在提高序列数据预测精度，适合同时具有线性和非线性趋势混合特征的时间序列数据。在此基础上，结合GARCH类模型预测上证指数的波动率与VaR，经检验有效提高了GARCH-VaR模型的预测准度。

2. 文献回顾

VaR-GARCH模型在金融资产的风险测度与预测的相关研究中被广泛使用，众多的研究结果也验证了VaR方法适用于我国当前的金融市场。模型的具体应用领域方面，高岳，朱宪辰[1]在使用极值理论描述收益率尾部特征的基础上，将GARCH模型和极值理论结合，分析了我国同业拆借利率市场的系统性风险波动趋势。周茂华[2]分别在正态、学生t和偏态t分布下，使用GARCH类模型估算上海和伦敦黄金现货市场收益率的风险价值，并根据失败频率法和动态分位数法对结果进行检验。指出t分布更适合描述上海黄金市场的风险特征，而正态分布则更适应伦敦黄金市场。杨超[3]构建SWARCH模型与MS-GARCH (Markov-switching GARCH model)模型，结合极值理论，测算动态VaR值描述国际碳交易市场的系统风险。严伟祥[4]使用GARCH-VaR模型测度对冲基金的波动情况，使用Kupiec失败频率法，对比不同长度的观测数据对VaR值估计效果的影响。申利[5]使用外汇市场中人民币与美元的历史交易数据，建立GARCH-VaR模型对外汇风险进行度量，指出t分布下该模型能有效测度未来较长时期的外汇风险情况。张贺，沈倩[6]根据上证、中证申万互联网金融主题指数的日收益率数据，建立GARCH-VaR模型测度我国金融科技风险，指出新兴金融科技创新较传统金融更容易遭遇极端损失风险冲击。朱溪溪和王文胜[7]使用GARCH-VaR模型测算沪深300指数及其指数期货的风险价值，并基于估计结果设计了大额损失管理策略与股指期现套利策略。以上研究表明，VaR-GARCH模型能够有效适应我国金融市场，特别是股票市场的风险特征，而Kupiec失败频率法在较多研究中均被作为度量VaR的模型准确性的检验方法，这表明该方法在长期数据观测前提下，能够满足对模型预测准度的评价要求，本文在此基础上开展对上证指数的风险预测与分析。

模型方法方面，陈浪南[8]使用GJR-GARCH模型实证分析了利好消息和利空消息对中国股票市场的非对称影响。江涛[9]指出许多金融时间序列并不服从正态分布，而半参数法不需要提前假定分布，可根据数据特征直接构造VaR值置信区间的上下限以检验估计结果。蒋伟[10]指出仅依赖低频数据进行估计风险水平，可能会造成日度有用信息的遗漏，得到不准确的市场波动率预测和风险估计。较多研究通过构建RGARCH (Realized GARCH)模型分析高频数据，得到更为准确的已实现波动率并预测金融市场风险。李翠霞[11]认为序列分布的假设错误将导致GARCH模型失效，提出使用基于经验分布的GARCH模型，结合累积经验分布函数对残差进行修正，显著降低了失败频率和相对误差。次必聪[12]选取股指与金价指数，构建ARIMA-LSTM非线性组合模型进行波动率分析。比较各序列预测结果后，发现线性模型中长期的预测效果不佳，而非线性组合模型中长期内保持着较稳定的预测准确度。本文在此基础上，吴鑫育[13]指出人民币汇率收益率序列的高阶矩具有时变性，因此，引入时变风险厌恶指数为分析波动率提供有效信息，构建带时变高阶矩的GARCH-MIDAS-SK (GARCH with Mixed Autoregressive Conditional Heteroskedasticity-Sampling Kernel Model)模型，提高了拟合效果和预测准确性。上述研究表明，对金融收益率时间序列数据的扰动项分布假设需要考虑并对比不同分布的拟合效果，传统GARCH类模型研究通常只在标准正态分布假设下对GARCH类模型及其滞后阶数进行筛选，这将导致VaR值的预测结果低估实际风险。此外，收益率序列的非线性特征对预测结果准确度影响较为重要，ARIMA-LSTM模型能够有效捕捉序列数据的非线性关系并与GARCH-VaR模型有效结合，弥补传统ARMA-GARCH线性模型中长期预测结果的偏差。以往GARCH-VaR模型的研究更重视对GARCH类模型的筛选与改进，在条件方差预测的准确度上有很大贡献，但较为忽视对序列数据预测模型的改进，本文在此基础上分别建立以上两类模型展开对比研究。

3. 模型设定

3.1. VaR模型

VaR即在险价值，是指市场正常波动下，某一金融资产或证券组合的最大可能损失，或者说在一定置信水平下，某一金融资产在未来一定时期内的最大潜在损失值。根据定义，可以用公式(1)表示在险价值VaR：

$Prob {(Δ V (t, Δ x) \leq VaR)} = 1 - α$ (1)

其中，∆V表示标的资产t时期内发生的价值损失，x表示t时期的风险因子， $1 - α$ 为置信水平。Prob表示资产实际损失不超过预期损失上限(VaR)的概率。使用VaR模型对上证指数每日的市场风险进行度量，用公式(2)表示：

${VaR}_{t} = σ_{t} Z_{α} P_{t - 1}$ (2)

其中， $Z_{α}$ 表示假设分布下置信度 $α$ 对应的分位数， $σ_{t}$ 为t时期指数序列收益率的标准差， $P_{t - 1}$ 对应前一期的指数收盘价。

3.2. GARCH模型及其衍生模型

方差–协方差法估计每日的VaR值，需要对收益率序列条件方差进行测算。Engle [14]指出时间序列存在一种特殊的异方差，即“自回归条件异方差”(Autoregressive Conditional Heteroskedasticity，简记ARCH)，后续研究将ARCH推广为“广义条件异方差”，称为“Generalized ARCH”，简记GARCH。序列分布的波动率如果存在异方差性，通常在时间趋势图中表现出“波动性集聚”，而GARCH模型考虑了方差的时变性，故可以更准确地预测方差。GARCH (p, q)的基本形式模型可用公式(3)、(4)表示，其中，p、q分别表示ARCH项与GARCH项的滞后阶数。

均值方程：

$y_{t} = x_{t} φ + ε_{t}$ (3)

均值方程：

$σ_{t}^{2} = α_{0} + \sum_{i = 1}^{p} α_{i} ε_{t - i}^{2} + \sum_{j = 1}^{q} β_{j} σ_{t - j}^{2}$ (4)

进一步，金融收益率序列的波动存在“不对称性”，Glosten，Jagannathan and Runkle [15]提出了非对称的TARCH (Threshold GARCH)模型，用于描述正，负向冲击对序列波动性影响的“不对称性”。该模型用公式(5)表示，其中，1 (·)为示性函数，当时则取值为1；反之，则取值为0。

$σ_{t}^{2} = α_{0} + \sum_{i = 1}^{p} β_{i} ε_{t - i}^{2} + \sum_{j = 1}^{q} γ_{j} σ_{t - 1}^{2} + α_{1} ε_{t - 1}^{2} * 1 (ε_{t - 1} > 0)$ (5)

标准的GARCH模型对参数的取值有所限制，给MLE估计带来不便，因此，Nelson [16]提出了指数GARCH (Exponential GARCH，简记EGARCH)模型，EGARCH (1, 1)基本形式用公式(6)表示为：

$\ln σ_{t}^{2} = α_{0} + α_{1} (ε_{t - 1} / σ_{t - 1}) + γ_{1} | ε_{t - 1} / σ_{t - 1} | + β_{1} \ln σ_{t - 1}^{2}$ (6)

其中， $(ε_{t - 1} / σ_{t - 1})$ 为 $ε_{t - 1}$ 的标准化，只要 $α_{1} \neq 0$ ，则这个模型也包括了非对称效应(类似于TARCH)， $| ε_{t - 1} / σ_{t - 1} |$ 表示对称效应。该模型的优点在于，无论 $\ln σ_{t}^{2}$ 取何值，都有 $σ_{t}^{2} = \exp (\ln σ_{t}^{2}) > 0$ ，所以对方程中所有参数都没有任何限制。

根据金融理论，风险水平越高的金融资产，其期望收益率也应该越高。为了能够反映这种风险溢价的特点，Engle，Lilien and Robins [17]提出ARCH-M (ARCH-in-Mean)模型，对收益率序列建立均值方程与条件方差的关系。ARCH-M模型用公式(7)表示，其中( $β + δ σ_{t}^{2}$ )为风险溢价，是条件方差 $σ_{t}^{2}$ 的增函数，即 $δ > 0$ ：

均值方程：

$y_{t} = β + δ σ_{t}^{2} + ε_{t}$ (7)

GARCH模型假设扰动项服从标准正态分布，如果扰动项真实分布具有“尖峰厚尾”特征，则小概率事件比在标准正态分布下更容易发生，通常假设扰动项服从t(k)分布，或服从广义误差分布(Generalized Error Distribution，简记GED)对收益率序列尾部性质进行偏差调整。

4. 数据选取与实证分析

4.1. 数据选取与数据特征说明

选取2018年1月2日到2024年5月23日上证指数的日交易数据进行分析，样本共计1550条数据。在ARIMA-GARCH模型构建过程中，将前1450条数据作为训练集(截止到2023年12月18日)，后面100条数据作为测试集用于比较模型预测的日度VaR值对实际发生损益的覆盖效果。首先对数据集进行异常值和缺失值的检测及处理。表示上证指数的第t日收盘价，上证指数收益率采用对数计算方式，即： $r_{t} = \ln (p_{t} / p_{t - 1})$ 。绘制上证指数日收盘价与收益率的时间趋势图(如图1所示)，日收益率表现出明显的“波动性集聚”效应。

Figure 1. Time trend chart of Shanghai Composite Index closing price and logarithmic yield

图1. 上证指数收盘价与对数收益率的时间趋势图

在扰动项服从标准正态分布的假定下，序列数据的偏度应该为0，峰度应该为3。由表1可以看出，上证指数收益率的偏度为−0.61728，峰度为7.9223，呈现“尖峰厚尾”特征，且雅克贝拉统计量显著拒绝了“扰动项服从正态分布”的假设。收益率核密度函数与标准正态分布的函数图形也体现了上述差别(如图2所示)，因此，对该上证指数收益率条件方差的拟合，还需要引入t分布与广义误差分布。

Table 1. Statistical characteristics of data

表1. 数据的统计特征

	Jarque-Bera test	Skewness test	Kurtosis test
Test statistics		−0.6173	7.9223
P值	0.0000	0.0000	0.0000

Figure 2. Comparison chart of yield kernel density function and standard normal

图2. 收益率核密度函数与标准正态对比图

GARCH模型只适用于平稳性序列，并且为了避免时间序列的伪回归问题，需要先对收益率序列平稳性进行检验。进行DF、PP，ADF单位根检验，其中，PP检验可视为优化的DF检验统计量，通过非参数方法来修正DF统计量，使其具有滞后期估计的功能，结果如表2，上述检验在1%的显著性水平下均拒绝了“收益率为非平稳序列”的原假设。

Table 2. Stability test of yield

表2. 收益率的平稳性检验

r_t	DF test	PP test	ADF test (trend)
Z(t)	−38.100	−8.148	−8.147
P值	0.000	0.000	0.000

只有当扰动项存在条件异方差时，才需要使用ARCH或GARCH模型。因此，对上证指数收益率序列进行ARCH-LM检验，结果显示存在显著的ARCH效应(如表3所示)。

Table 3. ARCH-LM test results

表3. ARCH-LM检验结果

Lags (P)	Chi²
1	11.425^***
2	15.389^***
3	25.002^***
4	25.935^***
5	27.7^***

注:^***、^**和^*分别表示在1%、5%和10%的显著性水平上显著，下同。

4.2. 模型的确定与预测结果

构建广义自回归条件异方差模型，需要对收益率序列建立ARMA (p, q)模型得到均值方程，综合考虑AIC准则(Akaike Information Criterion)和SBIC准则(Bayesian Information Criterion Information Criterion)，将收益率自回归模型滞后阶数确定为6阶。此外，参照江涛[9]的做法，考虑到股市资金量对股票收益的影响，将t期股市成交额变化率 $x_{t}$ 以及其一阶滞后项 $x_{t - 1}$ 加入解释变量，股市成交额变化率采用对数计算方式，即： $x_{t} = \ln (l_{t} / l_{t})$ ，为t期的成交额。此AR(6)模型用公式(8)表示，OLS估计结果如表4所示：

$r_{t} = α_{0} + \sum_{i = 1}^{6} α_{i} r_{t - i} + β_{1} x_{t} + β_{2} x_{t - 1} + δ σ_{t} + ε_{t}$ (8)

Table 4. Regression results of the AR(6) model for the Shanghai Composite Index return rate

表4. 上证指数收益率AR(6)模型回归结果

Lags (P)	Chi²
1	11.425^***
2	15.389^***
3	25.002^***
4	25.935^***
5	27.7^***

根据AIC与SBIC准则，参照自相关、偏自相关与Q检验结果，对GARCH类模型及其滞后阶数做筛选，选择了TARCH (1, 1)、EGARCH (1, 1)-M、EGARCH (2, 2)-M模型，并分别汇报它们在标准正态分布、t分布，GED分布假设下的系数回归估计结果，分别在表5~7中列示。从结果中可以看出，无论是TARCH模型还是EGARCH模型，非对称效应均显著，说明外部带来的负向冲击，即利空消息对上证指数价格波动性产生的影响更突出。此外，部分模型中M项系数不显著或无法收敛(表格汇报结果中以“.”表示无法收敛的情况)，可能因为本文研究的对象是股票指数而非个股数据。

Table 5. TARCH (1,1)-M coefficient regression results

表5. TARCH (1,1)-M系数回归结果

TARCH (1, 1)-M	$α_{1}$	$β_{1}$	M项系数	$φ$	$α_{0}$
标准正态	0.2494^***	0.6973^***	6.4645	−0.1458^***	0.0001^***
t分布	0.1552^***	0.7434^***	13.6870^**	−0.1022^**	0.0001^***
GED	0.1858^***	0.7386^***	.	−0.1360^***	0.0001^***

Table 6. EARCH (1,1)-M coefficient regression results

表6. EARCH (1,1)-M系数回归结果

EARCH(1,1)-M	$α_{1}$ (非对称项)	$γ_{1}$ (对称项)	M项系数	$β_{1}$
标准正态	−0.1300^***	0.3016^***	10.8453^*	0.8457^***
t分布	−0.1378^***	0.1893^***	24.3203^***	0.8348^***
GED	−0.1178^***	0.2287^***	19.4278^***	0.8348^***

Table 7. EARCH (2,2)-M coefficient regression results

表7. EARCH (2,2)-M系数回归结果

EARCH (2,2)-M	$α_{1}$ ; $α_{2}$	$γ_{1}$ ; $γ_{2}$	M项系数	$β_{1}$ ; $β_{2}$
标准正态	−0.2111^*; 0.2276^*	0.2151^*; −0.1652^*	3.5310	1.7268^*; −0.7365^*
t分布	−0.2117^*; 0.2221^*	0.0992^**; −0.0473	10.6956^**	1.6793^*; −0.6931^*
GED	−0.212^*; 0.2147^*	0.1512^*; −0.1070^	11.1573^**	1.7022^*; −0.7120^*

4.3. 失败检验法

失败检验法的目的是检验所估计的VaR值是否有效覆盖了实际发生的损失，以此说明VaR模型的有效性。采用公式 $S R_{t} = R_{t} P_{t}$ 计算实际损益，即本期的价格与本期的收益率之积。在样本中，实际损失超出VaR估计值的次数记为N次，假定样本总天数为T日，则实际失败率为 $p = \frac{N}{T}$ 。根据Kupiec失败频率检验方法，覆盖失败的期望概率 $p^{*} = 1 - α$ ，令原假设为“ $p = p^{*}$ ”，运用LR似然比检验假设是否成立，计算方式用公式(9)表示，统计量LR服从自由度为1的卡方分布。如果VaR模型有效，则失败率应该等于预先设定的显著性水平 $α$ ；否则就应该拒绝原假设，说明模型预测效果不佳。

$LR = 2 \ln [{(1 - p)}^{T - N} p^{N}] - 2 \ln [{(1 - p^{*})}^{T - N} {(p^{*})}^{N}]$ (9)

为减少预测错误率，使用99%的置信度进行LR检验，对应卡方分布临界值为6.64。在训练集样本中，各模型的失败频率与失败次数N如表8。例如，在标准正态分布下，由EGARCH (2, 2)-M模型估计的日度VaR值，未能覆盖实际损益累计N = 21天，失败频率 $p = \frac{N}{T} = 0.014$ ，对应LR统计量小于临界值6.64，即通过了Kupiec失败率检验。根据结果可以发现，t分布更适合描述上证指数收益率分布特征，实际失败频率与期望失败概率基本一致，失败频率的差别主要来自于对分布的假设。

Table 8. Test results of failure frequency for various models in the training set

表8. 训练集种各模型的失败频率检验结果

	TARCH (1, 1)-M	LR统计量	EGARCH (1, 1)-M	LR统计量	EGARCH (2, 2)-M	LR统计量
标准正态	0.014 (N = 21)	2.56	0.016 (N = 23)	4.27	0.015 (N = 22)	3.38
t分布	0.006 (N = 9)	2.43	0.006 (N = 8)	3.51	0.008 (N = 12)	0.46
GED	0.007 (N = 11)	0.86	0.007 (N = 10)	1.58	0.012 (N = 18)	0.79

Table 9. The number of prediction failures for each model in the test set

表9. 测试集中各模型的预测失败次数

	TARCH (1, 1)-M	LR统计量	EGARCH (1, 1)-M	LR统计量	EGARCH (2, 2)-M	LR统计量
标准正态	N = 4	5.18	N = 4	5.18	N = 4	5.18
t分布	N = 3	2.63	N = 3	2.63	N = 3	2.63
GED	N = 4	5.18	N = 3	2.63	N = 3	2.63

进一步检验VaR-GARCH模型的预测效果，在给定99%的置信水平下，预测未来100个交易日的VaR值，并与测试集中实际损失进行比较，各模型预测失败次数如表9所示。从结果可以看出，各模型均通过了Kupiec失败率检验，并且EGARCH模型在t分布下具有较好的预测效果。然而，实际错误率均超出期望频率1%，原因可能是依靠AR(6)模型或“非季节性Holt-Winters平滑预测”所得到的上证指数收盘价线性预测结果与实际指数收盘价变化趋势差别较大。只考虑股指收盘价序列自回归而忽视其他变量的线性拟合，可能不足以在中长期内准确估计收盘价的实际波动变化情况。为避免重复汇报，选择性展示了t分布下各模型估计的VaR值与上证指数收盘价日实际损失的对比图(如图3~5所示)。

Figure 3. Comparison of VaR value and actual loss of TARCH (1,1)-M model under t-distribution

图3. t分布下TARCH (1, 1)-M模型VaR值与实际损失对比

Figure 4. Comparison of VaR value and actual loss of EARCH (1,1)-M model under t-distribution

图4. t分布下EARCH (1,1)-M模型VaR值与实际损益对比

4.4. ARIMA-LSTM模型及预测结果

为克服ARMA-GARCH模型在中长期预测中出现的较大误差，进一步，考虑使用ARIMA-LSTM模型实现对指数收盘价的准确估计。该混合模型旨在提高序列数据预测精度，尤其适合同时具有线性和非

Figure 5. Comparison of VaR value and actual loss of EARCH (2,2)-M model under t-distribution

图5. t分布下EARCH (2,2)-M模型VaR值与实际损失对比

线性趋势混合特征的时间序列数据。前文中，计算股指收盘价时所使用的AR(6)模型属于ARIMA模型，构建ARIMA模型需要根据AIC，SBIC等信息准则确定自回归与移动平均滞后阶数，通过捕捉时间序列数据间的线性相关关系实现预测。但是，ARIMA模型难以有效利用序列数据的非线性相关关系以及长期依赖关系所提供的有效信息。

LSTM是一种在时间序列数据建模中广泛使用的神经循环网络(Recurrent Neural Network, RNN)变体。LSTM解决了传统RNN中的梯度消失核梯度爆炸等问题，能更好地捕捉序列数据中的长期依赖关系[18]。相较之下，长短时记忆神经网络模型(即LSTM模型)模型更擅长捕捉非线性相关和长距离依赖关系，但却可能忽视线性相关部分所提供的信息。在此基础上，ARIMA-LSTM混合模型利用了二者的优势互补，使用ARIMA模型捕捉线性关系和短期依赖，LSTM模型则用于捕捉非线性和长期依赖关系。该混合模型以顺序方式构建，首先，构建ARIMA模型，选取合适的滞后阶数对时间序列数据进行自回归分析，其系数估计描述了线性趋势并用于后续预测。其次，ARIMA模型回归后的残差项保留了非线性部分信息，使用LSTM模型训练该残差值，捕捉数据的非线性趋势。最后，将基于LSTM模型得到的残差项预测结果，与基于ARIMA模型的线性预测结果进行加总，得到对时间序列数据的整体预测。

本文在构建模型的过程中，为了保证模型有足量的训练集数据，将训练集比例重新设置为0.9，并绘制了对上证指数收盘价的预测结果(如图6所示)。其中，蓝线表示实际的收盘价走势，红线则表示模型的预测走势，可以看出，在测试集的时间跨度内二者比较接近，ARIMA-LSTM模型在预测的准确度方面有显著提升。重新计算VaR值对实际损失的覆盖情况，将各模型的失败次数列示于表10中。总体来看，尽管实际错误频率仍然超出期望1%，但对比较表10的结果有了明显改进，此外，预测失败的原因也可能与其他因素干扰有关。从图7~9右侧尾部可以看出，t分布下各模型的VaR值估计结果对上证指数实际损失的覆盖效果得到了改善。

4.5. 在条件方差方程中引入注册制

注册制改革在我国最早于2013年11月的十八届三中全会被提出的，实际以2018年科创板宣布设立并试点注册制作为政策实践起点。2020年4月创业板注册制改革正式启动，标志着我国资本市场进入改

Figure 6. Comparison chart between ARIMA-LSTM model prediction results and actual closing price

图6. ARIMA-LSTM模型预测结果与实际收盘价对比图

Table 10. The number of prediction failures for each model in the test set

表10. 测试集中各模型的预测失败次数

	TARCH (1, 1)-M	EGARCH (1, 1)-M	EGARCH (2, 2)-M	LR统计量
标准正态	N = 2	N = 2	N = 2	2.63
t分布	N = 2	N = 2	N = 2	2.63
GED	N = 2	N = 2	N = 2	2.63

Figure 7. Comparison of VaR value and actual loss of TARCH (1,1)-M model under t-distribution

图7. t分布下TARCH (1, 1)-M模型VaR值与实际损失对比

Figure 8. Comparison of VaR value and actual loss of EARCH (1,1)-M model under t-distribution

图8. t分布下EARCH (1,1)-M模型VaR值与实际损益对比

Figure 9. Comparison of VaR value and actual loss of EARCH (2,2)-M model under t-distribution

图9. t分布下EARCH (2,2)-M模型VaR值与实际损失对比

Table 11. TARCH (1,1)-M coefficient regression results

表11. TARCH (1, 1)-M系数回归结果

TARCH (1, 1)-M	$α$	$β$	M项系数	$α_{1}$	$α_{0}$	$φ$
标准正态	0.2503^***	0.6616^***	9.5962^***	−0.1798^***	−0.6643^***	−0.1798^***
t分布	0.1585^***	0.7324^***	15.3418^***	−0.1087^**	−0.4984^***	−0.1087^**
GED	0.1847^***	0.6902^***	14.4034^***	−0.1266^***	−0.5714^***	−0.1266^***

Figure 10. Comparison of VaR value and actual loss of TARCH (1,1)-M model under t-distribution

图10. t分布下TARCH (1, 1)-M模型VaR值与实际损失对比

革的“深水区”。2023年2月17日，注册制在我国股票市场全面推行。注册制改革作为一项我国资本市场基础制度的增量改革，意在为更多具有创新能力但尚不满足传统上市要求的公司提供上市机会，强化新股发行的市场化程度[19]，强制信息披露进而提升股票价格的信息含量，抑制“炒新股”等投机行为[20]，培养投资者的价值投资理念。注册制全面推行进一步完善了我国资本市场的基础制度，在本文的样本环境下，通过在GARCH模型中加入注册制全面推行的虚拟变量(用公式(10)表示)，初步检验并分析注册制改革的施行是否有效降低了股票市场的整体风险水平。以全样本进行条件异方差回归，并展示TARCH (1, 1)-M模型不同分布下的主要系数回归结果，如表11所示(在其他模型中仍能得到相似结论，为避免重复汇报，此处只展示TARCH模型回归结果)。由系数估计结果可知，注册制推行有效降低了上证指数收益率序列的波动性。图10展示了该模型t分布下VaR值与实际的损益对比，全样本下失败次数N = 21次，失败频率P = 0.014符合预期失败频率1%。从右侧尾部可以看出，引入注册制后，VaR-GARCH模型估计的VaR值呈现出明显下降趋势，说明以上证指数表示的股票市场整体风险显著降低。

$σ_{t}^{2} = α_{0} + \sum_{i = 1}^{p} α_{i} ε_{t - i}^{2} + \sum_{j = 1}^{q} β_{j} σ_{t - 1}^{2} + γ_{1} ε_{t - 1}^{2} * 1 (ε_{t - 1} > 0) + δ D_{t}$ (10)

5. 研究结论

本文建立GARCH-VaR模型，测算上证指数风险价值并与指数的实际损失进行比对，通过失败频率法检验预测效果。通常GARCH类模型假设时间序列数据扰动项满足正态分布假设，但结合指数收益率的基本特征与核密度函数图，使用t(k)，GED作为替换分布假设进行条件方差方程拟合。参照信息准则，Q检验等结果，最终选择TARCH (1, 1)-M、EGARCH (1, 1)-M，EGARCH (2, 2)-M三个模型进行上证指数收益率条件方差的估计并计算VaR值。进一步，ARIMA-GARCH模型虽然在训练集下拟合效果基本符合预期，但在测试集中，特别是中长期预测中，表现出对上证指数收盘价序列线性预测效果不佳的问题，VaR值对实际损失的覆盖效果较差。因此，本文引入ARIMA-LSTM混合模型提高收盘价序列预测准度，从时间趋势图来看，该模型预测结果与指数收盘价实际走势基本一致。将预测结果用于估计日度VaR值，所得到的预测结果对实际损失的覆盖效果有了较明显的改善。最后，在初步分析了注册制改革的政策目的后，本文通过TGARCH (1,1)-M模型检验该政策的实施对我国股市整体风险水平的影响。结果表明，注册制全面推行显著降低了上证指数代表的大盘波动性水平，为注册制能抑制我国股市投机炒作行为提供了部分证据。

参考文献

[1]	高岳, 朱宪辰. 基于极值理论的同业拆借利率风险度量——基于AR-GARCH-POT方法的VaR值比较研究[J]. 数量经济技术经济研究, 2009, 26(8): 135-147.
[2]	周茂华, 刘骏民, 许平祥. 基于GARCH族模型的黄金市场的风险度量与预测研究[J]. 国际金融研究, 2011(5): 87-96.
[3]	杨超, 李国良, 门明. 国际碳交易市场的风险度量及对我国的启示——基于状态转移与极值理论的VaR比较研究[J]. 数量经济技术经济研究, 2011, 28(4): 94-109+123.
[4]	严伟祥, 张杰. 基于GARCH-VaR模型的对冲基金市场风险度量研究[J]. 经济与管理评论, 2013, 29(5): 78-83.
[5]	申利. 基于GARCH-VaR模型的外汇风险度量方法的统计比较[J]. 统计与决策, 2018, 34(21): 163-166.
[6]	张贺, 沈倩, 宁薛平. 基于GARCH-VaR模型的金融科技风险测度[J]. 统计与决策, 2023, 39(24): 142-146.
[7]	朱溪溪, 王文胜. 沪深300指数及其股指期货的风险管理研究——基于VaR-GARCH模型[J]. 中国证券期货, 2023(5): 39-47.
[8]	陈浪南, 黄杰鲲. 中国股票市场波动非对称性的实证研究[J]. 金融研究, 2002(5): 67-73.
[9]	江涛. 基于GARCH与半参数法VaR模型的证券市场风险的度量和分析: 来自中国上海股票市场的经验证据[J]. 金融研究, 2010(6): 103-111.
[10]	蒋伟, 顾研. 基于广义已实现测度的Realized GARCH模型改进及应用[J]. 数量经济技术经济研究, 2019, 36(7): 156-173.
[11]	李翠霞, 陈媛媛. 基于经验分布下GARCH模型对VaR的金融测度[J]. 中山大学学报(自然科学版), 2021, 60(4): 177-182.
[12]	次必聪, 张品一. 基于ARIMA-LSTM模型的金融时间序列预测[J]. 统计与决策, 2022, 38(11): 145-149.
[13]	吴鑫育, 梅学婷, 周海林, 尹学宝. 时变风险厌恶与人民币汇率波动率——基于GARCH-MIDAS-SK模型的实证研究[J]. 数理统计与管理, 2024, 43(4): 721-736.
[14]	Engle, R.F. (1982) Autoregressive Conditional Heteroscedasticity with Estimates of the Variance of United Kingdom Inflation. Econometrica, 50, 987-1007. [Google Scholar] [CrossRef]
[15]	Glosten, L.R., Jagannathan, R. and Runkle, D.E. (1993) On the Relation between the Expected Value and the Volatility of the Nominal Excess Return on Stocks. The Journal of Finance, 48, 1779-1801. [Google Scholar] [CrossRef]
[16]	Nelson, D.B. (1991) Conditional Heteroskedasticity in Asset Returns: A New Approach. Econometrica, 59, 347-370. [Google Scholar] [CrossRef]
[17]	Engle, R.F., Lilien, D.M. and Robins, R.P. (1987) Estimating Time Varying Risk Premia in the Term Structure: The Arch-M Model. Econometrica, 55, 391-407. [Google Scholar] [CrossRef]
[18]	危冰淋, 刘春雨, 刘家鹏. 基于Transformer-LSTM模型的多因素碳排放权交易价格预测[J]. 价格月刊, 2024(5): 49-57.
[19]	张宗新, 吴钊颖. 科创板基础性制度改革能否提升市场定价效率? [J]. 证券市场导报, 2021(4): 33-46.
[20]	赖黎, 蓝春丹, 秦明春. 市场化改革提升了定价效率吗?——来自注册制的证据[J]. 管理世界, 2022, 38(4): 172-190+199.

为你推荐

友情链接