1. 引言
金融市场一直以来都在经济发展中扮演着极其重要的角色,金融市场的各类信息都会对经济的健康发展产生影响。金融市场的风险通常是由金融资产价格的不确定性引起的,研究金融资产价格的波动有利于更深入地了解金融市场影响经济波动的变化规律,进而对价格和市场波动的变化做出更准确地分析与预测。收益率则是衡量金融资产价格波动的重要指标,对金融资产价格波动率进行准确的估计与预测是金融领域研究的核心,在金融产品定价、资产组合构建、风险管理以及货币政策制定中发挥着重要的作用。
我国资本市场已形成主板、科创板、创业板、北交所、新三板及区域性股权市场等多层次资本市场体系,承担着服务实体经济、推动中国经济转型以及助力产业升级的重大历史使命,各板块和市场功能定位明确、层层递进、错位发展,支持着处于不同成长阶段和不同类型企业创新发展。创业板市场作为我国多层次资本市场体系的重要组成部分,已成功运行近15年,但是其作为一个新兴的证券市场远没有达到成熟状态,市场波动性比较剧烈。股票市场中的数据看似杂乱无章,实则蕴含大量信息,如何捕捉股票市场时间序列数据信息并对其进行合理有效分析是研究的热点。而股票指数作为市场上所有股票总体水平的代表,其波动率也代表着市场的总体风险水平,指数波动率的预测相对于个股波动率更受关注。
相较于主板市场,创业板市场为成长性较高的企业提供上市的机会,其股价具有更高的波动性,也为投资者带来了更高的收益与风险。因此,分析并预测创业板综合指数波动有利于把握创业板市场的整体运行情况,降低市场风险。本文选取创业板综合指数的日收盘价数据,通过对其对数收益率序列建立ARMA-GARCH族模型,比较不同阶数下的模型拟合的优劣选出最优模型,对创业板综合指数对数收益率进行预测。
2. 文献综述
收益率是衡量金融资产价格的一个重要的指标,而收益率的波动性可以很好地描述资产价格的波动。目前,国内外在波动性方面的研究主要是利用GARCH族模型及其相关原理进行研究。Engle等(1990)通过对EGARCH、TGARCH等相关模型进行实证研究及比较分析发现,TGARCH模型在分析市场信息对股票市场价格波动性的非对称影响方面更具优点[1]。Chiang和Dong (2001)通过TGARCH模型分析亚洲七个关键股票交易市场的价格数据发现,股票市场价格的波动程度虽然不同但均具有明显的非对称性的特点[2]。唐齐鸣和陈健(2001)通过ARCH类模型对中国股市的波动特征进行分析发现,中国股市具有较为明显的ARCH效应且GARCH (1, 1)模型可以更好地刻画股市波动性[3]。岳朝龙(2002)通过对中国股票市场进行实证分析发现股票市场存在明显的ARCH效应[4]。田华和曹家和(2003)通过分析上证综合指数的收益率波动发现,上证综指存在非对称性的特征[5]。黄海南和钟伟(2007)通过GARCH族模型分析上证指数收益率并对不同模型的预测效果进行比较[6]。仝玉民(2009)通过构建ARCH条件均值方程分析沪深300指数发现,股票市场的波动性受信息不对称的影响并具有明显的杠杆效应[7]。陈艳和韩立磊(2009)通过对沪深300指数建立ARCH模型发现,日收益率数据的波动存在明显的持续性和集聚性的特点[8]。刘任重和郭雪(2016)通过对沪深300指数建立GARCH模型、TGARCH模型进行实证分析,发现股指期货的推出可以降低股市非对称杠杆效应[9]。Mhd Ruslan等(2021)运用GARCH模型研究了波动冲击对三个国家或地区的主要全球航运公司股票收益率数据的影响并得到良好结果[10]。俞越(2022)通过ARMA-GARCH模型对沪深300指数波动性进行分析,研究发现ARMA (2, 2)-N-GARCH (1, 1)模型是拟合沪深300指数回报率波动特征的最优模型,可以有效预测收益率序列[11]。
创业板市场因其特殊属性在资本市场中占据着重要的地位,随着创业板市场的不断完善与发展,创业板市场的股票指数也成为了学者研究的焦点。王玉洁(2012)通过游程检验对创业板指数进行分析,检验结果显示创业板市场弱式有效[12]。王红和陈帅(2014) 采用Wild Bootstrap方差比方法研究创业板价格指数和创业板综合指数,研究发现创业板市场基本达到弱式有效[13]。创业板市场的有效性证明了其存在的必要性,发挥了为中小企业融资的功能、有效分配资本市场的经济金融资源。王凯风(2014)通过对创业板指数进行量化研究并建立ARMA-GARCH模型拟合波动规律,对VAR值进行合理预测[14]。董佳慧和张李兰(2016)通过对比创业板市场个股日收益率与创业板综合指数日收益率,采用事件研究法将高管减持分为三个事件期间进行分析,发现创业板市场上高管减持前后15个交易日内对股票收益率波动产生影响[15]。王兆瑞和方壮志(2016)通过对创业板指数和人民币汇率建立GARCH模型发现二者之间存在负相关关系,再建立VAR模型证明了人民币汇率波动在短期内对创业板指数产生显著影响[16]。
综上所述,GRACH族模型在对股票收益率波动进行刻画和预测时具有很大的优势,能够有效捕捉时间序列数据波动的集聚效应以及异方差效应,及时的反映市场的时变性。关于股票指数收益率的预测以及创业板指数的研究已经有许多学者做过,但是少有学者研究创业板综合指数。我国创业板上市企业通常是具有高技术含量和高成长性的企业,对其股票市场指数进行预测具有一定的现实意义。本文将通过对创业板综合指数数据进行一系列的基本分析,尝试不同阶数的ARMA-GARCH族模型,对创业板综合指数进行波动分析和预测。
3. 模型与数据
3.1. ARMA模型
如果一个随机序列
当前的取值不但与其过去t-p时刻取值相关,同时也与其过去t-q时刻系统内的干扰误差项具有明显相关关系,那么就需要通过自回归移动平均模型即ARMA (p, q)模型对其进行合理有效的描述。ARMA (p, q)模型是由美国统计学家Gorge E.P. Box和英国统计学家Gwilym M. Jenkins在20世纪70年代提出的时间序列分析模型,该模型不但可以刻画时间序列的过去信息,也可以刻画它过去的一系列相关的外部干扰项的内容。模型的基本形式为:
这里
为白噪声序列,服从
,p、q为非负整数。
ARMA模型通过自回归部分捕捉历史值对当前值的影响,通过移动平均部分平滑随机误差项,具有更高的灵活性和精确度,在金融时间序列的分析中既考虑了序列本身的相关性也考虑了随机波动的影响,能够更全面地描述时间序列的动态特性,适用于平稳时间序列数据的分析和预测。因此本文选用ARMA模型建立均值方程。
3.2. ARCH模型
为了能有效刻画时间序列条件方差波动的集群性,Engle提出了ARCH模型,认为时间序列中不同时刻t中存在的方差是受t − 1时刻平方误差的取值大小影响的。ARCH模型主要由均值方程和方差方程两个部分共同组成,ARCH (q)均值方程具体形式如下:
其中,
为t时刻的被解释变量,
为由因变量的滞后变量和外生变量共同构成的解释变量向量。
,
为第t − 1期信息的集合,条件方差
为基于过去信息的一期预测方差。ARCH (q)模型条件方差方程具体形式如下:
其中,
为常数,
为滞后的残差平方项即ARCH项。
ARCH模型通过建立条件方差模型,将历史波动信息作为条件,反映条件方差随时间波动的特征并对其进行预测。
3.3. GARCH模型
Bollerslev在ARCH模型的基础上提出了GARCH模型,增加了长期均值项,有效地解决了参数数量较多的问题。扩展后的模型在兼具ARCH模型优点的同时能够更好地反映金融时间数据的长期记忆性特征,GARCH模型成为研究波动率的最理想模型之一,该模型也成为广泛使用的波动率预测模型之一。对于GARCH (p, q)模型,其条件方差方程具体形式如下:
其中,
是模型在过去时间的条件方差,而q为模型中ARCH项的最大滞后阶数,p为GARCH项的最大滞后阶数。
GARCH模型基于可观测的历史信息对波动率进行预测,是更高效的拟合异方差序列的模型,结构简单且易于实现。此后学者们基于GARCH模型构造出多个衍生模型,如TGARCH模型即门限GARCH模型,进一步修正了对正负扰动的反应对称问题。TGATCH模型的具体表达式为:
其中,
为虚拟变量,当
时,
;否则,
。只要
,就存在非对称效应。
项为非对称效应项即TGARCH项。
对金融时间序列的研究表明,除了波动聚集外,时间序列波动存在明显的非对称特征,即波动对于上升和下降的反应是不相同、不对等的。TGARCH模型通过引入一个非对称项来捕捉金融时间序列中常见的“杠杆效应”,即负面冲击(如股价下跌)往往比正面冲击(如股价上涨)对波动性的影响更大,这种非对称性的考虑使得TGARCH模型能够更准确地描述实际金融市场的波动特征。因此,综合考虑金融时间序列数据的特征,本文主要使用TGARCH模型进行实证研究。
4. 实证分析
4.1. 数据的选取与处理
本文的研究对象为创业板综合指数。创业板综合指数编制方法与上证综指、深证综指类似,其计算方法是以创业板上市的所有股票自由流通股数为权重,采取派氏加权法编制。该指数基日为2010年5月31日,基日指数为1000点。创业板综合指数能够全面反映创业板市场的整体运行情况,为投资者提供市场走势的参考,了解创业板市场的整体表现。创业板综合指数在过去几年中表现出色,特别是在科技股和成长股成为市场风口的时期,创业板综合指数往往能够大幅领跑市场。创业板综合指数自发布以来,经历了显著的波动和市场表现。在2014年至2023年这十年间,创业板综合指数经历了从震荡到牛市,再到调整的过程,指数的波动性较大,为投资者提供了丰富的市场数据和案例,有助于研究市场波动的原因、影响及应对策略。本文选取2014年1月3日至2023年12月29日共2433个数据用来进行参数估计,2024年1月共20个交易日的历史数据用来评价模型预测效果的差异。本文选取Eviews10软件进行实证分析。
由于资产收益率相对于资产价格可以更好地体现该资产的投资机会且具有更好的统计性质,因此本文采用创业板综合指数日收盘价计算其对数收益率,即
,建立创业板综合指数收盘价的对数收益率序列。通过对比发现创业板综合指数收盘价序列是明显的非平稳时间序列,但其对数收益率序列相对平稳。
4.2. 基本统计分析
为了确定创业板综合指数对数收益率序列的分布特征,对该序列进行基本的统计分析,结果如表1所示。
Table 1. Basic statistical analysis for logarithmic return series
表1. 对数收益率基本统计分析
均值 |
标准差 |
偏度 |
峰度 |
JB统计量 |
P值 |
Q(20)统计量 |
P值 |
0.0284 |
1.8542 |
−0.6461 |
5.8030 |
965.7666 |
0.00 |
39.539 |
0.00 |
从表1可以看出创业板综合指数对数收益率分布具有如下特征:均值为正且接近于0说明长期持股可能会获得收益,但很难获得大额收益;偏度值(−0.646)为负说明序列呈左偏分布;峰度值(5.803)大于3,说明序列分布为“尖峰厚尾”;JB检验统计量的P值接近于0,滞后20阶Ljung-Box检验Q统计量的P值也接近于0,二者均拒绝原假设,表明该序列非正态分布且不是白噪声序列。
4.3. 最优模型建立
4.3.1. 平稳性检验
平稳性是时间序列分析的基础,且ARMA模型是对平稳时间序列进行建模,因此在建模之前需对序列进行平稳性检验。为检验对数收益率序列的平稳性,本文采用ADF检验(Augmented Dickey-Fuller Test),该检验的原假设为:原时间序列存在单位根,即为非平稳时间序列,所得检验结果如表2所示:
Table 2. Augmented dickey-fuller test results
表2. ADF检验结果
ADF统计量 |
1%临界值 |
5%临界值 |
10%临界值 |
P值 |
−46.4377 |
−2.5659 |
−1.9410 |
−1.6166 |
0.00 |
创业板综合指数对数收益率序列的ADF检验结果的P值远小于0.01,在1%的显著性水平下拒绝原假设,因此序列不存在单位根,为平稳时间序列,可以建立ARMA模型。
4.3.2. ARMA模型建立
为选择出最优的ARMA模型阶数,通过比对不同阶数模型的拟合结果,结合参数的显著性,初步确定AR (1)、MA (1)、ARMA (2, 2)、ARMA (2, 3)、ARMA (3, 2)、ARMA (3, 4)、ARMA (4, 3),通过赤池信息准则(Akaike information criterion, AIC)、施瓦兹准则(Schwarz criterion, SC)和汉南奎因准则(Hannan-Quinn criterion, HQ)综合判断最优模型,具体结果如表3所示。
通过表3分析可知,最优的拟合模型为ARMA (3, 2),该模型的拟合结果如表4所示。
Table 3. ARMA model fits discriminant information
表3. ARMA模型拟合判别信息
ARMA (p, q) |
(0, 1) |
(1, 0) |
(2, 2) |
(2, 3) |
(3, 2) |
(3, 4) |
(4, 3) |
AIC |
4.0698 |
4.0701 |
4.0656 |
4.0638 |
4.0626 |
4.0632 |
4.0631 |
SC |
4.0722 |
4.0725 |
4.0752 |
4.0758 |
4.0745 |
4.0799 |
4.0798 |
HQ |
4.0707 |
4.0710 |
4.0691 |
4.0682 |
4.0669 |
4.0693 |
4.0692 |
Table 4. The fitting results of the ARMA (3, 2) model
表4. ARMA (3, 2)模型拟合结果
ARMA (3, 2) |
ar1 |
ar2 |
ar3 |
ma1 |
ma2 |
系数 |
0.3994 |
−0.9826 |
0.0690 |
−0.3413 |
0.9817 |
P值 |
0.00 |
0.00 |
0.00 |
0.00 |
0.00 |
具体模型为:
4.3.3. ARCH效应检验
对残差序列
进行ARCH-LM检验,用来确定残差序列是否存在ARCH效应或GARCH效应,且其是否由特定的相关关系导致的。该检验的构造思想是:如果残差序列方差非齐,且具有集群效应,那么残差平方序列通常具有自相关性。该检验的原假设为:原序列不适用ARCH模型或GARCH模型。
对ARMA (3, 2)模型的残差序列进行ARCH-LM检验,不同滞后阶数的检验结果如表5所示:
Table 5. ARCH effect test results
表5. ARCH效应检验结果
滞后阶数 |
F统计量 |
P值 |
LM统计量 |
P值 |
1 |
111.9751 |
0.00 |
107.1249 |
0.00 |
5 |
76.68871 |
0.00 |
331.7999 |
0.00 |
10 |
43.18070 |
0.00 |
367.8437 |
0.00 |
分析表5中数据可以发现,在滞后1阶、5阶、10阶的ARCH效应检验结果均能拒绝原假设,因此残差序列存在异方差性,可以建立GARCH模型。
4.3.4. GARCH族模型建立
一般而言GARCH模型的阶数并不需要很高,我们通过对比GARCH (1, 1)、GARCH (1, 2)、GARCH (2, 1)和GARCH (2, 2)的拟合结果,结合参数的显著性及AIC信息准则,发现GARCH (1, 1)的拟合效果最好,优先建立GARCH (1, 1)模型。
GARCH (1, 1)条件异方差模型表达式为:
ARCH项和GARCH项的估计参数0.0787、0.8995都大于0,且两者之和小于1,满足GARCH模型参数估计条件。并且两项系数估计值显著,反映了异方差性和波动聚集性的存在。
进一步建立TGARCH模型,ARMA (3, 2)-TGARCH (1, 1)模型估计结果如表6所示:
Table 6. ARMA (3, 2)-TGARCH (1, 1) model fitting results
表6. ARMA (3, 2)-TGARCH (1, 1)模型拟合结果
|
AR (1) |
AR (2) |
AR (3) |
MA (1) |
MA (2) |
|
ARCH项 |
TGARCH项 |
GARCH项 |
系数 |
0.3888 |
−0.9929 |
0.0475 |
−0.3440 |
0.9907 |
0.0399 |
0.0446 |
0.0237 |
0.9301 |
P值 |
0.00 |
0.00 |
0.03 |
0.00 |
0.00 |
0.00 |
0.00 |
0.01 |
0.00 |
因此得到的估计方程为:
从所得模型中可以看出ARMA (3, 2)-TGARCH (1, 1)模型对原ARMA (3, 2)模型、GARCH (1, 1)模型进行了一定程度的修正。其中,
为虚拟变量,当
时,
;否则为0。TGARCH项系数为0.0237 > 0说明序列存在非对称效应,
说明满足GARCH模型的约束条件,从GARCH模型的方差方程的非常数项系数显著为正且绝对值明显异于零可以看出,未来的波动确实收到过去波动的正向影响,表现出波动率的聚集现象。
4.4. 最优模型残差序列的ARCH-LM检验
进一步对ARMA (3, 2)-TGARCH (1, 1)模型的残差序列进行ARCH-LM检验,检验结果如表7所示,可以发现无论是滞后1阶、5阶还是10阶,检验统计量的P值都接近于1,说明接受原假设模型的残差序列不具有ARCH效应,即条件异方差得到有效消除。
Table 7. ARCH-LM test results
表7. ARCH-LM检验结果
滞后阶数 |
F统计量 |
P值 |
LM统计量 |
P值 |
1 |
0.0095 |
0.9224 |
0.0095 |
0.9224 |
5 |
0.2514 |
0.9392 |
1.2597 |
0.9390 |
10 |
0.4250 |
0.9352 |
4.2619 |
0.9348 |
4.5. 模型预测与分析
根据ARMA (3, 2)-TGARCH (1, 1)模型,预测2024年1月创业板综合指数20个工作日的收盘价,结果如表8所示。
观察创业板综合指数的预测值、实际值以及相对误差发现,预测与实际之间的相对误差并不是很大,误差绝对值几乎都在0.2%以内。可能的原因有两点:第一是样本时间的跨度较长而预测的天数较短;第二是本文是在对不同阶数GARCH族模型进行了比较后选择的最优模型预测,因此预测误差相对较小。
Table 8. Forecast of the closing price of the ChiNext Composite Index in January 2024
表8. 2024年1月创业板综合指数收盘价预测
日期 |
预测值 |
实际值 |
相对误差% |
日期 |
预测值 |
实际值 |
相对误差% |
2024-01-02 |
2514.214 |
2513.946 |
0.0107 |
2024-01-16 |
2363.868 |
2364.814 |
−0.0400 |
2024-01-03 |
2486.522 |
2488.671 |
−0.0864 |
2024-01-17 |
2293.970 |
2297.656 |
−0.1604 |
2024-01-04 |
2457.801 |
2461.040 |
−0.1316 |
2024-01-18 |
2314.506 |
2314.523 |
−0.0007 |
2024-01-05 |
2413.979 |
2416.565 |
−0.1070 |
2024-01-19 |
2282.119 |
2283.212 |
−0.0479 |
2024-01-08 |
2367.217 |
2368.922 |
−0.0720 |
2024-01-22 |
2175.394 |
2179.713 |
−0.1981 |
2024-01-09 |
2378.115 |
2377.975 |
0.0059 |
2024-01-23 |
2199.066 |
2200.031 |
−0.0439 |
2024-01-10 |
2352.953 |
2354.407 |
−0.0617 |
2024-01-24 |
2218.111 |
2218.201 |
−0.0041 |
2024-01-11 |
2408.408 |
2406.383 |
0.0842 |
2024-01-25 |
2276.667 |
2272.751 |
0.1723 |
2024-01-12 |
2381.744 |
2381.886 |
−0.0060 |
2024-01-26 |
2238.984 |
2238.289 |
0.0310 |
2024-01-15 |
2366.526 |
2366.811 |
−0.0121 |
2024-01-29 |
2149.106 |
2153.358 |
−0.1974 |
5. 研究结论
本文首先对创业板综合指数的收益率序列进行了相关的实证检验,检验结果显示GARCH族模型能够很好地刻画创业板综合指数收益率波动特征及其规律,因此我们构建ARMA (3, 2)-TGARCH (1, 1)模型,系统地分析创业板综合指数的波动性及其波动的可预测性,并得出以下结论:第一,创业板综合指数收益率序列不服从正态分布且其分布具有“尖峰厚尾”的特征。从创业板综合指数收益率序列的波动及其均值可以发现长期持股可能会获得超额收益。第二,创业板综合指数收益率序列具有显著的异方差性和非对称性,通过分析发现TGARCH (1, 1)模型可以较好地描绘创业板综合指数收益率的波动,并且预测误差相对较小。