1. 引言
经过30多年高速发展,中国期货市场目前已经具有庞大的规模和吸引力。尤其,金融期货品种之一的沪深300股指期货,从上市至今成交额一路高涨。在股市极其活跃的2019年,金融期货成交额也大幅上升,其中沪深300股指期货以26.71万亿元成交额成为当年冠军品种,成交额与去年同比一度大涨241.18%。虽然中国金融期货交易所之后陆续推出了中证500股指期货等资产,但是沪深300股指期货仍然有中国金融期货交易所的近40%成交额占比。
我国金融市场在快速发展的同时,也存在许多问题和危机,比如2015年的股灾。在此期间,沪深300指数经历了过山车式高起高落,使得以沪深300指数为基础资产的股指期货市场也经历了一段黑色风暴。此时,沪深300指数市场及其对应的期货市场价格和交易量持续下跌,陷入流动性危机,不仅使得众多投资者损失惨重,也严重扭曲了资本市场有效配置金融资源的功能。当然,15年股灾不仅发生在股指期货市场,也不仅仅归咎于流动性风险,还有比如投资者羊群行为导致的股市泡沫等也是重要原因。因此,有必要对流动性、波动率等问题展开研究。
流动性、波动率、交易活跃度以及价格跳跃是市场微观结构中被研究的最多的几个问题,其内在规律和相互关系对监管者和投资者都极其重要。对于投机者、套利者以及投机保值者而言,可以利用这些指标反应的市场信息以及指标间的相互作用,进行合理的投资。同样,市场监管者通过分析这些指标的变化以及可能造成的影响,有效进行市场监管,从而降低金融风险,稳定资本市场。
本文使用沪深300股指期货的高频交易数据,计算流动性、波动率、交易活跃度这三个指标,并进行描述性统计。在此基础上,通过构建VAR模型,研究流动性、波动率及交易活跃度的关系。此外,经过格兰杰因果检验和跳跃检验,发现不存在跳跃情况下,各个指标互为格兰杰原因,存在跳跃情况下,交易活跃度对流动性和波动性的引导关系不显著。
2. 文献综述
流动性和波动性指标的研究最为久远,应用较为广泛的是Amihud (2002)提出的非流动性指标,相比于其他指标,该指标衡量流动性主要考虑价格和交易量这两个因素 [1]。随后,Fong等(2017)从低频(每日)数据确定高质量的流动性指标,与高频(盘中)流动性指标相比,市价差是可用的最佳月度百分比成本代理,而Amihud提出的流动性指标是最好的每日流动性表示 [2]。Wang等(2010)采用VAR模型研究了股票市场波动率和流动性的关联问题,并分析了之间的格兰杰因果原因 [3]。同样,Bessembinder等(2015)提取期货合约数据,发现该合约的持仓量和波动率互为Ganger原因 [4]。随着电子信息的发展,高频交易数据开始逐步吸引海内外学者目光,数据频率的提取从月度、日度,逐步发展为小时、分钟以及tick,如Qiao等(2019)采用5分钟高频交易数据,通过实证研究了沪深300股指期现货的流动性 [5]。除了流动性之外,证券价格异常波动也是我们所关心的问题。异质市场假说的提出者Corsi (2009),通过构造三种不同滞后期的已实现波动率来代表三种不同异质市场驱动因素,研究了已实现波动率自回归结构 [6]。除了Amihud提出的流动性指标,Pietro Gottardo (2011)还利用不同回报间隔的方差估计意大利股票和期货市场价格对价值变化的调整速度 [7]。在股市以及债券市场,关于流动性研究文献很多。期货市场的研究较少,如Fenghua Wen等(2019)使用DCC-GARCH模型研究了中国燃料油与股指期货之间的波动溢出效应,发现沪深300指数期货在溢出过程中起主导作用 [8]。
21世纪初,国内学者开始逐步关注波动率、流动性以及交易活跃度之间的关系。随着中国金融市场的日益完善和发展,近几年越来越多的金融工作者开始关注流动性、波动率等因素与金融资产价格的关系。罗洎等(2011)实证研究了股指期货和现货市场波动率和流动性的关系,结果表明股指期货市场对现货市场的波动率和流动性变化有显著引导作用 [9]。欧阳红兵等(2012)采用离散度和交易成本指标研究了上证180指数成分股限价订单簿的流动性提供能力,结果显示流动性可以充当波动率信息传递路径,并主导市场实际波动 [10]。张峥等(2013)利用高频数据研究市场流动性,实证结果发现基于高频数据核算的价差优于其他所有流动性测度的效率 [11]。褚剑、方军雄(2016)等利用地区差异,比较不同时间段各地区波动性,证明了股市波动性容易受到融资融券制度的影响 [12]。除了对股市有相当的研究,学者们也开始研究期货与现货的波动性差异。比如,高扬(2014)使用沪深300指数及其期货的高频交易数据,实证检验了期货与现货市场波动率、交易活跃度以及流动性指标之间的因果关系 [13]。同样,在2019年孙广宇通过构建买卖价差指标来分析市场之间的波动率和流动性,并指出其关系可以显著影响股票预期收益 [14]。以往的研究,注重静态分析。鉴于此,巫秀芳等(2019)通过构建TVP-VAR模型,以动态互动方式研究了杠杆率、波动性以及流动之间的关系,结果显示:股市杠杆率、波动性和流动性之间具有显著的时间效应,当股市处于平稳状态时,杠杆率可以对流动性产生持续的正向效应,即短期存在正向冲击,但是长期这种效应趋于平缓;相比之下波动性和流动性对杠杆率的冲击可以长期持续 [15]。同时,李延军(2020)构建TVP-VAR模型并将知情交易概率作为门限变量,并以其阀值作为市场流动性匮乏、流动性关联异化和市场不稳定的预警指标 [16]。张陈等(2020)运用EGARCH模型,运用沪深300价格指数的日度收盘价格,研究股指期货的推出对股市收益率波动性和非对称性的影响 [17]。
随着金融市场高频数据的广泛使用,利用高频交易数据进行研究已经成为一种常态,但是价格异常波动就成为高频交易研究的意外。在检验价格波动中的跳跃成分中,主要有Barndorff-Nielsen等(2006)提出的BNS方法 [18],Lee等(2008)在此基础上提出检测日内跳跃的非参数方法(LM方法) [19]。后面的学者在此基础上进行了很多的研究,比如Ramesh Adhikari (2019)通过普通最小二乘法(OLS)估计能源、谷物和畜牧业这三个部门之间商品期货收益的过度联动,发现能源和牲畜市场的跨市场未平仓权益和期货回报之间存在着强烈的正相关关系,而跨市场库存变化对能源和谷物行业期货回报的影响非常小 [20]。国内学者针对金融市场跳跃的研究相对较少。考虑金融市场复杂性,孙洁(2014)利用HAR-CJN模型进行波动性预测研究,结果显示该模型的效果优于HAR-RV模型 [21]。同样,王明涛等(2018)采用沪深300指数及对应的主力期货合约5分钟交易数据,利用二值选择模型分析期货与现货共同交易时段跳跃的相互关系 [22]。Ying Li等(2017)使用股指期货高频数据,研究股指期货市场价格跳跃和波动性的关系 [23]。
3. 研究方法
对于我们的跳跃检测,我们遵循Barndorff-Nielsen等(2006) (BNS)跳跃测试。对于对数价格
,假设跳跃–扩散过程为:
(1)
其中
是资产对数价格的变化,
是漂移(它是局部有界且可预测的有限方差过程),而
是时间的增量。
表示瞬时波动率(右连续且极限存在的严格正的随机波动率过程),是一个càdlàg过程,而
是标准的布朗运动。跳跃大小由随机变量
描述,
是强度为
的泊松跳跃过程。如果在增量
中存在跳跃,则项
等于1 (以概率
出现),否则为
等于0。累积过程二次变差
,记为
,是连续样本路径分量的整体波动加上时间0到时间t之间发生的
平方跳跃的和:
(2)
与日二次变差相对应的经验数据是日实现波动率,表示为
,即日内收益率的平方之和:
(3)
其中,
,是在时间间隔
的收益率,本文采用价格
为对数价格。
正如Andersen、Bollerslev和Diebold (2006)所解释的,随着收益采样频率的增加(即
),实现的波动率在概率上一致收敛于二次变化过程的日增量,如方程(4)所示。也就是说,已实现的波动率始终估计综合波动率加上波动率的平方和,这里的RV也是我们后续采用的波动率指标。
(4)
为了解开已实现波动率的连续和跳跃成分,我们需要一致地估计综合波动率,即使在过程中存在跳跃。这是利用Barndorff-Nielsen和Shephard (2004, 2006)的渐近结果完成的。实现的双功率变化量
定义为用一个常数标准化的相邻日内绝对收益的乘积之和:
(5)
这里的
,
是预期的标准正态随机变量的绝对值。可以看出,即使存在跳跃,双幂次变差也收敛于实际波动率:
(6)
一天的跳跃可以通过估计已实现波动率和双幂次变差的差值来衡量。以前的学者将实现的变异测度分解为连续和跳跃分量,通过实现的方差与双幂变差的差来一致地度量跳跃分量:
(7)
根据上述所示,我们构造检验跳跃的统计量
,若满足条件
,那么跳跃被认为是显著的。统计量
的结构如下:
(8)
其中,
是标准正态分布的
分位数,
为四次方变化量,定义为:
(9)
利用式(8)的检验统计量和显著性水平
,我们提取了显著性跳跃
如下:
(10)
其中函数
为指示函数,若发生显著的跳跃,取值为1,否则取值为0。
4. 实证分析
4.1. 数据描述和指标计算
本文以中国金融期货交易所股指期货主力连续合约为研究对象。我国2010年4月16日推出股指期货,本文选取2017年12月25日至2020年12月25日间全部交易日的5分钟交易数据为研究样本。每个交易日交易时间上午9:30~11:30以及13:00~15:00,共计4小时,两个交易时段共48个可观测数据,本文共选取共731个交易日,35,088个观测数据。数据来源于万德数据库,数据预处理采用Python程序进行分钟数据的清洗,计算出每日流动性、波动率以及交易量等等指标。
4.1.1. 流动性指标(Liquidity)
流动性对金融资产价格波动和金融资产预期收益有显著影响。理论研究认为,投资者持有不同流动性的资产,为了满足收益风险平衡机制,会存在一个非流动性溢价。国内外学者在这方面进行了大量实证研究,得出了基本一致的结论。
在早期流动性的测量方法主要是基于最高价、最低价的High-Low估计方法,近几年随着非常方法的广泛使用,常使用换手率作为流动性的衡量指标。因此,我们采用这二种方法,利用换手率来计算市场流动性,定义为:
(11)
其中
表示第t天i时刻的收益率,
表示第t天i时刻的交易量,
表示第t天i时刻的持仓量,M表示第t天的有效观测数据个数。为了方便解释实证结果,这里我们使用如今最常见和有效流动性衡量。
4.1.2. 波动率(Volatility)
波动率主要显示的资产价格的波动显著性,除了以相邻时刻收益率绝对值之积来衡量波动率,现在学者更喜欢使用非参数方法——已实现方差作为波动率的有效估计。已实现方差,记为RV,通过分钟收益率的平方来估计该交易日的总体波动情况。理论上,已实现方差(RV)是价格扩散过程中波动率水平的一个有效估计。实际研究中,市场微观结构噪声会影响波动率的衡量。根据已有文献研究,避免市场微观结构造成的一个较好的方法就是选择合适的数据频率,基于此本文选择高频交易常用频率——5分钟频率。通过5分钟交易数据,直接计算已实现波动率RV。
4.1.3. 交易活跃度(Trade Activity)
交易活跃度主要是考虑交易频率和交易数量,本文用交易量和持仓量指标进行衡量。先计算5分钟数据的交易量和持仓量,然后按照交易日计算5分钟持仓量均值得到日持仓量,记为OI,对5分钟交易量求和得到日交易量,记为VOL。
通过python程序对5分钟交易数据进行预处理得到流动性(LIQ)、波动性(RV)、交易量(VOL)以及持仓量(OI)指标。本文对计算的日度指标进行描述性统计,结果如表1所示。

Table 1. Descriptive statistics of various market indicators
表1. 各市场指标描述性统计
根据描述性统计结果,交易活跃度(交易量指标和持仓量指标)的偏度和峰度并不大,说明交易时比较平稳的。但是波动性和流动性峰度很大,说明存在流动性受市场感染很大。并且,流动性指标的偏度为负值,说明流动性指标的尖峰厚尾特征很明显,这里我们不讨论流动性指标和波动性指标的其他原因,我们只关注这几个指标之间的关系。
4.2. 平稳性检验与跳跃检验
为了检验数据的平稳性和跳跃,本文对交易数据分别进行跳跃识别和平稳性检验。对股指期货市场跳跃识别,本文采用BNS方法。平稳性检验,本文采用ADF、PP和DF-GLS方法,结果如表2所示。

Table 2. The stability test results of each market index
表2. 各市场指标平稳性检验结果
注:表中数字为t统计量,***、**和*分别表示在1%、5%和10%的显著性水平下拒绝原假设。
表2中结果表明,根据ADF检验的结果,RV、LIQ指标在1%的水平上拒绝具有单位根的零假设,而OI和VOL指标存在单位根,但是它们的一阶差分D.OI和D.VOL在1%的水平拒绝存在单位根的零假设。同样,通过PP检验,发现所有指标均在1%的显著性水平下拒绝存在单位根的零假设,表明所用数据为平稳数据。除此之外,根据DF-GLS检验结果,除了VOL指标在10%水平上拒绝存在单位根的零假设,RV、LIQ以及OI指标的显著性水平均为1%。通过三种假设,我们可以认为流动性、波动率、交易量及持仓量的数据是平稳的。
在对跳跃成分的检验中,我们采用BNS的方法识别股指期货主力连续合约的跳跃。在1%的显著性水平下,本文选择的股指期货有731个交易日有跳跃的交易日数为68。根据跳跃日(存在跳跃的交易日)和非跳跃日(为发生跳跃的交易日)条件,本文将数据分为两组。
另外,本文仅将因变量按照价格是否存在跳跃分为两组,自变量的选取保持不变,即价格是否跳跃并不影响自变量的选取。
4.3. VAR模型
根据计算所得到的股指期货市场上的流动性、波动率和交易活跃度指标,以及跳跃检验结果,我们进行实证分析,研究各个指标之间的关系。以往学者有用GARCh模型、VAR模型以及TVP-VAR模型等对股票市场或者债券市场的波动性和跳跃等微观结构进行研究,本文采用VAR模型和Granger检验进行实证分析,来研究跳跃以及非跳跃情况下各个指标的之间的联系。
本文使用VAR模型,并将是否发生跳跃作为外生变量加入模型。同时,根据AIC和BIC准侧,确定滞后阶数为二阶,即模型阶数为VAR(2),实证结果如表3所示。
在表3中,滞后期波动率的增强会对流动性、持仓量和交易量产生显著的正向冲击。
注:表格括号中数值为标准差,***、**、*分别表示回归系数在1%、5%和10%的显著性水平下显著。
而滞后期流动性的增强却会减弱波动性,交易量和持仓量受到其影响不显著。同时,对于滞后期交易量的增加,会增加波动性,但是不会影响持仓量和流动性。此外,滞后期的持仓量几乎不会影响流动性,但是对波动率有显著的负效应,对交易量有显著的正效应。值得一提的是,是否发生跳跃对波动率有显著影响,而对流动性、持仓量和交易量指标的的影响并不显著。因此,本文接下来将基于跳跃的存在性,即按照期货的价格是否发生跳跃进行分组,分别研究期货流动性、波动率及交易活跃度之间线性Granger关系,探究上述各个市场指标间Granger原因有哪些。
4.4. Granger因果关系检验
根据是否存在跳跃,将股指期货数据分为两组。自变量不分组,仅对因变量(根据是否发生跳跃,即Jn是否为0)分组。不存在跳跃时,各个指标间的格兰杰因果检验结果如表4所示。存在跳跃时,各个指标间的格兰杰因果检验结果如表5所示。

Table 4. There is no Granger causality test among the variables when the price jumps
表4. 价格不存在跳跃时各变量间Granger因果关系检验
备注:表格中数值为F统计量,***、**以及*分别表示统计量在1%、5%以及10%的显著性水平下显著。

Table 5. Granger causality test among variables when price jumps exist
表5. 价格存在跳跃时各变量间Granger因果关系检验
备注:表格中数值为F统计量,***、**以及*分别表示统计量在1%、5%以及10%的显著性水平下显著。
如表4所示,在不存在跳跃的情况下,各个指标之间的关系更为密切。波动率指标不仅是流动性指标的Granger原因,此时F统计量在5%的显著性水平上显著,而且波动率(RV)还是交易活跃度的格兰杰原因。同样,流动性、交易量和持仓量均是波动性的Granger原因,且交易活跃度与流动性指标的F统计量在1%水平上显著。但是在存在跳跃情况下,各个指标的关系发生了很大改变,如表5所示。
当我们以跳跃为条件考察各个指标之间的格兰杰原因,各个指标之间的Ganger关系与不存在跳跃的情况大不相同。此时,期货波动率降低会导致当期期货流动性升高,但是交易量和持仓量几乎不会对流动性产生影响。流动性和交易活跃度(交易量)都是波动性的Ganger原因,但是流动性和波动性的降低并不会显著降低持仓量和交易量,即流动性和波动性不是交易活跃度的Ganger原因。
5. 结论
我国期货市场的交易机制不同于国外,并且价格波动变化莫测,对于投资者投资和监管者都提出了极大的挑战。沪深300指数期货是我国金融期货市场的典型代表,经过10多年的发展,交易量和规模急剧上升,对整个期货市场的价格变动有显著引导作用。因此,本文使用沪深300股指期货5分钟交易数据,采用VAR模型研究股指期货市场流动性、波动率和交易活跃度指标之间的关系,并进行了格兰杰检验,主要结论如下:
1) 价格存在跳跃情况会显著影响日流动性、波动率及交易活跃度之间的Granger因果关系。存在跳跃情况下,各个指标的Ganger因果关系十分强烈;但是跳跃情况下,各个指标之间的关系不容易发现。
2) 股指期货价格不存在跳跃时,流动性与波动性和交易活跃度指标之间均存在双向的Granger因果关系。比如,波动性的增加会显著的提高流动性、增加交易活跃度。
3) 股指期货价格存在跳跃时,流动性与波动性互为Granger原因,此时交易活跃度(持仓量和交易量)与这二者之间没有很强的联系,即当期货价格有跳跃发生时,交易活跃度与流动性和波动性的因果引导关系消失。
在期货市场价格波动平稳的时期,投资者以及市场监管者不仅要关注期货市场流动性,更要关注期货市场交易活跃度。在期货市场价格波动剧烈或者存在大量跳跃的时期,投资者应该重点关注流动性,因为此时交易活跃度往往不太重要。