1. 引言
碳交易市场一直是低碳经济背景下研究的焦点之一。其中,碳交易市场系统风险度量在风险管理中占据着核心和基础地位。2021年7月全国碳交易市场正式启动上线交易,至今已运行一年有余,而2011年相继开展的北京、深圳等七省市碳排放权交易市场运行时间更久,数据累积更丰富,因此,对上述七省市试点碳交易市场的风险研究仍然对全国碳交易市场风险管理有重要的指导意义,审慎度量碳交易市场风险能够帮助市场管理者制定更合理的市场运行机制,建立稳定、有效的市场环境。
在险价值法(VaR)是金融市场系统风险度量最主要的方法之一,它被众多学者和机构广泛研究。其含义是指在一定概率水平(置信度)下,某一金融资产或证券组合价值在未来特定时间内的最大可能损失。VaR度量涉及时序序列收益率分位数和收益率未来波动率,主要有四类计算方法:参数法、非参数法、半参数法和组合建模 [1] 。这些风险测量方法有局限性,其中一些限制包括对时间序列的正态性和线性依赖性假设。而大量的研究发现碳交易收益率序列分布呈现出明显的尖峰胖尾形状,更重要的,价格序列呈现典型的跳跃和波动聚集现象,这将严重增加尾部分布的厚度,从而产生比正态分布更大的损失概率。
围绕改进VaR的预测方法,国内外学者作了许多重要的工作。为修正收益服从正态分布假设,一系列的分布假定被提出,如T分布,威布尔–帕累托分布,逆高斯分布等,这些分布都可以用来拟合随时间变化的日收益率序列分布 [2] [3] [4] ;为了考虑价格跳跃的影响,极值理论(EVT)被引入模型来刻画价格跳跃 [5] 。另一方面,为量化时间序列波动率,建立了GARCH模型。基于之前实证工作,使用GARCH模型预测VaR时,无论是否使用厚尾和偏峰分布,得到的VaR预测结果在小概率时低估风险,在大概率时高估风险。其原因在于传统的GARCH模型假设波动率的变化是线性的。它使用过去的观测值和残差来建模波动率的变化,采用线性的加权和,将过去的波动率信息进行加权平均,以估计当前的波动率。其次,传统的GARCH模型假设残差序列是独立同分布的,即残差之间不存在相关性。这意味着传统的GARCH模型没有考虑到残差序列的长期相关性或其他非线性特征。最后,极值收益对波动的影响估计不足。
随着深度学习在金融领域的应用研究,Prado提出使用人工神经网络来预测波动风险。例如基于GARCH类模型和BP神经网络模型的波动预测和利用BP-GARCH模型实现汇率的有效预测 [6] [7] 。
如何深度挖掘碳交易历史价格数据中隐含的非线性和波动率信息,结合深度学习理论LSTM方法修正GARCH-VaR风险度量模型的线性和独立同分布假设,并应用于碳交易市场系统风险度量,还少有文献讨论。本文将利用碳交易价格信息,结合EGARCH模型,构造LSTM-EGARCH模型预测波动率,结合收益的T分布、极值分布度量方法,构建LSTM-EGARCH-VaR碳交易市场系统风险管理模型,进行实证分析。
2. 研究方法
2.1. LSTM-EGARCH波动率模型的构建
完整的Garch模型分为均值方程和方差方程,而且方程设定需要根据不同的意义设定。实际上,Garch模型是一个对称模型,而金融收益率序列常常具有非对称效应,因此,本文建模引入非对称EGARCH模型:
其中,
为收益率序列,
为残差平方,
为条件方差,
为白噪声序列,且
和
相互独立,当
时,模型为对称模型,当
时收益率对波动率有不对称的影响,并且
表明下跌对随后的波动影响要大于上涨引起的波动增幅。
诚然GARCH类模型可以对碳交易价格时间序列波动率进行有效的建模,但其局限性也显而易见:模型无法量化其中的非线性关系,并且没有考虑到残差序列的长期相关性或其他非线性特征。
神经网络模型包含输入层,输出层和不定层数的隐含层,通过设定阈值、学习速率、激活函数等更新调整各层之间连接权值,使其满足学习目标。神经网络的优势是不仅可以处理非线性关系而且对数据和模型假设没有诸多要求,因此可以很好的弥补GARCH类模型处理非线性信息上的不足。
碳交易价格数据通常存在未知尺度的长期滞后性,标准循环神经网络(RNN)在训练过程中会出现梯度消失问题。长短期记忆网络(LSTM)通过对隐藏层的每个单元节点内部增加控制信息流动的门控单元系统,通过门控系统有选择的遗忘之前积累的信息,加入新的信息,确保梯度可以通过多个时刻而不会消失。
LSTM的一个门控单元系统又称为细胞结构,包含遗忘门(Forget Gate)、输入门(Input Gate)和输出门(Output Gate)。门选择性的允许信息通过。从数学上讲,它是一个
激活函数(例如Sigmoid),取值在0到1之间,值0表示“忘记”,而值1表示“记住”。
遗忘门定义为:
其中
分别为偏置向量,输入权重矩阵和遗忘门的循环权重矩阵,
为t时刻样本特征向量,
为t时刻隐态向量,
为下一时间遗忘门输出向量。
输入门定义为:
其参数定义与遗忘门类似。定义输入调节向量
和细胞状态单元向量
分别为:
由此可知,一个单元系统状态
是由遗忘门
和输入门
控制,其中遗忘门
控制着上一单元系统状态,当遗忘门取值小于阈值时,则上一单元系统状态接近“遗忘”,当取值大于阈值时,则上一单元系统状态会被“记忆”,实现信息存储。输入门
控制着当前信息的调节比率,当输入门
取值为0时,输入信息无法进入单元系统,当取值接近于1时,输入信息将添加到当前时刻的单元系统状态中。
输出门定义为:
参数定义与遗忘门类似。
最终隐含层每个单元系统输出向量
。LSTM本质上是通过三个门控单元,分别控制单元系统的输入、状态更新和输出,从而实现对历史信息的长期存储,有效地修正标准卷积神经网络的梯度消失问题。
针对GARCH类模线性假设和滞后性特点,运用LSTM神经网络修正GARCH类模型,将GARCH类模型的预测结果和历史碳交易价格序列作为LSTM网络输入数据,校正GARCH类模型的不足。LSTM-EGARCH组合模型波动率预测流程框图如图1所示。

Figure 1. Flowchart of the combined LSTM-EGARCH model
图1. LSTM-EGARCH组合模型流程图
1) 根据ARMA模型得到收益率序列的残差序列
、EGARCH模型得到的当期条件波动率序列
,以及已实现波动率序列
,作为神经网络的输入变量。
为输入层和输出层的连接权重,信息前馈传播估计结果
表示为:
2) 实现波动率本文选择基于时窗滑动技术的计算方法,即通过时窗内的日成交数据估计已实现波动率。具体公式如下:
3) 计算神经网络结果的预测误差,更新连接权重值。
2.2. LSTM-EGARCH-VaR模型的构建
LSTM-EGARCH-VaR组合模型的碳交易价格风险度量步骤如下。
1) 考虑序列数据的平稳性,碳交易价格收益率定义为成交均价的对数收益率。
2) 将收益率序列经由ARMA模型得到的残差,通过Arch检验后,利用标准化残差序列建模EGARCH波动率方程。EGARCH模型得到的波动率、碳交易价格收益率和已实现波动率作为输入因素,训练LSTM网络,输出LSTM-EGARCH组合波动率。
3) 对标准化残差分别计算假设在正态分布、T分布和极值分布情况下的分位数,将分位数和LSTM-EGARCH波动率值代入VaR公式:
2.3. 基于失败率的VaR检验
VaR本质是一种统计估计量,因此同其它统计量类似,其准确度受样本容量、统计假设影响,因此需要对结果进行检验。Kupiec给出了一种LR检验方法 [8] ,其方法是通过构造一个LR统计量,将观察序列的实际收益结果与VaR值比较,如果亏损(收益)幅度小于(大于) VaR,则视为一次成功事件,如果亏损(收益)幅度大于(小于) VaR值,则视为一次失败事件。每次比较过程可被视为二项分布中的独立事件,由此可建立LR检验标准。
3. 实例分析
3.1. 数据处理
2013年11月,国内陆续启动了北京、上海、天津、重庆、湖北、广东、深圳、福建碳排放权交易试点,为全国统一碳交易市场做准备。2021年7月16日全国碳交易市场开市交易,截止2023年5月底,运行交易日581天,有成交量的有效交易日447天,市场活跃度为76.94%。其有效交易日样本量基本满足统计分析标准。为保证研究主体的时间一致性,兼顾统计研究要求与实际交易情况,本实例以全国碳交易市场开市时间为起点的581个交易日作为研究范围,选取交易活跃度排名前四的广东、全国、湖北和上海碳交易所为研究主体。碳交易市场成交均价序列进行对数变换后得到收益率序列ri作为研究对象。数据来源为wind数据库。
表1对碳交易市场价格收益率序列的描述性统计显示,全国碳交易市场价格收益率序列是右偏的,其它研究对象则是左偏的。所有研究主体的价格收益率序列峰度大于正态分布峰度值3,表现出尖峰胖尾的特征。这一特征印证了碳市场交易参与者倾向于在履约期前期集中交易,而清缴核算后市场陷入平静。
图2为湖北、上海、广东和全国碳交易市场价格收益率趋势图,各收益率序列均呈现出明显的波动聚集现象,即当前出现较大波动时,未来一段时间内也会持续较大波动。进一步在1%显著水平下,根据ADF检验,各碳交易市场价格收益率序列平稳。ARCH效应检验是检验回归模型的残差是否具有随时间变化的方差。残差序列由ARMA模型得到。根据KS正态性检验和异方差ARCH-LM检验,显示碳交易市场价格收益率残差平方序列拒绝正态性分布假设,且存在显著ARCH效应。综合以上分析,选取使用刻画非对称效应的EGARCH模型建模各碳交易市场波动率。

Table 1. Descriptive statistical information on carbon exchanges
表1. 碳交易所描述性统计信息

Figure 2. Sequence of carbon market price yields
图2. 碳市场价格收益率序列图
用AIC和BIC信息准则判断模型参数的合理性,全国和湖北碳交易市场外采用EGARCH(2,1,1)模型,上海和广东碳交易市场采用EGARCH(1,1,1)模型。
从表2数据可以看出,各碳交易市场GARCH项均显著,说明当前方差冲击对后期存在显著影响。其中全国碳交易市场价格的冲击衰减变化最慢,系数为0.9647,意味着当期波动冲击的96.47%仍会在下一期存在,其市场价格长期记忆性最大;全国和上海碳交易市场
值显著且大于1,说明外部环境对收益率的波动性冲击影响占主要因素,且影响非常强烈。

Table 2. Parameters of EGARCH model of carbon trading market returns
表2. 碳交易市场收益率EGARCH模型参数
此外,除广东碳交易市场
外,其它碳交易市场价格波动对外部环境反应会以较快的速度递增,外部环境的冲击对于碳交易价格波动性的影响要超过其自身的记忆性。广东碳交易市场价格波动具有持久性,当前的信息对预测未来的条件波动非常重要。
湖北碳交易市场参数
估计值小于零,表示在价格变化过程中,利空消息对价格波动的影响,要大于利好消息对价格波动的影响,其它碳交易市场则利好消息对价格波动影响大于利空消息的影响,这也证明了信息对价格波动的杠杆效应。
3.2. LSTM-EGARCH波动率模型VaR风险度量
EGARCH模型预测得到的条件方差、碳交易价格收益率和已实现波动率作为输入因素,训练LSTM网络。数据使用方面,按时间顺序以80%和20%的占比分别划分为实验集和测试集,其中实验集又以90%和10%的占比随机划分为训练集和验证集,输出LSTM-EGARCH组合波动率(见图3)。
求得LSTM-EGARCH组合波动率后,分别计算标准化残差在正态分布、T分布和极值分布情况下99%置信度的分位数,将分位数值和EGARCH预测波动、LSTM-EGARCH波动率分别代入VaR公式计算风险度量值。然后利用基于失败率的LR检验方法,对计算的EGARCH-VaR和LSTM-EGARCH-VaR进行比较。


Figure 3. EGACH and LSTM-EGARCH forecast volatility
图3. EGACH和LSTM-EGARCH预测波动率
从表3的LR检验失败天数统计发现,基于深度学习的LSTM-EGARCH-VaR在残差序列正态分布、T分布和极值分布下风险度量都优于EGARCH-VaR模型。说明基于深度学习的LSTM-EGARCH-VaR模型弥补了基于传统GARCH类在险价值度量的低估风险的不足,更好的覆盖损失情况。

Table 3. Statistics on the number of days of failure of LR test for VaR risk measure in carbon trading market
表3. 碳交易市场VaR风险度量LR检验失败天数统计
4. 结论与分析
本文提出的LSTM-EGARCH-VaR模型综合了LSTM神经网络处理非线性问题的优势和EGARCH类模型对金融产品非对称波动性建模的特点,得到了在正态分布、T分布以及极值理论下的在险价值估计。研究得到如下结论。
1) 在静态分析的基础上,应用极值理论对波动率尾部建模,相较与正态分布和T分布,可以较好的拟合收益率的波动。然后利用EGARCH-VAR模型测算动态VaR,在99%的置信度下,有效的估计碳交易市场的系统性风险。因此,采用极值理论将提高碳交易市场的运行安全。
2) 考虑非线性约束关系的LSTM-EGARCH类模型比传统的GARCH类模型,在碳市场在险价值风险度量出现失败频次更低。对比发现,当碳交易市场具有更高的交易频次可有效降低风险度量失败频次。
3) 基于研究结论,建议要加强市场风险的监测和管理,建立碳市场价格稳定机制,预防市场参与者的投机性风险,提升风险防控能力,除开发更加有效的风险度量模型外,要积极引导提升碳市场交易频次和参与主体范围,广泛、活跃的市场环境将有更加稳健、有效的碳金融市场。
基金项目
北京市教育委员会科学研究计划项目资助(KM202210020001);北京农学院省部级科研平台2022年度开放课题(BUAPSP202208)。