1. 引言
2020年9月,国家主席习近平在第七十五届联合国大会上郑重宣誓:中国将提高国家自主贡献力度,采取更加有力的政策和措施,二氧化碳排放力争于2030年前达到碳达峰,努力争取2060年前实现碳中和 [1] 。
欧盟的碳交易体系 [2] (EUETS)市场机制较为成熟且运行时间长,当下国内外对欧盟碳交易体系的研究成果也相对丰富,众多学者对碳交易价格的影响因素展开了深入地分析和研究。例如Deeney基于事件分析法对欧洲议会的决议对于碳交易价格波动的影响进行了研究 [3] ,Aatola对欧盟ETS市场进行探究并发现碳交易价格与电力价格及能源价格存在着强相关性 [4] ,Tan针对碳交易价格进行了基于分位数回归的探究,阐释了能源、经济因素的依赖性和相应的影响路径,其研究发现在碳金融市场发展前期,能源价格对碳金融市场冲击影响较大 [5] ;而在碳金融市场发展后期,股票市场因素、工业发展趋势的影响力则会逐渐提升。
在国内现有的文献中,郭文军选用了标准普尔500指数、法兰克福DAX指数与沪深300指数等为代表指标 [6] ,探讨了影响深圳碳交易价格的各种因素,并分别从国内、国外的经济因素方面对深圳碳交易价格的影响展开了深入的研究,发现欧洲、中国的经济状况对深圳的碳交易定价具有积极的作用,美国的经济状况对深圳的碳交易价格产生了负面影响 [7] 。陈欣运用上海综合指数和制造业PMI为代表的宏观经济指标,研究了我国七个试点城市的碳交易价格,并通过实证分析得出,宏观经济对其具有明显的作用 [8] 。祝越在对深圳地区的碳交易定价进行研究时,选择了以原油、煤炭为代表的能源价格,并对其进行了实证研究,最终得出煤炭价格对碳价有着负面作用,而原油价格对碳价有着积极影响的结论 [9] 。张云在针对除重庆外的六个试点的碳交易价格进行分析时,选取日均气温与历史平均气温的偏离值作为气候环境因素的代表指标,进而分析该差值对碳交易价格的影响,并得出气温偏差对碳交易价格有着显著的负向影响的研究结论 [10] 。陈欣对我国七个试点的碳交易价格影响因素进行探究时,采用了日均气温与历史平均气温偏差值的绝对值作为气候环境因素的代表指标,进而分析其对碳交易价格的影响,最终发现气温变化对碳交易价格的影响并不显著。同时张玉娟 [11] 、王煦楠 [12] 、欧阳仡欣 [13] 等从理论分析角度阐述了政策因素对于碳价的影响,研究结果显示,政策和制度信息对碳价格无明显影响。
在以往碳排放交易价格的研究中,研究者们大多使用经济计量模型或使用简单的机器学习模型来对碳排放交易价格进行预测,例如高杨和李健在对CER期货的价格进行预测时采用了EMD-PSO-SVM模型,研究结果显示该预测模型能够解决误差序列随机性等问题和缺陷,并且该模型的预测结果准确率也较高 [14] 。王娜使用大数据对深圳市的碳交易价格进行了预测 [15] 。张晨和杨仙子以深圳市碳交易试点为例子,构建了多频率组合碳价预测模型,结果发现该模型相较于NVA、WNN、SVM、GARCH等单模型,预测效果更好 [16] 。石雪涛等 [17] 为预测欧盟碳配额期货价格,构建了PSO-PSR-LSSVR模型,结果显示PSO-PSR-LSSVR模型的拟合精度要高于普通模型。Li和Lu在对我国碳交易市场展开分析研究时运用了EMD-GARCH模型,并对碳交易价格进行预测分析,最终发现EMD-GARCH模型的拟合精度较高,模型表现较为优秀 [18] 。
从上述文献综述可以看出,目前在碳价预测方面已有一些研究成果,但仍有待完善之处:一方面,已有研究主要通过历史碳价数据构建计量经济模型或智能机器学习模型,进而对当期碳价进行预测,对能源市场、金融市场、国际碳市场、自然环境等对碳价有较大影响的关键因素考虑不足;另一方面,现有LSTM等智能机器学习方法对碳价预测的精度通常比自回归求移动平均模型等计量经济方法高,但还有待进一步提升。因此本文将能源市场、金融市场、国际碳市场等对碳价有影响的因素均考虑在内,并使用CFS进行特征筛选并将StemGNN应用于预测碳排放权交易以期为碳排放权交易价格预测提出新思路。
2. 方法介绍
2.1. 相关性特征选择
基于相关性的特征选择(CFS)是由Hall提出的一种经典的过滤式特征选择算法,该方法通过启发式评估函数对特征子集进行评估,进而选择出特征变量预测能力强、特征之间相关性低的特征子集相关系数计算公式和启发式评估函数如下:
式中
为x,y的Pearson相关系数,
分别为
的平均数,
为包含k个特征的特征子集S的启发式merit值,k表示所选特征子集中包含特征变量的个数,
为特征自变量与特征因变量之间相关系数的平均值,其中
,
为特征自变量与特征自变量平均相关性。
CFS算法实现流程是先计算多维时间序列的相关系数矩阵,再使用序列前向选择即SFS搜索策略对变量子集进行搜索,经过启发式评估函数评估得到最优的特征子集。特征子集的搜索首先从空集S开始,首先计算单个特征变量的Merit值,选择Merit值最大的变量
进入S然后选择除
之外Merit值最大的变量
进入S,若
和
之间的Merit值小于原Merit值,则将子集S中的变量
剔除掉接着考虑除
和
之外的其他变量,循环迭代,直到所有变量被筛选完成,此时得到Merit值最大的特征子集
即为最优子集。CFS特征变量筛选原理图如图1所示。

Figure 1. Schematic diagram of principle based on correlation feature filtering
图1. 基于相关性特征筛选的原理示意图
2.2. 门控循环神经网络
GRU也称门控循环单元结构,是传统RNN的变体,GRU模型同LSTM一样能够有效捕捉长序列之间的语义关联,可以有效缓解RNN模型中梯度消失或爆炸现象。同时GRU模型的结构和计算要比LSTM更简单,GRU模型将LSTM模型中的遗忘门和输入门使用更新门来替代,进一步降低了神经网络的计算复杂度、参数量和计算时间。GRU网络结构如图2所示:
GRU网络模型前向传播公式如下:
其中,
为更新门,用来控制
时刻的状态信息和t时刻的输入信息有多少被保留到当前状态,其值越大表明保留信息越多;
为重置门,用来决定遗忘
时刻的信息程度,其值越小表明
时刻的状态信息带入的越少;
为t时刻候选集的状态;
为t时刻的输入向量;
为
时刻隐藏单元的输出信息;
为t时刻的输出信息;W为各类门的权重矩阵;b为各类门的偏置项;
为sigmoid激活函数;
为双曲正切激活函数。

Figure 2. Structure diagram of GRU neural network
图2. GRU神经网络结构图
2.3. 基于谱的图卷积神经网络
图卷积网络将卷积运算从传统数据推广到图数据。其核心思想是学习一个函数映射
,通过该映射图中的节点
可以聚合它自己的特征
与它的邻居特征
(
)来生成节点
的新表示。图卷积网络是许多复杂图神经网络模型的基础,包括基于自动编码器的模型、生成模型和时空网络等。GCN方法又可以分为两大类,基于谱(Spectral-Based)和基于空间(Spatial-Based)。基于谱的方法从图信号处理的角度引入滤波器来定义图卷积,其中图卷积操作被解释为从图信号中去除噪声。
图傅里叶变换(GFT)是频谱图卷积的基本算子。它将输入图投影到正交空间,其中基由归一化图拉普拉斯算子的特征向量构成。归一化图拉普拉斯算子可以计算为:
,其中
是单位矩阵,D是
的对角度矩阵。然后,我们对拉普拉斯矩阵进行特征值分解,形成
,其中
是特征向量矩阵,
是特征值对角矩阵。给定多元时间序列
,GFT和IGFT的算子分别定义为
和
。图卷积算子实现为特征值矩阵
的函数
,参数为
。整体时间复杂度为
。
2.4. 评价指标
为对模型预测结果作出直观评价,本文选取了3种误差指标:MAE(平均绝对误差)、RMSE(均方根误差)以及MAPE(平均绝对百分比误差)。研究对象的数量等级会对MAE和RMSE的绝对数值产生影响,而MAPE作为百分比误差规避了这种差异。Pao等根据MAPE的大小把预测效果分为:高精度预测(MAPE < 10%)、良好预测(10% ≤ MAPE < 20%)、合理预测(20% ≤ MAPE < 50%)和不准确预测(MAPE ≥ 50%) 4类。误差指标的计算方法如下:
RMSE为均方根误差,其范围为
,当预测值与真实值完全吻合时等于0,即为完美模型;误差越大则RMSE的值越大。
其中
表示碳价的预测值,
表示碳价的实际值,N表示数据集的个数。显然如果得到的这三个指标的数值越小,则代表模型的预测精度越高。
3. 模型架构
图神经在时间序列预测方面尚未被广泛使用,且现有的解决方案都没有在谱域中联合捕获时间模式和多变量依赖关系。
StemGNN基于GRU和GCN提出了具有联合捕获序列间相关性和时间依赖性功能的新型碳排放权交易价格预测模型,结合了图傅里叶变换(GFT)和离散傅里叶变换(DFT)。通过GFT和DFT后,谱表示具有清晰的模式,可以通过卷积和顺序学习模块进行有效预测,整体网络结构如图3所示。

Figure 3. Overall network architecture diagram
图3. 整体网络架构图
在对多变量时间序列进行建模时,基于GNN的方法需要图结构。因此利用自注意力机制自动学习多个时间序列之间的潜在相关性。
首先,输入
被送入一个门控循环单元(GRU)层,该层依次计算每个时间戳t对应的隐藏状态。然后,使用最后一个隐藏状态R作为整个时间序列的表示,并通过自注意力机制计算权重矩阵W,如下所示:
其中
和
表示query和key的表示,可以分别通过注意力机制中具有可学习参数
和
的线性投影来计算;
是
和
的隐藏维度大小。输出矩阵
作为图
的邻接权重矩阵。Self-attentionn的整体时间复杂度
。
图
作为两个残差StemGNN块组成的StemGNN层的输入。StemGNN块的设计目的是在频谱域联合多变量时间序列内的结构和时间依赖性进行建模。首先,图傅里叶变换(GFT)算子将图
转换为谱矩阵表示,其中每个节点的单变量时间序列变为线性独立。然后,离散傅里叶变换(DFT)算子将每个单变量时间序列分量变换到频域。在频域中,分量被输入一维卷积和GLU子层以捕获特征模式,然后通过逆DFT转换回时域。最后,在谱矩阵表示上应用图卷积并执行逆GFT。
在StemGNN层之后,添加了一个由GLU和全连接(FC)子层组成的输出层。网络中有两种输出。预测输出
被训练以生成对未来值的最佳估计,而回溯输出
以自动编码方式使用以增强多元时间序列的表示能力。最终的损失函数可以表示为预测损失和回溯损失的组合:
其中第一项表示预测损失,第二项表示回溯损失。对于每个时间戳t,
是滑动窗口内的输入值,
是要预测的真实值,
是时间戳t的预测值,
是来自回溯模块的重构值。
表示产生回溯输出的整个网络,
表示网络中的所有参数。
在推理阶段,采用滚动策略进行多步预测。首先,通过将
作为输入来预测
。然后,输入将变为
用于预测下一个时间戳
。通过连续应用这种滚动策略,可以获得下一个H个时间戳的预测值。
4. 实验分析
4.1. 参数设置
本文软件环境为python3.8,每个图卷积层的通道大小设置为64,1D卷积的内核大小为3。采用RMSprop作为优化器,并且将训练时期的窗口大小设置为50。学习速率初始化为0.001,每5个epoch后以0.7的速率衰减。
4.2. 数据来源
上海碳排放交易所目前已经成为全国规模和业务量最大的碳排放交易所之一,并且目前正在牵头组建全国碳排放权交易所。因此,本文选取其自2019年7月17日至2023年4月13日共595条交易数据进行实证分析。将数据按照8:1:1的比例划分为训练集、验证集以及测试集,在训练集上对模型进行学习与训练,在验证集上用于调整超参数,在训练集上验证模型的预测精度。对数据进行描述性统计如图4~图6所示。
4.3. 影响因素变量选取
本文以上海市碳排放权交易试点为例,对碳排放价格进行预测。关于解释变量本文根据查阅国内外相关的参考文献,选取了初步认为对碳交易价格影响较大的几个因素,同时考虑到数据的可获得性,本文选取中证500工业指数、沪深300指数、美元汇率、欧元汇率、温度、空气质量指数、原油期货、天然气期货、动力煤期货作为解释变量,变量的具体情况参见表1。

Figure 4. Training set data trading price trend chart
图4. 训练集数据交易价格走势图

Figure 5.Validation set data trading price trend chart
图5. 验证集数据交易价格走势图
下面将从经济因素、能源价格、气候因素三个角度对采用的解释变量进行说明。
宏观经济的发展影响着社会的总供给与总需求,供需关系决定了社会的生产状况,生产状况越繁荣,则社会总体碳排放量越高,从而影响碳排放权价格。因此从经济因素角度出发,本文采用中证500工业指数、沪深300指数、美元汇率以及欧元汇率分为代表指标,分别用x1、x2、x3、x4表示。经济发展水平会对社会的需求和消费产生直接影响,碳金融体系的运行离不开市场经济,由此国内外经济的变化情况会对碳价的波动产生重要影响。
在夏季或是冬季人们空调或暖气的使用率大大增加,导致全社会的用电需求量增加,从而引起发电

Figure 6. Test set data trading price trend chart
图6. 测试集数据交易价格走势图

Table 1. Specific situation of variables
表1. 变量具体情况
企业的碳排放量增加,从而影响碳排放权的价格。空气质量指数主要对CO2、PM 2.5、PM 10、CO、O3等污染物进行检测,进而反映了空气中主要污染物的含量。AQI的值越高,则意味着空气污染越严重,因此政府分配给各企业的碳配额就会越少,碳价会因此升高。因此从气候环境的角度出发,本文选取空气质量指数及温度作为代表指标,分别用x5、x6表示。
能源价格与碳交易价格密切相关。煤、石油、天然气等能源价格的变动会引起企业对所使用的能源类型、所占比例以及消费总量的变化。一方面,碳交易价格上涨时,企业为了减少成本会减少对碳排放权的购买和使用。另一方面,企业也可以通过改变生产方式、提高能源利用率或使用清洁能源的方式介绍对化石能源的使用,导致二氧化碳排放量降低,从而影响碳排放权的价格。本文选取原油期货、天然气期货以及动力煤期货这几个指标作为能源价格角度的主要因素,分别用x7、x8、x9表示。
对各影响因素进行描述性统计,结果如表2所示。

Table 2. Descriptive statistical results of each factor
表2. 各因素描述性统计结果
因相关因素数目过多,因此本文中只展现部分使用相关性函数的前向搜索计算过程如下(表3):

Table 3. Partial results based on CFS feature screening
表3. 基于CFS特征筛选部分结果
经过CFS特征筛选之后,根据Merit值最大即为最优子集的原理,筛选出最终的最优子集中包含温度,原油价格,沪深300指数,中证500指数,美元汇率,欧元汇率,天然气价格等因素。
从而可以得知根据CFS原理,碳排放权交易价格与温度、原油价格、沪深300指数、中证500指数、美元汇率、欧元汇率以及天然气价格等因素有关,而动力煤价格以及空气质量指数这两个因素对于碳排放权价格的影响较弱。各影响因素的相关性矩阵热力图如图7所示。

Figure 7. Correlation heatmap of various influencing factors
图7. 各影响因素的相关性热力图
4.4. 实验结果与分析
本文将LSTM网络、GRU网络作为对比网络模型,从而说明StemGNN在预测碳排放权交易价格方面的有效性。将筛选出的影响因素作为输入分别传入LSTM、GRU、StemGNN网络中,得到的预测结果如表4所示。

Table 4. Prediction accuracy results of each model
表4. 各模型预测精度结果
由表4可知,StemGNN网络在各评价指标中都取得了良好表现,总体效果均优于其他对比模型。StemGNN网络相比于LSTM和GRU网络模型具有联合捕获序列间相关性和时间依赖性功能,因此具有较好的预测性能。图8~图10分别为LSTM网络、GRU网络模型以及StemGNN在上海碳排放权交易价格上的预测结果。其中,横坐标代表预测天数,单位为天,纵轴为碳排放权交易价格,单位为元。由图10可以看出,StemGNN模型的预测值与实际真实值之间的拟合效果较好,其预测性能明显高于其他对比模型的预测性能。

Figure 8. LSTM network prediction results
图8. LSTM网络预测结果

Figure 9. GRU network prediction results
图9. GRU网络预测结果

Figure 10. StemGNN network prediction results
图10. StemGNN网络预测结果
5. 结语
本文使用StemGNN模型,即基于GRU和GCN提出了具有联合捕获序列间相关性和时间依赖性功能的新型预测模型对碳排放权交易价格进行预测,并且采用了平均绝对百分比误差(MAPE)、平均绝对误差(MAE)、均方根误差(RMSE)作为预测模型拟合精度的衡量指标。通过测试分析,我们可以得出StemGNN模型的预测值与实际真实值之间的拟合效果较好,其预测性能明显高于其他对比模型的预测性能。因此,StemGNN模型具备较好的预测能力,相较于普通LSTM、GRU模型更加准确,能够用于碳排放权交易价格的预测。并且以该模型为参考,也可以对全国其他省的碳交易价格进行预测分析,对碳金融市场的碳价预测具有一定的借鉴意义和参考价值。
基金项目
国家自然科学基金(2081112000701)。