基于iTransformer模型的碳排放权价格预测——以广东碳排放权为例
Carbon Emission Rights Price Prediction Based on the iTransformer Model—A Case Study of Guangdong Carbon Emission Rights
DOI: 10.12677/jlce.2025.141014, PDF, HTML, XML,   
作者: 张明赫:广西科技大学经济与管理学院,广西 柳州;袁中华*:河池学院商学院,广西 河池
关键词: 广东碳排放权时间序列分析Guangdong Carbon Emission Rights Time Series Analysis iTransformer LSTM
摘要: 在世界主要经济体高度关注生态环境问题,我国坚持绿色发展战略,努力实现“双碳”目标的背景下,碳排放权市场成为了一项有效的减排政策工具,被多国所使用。本研究聚焦碳排放权的交易价格,从多角度分析价格影响因素,构建iTransformer机器学习模型来分析价格波动规律及走势,以广东省碳排放GDEA为实证案例进行价格预测,并使用SHAP分析展示了各因素的影响方式和重要性。通过与主流的LSTM模型预测结果进行对比分析,预验证了iTransformer模型的泛用性及预测效果的准确性和可靠性。根据实证研究结果,本文为未来研究方向提供了一些思路,为我国碳市场发展提供了三点政策建议。
Abstract: With the global focus on ecological and environmental issues among major economies, China adheres to a green development strategy and strives to achieve its “dual carbon” goals. Under this context, the carbon emission rights market has become an effective policy tool for emission reduction, adopted by many countries. This study concentrates on the trading price of carbon emissions, analyzing the influencing factors from multiple perspectives. It constructs an iTransformer machine learning model to examine price fluctuation patterns and trends, using the carbon emissions GDEA of Guangdong Province as an empirical case for price prediction. Furthermore, SHAP analysis is employed to illustrate the impact and significance of various factors. By comparing the prediction results with those of the mainstream LSTM model, this study preliminarily verifies the versatility and accuracy of the iTransformer model. Based on empirical findings, the paper offers insights into future research directions and provides three policy recommendations for the development of China’s carbon market.
文章引用:张明赫, 袁中华. 基于iTransformer模型的碳排放权价格预测——以广东碳排放权为例[J]. 低碳经济, 2025, 14(1): 127-136. https://doi.org/10.12677/jlce.2025.141014

1. 背景介绍

近两百年来,科技的突飞猛进,随之而来的是生产方式的急剧变革以及生产力的极大提升。但高速发展的副作用在进入二十一世纪以来愈发显眼,特别是碳排放引起的环境问题引起了社会各界的关注。平衡发展与环境问题间的关系,已成为当下的时代课题,世界各主要经济体均通过制定减排政策、建立碳排放权市场、加强国际合作等方式积极应对挑战。我国于2020年9月正式提出2030年实现碳达峰,2060年实现碳中和的“双碳”目标,二十大报告进一步强调要坚持绿色发展,推动形成绿色低碳的生产生活方式,加快推进生态文明建设。我国规划中,碳达峰至碳中和间的过渡明显短于西方发达经济体,节奏快、任务重[1]。2013年起我国先后在北京、天津、上海、重庆、湖北、广东、深圳及福建8地设立试点交易市场,2021年7月全国碳排放权交易市场正式启动,正式构建出地方市场、全国市场并行的碳排放权交易体系,基本将所有高排放主体纳入了配额交易体系。

碳排放权市场体系是一项有效的减排政策工具,在我国绿色发展战略中起到了重要作用。碳排放权市场是一种典型的总量配额控制机制,监管部门设定区域的年度二氧化碳排放总量,并且根据各种权衡后将配额分配至各排控企业。本年度内排放超过所得配额的企业便需要从市场购买碳排放权,否则就需要缴纳罚款;排放低于所得配额的企业可以将多出的配额卖出,获得经济收益。碳排放权价格波动较大,影响因素复杂,使用传统方法对其价格进行分析预测难度较高。本文在现有研究的基础上,构建试点市场碳排放权价格影响指标体系,并且以地方市场中规模大且较为活跃的广东碳市场为案例,使用机器学习前沿的iTransformer模型对广东碳排放权GDEA价格进行预测,并使用SHAP分析确定了各指标的重要性。另外本文还构建多元回归和LSTM模型进行对比预测,验证了iTransformer模型的预测性能。研究揭示了碳排放权价格的波动规律,为市场参与者及监管机构提供了参考依据,有助于引导价格走向合理,有助于碳排放权市场稳步扩大、走向成熟,为我国绿色发展提供助力。

2. 碳排放权市场现状及价格影响因素

2.1. 我国地方碳市场基本情况

2011年9月国务院在《“十二五”节能减排综合性工作方案》首次提到“推进排污权和碳排放权交易试点”,随后发改委对第一批7各试点地区市场的交易规则、总量控制目标等进行了指示,2013年起各市场陆续开始交易,2016年福建碳市场开始运行,成为第8个试点市场。各地方市场所覆盖的行业均为当地碳排放量最大的行业,以便监管机构对排放总量进行有效控制。各试点市场中,累计成交量最大、最为活跃的是广东、湖北及深圳市场(见表1)。其中广东市场开始较早,交易数据较为完备且价格较为稳定,因此本文选取广东碳排放权GDEA价格作为研究对象,使用2014年10月1日至2024年9月30日的GDEA每日收盘价作为市场价格。

Table 1. Carbon market conditions in different regions (Data Source: iFinD)

1. 各地区碳市场情况(数据来源:iFinD)

试点市场

(交易品种)

建立时间

主要覆盖行业

累计成交量

(万吨截至2024/11)

近一年成交均价

(/截至2024/11)

深圳(SZA)

2013/06

工业、制造业、建筑业等

7715.69

44.38

北京(BEA)

2013/11

制造业、工业、服务业、火力发电等

3480.16

103.36

上海(SHEA)

2013/11

钢铁、电力、石化、宾馆、航空等

2582.64

69.02

广东(GDEA)

2013/12

电力、金属、钢铁、

水泥、石化、塑料、造纸等

20696.94

38.05

天津(TJEA)

2013/12

钢铁、电力、石化、汽油开采等

4494.60

35.00

湖北(HBEA)

2014/04

钢铁、化工、水泥、电力等

12138.72

46.14

重庆(CQEA)

2014/06

钢铁、铁合金、电石、水泥等

4547.53

43.56

福建(FJEA)

2016/12

电力、石化、建材、钢铁、有色等

5409.02

27.13

2.2. 碳排放权价格影响因素

2.2.1. 交易活跃度

交易活跃度直接反映了市场主体的供需旺盛程度和交易意愿。交易活跃度高的市场价格发现和资源配置效率往往更高,价格也会更加合理而稳定。同时交易活跃度保持较长时间的高水平也时常意味着需求端较为发达,也可能会拉高价格。本文使用GDEA日成交量作为交易活跃度的代表指标。

2.2.2. 国外碳价

部分国家和地区率先启动碳交易机制,并且较早形成了较为成熟的碳交易体系,例如欧盟碳交易体系(EU ETS),其价格走势必然会对其他后发碳市场产生示范和引导作用[2]。实际上我国开始建立碳排放权市场时,便一定程度上借鉴了EU ETS的交易机制、管理政策,我国碳市场也将欧盟碳价作为参考对象,而我国碳价长时间以来也明显与欧盟碳价有同向变化[3]。本文使用欧盟碳排放权EUA的每日收盘价作为国外碳价的代表指标。

2.2.3. 宏观经济

宏观经济情况会直接影响碳市场参与者的经营生产活动,而生产活动则直接决定着企业碳排放需求[4]。上行周期的经济中,企业生产扩张会引起碳排放需求的增长,进而影响碳价。如今经济全球化背景下,各国产业链互相交织,经济上联动性较高,国外宏观经济情况也会通过各种渠道传导至我国,影响碳排放权价格。股市是经济的晴雨表,股票指数往往能很好地体现经济中最优秀企业的经营、盈利情况,反映出宏观经济的景气度[5]。本文选取我国沪深300指数和美国标普500指数分别作为国内和国外宏观经济的代表指标。

2.2.4. 能源价格

能源成本是企业生产成本的重要部分,能源价格变动将显著影响企业的生产经营,进而影响其碳排放需求和碳价[6],例如能源价格下降时企业便有动机提高生产量从而加大排放量,拉高碳价。目前我国主要能源来自煤、石油和天然气,其中煤的自给率相对较高,石油和天然气进口依赖大。本文选取iFinD编制的动力煤价格,以及国际原油市场最常用的基准价格:布伦特原油期货收盘价,纽约商品交易所NYMEX天然气期货收盘价分别作为3种能源的价格指标。

2.2.5. 工业发展

工业生产是主要碳排放源,工业产值、产业结构、生产技术水平等工业发展都会影响地区碳排放需求,进而引发碳价变动。工业发展是一个综合多方面的概念,较难直接衡量,但是股票指数能够较为全面地反映行业经营生产情况,本文选取中证全市场指数中的工业行业指数作为工业发展的代表指标。

2.2.6. 区域环境

区域的气候条件、生态环境等因素也会影响区域的生产活动及环境监管,进而引发碳排放需求和价格波动。如冬季低温和夏季高温时,供暖和空调使用增加会大幅提升碳排放需求;空气质量下降则可能引起环境政策趋严,从而影响碳价。本文选取广州市的日最低气温和空气质量AQI指数分别作为温度和空气质量的代表指标。

综合以上分析,本文选取了6个方面的10个指标构建了碳排放权价格影响因素体系(见表2)。

Table 2. Multi-factor indicator system

2. 多因素指标体系

影响因素

指标名称

变量

单位

数据来源

待估指标

广东碳排放权GDEA收盘价

Y

元/吨

iFinD

交易活跃度

GDEA日成交量

X1

iFinD

国外碳价

欧盟碳排放权EUA收盘价

X2

欧元/吨

Wind

宏观经济

沪深300指数

X3

iFinD

标普500指数

X4

iFinD

能源价格

动力煤成交价

X5

元/吨

iFinD

ICE布伦特原油期货收盘价

X6

美元/桶

Wind

NYMEX天然气期货收盘价

X7

美元/百万英热单位

Wind

工业发展

中证全指工业行业指数

X8

iFinD

区域环境

广州市最低气温

X9

˚C

iFinD

广州市AQI空气质量指数

X10

iFinD

3. 模型构建

3.1. iTransformer模型

谷歌研究团队在2017年提出了Transformer模型,其摒弃了对序列信息的依赖,而是通过自注意力机制捕捉输入序列中不同位置之间的依赖关系,从而在并行计算的基础上实现更高效的序列建模,颠覆了传统的基于循环神经网络(RNN)的模型。Transformer模型展现出优秀的泛用性,经过调整改进后被广泛用于机器翻译、语言生成等任务中。目前以著名大语言模型ChatGPT为代表的大多数主流生成式AI模型均采用Transformer架构。Transformer架构以自注意力机制学习输入序列后,预测出后续序列的概率分布,根据概率来生成输出内容,不但高效而且预测准确度高[7]

根据现有研究来看,原始Transformer模型处理语言类任务非常优秀,但是对时间序列处理预测效果并不突出,像将其用于碳排放权价格预测等金融时间序列分析任务便需要进行改进调整。2023年阿里巴巴研究团队在ICLR上提出了iTransformer模型[8],在保留了Transformer模型基本模块的基础上进行了一定的修改,使得模型可不再仅仅对变量间关系建模,而是对变量自身时间序列和各变量间关系同时建模,大大改进了模型的时间序列分析预测能力[9]。iTransformer模型很好地解决了时间序列分析中,变量间相关关系非线性,以及多重共线性等问题,利用机器学习将这些复杂的规律学习并纳入模型,在时间序列预测领域展现出巨大的优势。

Figure 1. iTransformer structure [8]

1. iTransformer结构[8]

模型的基本结构(见图1)及运算过程如下:

(1) 输入嵌入(Embedding)

对于输入的数据, X i,n 代表变量 i 的时间序列中第 n 个值。输入嵌入这个部分将每个变量的时间序列分别聚合成全局特征 h n o

h n o =Embedding( X i,n )

(2) TrmBlock模块

TrmBlock模块由Transformer模型中的多个主要模块构成,包括多变量注意力、前馈网络及层归一化。它是模型主要的机器学习和运算分析模块,通过自注意力机制以及多次的运算可以很好地学习时间序列之间的复杂相关关系:

H l+1 =TrmBlock( H l ),l=0,1,,L1

其中 H 为同一变量整条时间序列的全局特征 h n 的集合, l 为运算次数。

(3) 预测输出(Projection)

模型通过TrmBlock模块进行多轮的学习分析后,持续调整参数使得预测值不断向真实值收敛,达到较好的预测效果。此时模型根据学习得出的序列中下一项的概率分布,选择概率最大的内容作为预测值进行输出:

Y ^ i,n =Projection( h n L )

3.2. 模型评价指标

本文从绝对误差、相对误差和拟合优度多方面选取了4个模型评价指标,以衡量模型预测效果,下面是各指标及计算公式,其中为样本数量,为真实值,为评估值:

(1) 平均绝对误差MAE:

MAE= 1 n i=1 n | y i y ^ i |

(2) 均方误差MSE:

MAE= 1 n i=1 n ( y i y ^ i ) 2

(3) 平均绝对百分比误差MAPE:

MAPE= 100% n i=1 n | y i y ^ i y i |

(4) 判定R2系数:

R 2 =1 i=1 n ( y i y ^ i ) 2 i=1 n ( y i y ¯ ) 2

Figure 2. Prediction results on test set

2. 测试集上的预测结果

4. 实证分析

从数据平台获取原始数据,因为缺失值大多为非交易日造成的价格数据空缺。因此使用前值填充缺失值,这样可以减少时间断点,便于模型学习各指标变化规律,预测结果删去非交易数据即可得到交易价格。按照机器学习基本的研究步骤,本文将原始数据的11个变量的时间序列(Y, X1, X2, X3, X4, X5, X6, X7, X8, X9, X10),共3658组数据按7:1:2分别划分为训练集、验证集和预测集。模型将在训练集上进行学习训练并完成模型初步的参数设置和调整,在验证集上测试在未学习数据上的效果以进一步修正参数。最终调整完善后的模型将根据测试集的数据对GDEA价格进行预测。多变量注意力中,注意力头数设定为8,学习轮数设定为100轮。

4.1. GDEA价格预测

预测集上预测值和真实值整体拟合程度较好,预测准确度较高(见图2)。

部分预测值具体情况显示出良好的预测效果(见表3)。

Table 3. Predicted prices in the month prior to research initiation

3. 研究开始前一个月内的预测价格

交易日

预测值

真实值

2024-09-30

43.98

43.03

2024-09-27

43.54

47.12

2024-09-26

41.57

43.14

2024-09-25

43.88

40.70

2024-09-24

46.31

44.06

2024-09-23

46.33

47.94

2024-09-20

41.44

43.98

2024-09-19

43.56

40.47

2024-09-18

43.20

44.19

2024-09-13

42.95

48.93

2024-09-12

45.39

42.11

2024-09-11

41.95

45.97

2024-09-10

41.65

41.67

2024-09-09

41.78

41.08

2024-09-06

40.68

44.08

2024-09-05

41.16

40.07

2024-09-04

43.33

40.08

2024-09-03

43.91

43.40

2024-09-02

45.05

43.91

4.2. SHAP指标分析

SHAP分析是种广泛用于机器学习模型解释的工具,它基于博弈论中的Shapley值概念。SHAP分析为每个指标分配一个重要性分值,过程考虑了所有可能的指标组合,以确定特定指标在给定预测中的重要性。这些贡献值基于公平分配原则,确保每个指标的贡献是合理的,能够帮助研究者理解模型的决策过程。SHAP分析不仅能解释全模型的整体表现,还能够解释单个指标的影响力及单个预测结果。本文使用Pyphon库SHAP工具对各指标的影响和重要性进行分析。

Figure 3. Importance bar chart

3. 重要性条形图

Figure 4. Dot summary chart

4. 点状汇总图

重要性条形图(见图3)的横轴是对各指标对预测重要性的量化柱状图,可以看出对GDEA价格影响较大的指标为X2、X4、X3、X8、X5,影响一般的为X7、X6、X9、X1,影响较小的为X10。点状汇总图(见图4)是各指标高值(偏红)和低值(偏蓝)对预测结果的影响情况,其中X2、X6指标的高值明显拉高预测值,说明其与GDEA价格有正向关联;而X3、X9、X1的高值则明显拉低预测值,说明其与GDEA价格有反向关联。

4.3. 对比分析

为了验证iTransformer模型的预测效果,本文还构建了目前时间序列分析中主流的机器学习模型-LSTM模型。LSTM模型是目前性能较好的RNN架构模型,其可以学习时间序列数据中长短期依赖信息,促进模型的快速训练[10],同时LSTM在有强关联性的特征数据上也有很强的预测能力[11]。本文使用LSTM对同样的数据进行了学习预测,以对比分析两个模型的预测能力。两个模型的评价指标结果对比差异明显(见表4)。

Table 4. Model evaluation metrics

4. 模型评价指标

预测模型

MAE

MSE

MAPE

R 2

LSTM模型

1.908

12.366

7.375%

0.946

iTransformer模型

1.625

5.939

2.383%

0.932

从MAE的角度看,iTransformer模型预测值与真实值的差距为1.63元/吨,明显优于LSTM的1.91元/吨,说明其预测准确性高。MSE指标对于极端值较为敏感,预测值与真实值差距的极端值较多,或者单个差距过大会使MSE大幅提高,iTransformer模型在MSE指标上大幅优于LSTM模型,说明其预测结果极端值较少,预测可靠性更好。MAPE衡量预测值与真实值的百分比差距,iTransformer模型的MAPE仅为LSTM模型的1/3左右,预测精度优势明显。 R 2 预测值的方差占真实值方差的比例,其不能衡量预测的精度,但是可以体现模型对于真实价格散布和波动情况的拟合程度,通常来说 R 2 大于0.8时便可以判断预测模型对价格方差的解释效果较好,iTransformer模型和LSTM模型均能很好的解释GDEA价格的波动,LSTM模型存在一些优势。

5. 结论及政策建议

本文分析建立了碳排放权价格影响指标体系,构建了iTransformer模型,并以广东生碳排放权GDEA价格为案例进行预测。结果表明,iTransformer模型对碳排放权价格预测有着很好的适用性,能够精确捕捉价格对各影响指标及时间变量的依赖性,准确预测出较长时间内的价格走势及波动,相比目前主流的LSTM模型,iTransformer在评估精准性和可靠性上均有显著优势,具备广泛应用的潜力。评估结果的SHAP分析一定程度上解决了以往机器学习中过程不可观测的“黑盒”问题,定量地显示了各指标的重要性,揭示了碳排放权价格波动的一些机制。总体来看,国外碳价、宏观经济、工业发展和能源价格对我国碳排放权价格影响最为显著。

未来的研究可以对Transformer等具有优秀性能的模型进行更加深入的调整改进,充分发挥机器学习对非线性依赖关系及突发冲击的优秀分析能力,以构建出更加精准、稳定的价格预测模型。同时,随着交易时间的增长,将会有更多实证案例和数据可以用于模型的学习分析,从而使得研究者可以更加合理深入地构建价格影响指标体系,使得机器学习模型更好地发挥对海量数据的处理能力。

根据研究结果,本文提出两点政策建议:首先,监管机构需要不断根据区域经济发展,碳排放总量及分布等情况科学规划碳排放限额,以确保碳排放权交易机制、配额总量的合理性,为碳排放权交易提供一个公平的环境保障,促使碳排放权市场健康发展,稳步扩张,从而更好地发挥减排工具的良好作用,同时可以将碳排放配额分区域细化统筹,使得地区内的碳排放分布更加合理而有利于产业绿色转型。其次,SHAP显示我国碳价与欧盟碳价高度正相关,存在较强的对外依赖,市场独立性还有发展的空间,未来可以根据情况提出更多创新性的制度措施,以培养出更具特色而符合我国发展需求的碳市场。最后,SHAP分析显示我国碳价受国外能源价格影响明显,未来我国应该继续坚定推动新能源发展,并加大力度替代传统化石能源,以提升碳市场的抗风险能力。

NOTES

*通讯作者。

参考文献

[1] 王建芳, 苏利阳, 谭显春, 陈晓怡, 葛春雷. 主要经济体碳中和战略取向、政策举措及启示[J]. 中国科学院院刊, 2022, 37(4): 479-489.
[2] 危冰淋, 刘春雨, 刘家鹏. 基于Transformer-LSTM模型的多因素碳排放权交易价格预测[J]. 价格月刊, 2024(5): 49-57.
[3] 白强, 董洁, 田园春. 中国碳排放权交易价格的波动特征及其影响因素研究[J]. 统计与决策, 2022, 38(5): 161-165.
[4] Ling, M. and Cao, G. (2024) Carbon Trading Price Forecasting Based on Parameter Optimization VMD and Deep Network CNN-LSTM Model. International Journal of Financial Engineering, 11, Article ID: 2450002.
https://doi.org/10.1142/s2424786324500026
[5] Lu, H.F., Ma, X., Huang, K. and Azimi, M. (2020) Carbon Trading Volume and Price Forecasting in China Using Multiple Machine Learning Models. Journal of Cleaner Production, 249, Article ID: 119386.
[6] Zhou, J. and Chen, D. (2021) Carbon Price Forecasting Based on Improved CEEMDAN and Extreme Learning Machine Optimized by Sparrow Search Algorithm. Sustainability, 13, Article No. 4896.
https://doi.org/10.3390/su13094896
[7] 任佳屹, 王爱银. 融合因果注意力Transformer模型的股价预测研究[J]. 计算机工程与应用, 2023, 59(13): 325-334.
[8] Liu, Y., Hu, T., Zhang, H., et al. (2023) iTransformer: Inverted Transformers Are Effective for Time Series Forecasting.
https://arxiv.org/abs/2310.06625
[9] 王钰涵, 梁志勇. 基于iTransformer模型的金融时间序列预测[J]. 产业创新研究, 2024(15): 122-124.
[10] 郭宇辰, 加鹤萍, 余涛, 刘敦楠. 基于CNN-LSTM组合模型的碳价预测方法[J]. 科技管理研究, 2023, 43(11): 200-206.
[11] 曹超凡, 罗泽南, 谢佳鑫, 李路. MDT-CNN-LSTM模型的股价预测研究[J]. 计算机工程与应用, 2022, 58(5): 280-286.