1. 引言
在“双碳”目标(2030年前碳达峰、2060年前碳中和)背景下,碳排放权交易市场成为引导企业减排、优化环境资源配置的核心机制。自2011年起我国先后在8个试点地市开展了碳排放权试点工作,2021年7月16日全国碳排放配额(Carbon Emission Allowance, CEA)交易市场正式启动,标志着我国碳排放权定价机制进入市场化新阶段——CEA价格作为碳市场的关键信号,直接影响企业减排成本核算、低碳投资决策与产业链结构调整[1]。然而,我国碳交易市场起步较晚,交易机制还不完善,CEA价格受宏观经济波动、能源价格联动、国际碳市场传导及政策调整等多因素交叉影响,表现出线性趋势与复杂的非线性波动并存特征。传统单一模型往往难以同时刻画这一复合性特征,预测精度因而受限,进而影响碳市场的风险管理和政策调控效果。基于此,本研究尝试将ARIMA模型与改进的BP神经网络组合建模,以提升全国碳排放权价格的预测精度。此外,本研究对模型性能的评估不仅限于传统的点预测误差指标,还进一步分析模型在价格涨跌方向预测上的表现,以期为不同应用场景下的模型选择提供更全面的参考。
碳排放权价格预测研究长期以来都是碳市场领域的热点,现有文献主要从影响因素分析与预测模型构建两个维度展开。预测方法也呈现出由传统统计方法向人工智能模型演进,再到混合型组合模型发展的趋势。
在影响因素研究方面,研究侧重于识别碳排放权价格的核心驱动因素。Alberola 等(2008)针对欧盟碳市场(EU ETS)的早期研究表明能源价格(特别是煤炭与天然气价差)通过发电企业的燃料切换行为成为驱动碳价波动的关键变量[2]。在中国的试点市场中,李菲菲等(2020)通过结构性断点检验,证实了重大政策事件对各试点碳价存在显著而异质的影响[3]。随后,姜瑜等(2021)将技术进步纳入分析框架,发现其与碳价之间存在显著的协同关系[4]。这些研究成果为预测模型的变量选取奠定了理论基础。
在预测模型方面,时间序列模型因其在处理线性特征上的优势而被广泛应用。王娜(2017)在对碳价预测时,针对模型阶数较高的难题,提出了一种Boosting-ARMA预测算法,利用Boosting算法自动且高效地完成ARMA模型的识别[5];田玲玲等(2023)基于ARMA-GARCH家族模型对北京碳价进行了预测[6];姜楠等(2025)则利用AR-GARCH模型分析了全国碳市场的价格波动性[7]。然而,碳价序列兼具线性趋势与非线性波动的复合特征,这使得传统计量模型在捕捉复杂非线性关系时存在局限。为了弥补这一不足,研究者逐渐转向机器学习与人工智能模型。BP神经网络凭借其强大的非线性能力成为主流工具之一。赵成柏等(2012)将ARIMA与BP神经网络结合,利用ARIMA捕捉线性趋势,再将残差输入BP网络进行非线性修正,验证了组合模型的优越性[8]。罗中杰(2023)的实证研究表明,融入多影响因素的BP神经网络模型的预测精度要比单一时间序列模型效果好[9]。与此同时,遗传算法(GA)、布谷鸟搜索(CS)等优化算法被引入以改善BP神经网络的训练效率和稳定性[10] [11]。
近年来,混合组合模型成为提升预测精度的前沿方向,其基本思想是利用不同模型的互补性来提高预测精度。Zhu和Wei (2013)将ARIMA与最小二乘支持向量机(LSSVM)相结合,为混合模型研究提供了有益借鉴[12]。周莉(2023)则提出了基于信号分解与深度学习的CEEMDAN-ARIMA-GARCH-LSTM框架,通过多层次建模提升了预测准确率[13]。
综上所述,尽管已有研究成果丰富,但仍存在以下不足:(1) 大多数研究仅关注单一优化方法改进BP神经网络,缺乏对学习率自适应调整机制的深入探讨,因而未能系统性解决收敛速度慢与局部最优问题;(2) 组合模型多数采用简单加权或主观赋权方式,未能实现基于模型性能的动态权重分配。本研究的创新点在于引入粒子群算法与Adam算法双重优化BP神经网络,结合梯度下降法实现客观权重寻优,并以点预测精度和方向预测准确性为标准衡量模型性能,全面增强模型的预测性能与决策参考价值。
2. 碳排放权价格预测模型构建
2.1. ARIMA模型
ARIMA (Autoregressive Integrated Moving Average)模型即差分自回归移动平均模型,是一类经典的时间序列预测模型。通过差分消除非平稳性,再利用自回归与移动平均成分来刻画线性特征。ARIMA (p, d, q)模型的核心公式为:
(1)
其中,
为滞后算子,
表示对序列进行
阶差分,
和
分别表示自回归和移动平均的系数,
为白噪声误差项,
表示自回归模型阶数,
表示移动平均模型阶数。
ARIMA模型能有效捕捉时间序列中的线性趋势,但在处理高度非线性和突发波动方面表现不足。
2.2. 改进的BP神经网络
BP (Back Propagation)神经网络属于典型的多层前馈神经网络结构,包含输入层、隐含层和输出层,各层之间通过权重与偏置相互连接。该网络通过前向传播计算输出结果,并借助误差反向传播机制,根据输出值与真实值之间的误差逐层调整网络中的权重和偏置参数,通过迭代优化使网络输出不断逼近真实值,最终达到设定的收敛条件。
输入层与隐含层之间神经元的关系为:
,
。其中
表示
输入层神经元,
表示输入层的第
个神经元与隐藏层的第
个神经元之间的权重值,
表示第
个神经元的偏置,
表示隐含层输出结果,
表示激活函数。隐含层与隐含层、隐含层与输出层之间神经元的关系与之类似。单个隐含层的BP神经网络结构如图1所示。
Figure 1. Topology of BP neural network
图1. BP神经网络拓扑图
BP神经网络的非线性映射能力和自适应能力使其在很多领域得到广泛应用,但其也具备一定的局限性,比如对于初始权重依赖性强、学习率固定以及容易陷入局部最优等缺陷。针对以上不足之处,本研究进行了如下改进。
2.2.1. PSO优化初始权重和阈值
BP神经网络对初始权重和阈值依赖程度较大,若初始权重或阈值设置不当会导致梯度消失或梯度爆炸,使训练停滞;同时也会降低训练效率与模型性能。本研究利用粒子群算法(Particle Swarm Optimization, PSO)对BP神经网络的初始权重与阈值进行优化,以提升其整体性能。
粒子群算法是一种基于群体智能行为在解空间中搜索最优解的随机优化算法。在本研究中,将BP网络的所有初始权重和阈值编码为一个粒子,以网络预测误差作为适应度函数。通过迭代更新粒子位置,最终获取一组性能优异的初始参数,为后续神经网络训练奠定良好基础,以增强模型的稳定性和泛化能力。
2.2.2. Adam算法优化自适应学习率
在传统BP神经网络中,学习率一般是固定的,所有权重共享同一个全局学习率,这种设置难以适应不同特征对参数更新的差异化需求。此外,传统的梯度下降方法容易在损失函数曲面较陡或较平坦的区域产生振荡,从而导致算法收敛速度慢,且容易陷入局部最优。为克服上述局限,本研究引入Adam (Adaptive Moment Estimation)自适应优化算法。Adam算法通过利用每个参数梯度的一阶矩和二阶矩估计,使得全局学习率根据其进行调整,进而使得每个参数都能获得与其历史行为相适应的有效步长更新,可有效缓解梯度振荡问题,使BP网络更快收敛至更优解。
2.3. 基于梯度下降法的组合模型
为了更好地平衡ARIMA模型的线性特征和BP神经网络的非线性处理能力,通过赋予ARIMA和BP神经网络不同的权重值构造并联型组合模型。梯度下降法可以通过迭代优化确定各子模型的最优权重,以达到最小化组合模型整体误差的目的。同时,也可以避免人工赋权的主观性,提升组合模型的综合性能[14]。
ARIMA-改进BP加权组合模型流程为:首先并行使用两种算法分别对模型进行预测,其次借助梯度下降法计算两种模型的权重值,最后将加权求和的计算结果作为组合模型的预测值,组合模型计算公式如下。
(2)
其中
是加权组合模型的预测结果,
是第i种模型的预测结果,
是第i种模型的权重值。
2.4. 模型评价指标
为综合评判模型预测性能,本研究从点预测精度与方向预测准确性两个维度选取评估指标。点预测精度选取均方根误差(RMSE)、平均绝对误差(MAE)、平均绝对百分比误差(MAPE)作为模型评价指标。RMSE、MAE和MAPE数值越小,模型预测效果越准确。其计算公式分别为:
(3)
(4)
(5)
其中
是样本的个数,
和
分别是第i个样本的真实值和预测值。
方向准确性(Directional Accuracy, DA)指标是评估模型预测价格变动方向(上涨或下跌)与实际方向一致的能力,对于交易决策至关重要。其计算公式为:
(6)
其中
是指示函数:。DA值越高,表明模型捕捉市场趋势变化的能力越强。
3. 碳排放权价格预测模型构建
3.1. 变量选取与数据来源
3.1.1. 研究对象
2021年7月16日,全国碳排放配额交易市场正式启动,是我国实现“双碳”目标最关键的政策工具之一,研究CEA价格对于理解全国统一碳市场的运行具有重要的意义。故本研究以全国碳排放配额(CEA)收盘价为研究对象。
3.1.2. 影响因素分析
当前国内外学界对碳排放权价格影响因素已有较多、较为深入地探讨,宏观经济、能源价格、汇率及国际碳市场四大因素被普遍视为主导国内碳价变动的核心变量,但其作用机制与影响路径仍需结合国内碳市场的实际运行情况进一步深入剖析。
宏观经济以总消费、总投资与净出口为核心构成,其规模扩张或收缩直接作用于碳排放市场的供需关系:经济上行期,工业生产、能源消耗需求增加,碳排放总量上升,推动碳配额需求增长;经济下行期则相反,进而通过供需失衡影响碳交易价格,是碳价波动的基础性驱动因素。
能源价格与碳价存在多重且具有行业差异性的联动关系。在我国碳排放结构中,二氧化碳排放占比排名前三的分别是煤炭、石油、天然气。不同类型企业的能源消费结构也各不相同,当某类主导能源价格波动时,企业会重新权衡是购买碳配额以完成履约还是投入资金改善能源结构、降低碳排放这两种方案的成本与收益,最终通过生产决策调整传导至碳价,形成能源价格对碳价的间接影响。
汇率作为国际贸易的核心调节变量,其波动会通过进出口贸易链条影响国内经济活动:汇率升值可能抑制出口、促进进口,导致出口导向型高耗能企业生产规模收缩;汇率贬值则可能刺激出口,推动相关企业产能扩张,而生产规模的变化会直接影响企业碳排放总量,进而间接作用于碳配额需求与碳交易价格。
欧盟碳市场历经多年发展已进入成熟阶段,其碳配额(EUA)交易价格较为稳定,波动性范围合理,能够较为准确地反映全球碳排放权的客观供需关系。相比之下,我国碳市场仍处于初期过渡阶段,在配额总量设定、交易制度设计、市场参与者结构等方面尚未完全成熟,故而EUA价格波动及国际碳市场政策调整,均可能对国内碳配额交易价格产生影响。
3.1.3. 数据来源与处理
选取全国碳排放配额(CEA)价格作为研究对象,即被解释变量;选取四大类共7个指标作为碳排放权价格的影响因素,即解释变量。表1列出了各指标的选取及来源。
Table 1. Variable selection and data sources
表1. 变量选取及数据来源
变量 |
指标 |
来源 |
被解释变量 |
全国碳排放配额(CEA) |
Wind数据库 |
解释变量 |
宏观经济 |
沪深300指数收盘价(HS) |
英为财经 |
上证指数收盘价(SHZ) |
英为财经 |
能源价格 |
WTI原油期货收盘价(WIT) |
英为财经 |
动力煤期货收盘价(DLM) |
英为财经 |
天然气期货收盘价(TRQ) |
英为财经 |
汇率 |
欧元兑人民币汇率(EUR) |
Wind数据库 |
国际碳价 |
欧洲碳排放配额(EUA) |
Wind数据库 |
CEA价格数据的选取时间为2021年7月16日~2023年7月14日,按照选取时间对表1中7个解释变量进行数据提取。为了保证选取变量的一致性,只保留有效交易日对应的收盘价。对于缺失数据,采用前一时刻填充法对7个解释变量的缺失值进行填充,最终得到482条数据。
3.2. 数据预处理与实证分析前检验
在构建模型之前,需对数据进行必要的预处理并进行统计检验,以确保数据质量和模型有效性。
3.2.1. 数据标准化处理
在用BP神经网络做模型预测时,若数据量纲不同会造成预测数值不准确。根据文献研究,采用min-max normalization函数对输入数据进行归一化处理,以消除不同特征因量纲差异带来的影响。其计算公式为:
(7)
其中
是原始特征数据,
和
分别是原始特征数据的最大值和最小值。
3.2.2. 平稳性检验
在使用ARIMA模型对CEA价格进行预测前,需要观察序列是否具备平稳性。借助python软件绘制CEA价格的时序图,如图2所示。
Figure 2. Original time series chart of CEA
图2. 碳排放权价格原始时间序列图
从图2可以看出,CEA价格不具有平稳性。ADF检查结果为
,进一步表明序列不平稳,需要对原始数据进行差分处理。经过一阶差分处理之后,
,即一阶差分之后的序列已具备平稳特征。
3.2.3. 变量相关性分析
为量化各变量与CEA价格间的线性相关性,本研究采用皮尔逊相关系数进行分析,结果见图3。
从图中可以看出上证指数(SHZ)、沪深300指数(HS)、动力煤(DLM)与CEA存在较强的负相关关系,欧洲碳排放配额(EUA)、WTI原油与CEA存在较强的正相关关系,而欧元汇率(EUR)和天然气(TRQ)则与CEA存在相对较弱的相关关系。整体而言,选取的影响因素可作为CEA的解释变量,进而纳入模型分析中。
4. 实证分析
4.1. 基于ARIMA模型的预测
基于3.2.2节得到的平稳序列,即CEA价格的一阶差分序列构建ARIMA模型。通过观察ACF与PACF图(详见图4)并结合AIC准则来确定模型阶数。
Figure 3. Correlation coefficients of CEA with its influencing factor
图3. CEA与影响因素的相关系数
Figure 4. ACF and PACF results
图4. ACF与PACF结果
表2列出了ARIMA模型在不同阶数下的AIC值,根据AIC最小准则可以确定ARIMA模型的参数。
Table 2. AIC values for different orders of the ARIMA model
表2. ARIMA模型不同阶数的AIC值
模型阶数 |
AIC值 |
模型阶数 |
AIC值 |
ARIMA (1, 1, 1) |
1052.93 |
ARIMA (1, 1, 2) |
1053.63 |
ARIMA (1, 1, 3) |
1044.88 |
ARIMA (1, 1, 4) |
1039.91 |
ARIMA (2, 1, 1) |
1052.71 |
ARIMA (2, 1, 2) |
1040.45 |
ARIMA (2, 1, 3) |
1040.74 |
ARIMA (2, 1, 4) |
1032.76 |
ARIMA (3, 1, 1) |
1042.01 |
ARIMA (3, 1, 2) |
1039.96 |
ARIMA (3, 1, 3) |
1041.67 |
ARIMA (3, 1, 4) |
1034.45 |
ARIMA (4, 1, 1) |
1042.54 |
ARIMA (4, 1, 2) |
1041.17 |
ARIMA (4, 1, 3) |
1042.04 |
ARIMA (4, 1, 4) |
1033.3 |
综上分析,当p = 2、q = 4时AIC值最小(AIC = 1032.76)。因此建立ARIMA (2, 1, 4)模型,并按照8:2划分测试集和预测集对CEA价格进行预测。
4.2. 基于改进BP模型的预测
4.2.1. 传统BP神经网络模型的预测
将CEA收盘价作为被解释变量,将3.2.1节经过标准化处理后的7个影响因素作为解释变量,按照7:1:2比例划分测试集、验证集和预测集,基于Python软件对CEA数据进行预测。对于BP神经网络来说,输入层节点数7个,输出层节点数1个,隐藏层采取单层网络,节点数按照
计算。其中k是隐藏层的节点数,m是输入层节点数,n是输出层节点数,
。隐藏层激活函数选取tansig函数,输出层激活函数选取purelin函数,学习率设定为0.02,训练轮次为1000次。对隐藏层节点数进行逐一计算,由表3可知当节点数为7时,模型效果最好。
Table 3. Prediction errors for different hidden layer sizes of BP network
表3. 传统BP不同隐藏层节点数对应误差
不同节点数 |
RMSE |
MAE |
MAPE |
4 |
1.9426 |
1.6211 |
2.90% |
5 |
1.9737 |
1.6542 |
2.96% |
6 |
1.9614 |
1.6363 |
2.93% |
7 |
1.9359 |
1.6149 |
2.88% |
8 |
1.9738 |
1.6441 |
2.94% |
9 |
2.1779 |
1.8361 |
3.29% |
10 |
1.9659 |
1.6476 |
2.95% |
11 |
1.9601 |
1.6411 |
2.93% |
12 |
1.9877 |
1.6679 |
2.98% |
13 |
1.9870 |
1.6667 |
2.98% |
4.2.2. 改进BP神经网络模型的预测
由于碳排放权价格属于时间序列范畴之内,而且其价格会受到历史价格的影响。经对原始数据进行ACF检验,发现滞后1期的ACF值为0.9833。因此增加滞后1期的特征纳入BP神经网络模型训练中,以提高模型准确性。
根据前文所述,使用PSO算法优化BP神经网络初始权重和阈值。粒子群算法的参数主要有粒子总数N,迭代次数G,惯性权重
以及学习因子
、
。N影响解空间搜索范围,N太小容易陷入局部最优,太大则会增加计算成本。结合BP神经网络节点数,采用网格搜索分别测试N取值20、30和40时的算法性能,发现N设为30时MAE数值最小,故设置N = 30。通过绘制不同迭代次数下的适应度函数曲线,发现G = 80时趋于平稳,故迭代次数设为80。惯性权重
设为0.7,以平衡算法的全局探索与局部寻优能力。学习因子影响粒子对自身最优与群体最优的依赖,一般设为相同的取值。通过测试不同的取值,即
,发现当
、
均设为1.2时,MAE数值最小,故
、
取值均设定为1.2。
此外,使用Adam算法进一步优化BP神经网络。Adam算法主要参数包括初始学习率
、一阶矩估计衰减率
以及二阶矩估计衰减率
。测试
和0.01时模型的平均绝对误差,当
取值为0.005时收敛稳定,故选择
。而
和
的取值则采用通用默认值,即
和
。
对改进BP神经网络隐藏层节点数的选取逐一计算,其他参数选取与传统BP保持一致。由表4可知当隐藏层节点数设为10时,预测效果最好。
Table 4. Prediction errors for different hidden layer sizes (improved BP network)
表4. 改进的BP不同隐藏层节点数对应误差
不同节点数 |
RMSE |
MAE |
MAPE |
4 |
1.0852 |
0.8025 |
1.43% |
5 |
2.1317 |
1.8647 |
3.34% |
6 |
0.9353 |
0.5944 |
1.06% |
7 |
1.0593 |
0.7177 |
1.27% |
8 |
1.0523 |
0.7576 |
1.36% |
9 |
1.0262 |
1.0262 |
1.15% |
10 |
0.9274 |
0.4978 |
0.89% |
11 |
1.0800 |
0.6723 |
1.20% |
12 |
0.9394 |
0.6019 |
1.07% |
13 |
1.2378 |
0.8585 |
1.53% |
4.3. 加权组合模型的预测
以MAE为优化目标,通过梯度下降法计算组合模型中每种模型所占权重,经过270次迭代收敛。最后组合模型中ARIMA模型的权重值为0.2652,改进BP模型的权重值为0.7348。
4.4. 模型预测结果评价
将ARIMA模型、传统BP神经网络、改进BP神经网络以及ARIMA-改进BP神经网络组合模型的预测值与真实数据进行比较,并绘制在同一张图中。图5是全部预测集数据对比结果,图6是最后60个预测集数据对比结果。
Figure 5. Global comparison of predicted values against observed values for all models
图5. 各模型预测值与真实值对比(全局对比)
Figure 6. Local comparison of predicted versus actual values across models
图6. 各模型预测值与真实值对比(局部对比)
从图5和图6中可以看出,除了传统BP神经网络的预测误差比较大之外,其余三种模型的预测值均与实际值比较接近。
为全面评估模型性能,本研究从点预测精度(RMSE, MAE, MAPE)与方向预测准确性(DA)两个维度进行分析,结果如表5所示。
Table 5. Prediction results of various models
表5. 各模型预测结果
模型 |
RMSE |
MAE |
MAPE |
DA |
ARIMA |
0.9848 |
0.5774 |
1.03% |
49.47% |
传统BP |
1.9359 |
1.6149 |
2.88% |
40.00% |
改进BP |
0.9274 |
0.4978 |
0.89% |
66.32% |
ARIMA-改进BP |
0.8246 |
0.4712 |
0.84% |
66.32% |
在点预测精度方面,由表5可知,在单一模型对比中,改进BP神经网络的各项误差指标均优于传统BP模型(如MAPE值从2.88%降至0.89%),表明本研究采用的优化措施(PSO算法优化初始参数与Adam自适应学习率策略)弥补了传统BP网络收敛慢、易陷入局部最优的缺陷。另一方面,在线性与非线性模型的对比中,改进BP的预测误差也低于ARIMA模型(如MAE值从0.5774降至0.4978)。这表明在CEA价格预测中,非线性特征占据重要地位,而引入宏观经济、能源价格等多因素的非线性模型能更有效地捕捉价格波动规律。ARIMA-改进BP神经网络组合模型在RMSE、MAE、MAPE三项指标上均达到最优(RMSE = 0.8246, MAE = 0.4712, MAPE = 0.84%),说明组合模型能够有效融合线性与非线性模型的优势,实现优势互补,显著提升预测精度。而权重分配结果(BP占比73.48%)表明,CEA价格波动中非线性成分占据主导地位。ARIMA模型虽贡献较小,但其捕捉的线性趋势对于平滑预测结果、提升模型稳健性起到了必要的补充作用。
从方向预测准确性(DA值)的结果来看,改进BP神经网络以及构建的组合模型是最好的,其DA值均为66.32%,相比传统BP模型(DA值为40.00%)和ARIMA模型(DA值为49.47%)预测准确度分别提升了26.32%和16.85%,表明采取的优化措施可以使模型具有较强的捕捉碳市场发展趋势以及判断碳价格涨跌的预测能力。而本研究构建的ARIMA-改进BP组合模型在预测准确精度和方向预测准确性上的表现均较为优异,实现了预测精度与预测方向的全面平衡。
5. 研究结论与建议
5.1. 研究结论
本研究构建了一种基于梯度下降法确定权重的ARIMA-改进BP神经网络组合模型,用于预测全国碳排放配额(CEA)价格。通过引入粒子群算法和Adam自适应优化算法,有效解决了传统BP神经网络易陷入局部最优、收敛速度慢的问题。实证结果表明,在CEA价格波动中,非线性特征较为突出,因而改进BP神经网络算法表现较为优异。而本研究提出的加权组合模型综合性能最优,改进BP模型在非线性趋势上发挥了重要作用,ARIMA模型在线性趋势上进行了有效补充,使得其在点预测精度和方向预测准确性上均保持领先。本研究提出的算法不仅可以为碳市场提供可靠的预测工具,还能为不同应用场景下的模型选择提供了多维度科学依据。
5.2. 研究建议
基于本文研究结论,结合全国碳市场初期过渡阶段的特征,提出以下建议。
(1) 在碳价形成机制方面,一方面综合考虑宏观经济、能源结构及国际市场等多种因素的影响,厘清各类影响因素与碳排放权价格变动之间的传导机制;另一方面依托高精度预测模型,建立科学、动态的碳价定价参考体系。
(2) 在宏观层面上,建议完善碳市场的相关机制,增强政策制定的科学性;加强市场交易监管与风险管控,有效监控碳价异常波动;推动全国层面的碳市场不断发展与完善,保证碳市场稳定运行,维护市场参与者的合理权益。
基金项目
本论文受保定市科技计划项目资助(2341ZF364)。