1. 前言
在全球应对气候变化的背景下,碳排放问题已成为各国政府、学术界和公众广泛关注的焦点。科技的迅猛发展和经济的快速增长,虽然提升了生活质量,但也导致了环境问题的加剧,特别是温室气体的排放[1]。中国作为全球最大的碳排放国,其碳达标和碳中和目标的实现,不仅关乎国家的可持续发展战略,也对全球气候治理产生深远影响。
实现碳达标和碳中和的目标,要求我们对碳排放进行准确地预测和分析。本文将关注碳排放量与人口、GDP和能源消费量之间的关系,通过建立相关的数学模型来开展研究。首先,运用SPSS分析碳排放与相关变量之间的相关性,发现能源消费量与人口、GDP、第二产业占比、能源结构之间具有显著相关性。由于样本数量的限制,传统的线性回归模型难以满足研究需求,因此采用MATLAB进行多元非线性回归分析,以获取更为准确的能源消费量预测。
此外,基于时间序列分析的方法,我们将运用ARIMA模型对未来的能源消费量进行预测[2]。与此同时,我们还将建立Logistic阻滞增长人口模型,ARIMA时间序列的GDP预测模型,以及第二产业占比和能源结构的灰色GM(1,1)模型。这些模型将为碳排放量的预测提供重要的基础数据。
最后,结合粒子群优化算法和BP神经网络,利用灰色GM(1,1)模型的结果,进一步优化碳排放量[3]的预测。通过这一系列的建模与分析,本文旨在为我国碳达标和碳中和目标的实现提供科学依据和决策支持。随着碳中和目标的逐步推进,本文的研究结果将为政策制定者和企业提供重要的参考,推动我国在全球气候治理中的积极角色[4]。
2. 正文
2.1. 问题概述
以2020年为基期,结合两个时间点(2035年和2050年),预测地区在2021年至2025年和2056年至2060年两个期间的人口、GDP和能源消费量变化,能源消费量需要与人口和GDP互相关联,在此基础上,建立人口和经济变化的能源消费量预测模型。建立碳排放量与人口、GDP、能源消费量预测相关联,碳排放量与各能源消费部门和能源供应部门的能源消费量、能源消费品种之间相关联的区域碳排放量预测模型[5]。
2.2. 基于人口和经济变化的能源消费量预测模型
在建设社会主义现代化的新征程中,我们提出了两个重要的节点,在2030年前我们力争达到二氧化碳排放的峰值,并且在2060年实现碳中和。下面结合中国式现代化的两个时间节点,预测这个区域在十四五(2021~2025年)至二十一五年(2056~2060年)的人口、经济和能源消费量变化。
2.2.1. 利用阻滞增长模型建立人口的预测模型
见下图1是2010到2020年该区域人口数量变化折线图:
Figure 1. Trend of population changes from 2010 to 2020
图1. 2010年至2020年期间人口变化趋势图
Figure 2. Population prediction based on the growth retardation model
图2. 基于阻滞增长模型的人口预测图
通过建立阻滞增长模型我们得到了2021到2060年的人口数量曲线如图2所示。
如图2所示蓝色的曲线是人口实际值,绿色的曲线是人口预测值。经过残差分析,从下中可以得出我们人口预测结果的效果,如下表1。
Table 1. Model parameter values
表1. 模型参数值
R方 |
SSE |
DFE |
调整R方 |
RMSE |
0.79707 |
8.154 |
9 |
0.77453 |
0.95184 |
2.2.2. 利用时间序列ARIMA建立经济(GDP)的预测模型
ARIMA中的AR是自回归模型[6],利用自身变量历史出现的数据对自身未来时间进行预测,描述了目前情况下当前值和历史值之间的关系。自回归需要满足平稳性条件。时间序列的平稳性指的是在一段时间某个数据看起来没有大波动,很平坦。从数据上来说就是各阶统计特征不随时间的变化而变化。自回归模型也是有一定的限制,比如自回归模型需要用自身的数据进行预测并且需要数据具有平稳性和自相关性。ARIMA中的MA是移动平均模型,移动平均模型对于自回归模型中误差项的累加十分关注。并且通过移动平均法可以适当的消除在预测过程中随机的波动。因此两部分组成的ARIMA为差分自回归移动平均模型[7]。如图3是2010年到2020年我国GDP的趋势走向,可以看出我国GDP是逐年上升的。
Figure 3. Trend of GDP Changes from 2010 to 2020
图3. 2010年至2020年期间GDP变化趋势图
利用ARIMA模型预测未来四十年的GDP,通过软件分析结果如下图4:
Figure 4. GDP forecast based on ARIMA model
图4. 基于ARIMA模型的GDP预测图
分析自相关函数ACF,通过自身比较有序的随机变量,自相关函数说明了对于同一时序不同取值之间是否相关联。AFC的公式如下:
(1)
PACF是偏自相关PACF,是当计算xt与
的相关系数时能够消除
到
影响的方法。我们通过代码可以绘制该时间序列ACF和PACF的图5:
Figure 5. Residual analysis chart
图5. 残差分析图
可以看出时间序列ARIMA对于经济预测是比较准确的。残差的ACF值和PACF也在合理范围内。通过建立时间序列模型,我们预测在2021年到2060年我国的GDP是不断提高的。
2.2.3. 利用灰色预测建立能源消费量的预测模型
Figure 6. Trend of energy consumption changes from 2010 to 2020
图6. 2010年至2020年期间能源消费量变化趋势图
灰色预测模型中的灰色生成新的算子的目的是将无序的序列靠近为有序的序列,弱化了无序中的随机性,无限趋近于规律的有序序列中,例如累加生成算子、逆累加生成算子、均值生成算子、级比生成算子等[8]。灰色预测模型依据了最初的离散非负数列,利用了一次累加的方式,降低了之前序列的无序性,形成比较有规律的离散数列,通过建立对应的微分方程,从而获得离散点处的解利用了累减生成的原始数据的近似估计值,最后预测后续原始数据的发展情况。下面是2010年到2020年能源消耗量的趋势走向。如图6可以看出我国该地区总体能源消耗量是上升的。
如图7我们利用灰度预测模型预测未来四十年的能源消耗量:
Figure 7. Energy consumption prediction based on grey prediction model
图7. 基于灰色预测模型的能源消费量预测图
通过灰色预测我们推测在未来四十年不经过干扰情况下,能源消耗量会稳步提升。下面分析一下灰色模型预测的好坏,通过均方根误差、均方误差、平均绝对误差、平均绝对百分比误差的数值来比较,如下表2。
Table 2. Error table
表2. 误差表
误差类型 |
英文简称 |
数值 |
均方根误差 |
RMSE |
418.5234 |
均方误差 |
MSE |
175161.8234 |
平均绝对误差 |
MAE |
355.1055 |
平均绝对百分比误差 |
MAPE |
0.0118 |
2.2.4. 基于皮尔逊相关系数处理的能源消费量与人口预测相关联模型
首先我们分析当人口逐年上升时消费量的变化[9],可以从下图分析当人口越多时,能源消费量也在不断地上升,从图8中可以分析,能源消费量与人口大概是成正比。
相关性分析:我们利用皮尔逊相关系数来判定两个量的相关性。皮尔逊相关系数也称积差相关,是英国统计学家皮尔逊名字命名的计算相关性算法,用于定比或定距相关性的研究。计算方式为两个变量之间的协方差和标准差的商。可知能源消费量和人口的相关性为0.986。当数值大于零时是正相关,并且数值接近于1时就是完全线性关系。如图9。
Figure 8. Prediction of the relationship between energy consumption and population
图8. 能源消费量与人口相关关系预测图
Figure 9. Pearson correlation coefficient heatmap of energy consumption with population and GDP
图9. 能源消费量与人口、GDP的皮尔逊相关系数热力图
2.2.5. 能源消费量与经济GDP预测相关联
我们先分析当经济逐年上升时消费量的变化,可以从下图分析当经济收入越大时,能源消费量也在不断地上升,从图10中可以分析,能源消费量与经济也大概是成正比。
相关性分析:分析现象之间是否存在某种相互依靠的关系。在相关关系中,当一个或几个相互依存的变量取一定的值时,与之相对应的变量也会随即发生改变。我们看一下对于能源消费量和经济之间相互关系图,如图9,可以分析出能源消费量与经济之间的皮尔逊相关系数为0.986;可以得出能源消费量与经济之间几乎为正比关系。
Figure 10. Prediction of the correlation between energy consumption and GDP
图10. 能源消费量与GDP相关关系预测图
通过上面人口和GDP与能源消费量的相关性可以分析得出,对于人口和GDP和能源消费量近似成正比。当一个地区人口越多,GDP逐渐上升的时候,能源消费量也不断上涨。
2.3. 区域碳排放量预测模型
需要碳排放量与人口、GDP、和能源消费量相关联,我们选择了与碳排放量关系影响最大的几个指标,并使用皮尔逊相关系数对数据进行了处理分析,得到如下表3所示相关系数表:
Table 3. Correlation coefficients between various indicators and carbon emissions
表3. 各指标与碳排放量相关系数表
驱动指标 |
含义 |
r |
人口数量 |
地区中居住的总人数 |
0.89 |
人均GDP |
GDP/人口数量 |
0.87 |
能源结构 |
第二产业增加值/GDP |
−0.795 |
能源消费强度 |
产生单位GDP所需的能源总量 |
−0.79 |
第二产业占比 |
第二产业在地区GDP中所占的比例 |
−0.851 |
从表中可以看出,碳排放量的产生为正相关且影响最大的依次为人口数量和人均GDP,与碳排放量的产生为负相关且影响最大的依次为第二产业占比、能源结构和能源消费强度。本文需要碳排放量与各部门的能源消费量相关联,我们使用了最小二乘法拟合的办法并带入各部门所对应的数据,得到了如图11所示的碳排放量与各部门能源消费量的关系关联图:
Figure 11. Prediction of the relationship between carbon emissions and energy consumption in various departments
图11. 各部门碳排放量与能源消费量关系预测图
再次使用皮尔逊相关系数对碳排放量与六个部门能源消费量的数据进行处理,得到皮尔逊相关系数热力图如图12所示。
各部门能源消费量在2010年至2020年之间的占比关系图如图13所示。
可以看出,工业消费部门的能源消费量在2010年至2020年期间一直处于占比较高的状态,在0.55至0.62之间,能源供应部门的能源消费量次之,处于0.2至0.3的占比状态,往后分别是交通消费部门、居民生活消费、建筑消费部门和农林消费部门,都处于0.1占比以下。本文需要碳排放量与各部门的能源消费品种(化石能源消费与非化石能源消费以及二次能源(电或热)消费)相关联,我们使用了最小二乘法模型进行模拟,将数据带入处理,得到各部门碳排放量与非化石能源及二次能源占比之间的预测图如图14。
Figure 12. Pearson heatmap showing the correlation between carbon emissions and energy consumption in various sectors
图12. 碳排放量与各部门能源消费量相关关系皮尔逊热力图
Figure 13. Trend chart of energy consumption proportion of various consumption departments from 2010 to 2020
图13. 2010年至2020年期间各消费部门能源消费量占比趋势图
Figure 14. Prediction of the relationship between carbon emissions of various departments and the proportion of non fossil energy and secondary energy
图14. 各部门碳排放量与非化石能源及二次能源占比关系预测图
根据以上五张图,农林消费部门非化石能源及二次能源占比的增长会导致碳排放量随之线性增长,工业消费部门非化石能源及二次能源占比在41.1%左右时该部门碳排放量达到最高值,交通消费部门非化石能源及二次能源占比在3.8%左右时该部门碳排放量达到最高值,建筑消费部门非化石能源及二次能源占比在76.2%左右时该部门碳排放量达到最低值,居民生活消费非化石能源及二次能源占比的增长会导致碳排放量随之线性增长,能源供应部门非化石能源及二次能源占比的增长也会导致碳排放量随之线性增长。
基于PSO-BP模型的区域碳排放量测预测
传统的BP神经网络在训练过程中容易陷入局部最优解,导致预测结果不够准确。而PSO算法通过使用粒子群的群体智能搜索机制,能够一定程度上避免陷入局部最优解,提高了全局搜索能力,从而更有可能找到更优的权重和阈值组合。PSO算法通过不断迭代更新粒子位置和速度,并利用历史最优位置和全局最优位置的信息,在搜索空间中逐渐收敛到较优解[10]。相比于传统的BP神经网络,PSO-BP算法通常具有更快的收敛速度,可以快速找到较优的权重和阈值组合。PSO算法利用粒子群的集体智慧,通过合作和信息共享,可以在搜索空间中较好地探索全局最优解的可能区域。这种全局搜索能力可以帮助BP神经网络在参数空间中寻找到更优的组合,提高回归预测的准确性。PSO算法的参数相对较少且易于设置,主要包括迭代次数、粒子数量和权重参数等。通过合理地调节这些参数,可以在一定程度上控制PSO-BP算法的搜索性能,使其更好地适应具体的回归预测问题。
综上所述,PSO-BP算法结合了粒子群优化算法[11]和BP神经网络的优势,能够充分利用粒子群的全局搜索能力,避免局部最优解,提高回归预测的准确性,并且收敛速度较快。这使得PSO-BP算法成为一种有效的回归预测方法。算法具体步骤如下图15。
初始化粒子群和BP神经网络,输入训练数据,计算适应度值,更新粒子的个体历史最优位置和全局最优位置,更新粒子的速度和位置,更新BP神经网络的权重和阈值,判断停止条件,输出预测结果。
Figure 15. PSO-BP model flowchart
图15. PSO-BP模型流程图
将已划分的样本数据导入PSO-BP神经网络模型中,得到模拟结果如下图16所示。
由预测图可以看出,如果是在自然情况下,不采取任何措施,那么该地区在2030年以前达不到“碳达峰”这个目标,而是会延迟约为十三年以后达到“碳达峰”;且在2060年以前达不到“碳饱和”这一目标,这一目标难度巨大,因此需要考虑多方面因素,在各个领域各个部门采取相应措施,以达到尽最大力量减少碳排放量的目的。
Figure 16. Carbon emission prediction based on PSO-BP model
图16. 基于PSO-BP 模型的碳排放量预测图
3. 总结
首先,根据人口、GDP、能源消费量的数据特点选择不同的数学预测模型。利用阻滞增长模型预测人口,通过残差分析证明预测结果的准确性;利用时间序列模型预测GDP的变化趋势,预测出我国GDP不断提高;利用灰色预测模型较精确地预测近几年能源消费量的变化趋势。其次,需要研究碳排放量与各部门的能源消费量和能源结构的关联性,利用Matlab软件中最小二乘法回归模型来拟合碳排放量与各个部门能源消费量和能源结构的曲线。最后,以人口、GDP、各部门的能源消费量和能源结构为自变量,碳排放量为因变量,使用粒子群-BP神经网络算法拟合曲线并预测出2025~2060的碳排放量,分析出我国各个部门需要采取相应的措施才可以实现2023年“碳达峰”和2060年“碳饱和”的目标。