1. 引言
物流产业是为保证社会生产和社会生活的供给,由运输业、仓储业、通信业等多种行业整合的结果。作为新兴的生产性服务业,它连接着社会经济的各个产业部门,既是支撑国民经济发展的基础性产业,又是国民经济的新增长点。然而,随着经济不断发展,我国在能源生产消费方面日益增加,交通运输业作为国民经济的支柱性产业,与工业、发电共同构成了国家三大能源消耗碳排放源头产业,因此物流业的二氧化碳(CO2)排放量也在逐年递增。我国交通运输业具有高污染、高能耗、低效率等特点,且现阶段碳排放量也有逐年升高趋势。因此,为了响应国家“碳达峰、碳中和”(“双碳”)目标,实现节能减排,需构建科学的预测模型对物流业未来的碳排放量进行预测,以控制能源消费总量,大幅度提高能源效率,减少物流业碳排放量对“双碳”目标实现的影响,为制定物流业合理有效的碳减排政策提供决策依据 [1] 。
近年来,国内外学者采用多种组合预测模型对碳排放量进行预测,刘晓蝶等 [2] 使用Lasso回归模型筛选出碳排放影响因素,建立BP神经网络模型预测江苏省碳排放量;金尚柱等 [3] 选取6项碳排放影响因素,运用支持向量回归模型构建重庆市碳排放量预测模型;张迪等 [4] 针对山东省的碳排放数据建立改进的粒子群算法(IPSO)优化BP神经网络模型,对山东省碳排放量进行预测;刘炳春等 [5] 构建了一个基于主成分分析法(PCA)和支持向量回归(SVR)的中国碳排放量组合预测模型;徐勇戈等 [6] 应用模糊布谷鸟搜索算法(FCS)优化支持向量机(SVM)组合预测模型,对建筑业碳排放进行预测;Lu等 [7] 利用粒子群优化(PSO)算法优化BP神经网络模型,对2017~2035年重化工行业未来碳排放进行预测。
在以上研究分析的基础上,本文测算了北京市物流业2000~2021年产生的碳排放量,分析北京市物流业碳排放量的影响因素特征,采用Lasso回归选取影响碳排放量的关键因素,通过对比多个组合预测模型,应用广义回归神经网络(Generalized Regression Neural Network, GRNN)对各年度物流业碳排放量进行预测,并对所提出的Lasso-GRNN模型的预测性能进行分析。
2. 数据来源
为预测北京市物流业2022年碳排放量,测算2000~2021年北京市物流业碳排放量并在此基础上进行分析预测。根据现有的文献成果和影响因素的选取原则,选取与碳排放量密切相关的人均GDP、物流产业产值、邮电业务总量、物流业从业人数等指标作为影响因子,并将之归纳为经济规模、经济结构、物流发展水平、物流需求规模和物流供给能力5大类别,其中所有的数据均来源于《中国能源统计年鉴》和《北京市统计年鉴》,如表1所示。

Table 1. Influencing factor indexes of carbon emissions from the logistics industry in Beijing from 2000 to 2021
表1. 2000~2021年北京市物流业碳排放量影响因素指标
本文根据政府间气候变化专门委员会(IPCC)推荐的方法测算碳排放量。北京市物流业碳排放量的测算分为两部分进行计算,一部分是根据物流行业运输等活动过程中,原煤、焦炭、燃料油等化石燃料的消耗量直接计算其CO2的排放量;另一部分则是选取与物流业相关的其他领域产生的CO2排放量进行计算。根据IPCC碳排放计算方法,物流业CO2排放测算模型建立如下:
式中,I为物流业碳排放量(万吨);i为能源种类;Ei为第i类能源实物消费量;Fi为第i类能源折算标准煤参考系数;Ki为第i类能源的碳排放系数。能源折算标准煤参考系数如表2所示。

Table 2. Reference coefficients for converting various types of energy into standard coal
表2. 各类能源折算标准煤参考系数
根据以上分析计算北京市2000~2021年碳排放量,结果如表3所示。

Table 3. Carbon emissions from 2000 to 2021 (Unit: ten thousand tons)
表3. 2000~2021年碳排放量(单位:万吨)
3. 多重共线性检验
经济发展、技术进步及从业人口变动等因素相互制约、相互影响,导致相关数据会出现多重共线性问题。在多元回归实验中,检验各变量之间是否存在多重共线性是非常必要的。根据相关文献分析,最常用的多重共线性诊断方法是VIF值(方差膨胀因子)检测法,将自变量值的方差膨胀因子记为VIFj,计算方法为:
式中,
是以自变量自身为因变量时对其他自变量回归的可决系数。
当VIF的值大于10时,一般就认为变量间存在显著的多重共线性。对已选取的北京市物流业碳排放影响因素进行多重共线性检验,结果如表4所示。

Table 4. VIF values of each influencing factor
表4. 各影响因素VIF值
由表4可以看出,以上20个影响因素的VIF值均大于10,说明影响因素变量之间存在严重的多重共线性问题,因此消除多重共线性对分析结果的影响从而减少误差是至关重要的。
4. Lasso变量选取模型
消除多重共线性的方法有很多,如:逐步回归法、岭回归、主成分分析等,本文选择使用Lasso回归方法。运用Lasso回归方法选择了10个关键变量,即x2、x5、x8、x9、x10、x14、x16、x17、x19、x20。从表5中的结果可知,这10个变量的Lasso回归系数显著不为零,即剔除了地区生产总值(x1)、人均GDP (x3)、第一产业占比(x4)、第三产业占比(x6)、物流产业产值(x7)、公路营运汽车拥有量(x11)、邮电业务总量(x12)、城镇居民可支配收入(x13)、货物周转量(x15)、物流业从业人数(x18)这10个变量。之所以运用Lasso剔除了上述10个变量,是因为地区生产总值(x1)、人均GDP (x3)与社会消费品零售总额(x2)存在明显的多重共线性,公路营运汽车拥有量(x11)与公路里程(x10)相关性太强。

Table 5. Lasso regression coefficients
表5. Lasso回归系数
综上,Lasso变量选择模型选取了10个变量,分别是社会消费品零售总额(x2)、第二产业占比(x5)、贸易进出口总值(x8)、铁路营业里程(x9)、公路里程(x10)、货运量(x14)、客运量(x16)、旅客周转量(x17)、物流业固定投资(x19)、互联网上网人数(x20)。因此,将这10个变量作为影响北京市物流业碳排放量的主要影响因素。
5. Lasso-GRNN神经网络模型预测
将Lasso选取出的这10个变量作为神经网络模型中的输入变量,记为P,以物流业碳排放量这1项指标的数据作为输出变量,记为T。以2000~2020年的数据作为训练样本,2021年的数据作为测试样本,由于训练样本比较少,所以采用交叉验证的方法训练GRNN神经网络,并采用循环迭代的方法找出最佳的SPREAD值,本案例中最后循环得到的最佳SPREAD值为0.6。Lasso-GRNN神经网络模型的预测效果如图1所示,从图1可以看出2021年的预测值和真实值之间相差较小,表明Lasso-GRNN神经网络模型的样本预测效果非常好。

Figure 1. Comparison between the predicted value of the Lasso-GRNN neural network model and the true value
图1. Lasso-GRNN神经网络模型预测值与真实值的比较
为了检验本文提出的Lasso-GRNN神经网络模型的预测效果,将Lasso-GRNN神经网络模型和PCA-GRNN、PLS-GRNN神经网络模型做比较研究。最后得到三个组合模型的预测对比结果,如表6所示。

Table 6. Prediction results of combined models
表6. 组合模型预测结果
从表6可以看出,PLS-GRNN和PCA-GRNN的组合预测模型的预测相对误差分别为12.81%和13.95%,PCA-GRNN的组合预测模型效果最差,而Lasso-GRNN神经网络模型的预测相对误差非常小,只有4.83%,预测精度最高。三组模型的预测效果图见图2,从图2中的局部放大图可以看出,Lasso-GRNN神经网络模型在2021年的北京市物流业碳排放量预测值与真实值相差最小。与PLS和PCA主成分分析法相比,Lasso是一个特征选择,通过Lasso回归分析,提取部分特征变量进行预测,而PLS和PCA是特征转换,降维后的每一个新的维度,其中都包含原有特征的信息(只是占比不同),但是降维后新的维度丢失了原有数据维度的语义信息。因此,运用Lasso回归模型进行特征变量选取更适用于GRNN神经网络模型,预测效果也是另外两个降维模型无法比拟的。

Figure 2. Comparison of combined prediction models
图2. 组合预测模型对比
总之,经过反复训练得到Lasso-GRNN神经网络模型具有很好的预测效果,因此,可以用该组合模型预测北京市物流业碳排放量,其中,2022年各影响因素的数值利用指数平滑法得到,以2000~2021年的数据作为训练样本,2022年数据作为测试样本,训练神经网络得到最佳的SPREAD值为1.6,预测结果见图3。

Figure 3. Prediction of carbon emissions from the logistics industry in Beijing in 2022
图3. 2022年北京市物流业碳排放量预测
由图3可以看出,所输入的真实值与利用Lasso-GRNN预测的预测值两者呈线性相关,除了在2018~2020年份之间两者可能因受到新冠疫情的影响而出现了较大的差值外,其余年份的预测值与真实值相对比,均能呈现较好的预测效果。而在2022年疫情结束后,各行各业又恢复以往的运行秩序,北京市物流业也在“双碳”目标下全面重启,该年在恢复经济的同时,碳排放量也有着较为缓慢的增长。总体上,近20年北京市物流业的碳排放总量处于不断增长趋势,其中2004~2008年中增长趋势较为明显,其余年份比较平稳。基于本文的研究结论,北京市在物流行业降低碳排放量可参考以下建议:加快产业结构调整,大力发展战略性新兴产业,降低能源消费强度;优化运输结构和交通运输工具,减少能源消耗;加强技术创新,改进物流作业方式等措施,不断提高能源利用效率;注重培养高素质物流业从业人员。
6. 结束语
由于影响物流业碳排放量的因素众多,并且一些影响因素之间存在多重共线性,本文采用Lasso方法筛选影响物流业碳排放量的特征变量,从Lasso的回归系数可以看出,影响北京市物流业碳排放量的主要因素有社会消费品零售总额、第二产业占比、贸易进出口总值、铁路营业里程、公路里程、货运量、客运量、旅客周转量、物流业固定投资、互联网上网人数,其中旅客周转量的系数最大,其次是铁路营业里程,表明旅客周转量和铁路营业里程对北京市物流业碳排放量具有显著的正向作用。然后在变量选取的基础上,用GRNN神经网络模型拟合碳排放量与各主要影响因素之间的非线性关系,最后用训练好的Lasso-GRNN神经网络模型预测北京市物流业碳排放量,并与PLS-GRNN和PCA-GRNN组合预测模型的预测结果进行对比,从预测精度来看,两个模型预测相对误差分别为12.81%和13.95%,而Lasso-GRNN神经网络模型的预测相对误差只有4.83%,可见该模型明显优于另外两个组合模型,验证了Lasso-GRNN神经网络组合预测模型的优越性,同时也说明了该模型更适合于预测物流业的碳排放量,预测结果显示,2022年北京市物流业的CO2排放量将在742.423万吨上下浮动。
基金项目
天津商业大学大学生创新创业训练计划项目(项目编号:202210069311)。
NOTES
*通讯作者。