1. 引言
随着全球气候变化问题日益严峻,碳排放预测逐步成为能源密集型行业推进节能减排、优化生产调度和制定低碳战略的重要技术手段。在“双碳”战略背景下,中国政府先后出台了《“十四五”节能减排综合工作方案》[1]、《“十四五”工业绿色发展规划》[2]等政策文件,明确要求包括烟草工业在内的传统制造行业加快绿色转型,提升碳排放管理与预测能力。
早期的碳排放预测研究主要基于传统时间序列方法,如自回归滑动平均模型(ARIMA) [3]、灰色预测模型(GM) [4]等。这些方法在短期趋势预测上具备一定优势,模型构造简单,对数据要求较低,但其线性假设限制了对复杂非线性和多因素交互关系的刻画能力,预测精度有限。为克服这一局限,部分学者引入支持向量回归(SVR)、随机森林(RF)等机器学习方法,对碳排放与多维影响因子的关系进行建模[5]。实验结果说明上述方法在泛化能力和鲁棒性方面表现良好,能够处理非线性特征,在多行业碳排放预测中展现出一定应用潜力。
近年来,深度学习技术在碳排放时序预测中的应用显著增多。循环神经网络(RNN)及其改进结构,特别是长短期记忆网络(LSTM)和门控循环单元(GRU),在捕捉时间依赖性、非线性动态特征等方面表现出优异能力。例如,Liu等人提出的基于LSTM-Attention的电力系统碳排放测算方法,实现了对多变量序列的高精度建模[6];Nikpour等人开发的基于Informer的新型混合深度学习模型在碳排放和空气污染预测中同样取得了良好效果[7]。这些进展表明,深度神经网络已成为碳排放预测的重要研究方向。
尽管已有研究在能源、电力、交通等典型高碳行业的碳排放预测中取得了丰富成果,但在卷烟工业等轻工制造领域,相关研究主要集中于能耗统计[8]、碳排放核算[9]和绿色制造评估。针对卷烟生产碳排放的动态建模与深度学习预测尚缺乏系统性的探索,尚未形成成熟的技术框架与行业应用案例。因此,进行面向卷烟生产企业的碳排放预测研究既具备重要的理论意义,也具备显著的行业实践价值。
2. 理论背景
2.1. 蜣螂优化算法
蜣螂优化算法(Dung Beetle Optimization, DBO)是一种受自然界蜣螂觅食与生活习性的启发而提出的新型智能优化算法[10]。蜣螂通过滚动粪球、避障、定位巢穴等行为展现出良好的全局搜索和局部搜索能力。DBO模拟蜣螂的多阶段行为过程,综合利用多种搜索策略实现对优化问题的求解。算法包含滚动觅食、产卵觅巢、小蜣螂和偷窃觅食四个核心机制,其数学模型如下。
(1) 滚动觅食:在滚动觅食过程中,蜣螂通过滚动粪球探索食物源区域,并保持粪球在直线上运动,其位置更新公式为:
为避免陷入局部最优,DBO引入了扰动因子
进行位置调整:
(2) 产卵觅巢:蜣螂在滚动过程中需选择适宜的产卵地点以保证后代存活。DBO通过对搜索区域的动态调整实现此过程,搜索边界定义如下:
新个体位置更新为:
(3) 小蜣螂:部分孵化出的新个体会迁出当前栖息地探索邻域区域,增加搜索多样性,边界定义为:
小蜣螂位置更新公式:
(4) 偷窃觅食:蜣螂在觅食时也可能从其他蜣螂的粪球中偷取食物,该机制通过新的探索路径提高全局搜索能力,位置更新公式:
2.2. 双向长短期记忆网络
双向长短期记忆网络(Bidirectional Long Short-Term Memory, BiLSTM)是一种改进的LSTM,它通过双向处理序列数据,能够同时捕捉时间序列中的正向和反向依赖关系[11]。LSTM本身是一种循环神经网络,能够有效解决标准循环神经网络在长序列中遇到的梯度消失和梯度爆炸问题。BiLSTM在此基础上,通过引入反向传播机制,增强了对时间序列中复杂依赖关系的建模能力。
正向LSTM从时间序列的第一个时间步
开始,逐步处理输入数据
,捕捉从过去到当前的依赖关系。LSTM模型的结构如图1所示。
Figure 1. Schematic diagram of LSTM neural network
图1. LSTM神经网络结构示意图
计算公式如下:
其中
为输入门,
为遗忘门,
为输出门,
为候选记忆状态,
为当前记忆单元,
为当前时间步的输出。
反向LSTM则从序列的最后一个时间步
,开始,逆向处理数据
,捕捉从未来到当前的依赖关系。反向LSTM的计算过程与正向LSTM类似,但时间步顺序相反,输出记为
。
BiLSTM通过拼接或加权平均,将正向LSTM与反向LSTM的输出结合,生成每个时间步的最终表示
。该结构能够同时捕捉过去和未来的信息,从而提升对时间序列复杂依赖关系的建模能力。
2.3. 注意力机制
注意力机制(Attention Mechanism)是一种在序列模型中广泛应用的技术,能够根据输入序列中不同部分的重要性动态地分配不同的权重[12]。尤其是在处理长序列数据时,传统的循环神经网络可能难以有效捕捉到远距离的依赖关系,而注意力机制通过计算每个时间步的权重,能够自适应地关注序列中最重要的部分,从而增强模型的表达能力。
在自注意力机制中,模型首先将输入序列
映射为查询(Query)、键(Key)和值(Value)向量。通过计算查询向量与所有键向量之间的相似度,得到每个时间步对其他时间步的注意力权重,再利用这些权重对值向量进行加权求和,得到每个时间步的输出。核心公式如下:
其中,Q为当前需要计算输出的查询项;K用于与查询项匹配的键;V是与键对应的实际值;
为键的维度,用于缩放点积结果。
3. 研究方法
为提升卷烟企业碳排放的动态预测能力,本文提出基于蜣螂优化算法(DBO)的BiLSTM-Attention预测方法。整体框架如图2所示:
Figure 2. Conceptual framework diagram of carbon emission forecasting research in the cigarette manufacturing sector
图2. 卷烟企业碳排放量预测研究总体框架图
该方法依托《IPCC温室气体清单指南》及相关行业标准,构建碳排放核算体系,采用排放因子法对企业各类能源消耗进行碳排放量计算,生成连续的碳排放时间序列数据。针对碳排放受生产节奏、能源结构及周期性等多因素综合影响的特点,设计了多维特征工程流程,提取产量、工作日状态、周内与日内周期等辅助特征,构建多变量输入数据集。
在建模环节,采用BiLSTM与自注意力机制相结合的深度神经网络模型,以充分学习碳排放序列的长期依赖特性及关键时间步的重要性。BiLSTM结构能够同时捕捉历史与未来的时序关系,提升对波动趋势的刻画能力;自注意力机制通过计算各时间步的权重,增强模型对关键特征的关注和表达。
为进一步提高模型的鲁棒性,本文引入DBO算法对超参数进行全局优化。DBO通过模拟蜣螂在觅食、产卵和避障过程中的多阶段搜索行为,实现对LSTM单元数、注意力维度、学习率、批量大小等关键参数的自适应搜索与调整,用于克服传统调参方法易陷入局部最优的问题。
本方法以生产过程中的能源消耗数据为基础,结合多变量时序特征,利用深度学习模型建模碳排放变化趋势,并通过蜣螂优化算法优化模型性能,最终实现卷烟企业的碳排放量预测。
3.1. 碳排放量核算
3.1.1. 碳排放量计算
本文采用IPCC指南提供的排放因子法来计算碳排放量[13]。该方法的基本思路是利用活动水平数据(Activity Data, AD)与碳排放因子(Emission Factor, EF)的乘积来估算碳排放量。具体的计算公式为:
其中,E表示总碳排放量,
表示第i类能源的活动水平数据,
为对应碳排放因子。
3.1.2. 碳排放源识别
生产过程中,卷烟企业会涉及多个环节,例如解包、制丝、掺配加香、卷包等,每个工艺环节都会消耗能源,产生碳排放。因此,在进行碳排放计算时,需要对各个环节的能源消耗进行详细记录并识别其相应的碳排放源,具体的碳排放活动数据见表1。
Table 1. Activity data of carbon emissions from cigarette manufacturing enterprises
表1. 卷烟生产企业碳排放活动数据
排放类型 |
种类 |
活动数据来源 |
化石燃料 燃烧排放 |
固定排放源 |
天然气 |
锅炉、产线等 |
移动排放源 |
汽油 |
运输车辆等 |
总样本数 |
- |
电力 |
各产线、企业经营所需的电力等 |
上述活动数据通过生产设备的能源计量数据、运营记录和现场能源消耗数据获取,确保对所有能源消耗环节进行了全面考虑。
3.1.3. 碳排放因子
碳排放因子的选定直接影响碳排放量计算的准确性。依据《温室气体排放核算与报告要求第25部分:食品、烟草及酒、饮料和精制茶企业》[14]、《综合能耗计算通则》[15]以及生态环境部发布的公告[16],本研究选定如表2所示碳排放因子:
Table 2. Carbon emission factor data
表2. 碳排放因子数据
活动数据种类 |
碳排放因子 |
天然气 |
2.162 kg CO2/m3 |
汽油 |
2.93 kg CO2/kg |
净购入电力 |
0.5153 kg CO2/kWh |
3.2. 数据预处理
针对碳排放受生产节奏、能源结构及周期性等多因素综合影响的特点,本文在数据预处理阶段设计了多维特征工程流程,以提升模型对碳排放波动规律的学习能力。
3.2.1. 生产负荷特征
生产产量是碳排放的重要驱动因素,能够直接表征单位时段内的生产强度和负荷水平,对能源消耗与碳排放具有显著影响。为反映生产规模变化对碳排放的动态作用,本文统计了各时间步的实际产量数据,构建生产负荷时间序列,将其作为模型输入变量之一。
3.2.2. 能源消耗结构特征
不同类型能源对应的碳排放因子和使用比例存在显著差异,为刻画能源结构变化对碳排放的影响,分别提取汽油、天然气和外购电力在总能耗中的占比,形成能源组合特征,用于描述能源利用方式的差异性和动态调整对排放水平的贡献。
3.2.3. 周期性时间特征
卷烟生产在日内与周内均表现出显著的周期性波动。为有效捕捉周期性模式,本文提取了两类时间特征:一是基于工作日视角,将每一时间步所属周内日期编码为独热向量(周一至周日),以体现周内排产规律;二是基于24小时周期,将时间步在日内的相对位置采用正余弦函数对时间步进行周期性位置编码,增强模型对碳排放日内周期性变化的感知能力。
3.2.4. 工作日状态特征
工作日与非工作日生产安排差异显著,能源消耗和碳排放量也随之变化。为反映日类型对碳排放的潜在影响,设定是否工作日的二值指示变量,其中工作日标记为1,周末及法定节假日标记为0,并将其作为辅助输入特征纳入模型。
所有特征在提取后均进行最小–最大归一化,统一量纲区间为[0, 1],以提高模型收敛性。经过上述处理,最终构建了包含碳排放历史序列、生产产量、能源消耗比例、周期性编码与工作日状态等多维特征的输入数据集。
3.3. DBO-BiLSTM-Attention预测模型
为实现卷烟生产企业碳排放量的高精度动态预测,本文设计了基于DBO优化的BiLSTM-Attention的碳排放量预测模型。整体结构如图3所示。
Figure 3. Architectural schematic of the dung beetle optimizer (DBO)-enhanced BiLSTM-Attention model for carbon emission prediction
图3. 基于DBO优化的BiLSTM-Attention碳排放量预测模型结构图
为进一步提高模型配置的透明性与实验的可复现性,本文对DBO-BiLSTM-Attention预测模型的具体实现细节和参数设定进行如下说明:
(1) 输入数据结构
模型输入数据为三维张量,定义为:
其中,B为批量大小;T表示历史时间步长度;D表示输入特征维度,包含碳排放历史值、生产产量、三类能源消耗比例、工作日状态、周内周期性独热编码及日内正余弦周期性编码。
(2) BiLSTM网络配置
模型采用两层堆叠式BiLSTM结构:
每层BiLSTM的隐藏单元数在[32, 256]范围内,由DBO算法在搜索空间内自动确定,输出通过正向与反向隐藏状态拼接,输出张量维度为:
其中,H表示第二层单向隐藏单元数,具体数值由优化过程确定。
(3) 注意力机制实现
注意力机制采用单头缩放点积注意力,Query、Key、Value由BiLSTM输出经线性映射生成:
其中,
;注意力维度
在[8, 64]范围内由DBO搜索确定。
权重计算公式:
上下文向量
与BiLSTM输出拼接后输入全连接层。
(4) 输出层设计
拼接结果先通过ReLU激活函数,再经全连接层映射为最终输出,表示未来时间步的碳排放量。输出张量维度:
(5) 损失函数
训练优化目标为均方误差(MSE):
(6) DBO超参数搜索
为克服超参数对模型性能的敏感性,本文利用蜣螂优化算法(DBO)在多维搜索空间内进行全局超参数寻优,搜索范围定义如表3所示:
Table 3. Hyperparameter search space of the Dung Beetle Optimizer
表3. DBO超参数搜索范围
超参数 |
搜索范围 |
BiLSTM隐藏单元数 |
[32, 256] |
注意力维度 |
[8, 64] |
学习率 |
[1e−4, 1e−2] |
批量大小 |
[16, 128] |
适应度函数(验证集平均绝对误差):
其中
表示超参数组合。
搜索过程包括滚动觅食、产卵觅巢、小蜣螂扰动和偷窃觅食等机制。当连续10代验证集适应度无显著下降(改进幅度<1%)或达到最大迭代次数时,搜索自动终止。
4. 实验
4.1. 数据集
本研究的数据集来源于华东某卷烟生产企业,涵盖生产周期内的能源消耗和碳排放核算信息。本文依据排放因子法,对汽油、天然气和外购电力的使用量进行了碳排放量换算,并结合生产产量、工作日状态等辅助特征,构建了多变量时序数据集。为避免数据泄露,样本按时间顺序划分,前70%用于模型训练,后30%用于测试和验证。数据集的基本情况如表4所示。
Table 4. Overview of the carbon emission dataset
表4. 碳排放数据集概述
描述 |
详情 |
时间范围 |
2022年1月1日至2024年12月31日(采样间隔:2小时) |
数据特征 |
多变量时序特征(见3.2节) |
总样本数 |
13164 |
训练集样本数 |
9215 |
测试集样本数 |
3949 |
4.2. 实验设置
本研究在Intel i7-12650H CPU和NVIDIA GeForce GTX 4060 GPU的Windows 11环境中完成模型训练与测试。深度学习实验采用Python 3.11.0变成语言,基于Pytorch 2.4.1完成。
实验使用过去24小时(12个时间步)的历史碳排放数据,预测未来2小时(1个时间步)的碳排放量。
为验证所提出方法的有效性,本文引入两类对比模型进行实验分析:一是结合时间卷积网络与LSTM的TCN-LSTM模型,二是集成注意力机制的Attention-LSTM模型。三种模型均在相同数据集和评估体系下进行训练与预测,以量化各方法在碳排放预测任务中的表现差异,为保证各模型性能的充分发挥及对比的公正性,实验分别采用随机搜索、贝叶斯优化和蜣螂优化算法对超参数进行优化。在50轮随机搜索下所得出的最佳超参数设定如下表5所示:
Table 5. Optimal hyperparameter configuration
表5. 最佳超参数组合
超参数 |
TCN-LSTM |
Attention-LSTM |
DBO-BiLSTM-Attention |
LSTM层数 |
1 |
1 |
2 |
LSTM单元数 |
64 |
128 |
128,192 (DBO搜索) |
注意力维度 |
— |
32 |
48 (DBO搜索) |
注意力头数 |
— |
1 |
1 |
TCN卷积核大小 |
3 |
— |
— |
TCN卷积层数 |
2 |
— |
— |
TCN通道数 |
32 |
— |
— |
续表
Dropout比率 |
0.3 |
0.2 |
0.3 |
学习率 |
0.001 |
0.0005 |
0.001 (DBO搜索) |
批量大小 |
64 |
32 |
64 (DBO搜索) |
优化器 |
Adam |
Adam |
Adam |
学习率衰减策略 |
启用 |
启用 |
启用 |
梯度裁剪阈值 |
1.0 |
1.0 |
1.0 |
提前终止 |
10轮 |
10轮 |
10轮 |
滑动窗口大小 |
12 |
12 |
12 |
预测步长 |
1 |
1 |
1 |
其他 |
— |
— |
DBO:种群30,迭代50 |
4.3. 评估指标
为了评估实验预测的准确性,本文采用了MAE、MAPE、RMSE、以及R2四个评估指标用于评估预测模型的准确性。四个评估指标的计算公式如下:
其中,
为实际值,
为预测值,
是样本总数,MAE、RMSE和MAPE评估预测值和实际值之间的偏差,指标越小,表明预测精度越高。
4.4. 结果
为直观展示不同模型在碳排放预测任务中的性能差异,本文预测了最后10日的碳排放量。图4~6分别给出了TCN-LSTM、Attention-LSTM和DBO-BiLSTM-Attention三种模型在该时间段的预测值与真实值对比曲线,从中可以直观比较各方法在整体趋势跟踪和局部波动捕捉方面的差异。表6则汇总了三种模型在上述预测区间的主要误差指标。
Table 6. Comparative error metrics of experimental results
表6. 实验结果误差指标对比数据
预测模型 |
MAE |
MAPE (%) |
RMSE |
R2 (%) |
TCN-LSTM |
775.23 |
7.97 |
1013.64 |
80.88 |
Attention-LSTM |
710.34 |
7.15 |
860.43 |
86.22 |
DBO-BiLSTM-Attention |
529.60 |
5.35 |
639.08 |
92.40 |
Figure 4. Comparative analysis of predicted versus observed carbon emissions based on the TCN-LSTM model
图4. TCN-LSTM模型碳排放量预测值与真实值对比图
Figure 5. Comparative analysis of predicted versus observed carbon emissions based on the Attention-LSTM model
图5. Attention-LSTM模型碳排放量预测值与真实值对比图
Figure 6. Comparative analysis of predicted versus observed carbon emissions based on the DBO-BiLSTM-Attention model
图6. DBO-BiLSTM-Attention模型碳排放量预测值与真实值对比图
通过对比预测值与真实值的变化曲线可知,DBO-BiLSTM-Attention模型在碳排放趋势的拟合方面表现出显著优势。尤其在峰值与谷值区间,该模型能够更灵敏地捕捉到碳排放的剧烈波动,展现出更快的响应速度与更高的预测精度。与TCN-LSTM模型相比,DBO-BiLSTM-Attention模型有效抑制了极值点预测中的高估误差,提升了在异常时段的稳定性;而与Attention-LSTM模型相比,则明显缓解了对剧烈波动阶段响应滞后的问题,模型输出更接近于真实观测值。
该模型性能的提升,主要归因于其结构优势:一方面,BiLSTM能够同时捕捉序列的前向与后向依赖信息,从而增强了对碳排放量时间演化规律的刻画能力;另一方面,自注意力机制使模型能够在关键时间步自适应地分配特征权重,突出对重要信息的关注。双机制协同显著提高了模型对复杂碳排放序列的建模表现。
从误差评估指标来看,该模型在多个维度上均优于对比模型。具体而言,其平均绝对误差(MAE)为529.60 kgCO2,平均绝对百分比误差(MAPE)为5.35%,均方根误差(RMSE)为639.08 kgCO2,分别相较TCN-LSTM和Attention-LSTM模型降低约30%~40%。尤其是MAPE的大幅下降,表明其在波动性较强的时段中具有更高的稳健性和可靠性。此外,决定系数(R2)达到92.40%,较TCN-LSTM提升近12个百分点,较Attention-LSTM提升约6个百分点,进一步印证了其在实际预测任务中的拟合能力与泛化性能。
5. 结论
在国家“双碳”目标和节能减排政策持续推动下,卷烟行业被赋予了更高的绿色转型要求。本研究以卷烟生产企业为对象,基于近年来典型的深度学习与智能优化方法,探讨了多变量时序特征在碳排放量短期预测任务中的适用性和有效性。通过引入双向长短期记忆网络与自注意力机制,模型能够在一定程度上提升对复杂碳排放序列的动态建模能力。模型结合蜣螂优化算法对超参数空间进行全局搜索,在保证模型结构灵活性的同时,提高参数配置的自动化水平和实验可复现性,研究结果显示,所提出的DBO-BiLSTM-Attention模型能够在不确定性强、非线性特征显著的碳排放序列中实现更高拟合精度,尤其在周期扰动和极值响应方面具有良好表现。
从实际应用价值角度来看,该模型不仅满足企业对碳排放趋势提前预判的技术需求,也为其应对碳配额监管、构建低碳生产计划与节能评估体系提供了量化支撑。预测结果可有效辅助企业在生产调度、能源资源配置及节能改造等方面做出更具前瞻性的决策,增强其在绿色转型过程中的主动权与竞争力。
然而,研究亦存在一定局限性。一是实验数据来源于单一企业,样本多样性和地域代表性有限,模型的泛化能力和适应性有待在更广泛的行业和不同区域进一步检验。二是当前模型主要聚焦于短期预测,长期趋势、极端事件及宏观经济、政策扰动等外部变量的引入尚不充分。后续研究可进一步整合多源异构数据,如气象信息、区域能耗数据、碳交易市场价格等,提升模型对复杂工业环境和多变市场情境的适应能力。此外,随着碳达峰、碳中和战略的推进,企业对碳排放动态监控和实时响应的需求日益增长,未来可结合边缘部署、多尺度建模、模型可解释性等技术,持续完善碳排放智能管理工具的理论与应用体系,为卷烟及相关行业的低碳发展和可持续转型提供更加有力的技术支撑。
基金项目
浙江省教育厅科研资助项目(Y202456363)。