1. 引言
电弧炉炼钢作为钢铁生产的重要方式,在推动绿色钢铁产业发展、实现资源高效利用方面发挥着核心作用,与国民经济建设、制造业升级息息相关。上官方钦等[1]从5个方面论述了中国发展全废钢电弧炉流程的战略意义和价值,届时对于电能的需求会更大。在电弧炉各项关键技术指标里,吨钢电耗占据重要地位。就当下发电行业情形而言,降低吨钢电耗,无论从经济效益还是环境效益方面考量,都意义非凡。精准预测吨钢电耗,能助企业规划能源采购、优化生产调度,为节能技术研发应用提供数据支持,对钢铁工业绿色转型意义重大。但电弧炉吨钢电耗影响因素复杂交织,精确预测极具挑战。
不少冶金工作者对此深入研究。如Pfeifer H等[2]构建静态线性回归模型预测电耗,适用于简单场景的电耗预测。郁健等[3]搭建物料与能量平衡模型进行电弧炉吨钢电耗的预测。Carlsson LS等[4]用人工神经网络预测不锈钢电弧炉电耗,能处理非线性关系,具有良好的预测精度。林女贵等[5]提出基于模糊需求响应的电耗自动核算方法,融合中值滤波、指数加权移动平均法与模糊深度神经网络,实现电耗数据去噪、负荷预测与精准核算,实验显示该方法核算误差小、效率高,噪声干扰下稳定性强。
本文旨在预测电弧炉吨钢电耗,为此分析了与该指标相关的特征。运用随机森林(RF)算法对输入特征的贡献度排序,依据贡献程度挑选特征作为BP神经网络的输入[6]。首先利用遗传算法初步优化BP神经网络的训练参数(权重与阈值参数),随后借助粒子群算法对训练参数二次寻优,最终输出预测的电弧炉吨钢电耗,由此构建改进的PSO-GA-BP电弧炉吨钢电耗预测模型。
2. 数据处理与分析
电弧炉炼钢生产是一个多变量耦合的复杂过程,各个变量彼此关联、相互制约,共同决定着电弧炉炼钢的质量、效率与能耗。在进行吨钢电耗预测时,出钢量、氧气、电耗、造渣剂、最高出钢温度等变量,都和吨钢电耗存在直接或间接联系。要是把所有变量都当作预测模型的输入,无疑会导致信息冗余,增加模型构建难度。尽管影响吨钢电耗的可测过程变量繁杂,但必定有部分变量更为关键。此时,可通过随机森林算法得出变量的贡献度排序,进而筛选出与吨钢电耗相关性较高的变量。
随机森林算法评估特征重要性的核心思路,是基于集成学习的多棵决策树。算法对每棵决策树中的特征分别计算其贡献得分,再通过求均值的方式得到特征的综合重要性,以此实现对不同特征贡献程度的量化比较。在RF理论里,一般运用基尼指数来体现贡献度高低,它用于衡量各不同特征在决策树中所占比例。基尼指数G的计算公式为公式1,式中:K、
分别表示类别数、第k类的样本比例。
结合RF算法筛选和现场实际,共选取了15相关过程参数共计2000组数据。表1呈现了电弧炉吨钢电耗相关的过程参数及其贡献度。依据表1的贡献度排序,并结合实际生产工艺可知,进料速度、废钢加入量、上炉留钢量以及镁球,对吨钢电耗计算影响不大,故予以删除。选取冶炼时间、出钢量、最高出钢温度、电耗、氧气、燃气、碳粉、石灰、通电时间、进料时间、碎电极11个参数作为模型的输入特征。结合冶金反应机理分析与能量平衡方程可以验证得到上述特征选择过程的合理性。例如,吹氧量增大时,脱碳反应加剧并释放更多化学热,可降低对电能的依赖以维持炉温。
Table 1. The process parameters and contribution degree that affect the power consumption per ton of steel
表1. 影响吨钢电耗的过程参数及贡献度
过程参数 |
贡献度 |
过程参数 |
贡献度 |
电耗/WH |
0.300563 |
出钢量/t |
0.049718 |
通电时间/min |
0.134781 |
碎电极/kg |
0.046912 |
氧气/m3 |
0.121188 |
最高(出钢温度)/℃ |
0.031478 |
燃气/m3 |
0.077408 |
进料时间/min |
0.028080 |
冶炼时间/min |
0.071331 |
碳粉/kg |
0.025778 |
石灰/kg |
0.061382 |
进料速度/(t/min) |
0.020051 |
废钢加入量/t |
0.014274 |
上炉留钢量/t |
0.013960 |
镁球/kg |
0.003086 |
|
|
数据是决定数据挖掘算法准确度上限的关键要素,换言之,数据挖掘算法所构建模型的效果优劣,根本取决于用于训练、测试及验证的数据质量[7]。为提高数据质量,在利用RF算法完成特征筛选后,采用Pauta法则剔除异常数据,Pauta法则的计算如公式(2)~(4)。式中:
、
、
、
分别是数据的实际值、平均值、标准差和样本数量。
(1)
(2)
(3)
(4)
3. 吨钢电耗预测模型
3.1. 传统电弧炉吨钢电耗预测模型
传统电弧炉吨钢电耗预测模型基于冶金反应的能量平衡原理,通过解析电能消耗与化学能替代的物理机制,建立输入参数与吨钢电耗的定量关系。该模型将吨钢电耗分解为电能主导消耗和化学反应热补偿两部分,结合物料平衡方程实现预测,其核心思想是通过可测工艺参数计算能量收支,从而得到单位产量的电能消耗。该模型一般采用式5所示的基本形式,式中:
为吨钢电耗;P为输入功率;t为冶炼时间;
为能量转换效率,取行业平均水平70%;M为钢水重量;F为其他影响因素对电耗的修正值,取F = 0.1 × (氧气流量 + 碳粉加入量 + ……)的平均值,反映未建模因素的综合影响。
从上述公式可以看出,吨钢电耗与输入功率、冶炼时间成正比,与钢水重量成反比。该模型基于理想假设(如恒定热效率、完全燃烧),未考虑冶炼过程中温度波动、炉渣热损失等动态因素,在复杂工况下可能存在预测误差。
(5)
3.2. BP神经网络
BP神经网络具备非线性逼近、自学习等特点,泛化能力极强[8]。它依据历史生产数据,借由信息的正向传播以及误差的反向传播,去拟合输入和输出间的映射关系,从而实现预测未来的目标。BP神经网络的结构为输入层、隐藏层、输出层[9]。通过RF算法筛选得到以下11个输入特征:电耗、通电时间、燃气、氧气、冶炼时间、石灰、出钢量、碎电极、最高出钢温度、进料时间、碳粉。通过文献[10]中的公式确定神经单元的个数。BP神经网络的架构如图1所示。
3.3. GA-BP预测模型
GA算法源于生物进化论,是一种模拟自然界生物染色体遗传、交叉、变异和自然选择过程的自适应全局搜索寻优算法[11]。该算法将问题参数编码为染色体,以适应度函数评价个体优劣,经选择、交叉、变异操作逐代进化,最终逼近全局最优解。其优势在于并行搜索能力强、鲁棒性高,尤其适合处理非线性优化问题。在电弧炉吨钢电耗预测中,BP神经网络虽能建立非线性映射,但易受初始参数影响而陷入局部最优。本研究采用GA优化BP网络的初始权值和阈值,既保留BP网络的非线性处理能力,又提升了模型的收敛速度与预测精度,为电弧炉能耗预测提供了更有效的方法。
3.4. 改进PSO-GA-BP模型
3.4.1. GA算法缺陷分析
虽然GA算法能有效优化BP神经网络的初始权值和阈值,但GA算法本身仍存在一些理论缺陷,限制了其在神经网络参数优化中的性能。GA算法的局限性主要体现在以下几个方面:首先,GA算法的收敛性受到编码精度的限制。在实际问题中,权值和阈值往往需要较高精度表示,但二进制编码的长度受到计算能力限制,导致参数精度存在上限,如公式(6),式中:Δ为参数精度;
和
分别为参数
Figure 1. BP neural network architecture
图1. BP神经网络架构
上下界;
为编码长度。当参数空间较大时,GA难以保证高精度搜索。其次,GA算法在后期收敛过程中,种群多样性急剧下降,导致搜索能力减弱。此时种群基因趋于一致,交叉操作难以产生新的有效解,变异操作效率也随之降低,如公式(7),式中:
表示交叉操作产生新解的概率;
为染色体
和
的汉明距离;
为种群规模。随着迭代进行,
逐渐降低,导致算法陷入早熟收敛。第三,GA算法缺乏利用问题梯度信息的机制,搜索效率相对较低。在参数空间中,GA主要依靠随机操作探索,忽略了解空间的结构特性,导致在精细优化阶段效率不高,如公式(8),式中:
表示第
代种群的期望适应度;
为学习率;
为个体i的选择概率;
为适应度函数在
处的梯度。GA算法无法直接利用
信息,导致优化效率受限。基于上述对于GA算法的理论缺陷分析,引入PSO等算法进行二次优化具有合理性和必要性。
(6)
(7)
(8)
3.4.2. PSO算法引入讨论
PSO算法是一种群智能优化方法,该算法模拟了鸟群觅食的行为,通过个体间的信息共享来引导整个种群向最优解迁移。在PSO算法中,每个粒子代表问题的一个潜在解,粒子在解空间中移动时会考虑自身历史最优位置和群体历史最优位置。标准PSO算法中,粒子i的位置和速度更新公式如公式(9)~(10),式中:
和
分别为粒子i的速度和位置;
为惯性权重;
和
为学习因子;
和
为
之间的随机数;
为粒子i的历史最优位置;
为全局最优位置。
(9)
(10)
通过分析公式(9)~(10)所表述的PSO算法的搜索机制可知,该算法存在以下不足:一是惯性权重固定,导致算法在迭代过程中难以平衡全局搜索和局部开发能力;二是容易陷入局部最优解,尤其在处理复杂多峰问题时表现明显;三是后期收敛速度减慢,搜索精度有限。
针对上述问题,对标准PSO算法进行了改进。首先,引入线性递减的惯性权重策略[12],使算法在初期具有较强的全局搜索能力,后期具有较高的局部开发精度,如公式(11),式中:
和
分别为惯性权重的最大值和最小值;
为当前迭代次数;
为最大迭代次数。其次,为增强算法跳出局部最优的能力,引入自适应变异操作。当连续多次迭代全局最优解无改善时,对全局最优位置进行变异,如公式(12),式中:
为变异后的全局最优位置;
为变异强度系数,随迭代进行而减小;
为标准正态分布随机数;
和
分别为搜索空间的上下界。
(11)
(12)
改进PSO算法相比标准PSO具有明显优势。标准PSO和改进PSO对比收敛曲线如图2。从收敛
Figure 2. Comparison of convergence curves between standard PSO and improved PSO
图2. 标准PSO与改进PSO收敛曲线对比
曲线可见,改进PSO最终适应度值为0.026106,比标准PSO的0.093097降低了约72%;在测试集上,改进PSO误差为0.127957,比标准PSO降低了22.87%,表明其泛化能力更强。线性递减惯性权重策略使算法在初期保持较强全局搜索能力,后期增强局部开发精度;自适应变异操作有效避免了局部最优陷阱,且未显著增加计算负担。这验证了改进策略在BP神经网络参数优化中的有效性。
基于上述分析,提出改进PSO-GA-BP混合优化策略:先通过GA获得具有良好全局特性的初始网络参数,再利用改进PSO算法在GA解的基础上进行精细优化,充分发挥两种算法的互补优势。这种混合优化策略可表示为公式(13),式中:
为最终优化的网络参数;
为初始BP网络参数;GA和
分别表示GA优化和改进PSO优化操作。通过这种混合优化策略,既保留了GA的全局搜索能力,又利用改进PSO的高效局部开发能力,从而更有效解决电弧炉吨钢电耗预测这一复杂非线性问题。改进PSO-GA-BP模型的流程图如图3所示。
(13)
Figure 3. Flow chart of improved PSO-GA-BP model
图3. 改进PSO-GA-BP模型流程图
4. 结果与分析
为了得到准确的预测模型,先使用随机森林算法和Pauta法则对原始数据进行特征筛选和异常值剔除,再将数据中的80%作为训练集,其余部分作为测试集。
4.1. 模型预测结果
本模型的数据来自于国内某钢厂。结合现场数据,对机理模型、BP神经网络、GA-BP模型以及改进PSO-GA-BP模型进行编程实验。表2为4种预测模型在相同固定偏差范围下准确率的统计表。由表可知在误差区间
内,从机理模型到改进PSO-GA-BP模型分别有38.14%、78.79%、88.34%、94.87%的准确率,说明了改进PSO-GA-BP预测模型具备更高的预测精度。
Table 2. Comparison of the accuracy of the 4 models
表2. 4种模型准确度对比图
偏差范围 |
机理模型 |
BP神经网络 |
GA-BP模型 |
改进PSO-GA-BP模型 |
±5 WH/t |
15.22% |
52.45% |
43.12% |
57.58% |
±10 WH/t |
38.14% |
78.79% |
88.34% |
94.87% |
±15 WH/t |
63.21% |
89.51% |
99.07% |
98.37% |
±20 WH/t |
78.71% |
95.10% |
99.53% |
99.30% |
4.2. 模型评价
采取均方根误差
(Root Mean Square Error, RMSE)、平均绝对误差
(Mean Absolute Error, MAE)和均方相关系数
这3个评价指标对上述预测模型进行评价分析,公式如(14)~(16),式中:
和
分别为实际值和预测值;
为实际值的平均值。在测试集上,分别求解从机理模型到改进后的PSO-GA-BP模型的
、
、
,其对比结果如表3所示。
(14)
(15)
(16)
Table 3. Comparison of prediction performance of four kinds of models
表3. 4种模型的预测性能对比
评价指标 |
机理模型 |
BP神经网络 |
GA-BP模型 |
改进PSO-GA-BP模型 |
|
17.5000 |
9.1113 |
6.8706 |
5.7687 |
|
14.2200 |
6.6875 |
5.7179 |
4.7516 |
|
0.7953 |
0.9466 |
0.9696 |
0.9786 |
分析表3能够发现,从机理模型到改进PSO-GA-BP模型的
、
呈逐步下降之势,这两个指标用于衡量模型预测值与实际值的偏离程度,其数值不断下降说明了模型预测精度的提高;从机理模型到改进PSO-GA-BP模型的
呈现逐渐递增的情况,
用于度量模型对观测数据的拟合程度,其数值越接近于1,就说明预测值和实际值的相关性越强,即模型对数据的解释力度越好。
图4展示了各模型预测值与实际值相对误差、绝对误差的对比小提琴图。观察图4可清晰发现,从机理模型到改进PSO-GA-BP模型,绝对误差和相对误差的小提琴图逐渐变窄。小提琴图变窄表明数据离散程度减小,也就是模型预测值与实际值的差值波动范围缩小,这表明模型预测精度在不断提高。其中,改进PSO-GA-BP模型的箱型图收窄程度最为显著,充分彰显了其较高的预测精度与泛化能力。
Figure 4. Comparison of absolute and relative prediction errors of four models
图4. 4种模型预测绝对误差与相对误差对比
5. 改进PSO-GA-BP模型可解释性分析
尽管改进PSO-GA-BP模型展现出优异的预测性能,但其作为黑盒模型的固有特性,使得研究人员难以洞悉模型的决策逻辑与机制,进而可能引发对模型可靠性的信任疑虑。鉴于此,引入SHAP (SHapley Additive exPlanations)值分析方法,以量化解析各特征对吨钢电耗预测的贡献程度。SHAP值理论根植于合作博弈论,通过计算每个特征在模型预测中的边际贡献,将黑盒模型的决策过程转化为可量化、可解释的特征影响权重,从而实现模型逻辑的可视化表达与透明化阐释。这一分析方法不仅能够揭示关键特征对预测结果的作用强度,更能通过特征间的交互效应分析,为理解复杂工业场景下的能耗预测机制提供量化依据。通过SHAP值分析生成的特征重要性见图5,清晰展现了各工艺参数对吨钢电耗预测的边际贡献排序。
如图5所示,图谱以横向条形图直观呈现特征影响强度,红蓝色系分别表征降耗电与增耗电效应。其中电耗、通电时间和氧气流量为三大主要影响因素,与随机森林特征贡献度排序高度吻合,证明模型通过非线性学习准确捕捉到工艺参数与电耗的物理关联,如通电时间作为电弧加热直接变量、氧气流量反映化学热替代电能的冶金机理。SHAP分析将黑盒模型的预测逻辑转化为可解读的特征权重体系,高电耗预测可归因于“长通电时间 + 低氧气流量”,低电耗预测对应“富氧吹炼 + 碳粉协同”的特征组合。这种将预测结果映射到具体工艺参数的能力,提升了模型决策透明度,为研究人员提供了从预测结果到作用机制的解释路径,增强了模型的可解释性且有效解决了黑盒模型的信任问题。
Figure 5. Characteristic SHAP distribution map
图5. 特征SHAP分布图
6. 结论
1) 采用线性递减的惯性权重策略和自适应变异操作对于原始的粒子群算法初始化方式进行了改进,从而得到了改进PSO-GA-BP模型,其相较于原有的PSO在初期具有更强的全局搜索能力,后期具有更强的局部开发精度,进一步提升了算法的求解能力。
2) 在测试集上进行模型性能评估时,建立的改进PSO-GA-BP模型的
、
、
三个评价指标均优于其他模型。证明了改进PSO-GA-BP模型具有较高的预测精度及泛化能力。
3) 通过对于改进PSO-GA-BP模型的SHAP可解释性分析,打破了传统黑盒模型的壁垒,增强了模型的可解释性,有效缓解了模型的信任危机。
NOTES
*通讯作者。