1. 引言
在炼钢工业之中,温度是一项关键的工艺参数,它对于钢液成分方面的控制、夹杂物去除工作的效率,以及最终产品呈现出来的性能,都起着决定性的作用[1]-[3]。在整个冶炼的具体过程当中,对于温度的精确管理工作是贯穿于全过程之中的。在转炉吹炼的阶段,针对温度进行精准的调控,是确保化学反应动力学方面的条件以及终点命中率的关键所在[4];而在钢包运输的阶段,为了去防止因为温度过低进而导致质量方面出现问题,也需要持续进行控温操作[5];但在转炉出钢阶段,关于钢水温度方面的研究仍然是相对较少,当转炉进行出钢的时,为了应对出钢阶段的自然温降,常常设定高于最低需求的出钢温度冗余[6],若温度出现不足的情况,那么钢水就需要进行二次加热的处理,从而能够满足后续工序在工艺方面的要求[7]。所以转炉出钢的温度测量必不可少。
针对钢水温度的测量方法主要包含了接触式测温与非接触式测温这两个类别。最常用的接触式测温方法就是热电偶测温法,它是以热电效应来作为理论基础,一方面具备测量精度高、动态响应快等明显的优点,但另一方面也受限于材料在耐腐蚀性方面的表现及热响应方面的特性,仅能实现瞬时间的离散采样。与此同时,由于其探头属于易损件、且高度依赖于人工进行的操作,从而难以去满足现代炼钢流程对于高温熔池连续在线监测方面的迫切需求[8] [9]。
非接触式测温技术凭借着其响应迅速、可进行连续监测以及安全性高等方面的优势,目前已成为现代炼钢行业在线监测工作的一个重要方向[10]。然而,复杂的工况环境对温度测量的精度提出了极为严峻的挑战。光谱测温是非接触测温当中最常用的一种测温手段,其依据普朗克测温原理而具有极高的理论极限,但光谱本身极易被弥散的烟尘、跳动的火焰、以及高浓度的水汽所吸收与散射从而产生干扰,由此便导致有效的辐射信号出现严重失真的情况,进而使得测温的精度呈现出下降的趋势。
目前采用多光谱辐射测温法提高精度是学者们的主流方法,该方法获取两个或多个离散波段的光谱能量,利用波长间的信号关联性,在理论上能够构建超定方程组,从而在抵消发射率波动影响的同时,显著提升鲁棒性。王勇青等人通过分析转炉炉口的多光谱数据并结合小波分析与神经网络构建预测模型,实现了对炉口的火焰及钢水的温度的高精度在线反演[11]。李云红等在中低温(50℃~400℃)范围内建立多波段测温系统,经过标定后系统温度误差在5℃左右(置信度0.95) [12]。张林等通过比色温法,在一定程度上减弱环境干扰和发射率变化对测温精度的影响,其在600℃~1000℃范围内的最大测温误差约为3.06% [13]。Sugiura等人提出了一种基于特定波长的双波长测温方法,成功解决热轧过程中水层和蒸汽对测温光路的遮挡问题,实现了对钢材表面温度的测量,显著提升了测温的稳定性和准确性[14]。Reggeti S A等提出了一种改进的光谱测温光学方案,通过消除视差和光路差异等固有误差,利用单摄像机和现成光学元件,实现了对非轴对称火焰中烟气浓度和温度的高时空分辨率半定量测量[15]。
尽管上述光谱测温技术在特定场景下取得了一定成效,但现有的研究在应对转炉出钢阶段时仍存在明显不足与局限,现有模型多针对稳态或实验室环境设计,在面对出钢时的高噪声的动态干扰时,往往面临特征提取能力不足、鲁棒性差的瓶颈。
针对上述出现的问题,本研究创新性地提出了一种具有双阶段的神经网络测温架构,使复杂工况下的反演精度得以显著提升。一方面,其通过借助基于梯度提升机(GBM)的钢水存在性检测模块,自动剔除掉无钢水或者强遮挡条件下的那些无效光谱,从而从源头上提高了数据的有效程度;另一方面,又突破性地构建出了LSTM-KAN温度反演模型,该模型不仅通过利用长短时记忆网络(LSTM) [16]充分挖掘光谱随时间演变过程中的动态时序特征,并引入Kolmogorov-Arnold网络(KAN) [17]来替代传统的多层感知机(MLP)。
实验结果表明,该联合架构能够有效地抑制住动态背景与环境负载变化带来的干扰,进而实现了平均绝对误差(MAE) 4.9443℃的高精度反演,与此同时,相较于传统方法,在特征辨识度与预测鲁棒性方面也实现了显著的提升效果。
2. 理论分析
2.1. 辐射测温基本原理
光谱测温主要基于普朗克辐射定律。普朗克辐射定律描述单位波长的辐射强度与温度、波长的关系如式(1)所示:
(1)
其中,
为第一辐射常数,
为第二辐射常数,普朗克常数
,
为波长,
为热辐射体的热力学温度。
为光谱发射率。
但在光谱测温时探测器并不会直接测得辐射强度,而是在经过光学系统、探测器响应函数后的信号。将这些影响因素结合化为一个常数
,则第
个通道的输出电压
可写为:
(2)
式(2)表示实际探测信号,其中既包含目标的发射率,也包含系统响应系数。当用温度为
的黑体作为参考时,其发射率
,输出信号为:
(3)
式(3)表示理想黑体的信号输出,用于校正系统因素。对公式(2)、(3)做比可得:
(4)
比值法使系统响应系数
消失,但保留发射率
项。因此,多波长测温的关键是如何处理发射率及干扰影响。仅依赖经验模型或假设的结果是难以满足工业上对精度和稳定性的要求[18]。而基于神经网络的多光谱测温方法不需要测量或假设发射率,神经网络可以直接从光谱特征中学习温度映射关系,发射率及其波动对辐射强度的变化在光谱输入就已存在中,因此网络在训练阶段能够自动建模这些非线性因素,实现对钢水温度的精确反演。
2.2. 模型建立
为了提升温度反演的鲁棒性与准确性,本文通过一种融合KAN神经网络与LSTM神经网络的模型充分挖掘钢水辐射光谱的时序演化特征与局部关键信息,实现对钢水真实温度的高精度建模与有效反演。
2.2.1. LSTM神经网络
LSTM (Long Short-Term Memory)其最早由Hochreiter和Schmidhuber于1997年提出,其核心是引入了门控机制,主要包括遗忘门
、输入门
和输出门
。遗忘门用于决定保留多少来自上一个时刻的状态信息,输入门控制当前时刻新信息的写入,输出门决定当前隐藏状态的输出内容,其最早由Hochreiter和Schmidhuber于1997年提出,是一种能够捕捉时间序列数据中长期依赖关系的神经网络[16] [18],单元结构示意图如图1所示。LSTM通过这些机制能够在处理长序列时有效缓解传统循环神经网络易出现的梯度消失或梯度爆炸问题,从而实现对时间序列中关键信息的选择性记忆与遗忘。
Figure 1. Schematic diagram of LSTM unit structure
图1. LSTM单元结构示意图
具体来说,给定当前时刻的输入向量
,以及前一时刻的隐藏状态
,各门的激活值通过o也就是sigmoid函数计算,其中
为遗忘门,
为输入门,
为输出门表达式如式(5)、(6)、(7)所示:
(5)
(6)
(7)
其中
,
,
分别为门控的权重矩阵,
,
,
为对应的偏置向量。
同时,利用tanh函数生成新的候选细胞状态
如式(8):
(8)
细胞状态更新为
如式(9):
(9)
隐藏状态输出为
如式(10):
(10)
结合上述机制,LSTM利用历史光谱的时序信息与当前输入光谱特征能够实现对钢水温度的精准预估,但尽管其在捕捉光谱数据中的动态变化方面具有优势,但在建模输入特征间复杂非线性关系时仍存在一定不足。本文引入了近年来发展迅速的Kolmogorov-Arnold Network (KAN)处理这个问题,以加强对光谱空间分布特征的刻画,提升温度反演的准确性与鲁棒性。
2.2.2. KAN神经网络
KAN的理论基础源自Kolmogorov-Arnold表示定理,该定理指出任何
维连续实值函数
都可以表示为若干一维函数的有限叠加组合,即存在连续基本一元函数
和
使得[17]:
(11)
与传统多层感知机(Multi-Layer Perceptron, MLP)不同,KAN网络是通过训练一组可学习函数,而非单纯权重和偏置参数,结构如图2所示,其基本操作是在近似函数时将多个可训练函数混合在一起,从而建模函数的非线性行为,不再使用传统的激活函数。
Figure 2. Illustration of KAN unit structure (Left) and MLP unit structure (Right)
图2. KAN单元结构(左)与MLP单元结构(右)示意图
KAN的激活函数是样条函数spline,通过学习样条函数的形状来增强模型的表达能力,每一层实际上是一个一维函数矩阵,改变参数即可获得不同的一维函数。一个KAN层可以表示为一个一维函数矩阵,其结构如式(12)所示:
(12)
其中,
表示第n个输出通道与第m个输入通道之间的函数关系,
是输入的第j个分量,函数
由样条函数进行参数化表示。KAN通过训练多个一维函数的组合来逼近高维非线性函数,由于每个激活函数是可调的样条函数,因此在保持非线性表达能力的同时模型具备更强的灵活性和可解释性。
3. 实验设计和数据获取
实现基于光谱测温的高精度温度反演,需要先开展光谱数据采集实验,来获取一定波长范围内多个时刻的高质量辐射光谱数据。本研究设计并且搭建起来了一套非接触式钢水光谱及温度在线监测系统,它集成包含了光谱信号采集、视频图像监控与温度真值校准三大功能模块,旨在复杂的冶炼环境下实现对高温钢水辐射信息的同步获取。
实验是在某大型钢铁厂的转炉炼钢现场作业区来开展进行的。考虑到在出钢的过程当中往往会伴随着剧烈的高温热辐射、偶发金属喷溅以及浓重的氧化烟尘环境,检测设备是无法去直接靠近熔融流股的。为此在经过现场勘测与安全评估后,最终选择将采集终端设备安装放置在距离转炉出钢口约20米的作业平台上,如图3所示。
Figure 3. Experimental design schematic
图3. 实验设计示意图
在光学采集光路的前端部分,是配置了一套长焦距望远镜头来精确对准出钢口下方的钢水流股核心区域的,它负责去收集目标辐射出来的光信号,而后端则是通过借助一根光纤将光信号传输至光谱仪当中。这种设计能够有效地将精密的光谱测量仪器与恶劣的高温现场环境进行远距离隔离,一方面避免了震动和高温可能会对仪器内部电子元件造成的干扰影响,另一方面又方便让实验人员能够在安全区域内去进行调试与维护的动作。与此同时,本研究为了辅助判断出钢过程中的钢水流股形态(像是散流、断流之类的情况)及烟尘遮挡的具体状况,在同轴位置同步安装了一台工业相机,这既便于去进行瞄准,又被拿来记录出钢全过程的视频图像,进而为后续剔除异常数据提供视觉参照。
在光谱仪的选择方面,是选用了Ocean Optics公司生产的USB4000-VIS-NIR微型光纤光谱仪来作为系统的核心感知单元,光谱仪的性能往往会直接决定了数据呈现出来的质量,而该设备具备微秒级的电子快门响应速度以及优异的环境适应性,是非常适合转炉炼钢现场的工业在线监测场景的。
光谱仪的波长响应范围被设定为350 nm至1100 nm,通过借助维恩位移定律计算可知其覆盖范围在1600℃左右皆有极大的跳动表现,且光学分辨率(FWHM)约为1.5 nm,配合25 um的狭缝宽度,让系统能够清晰分辨出钢水光谱中由微量元素所引起的细微特征峰。在数据采集的动作过程中,光谱仪是通过借助USB接口来与上位机连接的,它会根据现场钢水亮度方面的变化去动态调整积分时间(往往会控制在毫秒级),如此一来便确保光谱信号既不发生饱和溢出的现象,又能保持足够的信噪比水平。
本实验数据采集自某钢厂210吨转炉的150组实测出钢炉次,涵盖Q235、HRB400等主流钢种,出钢温度区间主要分布在1580℃~1680℃。为获取高精度的温度真值,实验采用B型双铂铑热电偶测温枪作为基准设备。
针对多传感器的数据同步问题,由于光谱仪连续采集频率为10 Hz,而热电偶为单次点测,本文引入了时间戳对齐技术。具体操作为:以热电偶测得稳定真值的时刻为基准,提取该时间戳前后1 s内(约10帧)的光谱数据并求均值,将其作为该炉次的模型输入特征。该机制不仅有效消除了设备间的同步误差,还平滑了出钢瞬间环境波动对单帧光谱的随机干扰。
4. 神经网络温度预测模型构建
4.1. 钢水存在检测模块
传统方法测温精度较低是因其难以有效分离钢水辐射光谱导致,本研究为实现钢水出钢过程中的自动温度测量,本研究引入钢水存在性检测模块判别光谱采集时是否存在有效辐射源。通过光谱采集系统
Figure 4. Feature importance and AUC trend chart
图4. 特征重要性柱状图叠加AUC变化趋势折线图
与灰度图像装置,获得转炉连续生产中的光谱与同步视频数据。基于图像,采用人工标注构建了包含8044个样本、正负样本比约1:1.8的光谱数据集,由于光谱具有1044维光谱特征要先利用Light GBM进行特征重要性排序,并通过五折交叉验证评估不同特征数对模型AUC的影响。结果如图4显示,当特征数达到12个时,AUC提升趋于平稳(ΔAUC < 0.5%),据此选取前12个波段构建优化特征空间,训练钢水存在性判别模型。
为全面评估不同机器学习模型在分类任务中的性能,本文通过九种主流算法相互对比选优,其中包括:决策树(DT)、极限树(ET)、梯度提升机(GBM)、K近邻(KNN)、轻量梯度提升(LGBM)、随机森林(RF)、支持向量机(SVM)以及极端梯度提升(XGB)。模型训练过程中采用网格搜索(Grid Search)与人工调参相结合的混合优化策略,针对不同模型设定相应的超参数搜索空间,并通过带有5折交叉验证(5-foldcross-validation)的Grid Search CV方法获取最优参数组合,从而提升模型泛化能力与稳定性。
最终模型中,GBM (梯度提升机)通过自动调参获得如下最优参数:学习率为0.05,最大深度为5,子样本比例为0.8,最小子分裂样本数为10,叶节点最小样本数5。这组参数在测试集(n = 1214)上表现最佳,其对应的混淆矩阵如图5所示,并在主要评价指标中取得了最优结果见表1。
Figure 5. Confusion matrix of the GBM on the test set
图5. GBM测试集混淆矩阵
Table 1. Performance metrics of classification models
表1. 分类模型的性能指标
Metric |
GBM |
DT |
ET |
KNN |
LGBM |
RF |
SVM |
XGB |
Accuracy |
0.9717 |
0.9390 |
0.9341 |
0.9324 |
0.9438 |
0.9439 |
0.9184 |
0.9406 |
Sensitivity |
0.9647 |
0.9364 |
0.9435 |
0.9411 |
0.9523 |
0.9552 |
0.9529 |
0.9482 |
Specificity |
0.9746 |
0.9404 |
0.9290 |
0.9277 |
0.9330 |
0.9378 |
0.8998 |
0.9442 |
PPV |
0.9535 |
0.8943 |
0.8774 |
0.8752 |
0.9001 |
0.8923 |
0.8367 |
0.9015 |
NPV |
0.9809 |
0.9364 |
0.9435 |
0.9411 |
0.9525 |
0.9552 |
0.9529 |
0.9482 |
F1 score |
0.9591 |
0.9149 |
0.9092 |
0.9070 |
0.9259 |
0.9227 |
0.8910 |
0.9243 |
Kappa score |
0.9382 |
0.8674 |
0.8576 |
0.8540 |
0.8899 |
0.8788 |
0.8263 |
0.88193 |
4.2. 温度预测模块
4.2.1. 数据预处理
经钢水存在性识别模块筛选,保留的光谱样本均含有效钢水辐射信号,每个样本包含1044个波长通道(350~1150 nm)。在经过常规的数据经清洗、背景噪声剔除及平滑处理后稳定性可以显著提升,随后需要进行特征压缩,其采用三阶段流程。
首先,基于冶金谱线物理特性与K-means算法进行波段划分。在转炉出钢的高温辐射光谱中,典型特征谱线的有效宽度通常在15 nm左右。由于相邻波长通道存在极高的共线性,若直接输入模型会引入大量冗余。因此,本文采用K-means对相似波段进行聚类。在聚类参数的确定上,本文并未单纯依赖经验调参,而是引入了严格的物理约束:为避免破坏特征谱线的物理完整性,选用10 nm作为单个分类特征带的等效宽度。这一设定确保了每个聚类带能够保留超过一半的特征谱线宽度,从而在大幅压缩维度的同时实现了关键辐射信息的无损提取。在此物理划分标准下,全波段被科学地聚合为70个物理一致的特征带。
其次,运用核主成分分析(Kernel PCA)提取非线性结构。考虑到工业现场高浓度的烟尘吸收与散射,会导致光谱辐射强度与钢水温度之间呈现出高度复杂的非线性耦合关系。由于传统的线性PCA无法捕捉此类深层非线性流形结构,本文通过径向基等核函数将聚类后的数据映射至高维空间,以提取抗干扰的非线性本质特征,并保留累计方差贡献率超过95%的25个主成分。
最后,通过Lasso回归进行特征稀疏化。为剔除与温度无关的冗余维度并增强特征筛选的科学性与可复现性,本文摒弃了人工经验调参,而是采用标准的10折交叉验证(10-fold Cross-Validation)流程在对数网格中进行参数寻优。最终确定了使验证集均方误差最小化的最优正则化参数为0.008。经过该步骤剔除低权重特征后,最终精准保留19个关键特征。上述核PCA映射与Lasso筛选规则被完整保存,以确保后续新输入样本投影的一致性。
4.2.2. 模型建立
本文所构建的KAN-LSTM模型结构具体的展示情况就如图6所示,整体是采用双分支架构来进行设计的,每一个分支分别拿来处理当前时刻的光谱信息内容与历史时序数据。在当前特征分支的运行过程当中,是通过借助KAN模块来对当前时刻的光谱数据加以非线性建模,从而让表达方面的能力能够得以增强;与此同时,在时序特征分支里,则是利用LSTM结构来挖掘出光谱时间序列所蕴含的动态规律。随后,把这两个分支的特征放到高维空间当中加以融合操作,在经过全连接层与非线性激活函数的处理步骤之后,最终回归并输出来钢水的温度反演数值。
4.2.3. 模型训练
实验所用到的数据集一共涵盖了4132个样本,每一个样本都是被19维的光谱特征构成的。数据是依照8:2的具体比例被划分成训练集(3035个样本)与测试集(1097个样本)。此次所设计的模型是去采用双分支结构的:当前特征分支是被3层KAN模块所组成的,时序特征分支则是由7层LSTM模块构建而成的,并且各个层级均被设定成512维的隐藏单元。模型的输入部分是长度为20的历史时间序列,用来建模钢水温度的动态演变具体过程的。
训练时通过借助Adam优化器,将初始学习率设定为5.5 × 10−4,并且借助于动态调度机制使其逐步降低。训练过程是采用批次大小为256的批量策略,使内存利用率能够获得提升。为了能够防止出现过拟合的情况,模型是在LSTM与全连接层之间加以引入Dropout (丢弃率为0.2)以及L2正则化(权重衰减系数为1 × 10−3)策略。整个训练过程启用了早停机制(patience = 10),从而确保在模型性能达到最优状态时把训练给终止掉。
训练过程中,模型在第103个epoch达到最佳性能后触发早停机制,有效防止了过拟合。最终训练损失为0.0085,验证损失为0.0121 (如图7),平均绝对误差(MAE)为4.9443℃,均方根误差(RMSE)为6.3798℃,决定系数(R2)达到0.9783。当前学习率调整至6.9 × 10−5,大误差比例(Δ > 15℃)为1.08%,表明模型在大部分样本上预测表现稳定且精度较高。误差大小分布与预测结果如图8、图9所示。
Figure 6. KAN-LSTM architecture diagram
图6. KAN-LSTM结构图
Figure 7. Training loss curve
图7. 训练损失曲线图
Figure 8. Error distribution plot
图8. 误差分布图
Figure 9. True vs. predicted scatter plot
图9. 真实值与预测值散点图
为验证本文提出的KAN-LSTM融合模型的先进性,在相同数据集上将其与纯KAN、纯LSTM及主流时序模型(Transformer、RNN)进行了对比与消融实验。结果显示,本文模型在测试集上取得了最优性能,MAE、RMSE及R²分别达到4.9443℃、6.3798℃和0.9783。从消融结果看,纯LSTM误差最大(MAE为6.1223℃),表明其难以直接拟合光谱与温度间复杂的非线性映射;纯KAN虽将MAE降至5.2134℃,但缺乏对时序动态特征的捕捉。本文的KAN-LSTM成功实现优势互补,既利用LSTM捕获了光谱特征的时间演化规律,又通过KAN完成了高阶非线性映射。此外,对比RNN和Transformer,本文模型的RMSE降幅显著。由于RMSE对大误差样本惩罚更大,这一结果有力证明了KAN-LSTM能有效抑制由现场烟尘遮挡、环境突变等引起的极端预测离群点,展现出极强的预测稳定性和工业应用鲁棒性。
Table 2. Performance comparison of different temperature inversion models
表2. 不同温度反演模型的预测性能对比
Model |
Training Set |
Validation Set |
Test Set |
MAE |
RMSE |
R² |
MAE |
RMSE |
R² |
MAE |
RMSE |
R² |
KAN |
5.0125 |
6.6104 |
0.9635 |
5.1033 |
6.6505 |
0.9612 |
5.2134 |
6.682 |
0.9675 |
LSTM |
5.8022 |
7.3954 |
0.9536 |
5.8158 |
7.4761 |
0.9533 |
6.1223 |
7.7427 |
0.9559 |
Transformer |
5.3801 |
7.1864 |
0.9563 |
5.3937 |
7.2364 |
0.9563 |
5.3974 |
7.2293 |
0.9616 |
RNN |
5.1046 |
6.9082 |
0.9593 |
5.2343 |
7.1059 |
0.9578 |
5.1064 |
6.9615 |
0.9644 |
KAN-LSTM |
4.812 |
6.2156 |
0.9801 |
4.895 |
6.3105 |
0.9791 |
4.9443 |
6.3798 |
0.9783 |
5. 结论
本文针对转炉出钢测温难题,结合多光谱测温的理论基础,提出了一种远程自动钢水测温系统。该系统采用梯度提升分类器(准确率为97.1%)进行阶段一识别,并结合长短时记忆网络(LSTM)与KAN神经网络的温度预测模型(平均绝对误差MAE = 4.9443℃,温度误差超过15℃的比例仅为1.08%)实现阶段二精准预测,形成双阶段架构,能够有效提升钢水温度测量精度。研究实现了对转炉炼钢出钢过程中钢水温度的非接触精准测量,有望提高炼钢工业整体智能水平合和减少吨钢成本。
NOTES
*通讯作者。