1. 引言
高光谱成像仪是光谱与二维成像相结合的一种三维成像,它可以获得丰富的光谱信息,在获取空间位置和形状信息的同时“突出”更多的地物,从而有助于区分各种信息[1]。光谱图像在食品质量检测、作物生长监测、资源调查和考古发掘等方面具有重要的应用价值。对于电缆绝缘的检测,已有的研究结果表明,高光谱技术可以用于复合材料绝缘性能的诊断,大多数研究使用全光谱高光谱数据来识别和识别单一污秽源[2]。本项目拟以高光谱成像仪和绝缘子为研究对象,利用高光谱成像仪分析技术,结合偏最小二乘回归(Partial Least Squares Regression, PLSR)与支持向量机(Support Vector Machine, SVM),分别建立基于支持向量机的绝缘子污秽度预测(SVM-ICDP)模型与基于偏最小二乘回归的绝缘子污秽度预测(PLSR-ICDP)模型(其中ICDP为Insulator Contamination Degree Prediction的缩写,即“绝缘子污秽度预测”),并采用多种预处理方法对绝缘子表面污垢进行预处理,对比分析其对绝缘子污秽程度的影响。选择最优数学模型,实现对绝缘子污秽的准确预测。
2. 高光谱成像仪污秽检测的理论和技术
2.1. 高光谱基本理论
高光谱成像技术的核心思想是通过吸收和反射不同波段的光能,获取光谱材料的“指纹”。光谱图是一种高分辨率、多波段的成像,能较好地反映复杂地物的特征,有利于地物分类模型的构建[3]。
污秽成分的差异会对绝缘基的覆盖率、颗粒浓度对色度、饱和度等的影响以及污秽成分在反射光路上的沉积结构等产生一定的影响。此外,光谱的总反射率与波长和污秽程度有一定的相关性。通过对其污秽成分特征谱的综合分析,可以对绝缘子的污秽成分程度进行分级。
2.2. 污秽检测平台
基于高光谱成像与检测原理,研制了GaiaField (F + V10)、调焦控制计算机、辅助光源、99%反射率白板等组件。用一块反射布搭建一个小的摄影场,镜头用三角架定位,镜头与样品之间的距离为120 cm [4]。光源以60度角固定在钢架上,等距布置,如图1所示。将从字段中提取的绝缘子串放置在外观区域的中心,并收集图形信息。
Figure 1. Schematic diagram of hyperspectral acquisition platform
图1. 高光谱采集平台示意图
3. 材料和方法
针对绝缘子的特点,提出基于高光谱图像的黑白标定和预处理方法。在现有标签数据的基础上,构建并验证了SVM-ICDP和PLSR-ICDP模型,具体流程见图2。
Figure 2. Method for calculating the degree of contamination of insulators
图2. 计算绝缘子积污度的方法
3.1. 测试仪器和测试仪器
目前,国内外对绝缘子污秽水平的研究多基于等效吸附盐浓度(Na S l),以cm2为单位进行计算。高压动力装置外绝缘污秽程度分为II级、III级、IV级,并按不同等级对样品进行均匀着色。ESDD值为0.04、0.06、0.08、0.1、0.15、0.18、0.25、0.25、0.30、0.30 mg/cm2,灰密度为1 mg/cm2。试验采用电子天平(型号esj201-4a,上重210 g,误差0.1 mg)。本项目拟采用中国四川自主研制的地面高光谱成像设备(Gaiafield-f-v10)进行高光谱成像。采用区域阵列探测器、驱动电源和运动控制模块,实现自动曝光、对焦、匹配扫描速度、数据标准、监控距离等功能,光谱分辨率为2.8 nm,覆盖率为400~1000 nm,包含256个光谱波段。
3.2. 高光谱成像采集和单色校正
本文拟利用高光谱成像系统中的图像采集软件,对同一批样品进行5次扫描,得到相应的高光谱成像仪。与单波段光源的偏振效应不同,在低照度条件下,高光谱成像具有较强的噪声[5]。图像的单色校正(黑白校正)可以减少噪声的影响。即:
(1)
式中:R为改进的高光谱成像系统。这里R0是未经校正的高光谱图像。D是一个标准的黑色参考图像(接近0%的反射率),关闭环境光,在相机镜头上方放置一个黑色按钮。W是在标准白色参考图像(99%反射率)上捕获的图像。在本项目中,使用envi5.1和matlab等程序选择rΟi,由于人工配置错误和光照的随机性,当无法对rΟi进行平均处理时,局部rΟi的高分辨率像素图像为x维和y维,波长信息λ表示光谱维数,以污秽分布均匀的区域为采样点[6]。选取污秽分布均匀的区域作为采样点。本研究共获得162份rΟi数据。高光谱图像通常分为256个波段,在1~20分钟和191~256波段,噪声和信噪比都很低。因此,本项目放弃该波段,只选取21~190波段的高光谱数据进行分析,如图3所示。
Figure 3. Hyperspectral imager and spectral curve
图3.高光谱成像仪和光谱曲线
3.3. 高光谱成像仪预处理
由于高光谱图像中含有大量的非相干成分,如电噪声、样本基等[7]。为了达到这一目的,必须首先对光谱进行预处理,去除不相关的光谱,然后建立模型。谱线预处理一般采用SG滤波、对数和一阶导数法。在此基础上,综合分析了不同预处理方法对模型构建的影响,选择了最优的光谱预处理方案。
根据同一物质的高光谱曲线的相似性,可以推断在不同介质下,其光谱的变化趋势是一致的。同时,受污秽介质表面污垢状态的影响,污秽介质选择性地吸收和反射不同波段的光,导致同一波段样品的光谱特性存在差异[8]。另外,通过对3个污秽等级的平均光谱曲线的分析(图4),得出在444~553 nm之间、444~553 nm之间,553 nm处的反射率减小,且553 nm处的反射率最小。三种光谱曲线在任意波长均存在明显差异,且反射率随污秽程度的增加而增大。然而,在667~861 nm的光谱曲线中,有一些区域无法区分[9]。为此,提出了绝缘子污秽的数学模型,利用能量曲线表征材料内部本质差异的方法。
Figure 4. Spectral average of samples with degree of contamination
图4. 污秽程度样本的光谱平均值
3.4. 预测模型的构建
按照污秽度从低到高的顺序,将样本数据按7:3的比例分成训练集和预测集,如图5所示。
Figure 5. Model establishment process
图5.模型建立过程
在此基础上,建立SVM-ICDP模型。该方法不仅适用于线性和非线性问题,而且可以很好地求解多项式核函数,其表达式为。
(2)
式中:
是常数,
。
支持属于双重分类模型。本项目采用“一对多”的简单有效方式解决绝缘子污秽问题,实现单、多分类器的简单有效分离[10]。在此基础上,构造了三个最优分类器,以达到最小缺失检测的目的[11]。该方法建立的SVM-ICDP模型对任意绝缘子的污秽程度都有较好的预测能力。
本项目拟在前期工作的基础上,以高光谱成像为参数,以现有高光谱数据X为参数,以实验室试验获得的绝缘子盐浓度为因变量,对建立的模型进行预测,建立一种基于超分辨率成像的盐富集浓度预测新方法。首先对X和Y进行归一化,然后得到E0和F0。由E0计算k (k ≤ r)的分量,然后对F0和各分量进行回归[12]。通过相关效度检验计算提取元素的数量。本课题拟在现有工作的基础上,建立5个PLSR模型构件,进行5个周期的交互验证,保证模型的准确性,完成构件的提取。最后对X进行归一化,得到Y与X的回归方程[10]。在构造PLSR-ICDP时,利用SG平滑、对数和一阶差分进行预处理,得到2,2,4,p = 1。
4. 结果与分析
4.1. 模型评价指标
评估模型质量非常重要,本文在该部分主要评估SVM-ICDP和PLSR-ICDP的指标。
(1) SVM-ICDP模型使用总正确率
和总错误率
对模型进行了评估:
(3)
(4)
(2) 提出使用均方误差eRMSE来评估PLSR-ICDP模型预测能力的方法:
(5)
式中:yi是观察到的第i个样本;预测第i个示例。
低RMSE表示预测结果和实际测量值之间的偏差较小。
4.2. 模型分类效果与分析
然后利用现有的高光谱数据进行预处理,构建SVM-ICDP模型。
Table 1. Classification effects of SVM-ICDP model under different preprocessing
表1. SVM-ICDP模型在不同预处理下的分类效果
预处理方式 |
|
|
原始高光谱数据 |
83.78 |
16.22 |
SG滤波对数变换 |
83.78 |
16.22 |
一阶导数变换 |
91.95 |
8.05 |
表1所示的聚类分析表明,经过一阶导数函数的变换,SVM-ICDP模型的特征值可以达到91.95%的概率,达到91.95%。结果表明,该算法的计算结果优于现有算法。同时,SVM-ICDP模型可以快速预测绝缘子的污染程度,为快速识别和更换污染严重的绝缘子提供依据[13]。在上述研究的基础上,建立了预测绝缘子低污染程度的PLSR-ICDP模型,为绝缘子污染预警奠定了理论基础。各种预处理方法见表2。
Table 2. Preprocessing examples of PLSR-ICDP model with different prediction effects
表2. PLSR-ICDP模型具有不同预测效果的预处理示例
预处理方式 |
|
原始高光谱数据 |
0.26 |
SG滤波对数变换 |
0.28 |
对数变换 |
0.28 |
一阶导数变换 |
0.025 |
由表2可以看出,两种预处理方法的拟合精度均小于0.0300。然后,利用PLSR-ICDP模型对高光谱数据进行微分变换,得到最佳的高光谱遥感数据。
5. 讨论
5.1. 一阶导数变换对模型性能提升的光谱学解释
本研究结果表明,经一阶导数变换预处理后的数据,所构建的SVM-ICDP与PLSR-ICDP模型均取得了最佳性能。从光谱学角度分析,其性能提升主要源于以下机理:原始的高光谱反射率数据易受环境背景、光照条件及绝缘子基底颜色等无关因素的干扰,导致光谱基线漂移和缩放,掩盖了与污秽成分相关的细微特征。一阶导数变换能够有效消除上述线性乃至缓变的背景干扰,从而“放大”目标物质的特征吸收与反射峰。具体而言,在反射光谱的斜坡和拐点处,一阶导数会呈现极值,这些位置往往对应污秽中特定化学成分(如盐类、灰尘)的敏感波段。因此,导数变换通过增强光谱曲线的形态特征,使得不同污秽等级之间在光谱上的差异性更为显著,为后续的分类与回归模型提供了信息量更丰富、信噪比更高的输入特征,最终显著提升了模型的判别与预测精度。
5.2. SVM与PLSR模型适用场景对比
本研究构建的SVM-ICDP与PLSR-ICDP模型在应用层面各有侧重,共同构成了对绝缘子污秽状态从定性判别到定量评估的完整技术方案。
SVM-ICDP模型的适用场景:SVM本质上是一个强大的分类器。因此,SVM-ICDP模型更适用于污秽等级的定性判别与快速分级。在实际应用中,当运维目标是将绝缘子快速划分为“清洁”、“轻度污秽”、“重度污秽”等有限类别时,SVM模型凭借其出色的非线性分类能力,能够实现快速、准确地等级判定,为制定清洗或更换策略提供直接依据。
PLSR-ICDP模型的适用场景:PLSR的核心是建立光谱与连续目标值之间的线性回归关系。因此,PLSR-ICDP模型更适用于污秽程度的定量反演,如精确预测等效盐密(ESDD)等具体数值。这对于需要精确掌握污秽积累动态、进行风险评估和寿命预测的精细化运维场景至关重要。
综上所述,在工程实践中,若需快速筛查与状态分级,应优先采用SVM-ICDP模型;若需精确量化污秽浓度以支持状态评估与预测,则PLSR-ICDP模型是更优的选择。两者可协同使用,形成优势互补。
5.3. 与已有研究的性能对比
与基于层次极限学习机的方法[6] (准确率约85%)相比,本研究提出的SVM-ICDP模型在准确率上有明显提升;与基于高光谱的污秽成分识别方法[12]相比,本研究的PLSR-ICDP模型在RMSE上进一步降低,显示出更高的预测精度。这表明本文所提出的方法在绝缘子污秽状态识别与预测方面具有较好的先进性与实用性。
本文利用高光谱成像系统,对不同污秽度的绝缘子进行了高光谱成像。通过SG滤波、对数变换、一阶差分变换等观测方法的对比研究,确定一阶差分变换后的数据更适合于构建模型。在实验中,采集了差分转换后的数据,SVM-I C DP模型的RMSE达到91.95%,PLSR-IСDP模型的RMSE达到0.025,验证了两种模型预测绝缘子污秽程度的有效性。
NOTES
*通讯作者。