1. 引言
2023年我国天然气表观消费量高达4260.5亿立方米,相较于2023年增长约8% [1]。在当前发展阶段,我国天然气在能源中的地位依然举足轻重,发展天然气的速度以及规模仍将保持高速持续增长,拥有良好的应用前景[2]。随着城市天然气的普及和燃气设施应用的迅速扩展,燃气系统的安全性变得越来越受到社会各界的关注[3]。燃气切断阀作为燃气系统的关键安全组件,承担着流量控制、事故状态下燃气供应切断的核心职责,其运行稳定性直接决定了整个燃气系统的安全水平。然而,在实际工况中,切断阀易受高频振动、介质腐蚀、操作不当等内外因素影响,导致性能衰减甚至故障频发,因此及时精准地识别其潜在故障并开展诊断,成为保障燃气供应安全的关键环节。
传统燃气切断阀采用人工巡检的方式,受人的时间和经验的限制,容易出现故障。随着人工智能技术的出现和推广,智能化诊断开始初步应用于工业领域。目前国内大部分大型天然气系统已经普遍使用SCADA系统,这类系统的自动监控功能更加先进,弥补了人工监控方式的缺陷[4],目前更加完善的第四代SCADA系统,包含了人工智能技术等领先技术,具备较好的移动通信能力,通过互联网远程监视和控制站点和设备[5]-[7],可以连接至可编程逻辑控制器等[8]-[10]。针对燃气切断阀的故障监测和诊断,目前主要从传感器特征融合、自适应诊断、机器学习方法三个方面进行了故障智能诊断方面的研究。
多特征融合与多算法协同目前成为故障智能诊断方面的研究热点,这些方法能够提取高辨识度多维度故障参数,提升诊断结果的可靠性。特征层面,现有研究多聚焦多域特征互补融合,如融合时域统计特征与小波包频域能量特[11],或结合CEEMD分解的时频特征与样本熵特征[12],通过全面挖掘故障信号深层信息,避免单一特征对复杂故障表征的局限性。算法协同方面,学者们提出多种组合架构,如采用粒子群优化(PSO)算法优化BP神经网络参数[13],或基于模糊理论与贝叶斯推理构建协同诊断模型[14],在旋转机械、液压系统故障诊断中有效提升了模型泛化能力;也有研究通过朴素贝叶斯与D-S证据理论结合,降低了不确定信息带来的诊断偏差[15]。但现有方法在适配燃气切断阀强耦合、多工况波动的非线性故障特征时,仍存在特征与算法适配性欠佳、复杂工况下诊断稳定性不足等问题,因此需进一步探索针对性的多特征融合与多算法协同方案。
现有研究多聚焦单一特征提取或单个算法应用,难以适配燃气切断阀故障信号的非线性、非平稳特性,无法全面捕捉复杂故障信息,导致诊断可靠性与准确性不足。本文针对燃气切断阀故障诊断的精准性需求,提出一种多特征融合与多算法协同的智能诊断方法。首先开展多源信号特征融合,将CEEMD处理后的压力信号、流量信号与IMF分量能量值进行特征整合,通过KPCA算法完成特征降维,筛选得到最优特征集。其次采用GA-SVM模型对最优特征集进行初步故障诊断,利用遗传算法优化SVM的核函数参数与惩罚因子,提升初步诊断性能。最后引入D-S证据理论,对GA-SVM的初步诊断结果进行概率赋值与证据融合推理,修正单一模型的诊断偏差,实现故障类型的精准识别。本文旨在通过多特征融合与多算法协同的设计,提升燃气切断阀故障诊断的准确性与可靠性,为燃气系统的安全稳定运行提供技术支撑。
2. 基于CEEMD-KPCA的多特征融合的特征提取
2.1. 切断阀常见故障分析
通过分析燃气切断阀的组成结构、工作原理和故障机理,得到燃气切断阀在运行过程中常见的故障状态。当切断阀的运行过程存在故障时,系统压力会随即发生变化。所以将切断阀的压力信号作为故障诊断的监控参数,可以帮助及时检测和诊断可能出现的故障。常见的切断阀故障主要有以下几种:
1) 阀门打开或关闭异常,导致流体无法顺利通过或阀门无法有效地切断流体,从而增加了系统的压力。
2) 阀门内外泄漏是几率最大的泄漏故障,一般多见于密封圈老化损坏。在阀门开始泄漏之前,系统压力可能会缓慢下降,随着泄漏的加剧,压力下降的速度增加。压力变化会显得更加显著。
3) 阀门卡滞是发生频率较高的故障,一般是由于阀门内部零件的积尘、腐蚀、润滑不足或机械零件损坏引起。发生卡滞,会导致系统中的压力波动或出现不稳定的变化。
针对几种切断阀的常见故障类型,需要根据故障类型的特点,选择或分解得到对应的故障诊断的特征集。
2.2. 基于CEEMD的多特征提取
在选择切断阀故障诊断需要的特征集时,一般将压力作为主要特征参数,流量作为辅助参数。但在实际的切断阀故障诊断过程中,如果使用单一的流量信号或压力信号,诊断结果准确性无法得到保障。CEEMD是一种改进于经验模态分解(EMD)的自适应信号频谱处理方法[16],适用于处理非线性、非平稳信号序列。相较EMD方法,CEEMD方法解决了模态混叠效应与产生虚假分量问题,其原理是在EMD分解的过程中加入一对高斯白噪声,通过抵消噪声达到处理的效果。其中,图1为EMD分解的压力信号及其频谱,图2为CEEMD分解结果瞬时特征,可以看到EMD分解得到的无关变量更多,选择CEEMD进行信号特征提取更加有效。
Figure 1. Signal and its spectrum after EMD decomposition
图1. EMD分解的信号及其频谱
Figure 2. Transient characteristics of CEEMD decomposition results
图2. CEEMD分解结果瞬时特征
本文提出的多融合特征提取方法,利用CEEMD将压力信号进行分解得到IMF分量,结合各IMF分量下的能量值以及流量信号进行特征融合,如图3所示为切断阀多特征融合模型。其中,在对压力信号进行CEEMD分解时采用了定量分析,以分解得到的IMF分量与原始信号之间的相关系数作为评价指标,对IMF分量进行筛选。
Figure 3. Multi-feature fusion model for shut-off valves
图3. 切断阀多特征融合模型
1) 相关系数
相关系数一般被称为相似度系数,用来判断算法分解的各个分量与原信号之间存在相似度的系数。其也作为分解结果中有效IMFs的筛选的一项重要指标,二者互相关系数计算方法如式(1)所示:
(1)
其中,cov为两信号的协方差,σ为方差,ρ为第i个分量信号与原始信号的相似度系数,相似度系数的大小决定了相关程度,越大则两个信号的内部信息越类似,相反越小则越不相似,为零则为不相关。
2) 能量值
能量值是指燃气切断阀系统压力信号在一个时间周期内的积分,每一种故障的能量值大小不尽相同,可以根据能量值对故障特征进行分类[17];若一层IMF的能量值很小,则说明这层IMF的主要成分为噪声干扰;若一层IMF的能量值明显较其他层大,则说明这一层IMF的主要成分为原始信号。各IMF分量从噪声部分到信号主导部分能量值会产生突变。连续信号的能量值的计算公式如式(2)所示,若信号为离散状态,则利用式(3)进行计算。
(2)
(3)
3) 流量数据
阀门内外泄漏是几率最大的泄漏故障,随着阀门泄漏会导致系统压力下降,而燃气泄漏量需要通过对流量的检测得知。因此,本研究加入了流量信号作为辅助特征,通过天然气流量的数据特征,可以得到系统压力与流量之间的数量关系,判断泄漏的大小。
通过对故障样本数据的选取,每种数据的压力值、流量值和CEEMD分解的IMF分量如图4~6所示,图7为多数据融合的数据图。
Figure 4. Pressure data feature set
图4. 压力数据特征集
Figure 5. Flow parameter feature set
图5. 流量参数特征集
Figure 6. Parameter feature set for the IMF component
图6. IMF分量的参数特征集
Figure 7. Multi-feature fusion data
图7. 多特征的融合数据
2.3. 基于KPCA的特征降维
直接使用切断阀故障诊断的全部提取特征易引发维度灾难,导致诊断模型复杂度升高、泛化能力下降,因此需进行特征降维。核主成分分析(KPCA)作为高效的非线性降维方法,核心优势在于通过核函数将切断阀故障的非线性耦合特征映射至高维特征空间,再执行线性降维,既能有效提取数据中关键非线性成分,又能最大程度保留故障诊断所需核心信息[18]。相较于线性PCA难以处理非线性特征的局限性,KPCA恰好适配切断阀故障特征多维度、强非线性的特性,可避免线性降维导致的关键故障信息丢失,在减少数据维度的同时保障诊断模型性能,精准满足故障诊断的降维需求。
利用燃气切断阀故障数据在高位空间线性可分这个特点,KPCA将原始切断阀特征数据通过核函数(kernel function)映射到高维度空间,再利用PCA算法进行降维。KPCA算法的关键在于核函数。假设现在有映射函数
,它将数据从低维度映射到高维度。得到高维度数据后,还需要计算协方差矩阵,协方差矩阵每个元素都是向量的内积。映射到高维度空间后,向量维度增加,计算量大幅度增大,而核函数可以很好地解决
应该把数据映射到多少维度[19]。
若将原始切断阀故障特征数据看作是矩阵X,其中矩阵的每一列数据为一组样本,每个样本有m个属性,一共有n组样本。
(4)
将每个切断阀故障特征样本通过函数映射到高维空间,得到高维空间的调压故障数据矩阵
,
是一个列向量。
(5)
用同样的方法计算高维故障特征空间中数据的协方差矩阵,进一步计算特征值与特征向量。
Figure 8. Data distribution plot before dimension reduction
图8. 降维前的数据分布图
图8为特征降维前的数据分布图,图9为KPCA中利用高斯(RBF)径向基核函数分裂后四种状态的分布图。从图中可以看出,KPCA中的高斯核函数可以有效地将四种故障类型分离,使四种状态之间的距离比较合适,其每一种特征的聚拢度较好,因此本文选择高斯核函数作为后续工作的核函数,将特征降维后的最优特征集作为后续故障诊断的重要依据。
Figure 9. Visualization of KPCA dimension reduction using gaussian kernel functions
图9. 高斯核函数下的KPCA降维效果图
3. GA-SVM优化诊断模型
遗传算法(Genetic Algorithm, GA)是一种模拟生物学自然规律的寻优方法,与生物遗传规律类似,是一种基于概率的人工智能算法。本文选择其处理切断阀故障特征寻优,因切断阀故障特征集具有多维度、强耦合、非线性特性,且参数分布存在不确定性,传统算法易陷入局部最优,而GA可直接以全部特征为对象,避免提前筛选遗漏关键信息,同时随机化技术指标能适配特征动态变化,灵活的编码机制可匹配离散与连续型特征,兼顾寻优效率与可靠性,精准满足故障特征融合寻优需求。
支持向量机SVM是一种二分类模型,它的基本模型是定义在特征空间上的间隔最大的线性分类器,间隔最大使它有别于感知机;求解切断阀故障特征的最优超平面需要在高维特征空间内对四种不同状态下的原始故障样本数据集进行内积运算。
在支持向量机的运算中存在两个可定义的参数
,对这两个参数进行不同的设置会对分类结果产生不同影响。其中,惩罚因子c调整了支持向量机的置信范围和经验风险在确定故障特征空间中的比例。
以利用RBF核函数的SVM分类器进行模式识别的结果为例,采用正常状态、阀门异常打开或关闭、阀门卡滞以及阀门泄漏四种状态下采集到的实验数据,利用优化算法对SVM的参数
进行优化,图10为GA-SVM的诊断流程图。
Figure 10. GA-SVM model diagnostic flowchart
图10. GA-SVM模型诊断流程图
经过编码和解码后获取父代数据集,进行程序运算,用每一对
和选择的特征子集进行交叉验证,将支持向量机中的训练函数产生的最大值作为适应度函数进行训练。当程序满足终止条件或达到最大迭代次数时,将会输出最优参数组的结果。利用最优参数组的SVM分类器再对特征集进行训练,获取识别好的模型。
4. 基于D-S证据理论的数据融合诊断
D-S证据理论作为贝叶斯理论的延伸,核心优势在于通过不确定区间量化未知或信息不全导致的不确定性,无需先验概率即可高效处理诊断决策中的模糊性问题,是信息融合领域的重要手段[20]。鉴于切断阀故障诊断中,上述模型易因特征耦合、工况波动产生诊断误差,且概率赋值需兼顾客观性与全面性,而D-S证据理论恰好适配此类不确定性问题的解决需求,因此本文采用GA-SVM模型的输出结果及其对应误差构造证据基本概率赋值,以此弥补单一模型诊断的局限性,进一步提升故障诊断的准确性。
将GA-SVM的训练误差e作为基本概率赋值的一部分,计算公式如式(6)为:
(6)
在误差计算公式(6)中,
、
分别代表GA-SVM模型中对应输出的期望输出值与仿真输出值。令证据理论的识别框架
,
分别代表燃气切断阀的四种状态为“正常状态”、“阀门卡滞”、“阀门打开或关闭异常”、“阀门泄漏”;
、
、
、
分别表示了GA-SVM模型对切断阀故障类型识别的“正常状态”、“阀门卡滞”、“阀门打开或关闭异常”、“阀门泄漏”四个输出的基本概率分配。式(7)为各状态
的BPA:
(7)
式(7)中,
为GA-SVM对状态
的分类预测置信度,即GA-SVM输出层对
的归一化决策函数值,取值范围[0, 1],反映模型对“
为真实状态”的信任程度。最后再由D-S证据理论融合规则可以得到融合决策后的结果在
上的基本概率分配。式(8)为不确定集
的BPA:
(8)
通过上述步骤,GA-SVM的输出被转换为D-S证据理论的BPA输入(
、
、
、
、
),再由D-S证据理论融合规则得到
上的最终基本概率分配。
D-S证据理论融合诊断的结果能够增加融合数据的可信度,经过D-S证据理论合成后有效地解决了证据模糊和预测结果偏差的情况,提高了算法的精度以及可靠性。
5. 实验测试与分析
5.1. GA-SVM模型故障诊断
遗传算法GA拥有快速寻优的功能,因此可以利用遗传算法对SVM分类器中的参数组
进行优化。选择信号分解和KPCA降维后的切断阀故障多维特征集作为输入,利用遗传算法对SVM的参数数组进行优化,在对SVM进行优化时,设定参数最大的进化迭代数为200,种群最大数量20,交叉概率0.8,变异概率0.01,参数c的寻优范围在[0.1, 100]之间,参数g的寻优范围在[0.01, 1000]之间[21]-[27]。
进行程序运算时,用每一对
和选择的特征子集进行交叉验证,对函数产生的最大值作为适应度函数进行训练;由图11~13可以得到,相比于多特征融合后的GA-SVM诊断模型得到的调压站故障结果,单特征下GA优化的SVM预测和未经优化的SVM预测的预测结果较差。
Figure 11. SVM prediction results optimized by GA using a single feature
图11. 单特征下GA优化的SVM预测结果图
Figure 12. Unoptimized SVM prediction results using the optimal feature set
图12. 使用最优特征集的未优化的SVM预测结果图
Figure 13. Prediction results of GA-SVM with the optimal feature set
图13. 代入最优特征集的GA-SVM的预测结果
5.2. D-S证据理论优化结果
要使用D-S证据理论对初步诊断结果进行优化,首先对切断阀运行过程中产生的不同的故障类型进行编号,编号结果如表1所示。
Table 1. Fault codes and fault types
表1. 故障编号与故障类型
故障类型 |
正常状态 |
阀门开关异常 |
阀门卡滞 |
阀门泄漏 |
输出值 |
1 |
2 |
3 |
4 |
在GA-SVM诊断模型的样本数据集中选取包含四种不同故障类型的4组特征数据集,运用DS证据理论,并对其诊断结果进行基本可信度分配,如表2所示,根据判定规则,确定切断阀故障类型。
Table 2. Credibility distribution results after integrating D-S evidence theory
表2. D-S证据理论融合后的可信度分配结果
证据 |
|
|
|
|
结论 |
1 |
0.984 |
0.006 |
0.008 |
0.002 |
1 |
2 |
0.021 |
0.966 |
0.012 |
0.001 |
2 |
3 |
0.0 |
0.011 |
0.979 |
0.01 |
3 |
4 |
0.0 |
0.029 |
0.072 |
0.899 |
4 |
6. 结论
本文对基于机器学习的燃气切断阀的故障诊断方法进行了研究,提出了基于多特征融合的GA-SVM燃气切断阀故障诊断方法,并通过实际验证了该故障诊断方法的可行性。本研究的主要内容如下:
1) 分析了燃气切断阀故障诊断过程中存在的问题,针对单特征误报率高的问题,提出了多融合的特征提取方法,将压力信号与CEEMD分解的信号、流量信号进行特征融合。最后针对所构建特征参数的高维度和数据冗余问题,采用KPCA算法进行降维处理,去除冗余特征,得到最优特征集。
2) 将对切断阀的相关参数进行数据处理后得到的最优特征集,代入改进的GA-SVM故障预测模型中进行故障诊断并将本文提出的优化过的与单一特征提取诊断和未优化的诊断模型得到的诊断结果进行对比分析,结果显示,代入最优特征集后的GA-SVM方法的对切断阀各故障的诊断准确率可以达到81.5%,高于传统的单特征下的GA-SVM方法诊断得到的78.5%和未优化SVM模型诊断的52%的准确率,对不同的切断阀故障类型具有较高的诊断准确率。
3) 将优化后的算法得到的切断阀故障诊断结果结合DS证据理论,进一步进行DS证据理论的基本概率分配,成功优化了诊断结果,提高了局部诊断的准确率,对不同的切断阀故障类型都可以实现较好的诊断效果。