1. 引言
液压系统在现代工业中扮演着至关重要的角色,广泛应用于各种工程和机械设备中[1]。其中,多路阀是液压系统中的关键控制元件之一,但由于长时间的运行和恶劣的工作环境,多路阀存在着各种潜在的故障风险,如阀芯卡死、阀芯磨损等。这些故障如果不及时诊断和修复,可能会导致生产中断、设备损坏甚至安全事故。在机械系统的故障诊断领域,有两种主要的方法:基于经验的方法和基于数据驱动的方法。基于经验的方法依赖于领域内专家的知识、经验,以及先前的故障案例[2]。这种方法通常使用知识库或专家系统来建立故障模式和规则。这种改进的专家系统虽然可以提供有用的线索,但它可能受到专家知识的限制,无法涵盖所有可能的情况。与此相反,基于数据驱动的方法通过数据分析和机器学习技术,能够自动发现与故障相关的模式和异常信号,这种方法恰巧弥补了基于经验的方法的不足[3]。
机器学习技术包括人工神经网络、支持向量机、决策树、贝叶斯网络等算法。它能够从数据中学习模式和规律,用于预测未来趋势、发现隐藏在数据中的知识。不过,值得指出的是,上述用于不同液压机构故障诊断的方法普遍要求在运用算法之前对特征进行预处理,以便获得更为显著的故障诊断准确性。这个方法虽然克服了仅依赖于有限经验的问题,但是,这并非总是最理想的,因为其实施通常涉及到对特征的降维操作或者人工地去除冗余信息,这个过程耗时较长且资源密集[4]。
为了克服这一缺陷,Alasmer Ibrahim等人提出了一种基于VGG-19卷积神经网络(CNN)的迁移学习模型,对异步电机单故障和多故障提供了一种新的技术[5]。Qing等人找到通过采用由自编码器组成的深度神经网络(DNN)对多通道信号自动进行深度特征提取,利用局域保持投影对多通道感知信号提取的特征进行融合的方法进行故障诊断[6]。然而,不论是对于单一信号还是多种信号的故障诊断,使用CNN、DNN等深度学习方法进行故障诊断都需要庞大的数据量,但是在实际工业环境中,获得足够的数据可能具有挑战性。在小样本的背景下,积极的去除冗余特征信息,引入了决策树算法。其在医学、生物学、电力系统设备维护中有相关应用,而在故障诊断中应用也较为广泛,Wan等人使用改进的随机森林算法对滚动轴承进行故障诊断[7],为了对旋转机械进行故障诊断,Yuan等人通过梯度提升决策树进行决策[8],Nagesh Tambake等人使用J48决策树算法对刀具故障进行诊断[9]。
因此,本文提出了一种结合小波包分解和C4.5决策树算法的故障诊断方法,应用于多路阀阀芯卡死领域。本方法包括三部分,即信号采集与预处理、特征提取以及诊断模型构建。在信号采集与预处理中,通过PLC采集压力和流量数据,使用加速度传感器采集加速度数据。在特征提取中,首先,采用小波包分解技术对信号处理,计算其小波包能量并以此作为特征数据集。在故障诊断模型的构建中,将上述故障特征数据集的百分之八十作为训练集,进行模型训练,百分之二十为测试集,在生成训练模型后,将测试的特征数据输入到WPD-C4.5-DT分类模型中,进行故障诊断。实验结果表明,此方法在多路阀故障诊断方面取得了出色的表现,其故障诊断正确率高于本文所提的其他方法。
本文的其余部分组织如下。在第二章中,详细介绍了实验设置和主要步骤。第三章中,介绍了本文所提方法。第四章对关键影响因素进行了分析,并对实验结果进行了讨论。第五章中得出了结论。
2. 实验
为了模拟不同工况下的多路阀故障类型,设计了相关实验,试验平台如图1所示。多路阀的工作原理是根据负载的变化来调整阀门的开度。当负载增加时,阀门打开的程度增加,从而增加流体的流量和压力,以满足不同工况下的需求。实验中对多路阀工况进行简化,只改变阀芯位移,其他参数在实验时保持不变。初始化实验参数设置如表1所示。
本实验阀芯正常运动为:阀芯以正弦信号在[−7 mm, +7 mm]中运动;而模拟不同阀芯卡死位置的实验为:阀芯先以正弦信号在[−7 mm, +7 mm]中运动,当运动一段时间后,在位移行程为任意整数时,控制阀芯不动来模拟不同卡死位置故障。由于阀存在不敏感区域,即当阀芯位移在[−2 mm, +2 mm]这个区间内,系统不允许流体流动,导致各参数不变。因此,为了排除阀芯位移带来的影响,在工况设定时,[−2 mm, +2 mm]中的位移选择初始位置(阀芯位于0 mm处)进行实验即可,即阀芯位于−2 mm,−1 mm,0 mm,1 mm,2 mm处时数据不会发生太大变化,因此,只需要从这五个位移中选择一个进行实验即可(本文以0 mm处进行实验),其他整数位移位置均进行实验,即共获取阀芯位移为−7 mm,−6 mm,−5 mm,−4 mm,−3 mm,0 mm,3 mm,4 mm,5 mm,6 mm,7 mm以及正常阀芯状态下的数据。因此,本实验共有12组实验,包括1组阀芯正常运动的实验以及11组模拟卡死位置的实验。
Table 1. Parameters of related experiments
表1. 相关实验参数表
实验参数 |
数值 |
实验参数 |
数值 |
负载压力 |
0 MPa |
电机转速 |
1200 r/min |
阀芯换向频率 |
0.01 Hz |
位移区间 |
−7 mm, +7 mm |
流量和压力采样频率 |
100 Hz |
振动采样频率 |
4000 Hz |
手柄活动范围 |
±19.5˚ |
位移信号 |
正弦信号 |
本实验中加速度信号由软件DAQami通过加速度传感器进行采集,加速度传感器主要测多路阀工作联进油口(A口)与出油口(B口)旁的信号;而压力以及流量信号则是LabVIEW通过多路阀系统内部的压力和流量传感器进行采集,压力传感器分别布置在泵出口(P口)、A口以及B口,流量传感器布置于液压泵和多路阀相连的主油路处。表2描述了不同传感器的相关信息。
Table 2. Information about the different sensors
表2. 不同传感器的相关信息
类型 |
代号 |
所测位置 |
型号 |
个数 |
加速度传感器 |
A1, A2 |
A口、B口 |
CT1010LC |
2 |
压力传感器 |
P1, P2, P3 |
P口、A口、B口 |
AAS-G2-126-AD |
3 |
流量传感器 |
F1 |
主油路 |
CT150-MA-B-B-6 |
1 |
Figure 1. Multi-way valve fault diagnosis experimental platform
图1. 多路阀故障诊断实验平台
3. 方法模型
基于小波包分解和C4.5决策树的多路阀故障诊断方法流程如图2所示。
3.1. 数据采集
本文中信号的采集是由两套系统完成的,需要对这些数据进行统一时间的处理。为了避免样本不同信号之间数据长度差距过大,保证数据采集的要求,选择20 s为样本长度,即每个样本压力流量信号的数据点为2000个,加速度信号的数据点为80,000个。图3显示了阀芯卡死在+6 mm位置时,各个传感器采集到的数据。
在实验时,通过PLC采集压力和流量数据,使用加速度传感器采集加速度数据,由于三种信号的采
Figure 2. Flow chart of the diagnosis method of multi-way valve spool jamming
图2. 多路阀阀芯卡死诊断方法流程图
质和特点。在小波包族中,
是时间,
为小波包层数,
表示尺度参数,它决定了小波包基函数的频率分辨率,
表示平移参数,决定了基函数在时间上的平移,
是第
层的子信号。一般小波包族是函数:
(1)
为了清楚可见,把小波家族:
(2)
与“频率区间”
视为等同,则下述结论描述了标准正交基的小波包的某些集合。设
是点对
的一个集合,使相应的频率区间
构成
的一个划分,并且它至多是可数的,则子序列:
(3)
是一个标准正交基。因此,为了得到一个标准正交的小波包基,实际上就是选取频率轴
的一个划分。
3.2. 小波包分解
小波包分解是一种多尺度分析方法,在小波包分解过程中,信号被反复分解为低频子信号和高频子信号。每一次分解都会将信号分成两个子信号,一个是低频子信号,另一个是高频子信号。低频子信号包含了信号的整体趋势信息,而高频子信号则包含了信号的细节信息。通过不断进行分解,可以得到一系列的子信号,它们分别对应不同的尺度和频率范围,这就实现了对信号的多尺度分析。
双尺度方程是多尺度分析的重要组成部分,它包括尺度函数和小波函数。根据正交小波的多分辨分析可知,如果空间
上的一列闭子空间
和一个函数
构成空间
上的正交多分辨分析,记为
,那么,对于函数
,存在位移的序列
,称为低通滤波器,使得
(4)
这就是尺度函数,尺度函数通常被用来进行信号的平滑和伸缩操作,用于提取信号的低频信息。这时,取
,称为高通滤波器,则函数
(5)
是一个小波函数,小波函数用于捕捉信号的高频信息和局部特征。
3.3. 能量特征提取
小波包能量特征提取包括获取各频带小波包分量,计算各频带小波包能量两部分。原始多路阀加速度信号经过以分析频率
的
层小波包分解后,频域将被分成
段,各小波包分量对应的频段分别为:
(6)
各个频带信号的小波包能量
是此频带小波包分量
的平方和,
层各频带信号的能量为:
(7)
层所有
组成的能量谱为:
(8)
第
层的能量谱构成了原始多路阀信号的特征向量。
多路阀发生阀芯卡死时,表现为某频带的能量值与其他频带的能量值相差很大,并且不同位置阀芯卡死的故障发生时,频带能量值的分布也不同。因此,不同位置阀芯卡死的小波包能量对于不同故障具有较好的区分性。以原始多路阀加速度信号经过分析频率
的3层小波包分解为例,频域将被分成8段,小波包分解过程如图3所示[10]。给出了三层小波包分解树和每一层各节点对应的频率子带,其中
为原始信号,
为小波包分解树节点
对应的重构信号。原始信号在第
级被分解为
个频率子带,每个频率子带的带宽为
,这表明小波包分解树节点
对应的频率子带范围为
到
。
Figure 3. Schematic diagram of three-layer wavelet packet decomposition
图3. 三层小波包分解示意图
3.4. C4.5决策树模型
决策树最小化损失函数是指在构建决策树模型时,选择划分特征和划分点以最小化一个损失函数。每组采集到的数据经过小波包分解后得到8个小波包能量,一共提取2640组特征数据。将这些特征数据的一部分作为训练集
,其中
表示输入特征实例,即特征向量,
为特征个数,
为类别标记(阀芯卡死位置),
为样本容量。决策树的学习目标就是构造一个决策树模型,能够对输入的多路阀特征数据进行最大可能正确的分类。假设树
的叶子节点分数为
,
为树
的叶子节点,每个叶子节点有
个样本,假设
类的样本有
个,其中
,
为叶子节点上的经验熵,
为正则化参数,那么决策树学习的损失函数可表示为:
(9)
决策树学习的目标就是最小化损失函数,在分类和回归问题中,不同的决策树模型通常使用不同的损失函数来衡量模型的性能。而对于C4.5决策树而言,损失函数通常是信息增益率。
4. 结果与讨论
4.1. 小波参数
小波包分解通过不同的小波基函数,以多尺度、多时域的方式对信号进行分解,从而提供更全面的信号分析方法。这使得它在信号处理、故障诊断等领域中具有广泛的应用,常见的小波基函数如表3所示。
Table 3. Types of wavelet basis function
表3. 小波基函数类型
小波基函数类型 |
特点 |
Haar小波 |
具有分段常数的特点 |
Daubechies小波 |
不同阶数有不同的性质 |
RBIO小波 |
由有理函数构成 |
Bior小波 |
用于分析不同信号的尺度成分 |
Symlet小波 |
适用于分析非平稳信号 |
在小波包分解中,信号被分解成不同频率和时间分辨率的子带,这些子带可以更详细的描述信号的局部特性。小波包分解的层数是一个重要参数,它决定了信号的深度和分辨率。随着层数的增加,小波包分解可以提供更高的时间和频率分辨率,较低层级的子带通常对应较低频率的信号分量,较高层级的
(a) (b)
(c) (d)
(e)
Figure 4. The correctness of different wavelet functions: (a) Haar wavelets, (b) Daubechies wavelets, (c) Reverse Biorthogonal wavelets, (d) Biorthogonal wavelets, (e) Symlets wavelets
图4. 不同小波函数的正确率:(a) Haar小波,(b) Daubechies小波,(c) Reverse Biorthogonal小波,(d) Biorthogonal小波,(e) Symlets小波
子带对应较高频率的信号分量。因此,选择适当的层数通常是小波包分解中的一个关键问题。过低的层数可能无法捕捉信号的细节,而过高的层数可能导致噪音的过度放大,通常需要根据应用的特定需求和信号的性质来确定适当的层数。
以多路阀加速度信号为例,使用C4.5决策树分类器对不同小波基函数以及小波包分解层数进行讨论。首先,提取不同卡死位置的小波系数,使用不同的小波基函数进行小波包能量特征提取;其次,分别将提取的能量特征作为决策树的输入进行故障诊断,得到对应的正确率如图4所示。
不同小波基函数和小波包分解层数的分析如下:① 对于不同的小波基函数,当分解层数为1时,算法的正确率普遍较低。这是因为小波包分解的层数决定了信号的细节级别,当分解层数较低时,会导致多路阀加速度信号的信息丢失,无法捕捉信号的多样性,因此不同基函数在分解层数为1时表现不佳。② 当分解层数达到3~4层时,所有基函数在算法正确率方面表现较好。这是因为在这个分解层数范围内,信号分解得较为完全,从中提取了足够的信息,有利于准确的信号分析和特征提取。③ 然而,当分解层数增加到n = 5时,基函数的正确率普遍会下降。这是因为在这个分解层数下,加速度信号被过度分解,导致信号中存在冗余信息,从而降低了算法的性能。
实验结果表明,当选择Daubechies小波基函数时,正确率普遍高于其他小波基函数。这可能是因为Daubechies小波更适合捕捉与阀芯卡死相关的信号特征,例如频率成分和幅度。此外,它在多尺度分解中具有较好的信噪比特性,有助于增强对信号中的有用信息的提取,并减少噪声的千扰。
综上所述,根据实验结果,选择Daubechies小波基函数并将分解层数设置为3层可能是一个较好的选择,因为它在多路阀阀芯卡死故障检测中表现出了最高的正确率,并且趋于稳定。小波包分解出8个能量子带,其能量分别为E1~E8,正常工作及不同卡死位置的加速度信号的能量如图5所示。
Figure 5. Diagram of the energy distribution of the normal and different stuck areas of the spool
图5. 阀芯正常和不同卡死区域的能量分布图
小波包分解的E1差异可能是由于阀芯正常和阀芯卡死时的加速度信号在频域上有显著差异所致。小波包分解是一种将信号分解成不同频率分量的方法,正常的加速度信号可能由于机械部件的正常运行而产生,通常包含主要的低频分量,这些分量导致E1较高。而当阀芯卡死时,由于摩擦、冲击或其他异常情况,加速度信号的频谱特性可能会发生变化,导致E1较低。同时,正常情况下的加速度信号幅度可能相对较大,因此能量也较高。但当阀芯卡死时,由于机械部件受阻或受损,从而导致E1较低,而其他能量会显著增加。
而当发生阀芯卡死故障时,卡死的位置不同,阀芯周围的压力,摩擦以及加速度等信号的特性可能会有所不同,同时,不同位置的阀芯卡可能会导致信号频谱发生变化,这将导致小波包分析中不同子带的信号能量分布不同,这种差异可以用来检测阀芯卡死的情况,因为它可能会导致加速度信号的频谱发生变化。通过监测能量的变化,可以识别异常情况并采取适当的措施进行维修或维护。
4.2. 不同算法的比较
根据调研发现,支持向量机(SVM)以及梯度提升机(GBM)等算法同样适用于多路阀阀芯卡死故障诊断中。支持向量机(SVM)是一种用于分类和回归的强大算法,尤其适合高维空间中的复杂问题。SVM通过找到一个最优的超平面,将不同类别的数据进行分隔,并使用核函数来处理线性不可分的数据,具有良好的泛化能力,常用于图像识别、文本分类等任务。梯度提升机(GBM)是一种集成学习方法,通过多个弱学习器(通常是决策树)的逐步加权组合,构建出一个强大的预测模型。GBM通过每次迭代来修正前一轮的误差,从而实现更高的准确率,特别适用于处理大规模数据和复杂的非线性关系。常用于排名、回归、分类等任务。
图6为所提方法和上述两种算法在不同加速度传感器的混淆矩阵图。可以看出,WPD-C4.5-DT和WPD-GBM方法在对阀芯卡死位置的诊断准确率方面远高于WPD-SVM方法。在不同的加速度传感器数据的诊断下,相对于WPD-GBM方法而言,WPD-C4.5-DT方法能够更加有效的诊断阀芯卡死位置。
对于两个加速度传感器采集的数据,将本文提出的方法与其它两种不同的方法进行对比。三种算法的阀芯卡死预测准确率如表4所示。
可以看出,本文所述方法对两个加速度传感器数据的准确率,均高于其他两种方法,其平均准确率高达97.50%。结果表明,该方法在多路阀阀芯卡死位置的诊断方面具有较高的诊断精度。
(a) WPD-C4.5-DT-A1 (b) WPD-C4.5-DT-A2
(c) WPD-GBM-A1 (d) WPD-GBM-A2
(e) WPD-SVM-A1 (f) WPD-SVM-A2
Figure 6. Confusion matrix plot of different sensor signals by different algorithms
图6. 不同算法对不同传感器信号的混淆矩阵图
Table 4. The prediction accuracy of spool jamming of different algorithms
表4. 不同算法的阀芯卡死预测准确率
算法模型 |
加速度传感器1 |
加速度传感器2 |
平均准确率 |
WPD-C4.5-DT |
99.09% |
95.91% |
97.50% |
WPD-GBM |
95.91% |
94.09% |
95.00% |
WPD-SVM |
75.00% |
76.82% |
75.91% |
5. 结论
由于多路阀系统本身复杂且工作在大型工程环境中,获取大样本的故障数据是非常困难的,同时,多路阀阀芯在出现卡死故障时能量容易积聚在高频范围。为此,提出了一种将小波包分解(WPD)与C4.5-DT算法相结合的多路阀故障诊断方法,其思想是基于小样本数据和故障特征来实现阀芯卡死的故障诊断。
实现阀芯卡死故障的诊断是该方法的关键。为了实现这一目标,本文做了两方面的工作:1) 确定最优小波包分解参数,降低计算成本,提高诊断精度;2) 构建诊断模型和模型优化,不需要特征降维,自动选择特征,提高诊断速度。
在多路阀阀芯卡死实验中,以两个加速度信号作为输入,该方法对不同阀芯卡死位置的诊断正确率分别为99.09%和95.91%,平均准确率高达97.50%。与传统C4.5-DT相比,WPD-C4.5-DT方法通过小波包分解提取阀芯卡死信号的能量特征向量作为系统的样本,提高了决策树算法的泛化能力以及计算效率,为阀芯卡死的故障诊断提供了一定的思路。
结果表明,在实际的多路阀阀芯卡死故障诊断中,使用上述方法能够有效诊断多路阀阀芯卡死故障。小波包分解能够有效提取阀芯卡死故障信号中的高频能量特征,特别是故障特征主要集中在高频范围内时。通过优化小波包分解参数,成功降低了计算成本,确保了故障特征的完整提取,C4.5决策树算法不需要进行特征降维,能够自动选择最优特征,提高了诊断速度和准确率,该方法不仅降低了对大样本数据的依赖,而且能够在复杂的工程环境下实现高效、准确的多路阀故障诊断,为多路阀系统的健康监测和维护提供了新的技术路径。