1. 引言
在现代工业制造与运维领域中,滚动轴承是旋转机械中最常见且最关键的部件之一,其运行状态的好坏对整个机械系统的安全性与可靠性起着决定性的作用。一旦轴承出现故障,不仅会降低系统运行效率,还可能造成重大安全事故与经济损失。因此,如何对轴承运行状态进行准确、及时的故障诊断[1]-[4],一直是工业界和学术界关注的焦点问题。
近年来,基于信号处理与智能算法相结合的轴承故障诊断方法逐渐成为主流研究方向。信号处理主要目的是从振动信号中提取出与故障类型相关的关键特征,从而提高后续诊断模型的准确度。其中,变分模态分解(Variational Mode Decomposition, VMD)作为一种新兴自适应信号分解算法,因其可将复杂振动信号分解为多个本征模态函数(Intrinsic Mode Function, IMF),而在轴承故障诊断领域得到广泛关注[5]-[8]。VMD算法能够自适应地提取信号中不同频带的特征分量,但其分解效果在很大程度上依赖于超参数(如分解模态数、平衡参数等)的选择。如果参数选择不当,VMD得到的模态分解效果将可能出现模式混叠或过分解等问题,进而影响后续故障特征的提取与分类。
针对VMD算法在参数选择方面的不足,近年来各类智能优化算法被引入以自动搜索最优或近似最优的VMD参数。为了进一步提升智能优化算法的效率和稳定性,本文引入了一种新型元启发式算法——HO河马优化算法(Hippopotamus Optimization, HO) [9]-[11]。与传统算法相比,HO优化算法在全局搜索能力和收敛速度方面具有一定优势,可有效避免局部最优陷阱,提高搜索效率。在本研究中,通过HO算法对VMD的关键参数进行自适应搜索和优化,得到更优的分解结果,以提取故障信号的有效特征,为后续分类诊断奠定良好基础。
在特征提取与故障诊断模型方面,深度学习方法近年来得到了广泛的应用[12]-[15]。传统的卷积神经网络(Convolutional Neural Network, CNN)已经在图像识别、语音识别和故障诊断等领域取得了显著成效。然而,由于旋转机械振动信号在时间维度上具有强相关性,单纯的CNN结构可能不足以捕捉到故障特征在时间序列上的全局依赖关系。为此,本研究采用时间卷积网络(Temporal Convolutional Network, TCN) [16] [17]作为分类模型。TCN通过因果卷积(causal convolution)和扩张卷积(dilated convolution)的方式捕获时序依赖,同时具备更灵活的网络结构,能够有效提取时域信息并在深度网络中保留长期依赖关系,从而显著提高对轴承故障类型的识别能力。
基于以上背景,建立了一种结合HO河马优化算法的TCN轴承故障特征诊断模型。其主要流程包括:(1) 基于HO算法对VMD分解参数进行全局寻优,得到最优分解结果;(2) 对分解后的信号模态进行故障特征提取;(3) 将提取的特征输入TCN模型进行分类诊断。通过在实际轴承故障数据集上的实验验证,所提出方法能够有效提升故障识别准确率并降低模型对参数选择的依赖度。该研究为智能故障诊断领域提供了一种更具针对性的解决方案,对于工业机组的故障预测与健康管理具有重要的指导意义。
2. 模型的相关研究机理
2.1. HO河马优化算法
如同其他元启发式算法(如粒子群优化、萤火虫算法、灰狼优化等),河马优化算法的目标是在可行解空间中搜索最优解(或近似最优解)。其基本思想通常包含以下要素:
1. 个体与种群(Solution/Individual & Population):
在
维决策空间中,每一个可行解可表示为一个
维向量
(1)
对应到HO算法,即每个“河马个体”在解空间中占据一个位置。
2. 目标函数(Objective Function):
在优化过程中,需要定义一个目标函数或适应度函数
(2)
用以评估解
的优劣程度(目标函数值越优,往往表示解越好)。
3. 种群初始化(Population Initialization):
通常以随机或其他启发式方式初始化一组候选解
,其中
为种群规模。
4. 迭代过程(Iterations):
算法通常进行多次迭代,在每次迭代中,个体会根据一定的更新策略(灵感来自“河马”在自然界中的行为模式),在可行解空间中移动或跳转,从而实现全局搜索(exploration)与局部开发(exploitation)的平衡。
5. 终止条件(Stopping Criteria):
当达到最大迭代次数、或目标函数收敛到某一阈值时,算法结束,输出全局最优或近似最优解
。
2.1.1. HO算法原理
1. “河马”个体位置表示
假设种群规模为
,第
个河马个体在
维空间中的位置向量记为
(3)
2. “领袖河马”(或最优个体)的确定
假设当前最优个体(全局最优)记为
,其适应度函数值为
。
(4)
3. 水中游动(全局搜索)
河马在水中游动时,可能会在较大范围内活动,模拟全局搜索的过程。以一个随机扰动形式来体现这种行为:
(5)
其中,
表示迭代次数,
是一个缩放因子(或学习率),
是一个维度相同的随机向量,其元素通常来源于某个概率分布(如均匀分布
或正态分布等)。若
或
取值较大,说明个体距离最优解时的搜索幅度较大,偏重全局搜索;若取值较小,则偏重局部搜索。
4. 河马“上岸捕食”(局部开发)
河马在捕食或活动时,会围绕某个局部区域进行探查,以强化对最优解附近的开发,可以用下面的方式建模:
(6)
是衡量个体是否向更优个体
靠近的权重
可以取全局最优解
或当前邻域中更优的个体;
是一个平衡探索与开发的系数;
为一个小扰动项,用于跳出局部最优陷阱。
在具体实现中,会根据迭代步数、当前个体适应度以及算法设计者对“河马”行为的抽象程度,在“水中游动”与“上岸捕食”之间进行概率性或条件性选择。例如,在算法早期更多地进行全局搜索,在算法后期更多地进行局部搜索。
2.1.2. HO算法的状态转移方程
综合以上两类行为,一种较为通用的HO状态转移方程可写成:
(7)
其中
为超参数,通常需要根据经验或网格搜索等方法进行调试;
与
分别表示从不同分布采样的随机向量,用以保障算法的随机搜索能力;
可取最优解
,或在种群中随机选择若干更优解;选择哪一种行为模式(全局/局部)常由迭代次数、随机数或自适应策略控制。
2.1.3. HO算法的流程
基于以上分析,一个典型的HO算法执行流程可概括如下:
1. 初始化
设置最大迭代次数
和种群规模
,设置
等超参数;随机生成初始种群
;计算初始适应度值
,确定最优解
。
2. 迭代
对每个河马个体
执行如下操作:
1. 根据自适应策略或随机数确定当前是全局搜索(游动)还是局部开发(捕食);
2. 使用相应的更新公式,计算得到新的位置
。
计算新一代种群
的适应度值
;更新当前最优解
。
3. 终止
当
或满足其他终止条件(如适应度收敛)时,算法结束,并输出最终的最优解
及其目标函数值
。
河马优化算法(Hippopotamus Optimization, HO)作为一类新型的群智能优化算法,核心思路与其他元启发式算法类似:通过模拟河马在自然界中的“游动、捕食”等行为,设计个体在解空间中的位置更新策略,从而协调全局搜索与局部搜索。其数学本质是利用随机扰动与启发式迭代方式,不断逼近最优解或优质解。
在实际应用中,HO算法具有如下特点:算法本身实现简单,便于与其他技术(如混沌映射、变异算子等)组合;可以与多种目标函数或约束条件结合,用于复杂或高维问题的优化;与其他同类元启发式算法相比,HO可能在某些特定问题上具有更快的收敛速度或更优的跳出局部最优能力,但其性能亦依赖于具体问题和参数设置。
2.2. VMD(变分模态分解)的基本理论
VMD的核心是在频域上对若干模态进行同时估计,每个模态都被假设为相对窄带,并通过中心频率
(k为模态索引)来约束和描述。VMD通过变分方法不断迭代优化以下目标函数,实现对各模态及对应中心频率的求解。
1. 信号表示
给定一个原始信号
,希望将其分解为
个模态
,即
(8)
2. 模态的调制与中心频率
VMD引入了将每个模态
(在频域中)向基频
调制,以突出其带通特性。对每个模态,定义了约束:
应当在其中心频率附近具有较高能量分布。
3. 变分优化问题
VMD通过最小化以下目标泛函(通常称作带惩罚项的约束优化问题)来寻找各模态函数及其中心频率:
(9)
其中
表示对时间的导数运算,
表示在频域对模态进行调制,而
表示
范数。该目标函数刻画了“每个模态在各自中心频率附近应当具有最窄的带宽”这一约束;通过增加拉格朗日乘子以及惩罚项,可保证所有模态之和近似还原原始信号。VMD的求解通常采用交替方向乘子法(ADMM),对各模态及其中心频率交替迭代更新,直到收敛为止。
2.3. TCN模型的基本理论
2.3.1. TCN模型的研究背景与动机
在处理序列数据(如时间序列、信号序列、语言文本等)时,传统的循环神经网络(RNN)、长短时记忆网络(LSTM)、门控循环单元(GRU)等往往通过“序列依赖”在时间步之间进行递归更新。这类方法虽然具有一定的理论完备性,但在实践中常面临以下问题:第一,训练不稳定造成长序列下的梯度弥散或梯度爆炸问题。第二,并行化困难,只能单步地在时间轴上进行前向、反向传播,导致计算效率较低。
为此,研究者们提出了时序卷积网络(TCN, Temporal Convolutional Network),见图1,试图在保持“因果性”(预测当前时刻不使用未来信息)的基础上,用一维卷积结构来高效建模时间序列,从而获得更稳定的训练过程与更高的并行化能力。
Figure 1. Basic architecture of TCN network
图1. TCN网络基本架构
2.3.2. TCN的核心:因果卷积 + 扩张卷积
1. 序列数据的基本表示
设给定一定长度为
的序列数据
(10)
其中
(可以是标量或多维向量)表示在时刻
的输入特征。TCN的目标是学习某种映射。
(11)
将输入序列映射到输出序列,输出通常记为
(12)
其中
。为确保“因果性”(causality),要求
(13)
即第
时刻的输出只能依赖当前及过去的信息,不能“看到”未来的
。
2. 因果卷积(Causal Convolution)
在一维卷积神经网络(Conv1D)中,第
步输出的计算通常可以写作
(14)
其中
为卷积核大小(kernel size),
为第
个时间偏移对应的卷积权重,
为偏置。然后再经非线性激活函数
得到:
(15)
若要满足因果性,则在计算
时,只能使用时间索引
的输入,即上式中的
必须保证
。这就要求对输入在边界处做适当填充(padding),并确保卷积核不访问未来信息(即没有像“中心对称卷积”那样取
为负值)。
3. 扩张卷积(Dilated Convolution)
仅使用因果卷积,仍可能需要较深的网络层数或较大的卷积核才能捕捉远距离的上下文依赖。为扩大感受野(receptive field),TCN引入扩张卷积(Dilated Convolution)。其计算形式可表示为:
(16)
其中
为扩张因子(dilation factor)。当
时,卷积在时间轴上会“跳跃”取样,进而使得同等深度下的网络感受野呈指数级增长。具体地,若有
层网络,每层卷积核大小为
,并令第
层的扩张因子为
,则第
层的感受野约为
(17)
多层叠加后,总感受野可写作
(18)
在典型设计中,
会在不同层按幂级递增(如
),使得深层卷积能够有效捕捉长距离依赖。
3. 实验设计及模型结果分析
3.1. 实验数据的预处理
针对结合HO河马优化算法的TCN轴承故障特征诊断模型,实验数据采用了来自凯斯西储大学官方轴承故障数据,取用10种不同的故障类型见表1。
Table 1. Fault categories
表1. 故障类别
类别 |
故障情况 |
类别1 |
正常状态 |
类别2 |
直径0.007英寸,转速为1797 RPM,内圈故障 |
类别3 |
直径0.007英寸,转速为1797 RPM,滚动体故障 |
类别4 |
直径0.007英寸,转速为1797 RPM,外圈故障 |
类别5 |
直径0.014英寸,转速为1797 RPM,内圈体故障 |
类别6 |
直径0.014英寸,转速为1797 RPM,滚动体故障 |
类别7 |
直径0.014英寸,转速为1797 RPM,外圈故障 |
类别8 |
直径0.021英寸,转速为1797 RPM,内圈故障 |
类别9 |
直径0.021英寸,转速为1797 RPM,滚动体故障 |
类别10 |
直径0.021英寸,转速为1797 RPM,外圈故障 |
实验数据整体采用1797转速下采样频率为12 K的原始轴承加速度信号,设置滑动窗口为1000,每个数据的故障样本点数s为2048,每个故障类型的样本量m为10。
3.2. 模态分解参数优化及特征提取
VMD参数的选择决定了最终分解信号所提取出故障特征的正确率,为了选取最佳的参数组合即选择分解模态个数
与惩罚因子
,需要结合HO优化算法在选择最佳的适应度函数条件下对VMD参数进行优化。通常有五种适应度函数来供选择,在这里选择最小包络熵作为适应度函数,通过设置优化变量数目
,这是因为在VMD中需要确定的参数就是
与
,设置HO优化参数中的最大迭代数目
,种群规模
,进过优化算法的迭代得出了在不同故障条件下对应的最佳VMD分解参数以及最佳的IMF分量,见表2。
Table 2. Results of HO parameter optimization
表2. HO参数优化结果
故障类型 |
K |
a |
最佳IMF分量 |
类别1 |
9 |
2049 |
IMF 4 |
类别2 |
3 |
543 |
IMF 2 |
类别3 |
10 |
2287 |
IMF 3 |
类别4 |
8 |
400 |
IMF 1 |
类别5 |
4 |
1423 |
IMF 3 |
类别6 |
10 |
897 |
IMF 6 |
类别7 |
10 |
2500 |
IMF 3 |
类别8 |
7 |
465 |
IMF 1 |
类别9 |
6 |
100 |
IMF 2 |
类别10 |
5 |
301 |
IMF 1 |
通过HO优化VMD参数,得到了具体含有大部分故障信息的IMF分量信号,为了在这些IMF分量信号中提取出对应的故障特征信息,以及作为后续TCN网络的输入特征参数,在故障诊断模型中建立了9种故障特征指标[18]分别是:故障信号均值、故障信号方差、故障信号峰值、故障信号峭度、故障信号有效值、故障信号峰值因子、故障信号脉冲因子、故障信号形状因子、故障信号裕度因子。通过故障特征指标的计算,得到故障特征指标数据集,由于故障特征指标的数量为9,因此在后端的故障诊断模型网络中的计算特征数据为9。
3.3. TCN网络的构建与故障诊断网络性能
Figure 2. TCN network architecture
图2. TCN网络架构
TCN网络设置了9特征变量输入,10特征变量输出,其分别对应9种故障特征指标及10种故障类别,卷积核个数为16,卷积核大小为3,残差块数目为2,建立如图2所示的TCN网络架构。
TCN网络架构完成后在训练设置中设置优化器为Adam优化器,初始学习率为0.005,学习率下降因子为0.8,训练次数50,设置训练集为样本集的70%,测试集为30%。
在经过TCN网络的训练后得到在训练过程中的目标学习率与损失函数,可以发现的是图3中的目标学习率在学习轮次较高时已经可以达到90%以上,且损失函数的值也在逐步的降低(见图4),说明TCN网络训练的效果十分显著。
Figure 3. TCN network training target learning rate
图3. TCN网络训练目标学习率
Figure 4. TCN network training loss function
图4. TCN网络训练损失函数
最终的训练结果显示,该故障诊断模型的训练集正确率为93.93% (图5),测试集诊断正确率为90% (图6),说明该模型针对轴承故障的正确率非常显著,且观察训练集与测试集的混淆矩阵(见图7,图8)后可以发现,在针对第三类和第六类故障特征非常的不敏感,错误率较高,第一类,第九类故障识别敏感度较低,在训练网络中的正确率相较于其他特征指标显著的低,其余故障特征类别对于在TCN网络下的轴承故障诊断有效性非常的显著。
Figure 5. Diagnosis results of training set
图5. 训练集诊断结果
可以发现TCN诊断模型在训练集中针对第一类,第三类,第六类,第九类故障识别出现了一定的误差,但整体识别效果非常显著。
Figure 6. Test set diagnostic results
图6. 测试集诊断结果
与训练集预测结果基本保持一致,但在第三类与第六类故障的识别上出现了好转,但在第七类故障的识别中准确率出现了降低。该种现象可能是由于训练集中第七类故障特征不明显,无法准确地识别第七类故障导致的。
Figure 7. Confusion matrix of training set
图7. 训练集混淆矩阵
Figure 8. Test set confusion matrix
图8. 测试集混淆矩阵
从模型整体的诊断率可以发现,针对所有的故障特征类别识别率基本都高于80%,只有个别特征识别率在80%以下,因此在经过了HO优化算法下的VMD分解所得出的故障特征指标,在TCN网络下对轴承故障的识别率达到了非常显著的效果
4. 研究结论
本文提出了利用HO (Hippopotamus Optimization)算法对VMD (Variational Mode Decomposition)的关键参数进行自适应优化的方法,并通过选取最佳IMF (Intrinsic Mode Function)来提取轴承故障特征,最终建立了基于TCN (Temporal Convolutional Network)的故障诊断网络。实验结果表明,采用HO算法可有效克服传统VMD在参数选择方面的局限性,获得更准确的信号分解;通过提取最优IMF中蕴含的故障信息,能够显著提升特征指标的区分度;而TCN网络在捕捉时序依赖关系和特征学习方面展现出优异的表现,使故障诊断的准确率和稳定性得到进一步提高,针对轴承故障诊断问题正确率基本在80%以上,尤其针对内圈故障与外圈故障具有非常好的诊断效果能够具有90%以上的诊断正确率,针对滚动体的诊断正确率也处在一个显著高的区间。总体而言,本研究为滚动轴承故障诊断提供了高效且稳健的技术手段,为后续在更复杂或实时监测场景下的故障预测和健康管理奠定了基础。后续研究可在多传感器融合、深度网络结构改进以及在线实时诊断等方面作进一步探索与提升。
NOTES
*通讯作者。