1. 引言
在工业领域中,滚动轴承作为机械装置中不可或缺的组成部分,承担着重要职责。作为常见零件之一,它的稳定性直接关系到设备的安全性,尤其在高负荷工况下,滚动轴承很容易出现各种故障,从而危及生产安全。因此,滚动轴承故障的准确诊断至关重要,是评估其制造质量的关键标志,研究滚动轴承故障诊断技术对于确保设备运行的可靠性和安全性具有重要意义[1]。
目前,Dong等[2]提出时移多尺度加权排列熵方法,并结合GWO-SVM模型实现滚动轴承故障的分类。李兵等[3]提出了改进随机森林方法中的决策树方法及集成投票方法,能够对轴承故障状态进行有效识别。张又才[4]等提出基于CEEMDAN的滚动轴承故障诊断方法,对融合后的信号做包络分析处理求其包络谱,提取故障特征,从而实现滚动轴承的分类。在机械故障诊断领域,诸如神经网络、机器学习算法和支持向量机等技术已广泛应用且取得成功,然而,这些模型也面临挑战,尤其在处理未见过的训练集样本时表现欠佳,缺乏良好的泛化性能,在进行人工特征提取时,通常需要依赖领域专家的经验[5]。随着深度学习技术的快速发展,将其应用于轴承故障诊断成为一种前沿且有效的方法。深度学习的优势在于其能够从大量数据中学习特征表示,进而提高诊断精度和效率。Cui等[6]通过CNN和频域振动数据对齿轮箱故障进行诊断。袁建虎等[7]基于CNN和连续小波变换进行故障诊断,通过连续小波变换获得滚动轴承的时频矩阵转换为灰度图,并结合CNN进行自适应特征提取和故障分类。王奉涛等[8]提出了一种基于信号灰度变换和卷积神经网络诊断模型,实现了航空发动机中介轴承的健康状态识别。
但是滚动轴承在工作中面临着高速运行、工况变化大等挑战,其振动信号具有复杂的形态成分,为了增强捕捉轴承故障信号的特征信息的能力,本文提出的基于结合注意力机制和卷积神经网络的模型的方法,首先,利用图像编码形式将不同的一维振动信号转换成差异明显的二维图像,然后,融入自注意力机制重点关注对故障诊断具有重要意义的特征,从而增强模型的特征提取能力,最后,使用西储大学的轴承数据进行验证,试验结果表明本文所提出的故障诊断模型能够针对不同种负载条件下的不同故障位置进行有效识别。
2. 滚动轴承结构与诊断方法
2.1. 滚动轴承结构
滚动轴承作为机械传动系统中的关键部件,广泛应用于各种机械设备中,滚动轴承由内圈、外圈、滚动体和保持架(某些类型除外)四部分组成,其中内圈安装在旋转轴上、外圈安装在支承结构上,滚动体在滚道中传递载荷并实现运动,而保持架则用于维持滚动体间距,共同协作以减小摩擦、承载载荷,实现机械系统的平稳运动[9],滚动轴承结构图如图1所示。
Figure 1. Diagram of rolling bearing structure
图1. 滚动轴承结构图
2.2. 滚动轴承故障诊断方法
为了有效对滚动轴承故障进行诊断,本文所提方法结合GAF图像编码技术和融合注意力的卷积神经网络强大特征提取优势,从而实现不同种负载条件下的不同故障位置进行有效识别,滚动轴承故障诊断方法流程如图2所示。
Figure 2. Diagram of rolling bearing fault diagnosis method flow
图2. 滚动轴承故障诊断方法流程图
滚动轴承故障诊断方法流程主要分为2个部分:GAF图像编码,建立GAF-CNN-SA故障诊断模型。首先,根据故障模拟实验台获取滚动轴承的振动信号数据,将采集到的振动信号进行随机分割,并对其进行归一化处理,通过GAF编码技术将分割的振动信号转换为二维特征图像,并按照4:1的比例划分训练数据集、测试数据集,将训练集输入到模型中进行训练,保存最佳模型参数,最后将测试数据集输入最佳模型中输出最终的诊断结果,实现滚动轴承的不同种负载条件下的不同故障位置进行有效识别。
3. 基于融合注意力的卷积神经网络滚动轴承故障诊断模型
3.1. 格拉姆角场
格拉姆角场GAF (Grami Angular Field)将直角坐标系下的时间序列数据转换为极坐标系下的二维格拉姆矩阵,保留数据的绝对时间相关性,利用正弦和余弦函数生成格拉姆角差场矩阵GADF (Gram Angular Difference Field)和格拉姆角和场矩阵GASF (Gram Angular Summation Field),建立多种采样点之间的关系表征方法[10]。这种图像化的表示形式能更直观地展示信号的特征,使异常模式和故障特征更易于发现,GAF图像编码流程如图3所示。
Figure 3. Diagram of GAF image coding process
图3. GAF图像编码流程图
3.2. 卷积神经网络
卷积神经网络(CNN)在轴承故障诊断方面发挥着重要作用,CNN的核心是卷积层(Convolutional Layer),这些层利用卷积操作从输入数据中提取特征,除了卷积层,CNN通常还包括池化层(Pooling Layer)和全连接层(Fully Connected Layer),池化层用于下采样特征图,减少数据维度,同时保留重要信息,全连接层则用于将提取的特征映射到输出类别。通过训练大量的轴承振动图像数据集,CNN可以利用图像中的空间信息和结构特征,从而更全面地分析振动信号,这种基于图像的轴承故障诊断方法能够提高诊断的准确性和效率,CNN故障诊断结构图如图4所示。
Figure 4. Diagram of CNN fault diagnosis structure
图4. CNN故障诊断结构图
3.3. 自注意力机制
自注意力机制(Self-Attention Mechanism)是一种在深度学习领域中常用的技术,特别适用于自然语言处理和计算机视觉任务中[11],在轴承故障诊断中,自注意力机制也可以发挥关键作用。在轴承振动信号的处理中,自注意力机制通过查询Q (Query)、键K (Key)和值V (Value)联系全局来突出故障特征信息和捕捉信号中的长程依赖关系,通过自注意力机制,系统可以自动学习信号中不同部分之间的关联性,重点关注对故障诊断具有重要意义的特征,从而更有效地诊断轴承的健康状况,自注意力机制结构如图5所示。
Figure 5. Diagram of self-attention mechanism structure
图5. 自注意力机制结构图
3.4. GAF-CNN-SA模型构建
本文基于卷积神经网络进行改进,引入自注意力机制,改进后的网络由5层卷积池化模块Block1~Block15、两个全连接层FC (Fully Connected)和自注意力机制SA组成,其中Block模块分别包含一层卷积层和一层池化层,具体模型结构如图6所示。
Figure 6. Diagram of concrete model structure
图6. 具体模型结构图
本文的网络模型包括五层卷积池化层,其中卷积核大小为3 × 3,激活函数为ReLU;池化层的池化核大小为2 × 2;全连接层1具有64个神经元,使用ReLU激活函数;SA (Self-Attention)层中的神经元个数为64。全连接层2具有4个神经元,采用SoftMax激活函数。优化方法选择了主流的Adam优化算法,并设定了初始学习率为0.001,使模型在训练过程中能够动态地调整学习率,以更有效地优化模型参数。损失函数选用分类交叉熵(categorical cross entropy),适用于多类别分类问题。在训练和验证过程中,模型评估的指标为准确率(accuracy),具体模型架构参数如表1所示。
Table 1. Specific parameters of network model
表1. 网络模型具体参数
网络层 |
输出特征参数 |
核尺寸 |
步长 |
权重参数个数 |
卷积层1 |
|
|
1 |
320 |
池化层1 |
|
|
2 |
0 |
卷积层2 |
|
|
1 |
18,496 |
池化层2 |
|
|
2 |
0 |
卷积层3 |
|
|
1 |
73,856 |
池化层3 |
|
|
2 |
0 |
卷积层4 |
|
|
1 |
73,792 |
池化层4 |
|
|
2 |
0 |
卷积层5 |
|
|
1 |
18,464 |
池化层5 |
|
|
2 |
0 |
全连接层1 |
64 |
|
|
8256 |
SA层 |
64 |
|
|
4224 |
全连接层2 |
4 |
|
|
260 |
4. 实验设置与结果分析
4.1. 数据集描述
在故障试验中采用凯斯西储大学(CWRU)轴承数据集作为实验数据,选用故障直径为0.1778 mm在电动机2种负载条件下的不同故障位置等多组振动数据,每种样本类型各有240个训练集和60个测试集,具体的数据集划分详情如表2所示。
Table 2. Bearing dataset
表2. 轴承数据集
电机负载 |
样本类型 |
标签 |
训练集 |
测试集 |
0 HP |
健康 |
0 |
240 |
60 |
内圈故障 |
1 |
240 |
60 |
滚动体故障 |
2 |
240 |
60 |
外圈故障 |
3 |
240 |
60 |
1 HP |
健康 |
0 |
240 |
60 |
内圈故障 |
1 |
240 |
60 |
滚动体故障 |
2 |
240 |
60 |
外圈故障 |
3 |
240 |
60 |
为了更有效地提取不同故障的特征,将一维振动故障信号编码转换生成的128 × 128的二维图像,经GADF编码转换生成的二维图像,不同故障类别的振动信号生成的编码图特征区别明显,有利于故障分类,不同故障样本的二维图像如图7所示。
Figure 7. Two-dimensional images of different fault samples
图7. 不同故障样本的二维图像
4.2. 实验结果与分析
为了验证所提出的GAF-GAF-CNN-SA模型性能,将处理好的2种负载条件下故障数据输入到GAF-CNN-SA网络模型中进行故障诊断,图8(a)和图8(b)分别为负载为0 HP下的滚动轴承训练集样本数据在诊断模型的准确率曲线和损失值曲线图,在迭代次数为27时,训练集的精度达到了100%,Loss函数减小到0.1以下,之后的准确率和Loss函数曲线平缓稳定。图8(c)和图8(d)分别为负载为0 HP下的滚动轴承测试集样本数据在诊断模型的准确率曲线和损失值曲线图,在迭代次数为27时,训练集的精度达到了98.7%,Loss函数减小到0.1以下,之后的准确率和Loss函数曲线平缓稳定,模型达到稳定收敛状态。
Figure 8. 0 HP model diagnosis result graph
图8. 0 HP模型诊断结果曲线图
图9(a)和图9(b)分别为负载为1 HP下的滚动轴承训练集样本数据在诊断模型的准确率曲线和损失值曲线图,在迭代次数为30时,训练集的精度达到了100%,Loss函数减小到0.1以下,之后的准确率和Loss函数曲线平缓稳定。图9(c)和图9(d)分别为负载为1 HP下的滚动轴承测试集样本数据在诊断模型的准确率曲线和损失值曲线图,在迭代次数为30时,训练集的精度达到了98.7%,Loss函数减小到0.1以下,之后的准确率和Loss函数曲线平缓稳定,模型达到稳定收敛状态。实验表明了本文提出的滚动轴承故障诊断方法能够有效识别不同负载下的不同故障位置。
Figure 9. 1 HP model diagnosis result graph
图9. 1 HP模型诊断结果曲线图
4.3. 不同网络模型对诊断结果的影响
为了进一步验证本文提出的方法在轴承故障诊断中的优越性,选用同样的样本数据采用多种故障诊断方法进行对比分析,实验方法包括BP神经网络、SVM分类器和CNN网络模型,在进行对比实验后测试结果如表3所示。通过对比分析验证了本文提出的方法具有更佳的性能,进一步提高了滚动轴承故障诊断的识别率。
Table 3. Comparison of the experimental test results
表3. 对比实验测试结果
诊断方法 |
每类训练集样本 |
每类测试集样本 |
平均值准确率 |
BP |
240 |
60 |
86.3% |
SVM |
240 |
60 |
90.7% |
CNN |
240 |
60 |
95.2% |
本文方法 |
240 |
60 |
98.5% |
5. 结论
针对传统故障诊断方法未充分挖掘故障信息的问题,本文提出的基于结合注意力机制和卷积神经网络模型的方法,解决了滚动轴承变面对复杂工况依然可以有效故障诊断的问题,研究结论如下:
1) 采用格拉姆角场将一维时序数据转化为二维图像,将原始信号中丰富的非线性信息提取出来,利用卷积神经网络对图像数据敏感的特点,可以达到较高的诊断精度。
2) 所选取的不同负载下的滚动轴承故障数据,均可以达到较高的识别准确率,表明本研究所提出的方法具有较强的鲁棒性和泛化性能。
3) GAF-CNN-SA故障诊断方法具有良好的效果,相较于其他深度学习方法,其可以进一步提升对滚动轴承故障的识别准确率。