1. 引言
本文选择PHM2012轴承退化数据集进行分析,该数据集是由PRONOSTIA试验台获得的。首先对原始轴承信号利用快速傅里叶变换(FFT),将收集到的时域振动波形转换为频谱幅值信号,增强滚动轴承振动信号的特征提取效果。然后为实现对轴承剩余使用寿命的预测,构造单一学习器LSTM网络[1],研究结果验证了基于长短时记忆神经网络在滚动轴承剩余使用寿命预测方面有一定实用性和准确性。最后针对在寿命预测过程中序列太长会出现记忆力衰退现象,因此提出了一种结合卷积神经网络(CNN)和长短时记忆神经网络(LSTM)的轴承剩余使用寿命预测方法[2],取预处理后数据的一半作为CNN的输入,利用CNN的卷积和局部参数共享机制,自适应地从频域幅值信息中捕获局部空间特征,将获得的深层特征与LSTM网络融合,输出最终结果为寿命的百分比。以此作为健康指标,根据相关模型评价指标将两种方法进行比较,研究结果验证了融合模型在轴承寿命预测方面的更优性。
2. 深度学习概念的介绍
深度学习(Deep Learning, DL)是机器学习(Machine Learning, ML)领域中的一个重要分支,深度学习的核心在于通过模拟人脑神经网络进行数据分析和模式识别,构建多层的、深度的神经网络模型,以学习数据的深层次特征和表示。因此,深度学习已经成为RUL预测研究领域的一大热点,深度学习中基于注意力机制、长短期记忆网络(LSTM)、Transformer以及卷积神经网络(CNN)等模型被广泛应用到轴承剩余使用寿命预测中。
剩余使用寿命(RUL)是指一个设备、系统或组件在达到失效状态之前,预计还能正常运行的时间或周期。它是故障预测和健康管理中的重要指标,用于评估设备的当前状态并预测其未来的性能退化。其定义如下:
3. 模型介绍
3.1. CNN神经网络模型[3]
CNN神经网络(卷积神经网络)是深度学习领域最重要的技术之一,它是人工神经网络的一种变种,专为处理具有类似网格状的数据,其基本思想是利用卷积操作自主提取图像中的空间特征,并结合池化操作降低计算复杂度,最终实现高效的图像分类、目标检测、语义分割等任务。
卷积神经网络模型主要由以下部分组成:
(1) 卷积层:卷积层是CNN的关键构成。它通过滑动一个卷积核在输入数据上提取特征,卷积操作对每个卷积核与输入数据计算点积,生成特征图。卷积层计算如下所示:
(2) 池化层:也称为下采样层,其主要目的是减小特征图的维度并降低计算复杂度和参数数量,同时还能防止过拟合。最常用的池化操作为最大池化,能够提取具有代表性的特征,池化层计算如下所示:
(3) 全连接层:通常位于卷积网络中的最后部分,用于将特征图展平并且、连接到神经元。
3.2. LSTM神经网络[4]
LSTM神经网络(长短期记忆神经网络)作为循环神经网络的一个重要变体,与其他网络结构显著不同的是LSTM 在其架构中创新性地引入了记忆单元。这一关键设计带来了多方面的优势,尤其体现在成功克服了困扰传统网络的梯度消失难题,有效解决了循环神经网络难以学习长期依赖信息的问题。
LSTM由三个关键的门控机制组成,三者协同作用来调控时间序列中的信息流通,旨在更精确地捕捉序列中的长期依赖特征,让网络在处理序列数据时更加得心应手。具体更新步骤如下:
(1) 遗传门的计算公式如下所示:
(2) 输入门的计算公式如下所示:
(3) 候选记忆单元值计算公式如下所示:
(4) 记忆单元更新公式如下所示:
(5) 输出门的计算公式如下所示:
(6) LSTM结果输出公式如下所示:
其中:
为上一时刻的输出;
,
,
,
分别为在时刻t的输入层
和隐藏层记忆单元、输入门、遗忘门及输出门间的权重值;
,
,
,
分别为隐藏层在时刻
与时刻t之间记忆单元、输入门、遗忘门及输出门的权重值;
为记忆节点偏置项;
,
,
分别对应3个乘法门的偏置项;
为sigmoid函数,取值为0~1。框架图如下图1所示。
Figure 1. Schematic diagram of LSTM
图1. LSTM框架图
4. 实验与分析
4.1. 数据集介绍
本文研究采用数据为常用的数据集IEEE PHM 2012滚动轴承加速寿命数据,是由PRONOSTIA试验台获得的。数据采集过程以10秒为周期展开,每次持续捕获时长为0.1秒的信号样本。加速度传感器的采样频率设定为25.6 kHz,因此每次采集的数据中包含2560个数据点。温度传感器的采样频率则为10 Hz。试验轴承均为同一型号,分别在1800 rpm和4000 N,1650 rpm和4200 N,1500 rpm和5000 N这3种不同的转速和载荷下,轴承数据如下表1所示。
Table 1. IEEE2012 PHM data table
表1. IEEE2012 PHM数据表格
运行工况 |
工况1 |
工况2 |
工况3 |
转速 |
1800 r/min |
1650 r/min |
1500 r/min |
负载 |
4000 N |
4200 N |
5000 N |
|
Bearing 1_1 |
Bearing 2_1 |
Bearing 3_1 |
|
Bearing 1_2 |
Bearing 2_2 |
Bearing 3_2 |
|
Bearing 1_3 |
Bearing 2_3 |
Bearing 3_3 |
|
1800 r/min |
1650 r/min |
1500 r/min |
|
4000 N |
4200 N |
5000 N |
|
Bearing 1_4 |
Bearing 2_4 |
|
|
Bearing 1_5 |
Bearing 2_5 |
|
|
Bearing 1_6 |
Bearing 2_6 |
|
|
Bearing 1_7 |
Bearing 2_7 |
|
本实验根据PHM2012数据集的划分,选择轴承1_1、1_2、2_1、2_2、3_1、3_2全寿命数据作为训练集,其余轴承的非全寿命数据作为测试集。同时,有相关研究表明水平振动信号比垂直振动信号更能反映轴承的退化状态,因此仅使用水平振动信号进行实验,构建预测模型。数据详细划分结果如下表2所示:
Table 2. Division of bearing data set and experimental data
表2. 轴承数据集划分及实验数据
数据集划分 |
轴承编号 |
非全寿命时间(×10 s) |
全寿命时间(×10 s) |
训练集 |
Bearing 1_1 |
—— |
2803 |
Bearing 1_2 |
—— |
871 |
Bearing 2_1 |
—— |
911 |
Bearing 2_2 |
—— |
797 |
Bearing 3_1 |
—— |
515 |
Bearing 3_2 |
—— |
1637 |
测试集 |
Bearing 1_3 |
1802 |
2375 |
Bearing 1_4 |
1139 |
1428 |
Bearing 1_5 |
2301 |
2463 |
Bearing 1_6 |
2302 |
2448 |
Bearing 1_7 |
1502 |
2259 |
Bearing 2_3 |
1202 |
1955 |
Bearing 2_4 |
612 |
751 |
Bearing 2_5 |
2002 |
2311 |
Bearing 2_6 |
572 |
701 |
Bearing 2_7 |
172 |
230 |
Bearing 3_3 |
352 |
434 |
以轴承1_1为例,绘制其水平和垂直两个方向的原始振动信号时域图如图2和图3所示。
Figure 2. Level diagram of bearing time domain signal
图2. 轴承时域信号水平方向图
Figure 3. Vertical diagram of bearing time domain signal
图3. 轴承时域信号垂直方向图
4.2. 数据预处理分析
针对训练集与测试集共计17组的轴承原始时域振动数据,采用FFT实施频域预处理操作,将时域振动数据转换为频域幅值信号。以轴承1_3的样本为例,截取0.1 s时间窗口内的原始振动波形及其对应的频域幅值信号,结果分析如下图4所示。
Figure 4. Time domain and frequency domain signal waveform of a sample of bearing 1_3
图4. 轴承1_3某一样本的时域及频域信号波形图
在实验中,对滚动轴承信号进行处理得到对称的频域信号,并对频域信号进行归一化,选取前一半频域信号作为输入。
4.3. 基于LSTM的滚动轴承剩余使用寿命预测分析
采用LSTM网络模型对轴承剩余使用寿命进行预测,根据多次实验尝试,确定模型结构为3个LSTM层,神经元的个数分别为256、128和64,以及1个全连接层和ReLU激活层。其模型参数设置如下表3所示。
Table 3. Hyperparameter settings based on LSTM model
表3. 基于LSTM模型的超参数设定
参数名称 |
参数类别/数目 |
批量大小 |
32 |
学习率 |
0.00001 |
优化器 |
Adam |
损失函数 |
MSE |
在选择出最优模型并完成模型的训练工作之后,需对其预测性能进行验证。对模型输入测试数据集,预测出趋势性量化健康指标。轴承1_3实际寿命与预测寿命百分比的对比如下图5所示,该图显示预测值围绕着真实寿命曲线波动,轴承的退化趋势明显,但存在波动偏差。
为减少震荡对健康指标的影响,采用移动平均(MA)平滑滤波方法处理,让健康指标的变化趋势更加平稳,从而达到更好地预测效果。将平滑处理后的数据充分线性拟合,其结果如下图6所示。
Figure 5. Comparison of predicted life before and after smooth bearing 1_3 with actual life
图5. 轴承1_3平滑前后预测寿命与实际寿命对比图
Figure 6. Prediction results of remaining life of bearing 1_3
图6. 轴承1_3剩余寿命预测结果
从图6,可以清晰地展现出预报结果在未来的变化趋势,进而对轴承的剩余使用寿命进行科学合理的预估。
为确保对模型预测性能的评估更加全面且具备参考价值,研究选择平均绝对误差(MAE)与寿命百分比误差构建的综合评分指标(Score)两项指标来直观反映模型预测的准确性和模型泛化能力的评估[5]。其计算公式如下所示:
其中
和
分别表示第i个滚动轴承的实际剩余寿命和模型预测所得的剩余寿命值,
表示第i个轴承的误差百分比。
仅观察单一轴承的误差对模型的性能的评估是不具备参考价值的。因此,需要计算多个轴承的剩余寿命误差的平均和总得分,以更准确地评价模型的整体表现。总得分Score计算公式如下[6]:
对于总得分的计算,当预测误差大于零时,表示低估了该轴承的使用寿命,能够在轴承报废前及时维护。当预测误差小于零时,说明在达到预测失效时间之前轴承就停止工作量,这种情况下,即使误差很小,也会带来巨大损失。
基于LSTM的滚动轴承剩余使用寿命预测方法在测试集轴承的评价指标结果如下表4所示。
Table 4. Evaluation indexes results of different bearings in LSTM
表4. LSTM不同轴承评价指标结果
轴承标号 |
得分 |
MAE |
B1_3 |
0.8892 |
0.0609 |
B1_5 |
−0.4484 |
0.1375 |
B1_6 |
−0.2701 |
0.183 |
B1_7 |
0.9025 |
0.0453 |
B2_3 |
−0.6144 |
0.138 |
B2_4 |
−1.6879 |
0.1764 |
B2_5 |
−3.7139 |
0.251 |
B2_6 |
−0.0024 |
0.1777 |
B2_7 |
−10.742 |
0.2174 |
B3_3 |
−2.0256 |
0.4003 |
Score |
—— |
0.1438 |
表4验证了该模型在轴承寿命预测方面的有效性,知LSTM模型在测试集的总得分为0.1438。
4.4. 基于CNN的滚动轴承剩余使用寿命预测分析
为验证CNN和LSTM模块在融合模型中各自的贡献,采用CNN基线模型对同一个数据集的轴承剩余使用寿命进行预测。在训练中用相同的损失函数、Adam优化器、学习率、batch size以及训练轮次训练模型,确保对比公平。同时确定模型结构为3个卷积层,卷积核数目分别为64、64、128。卷积核采用大小为3、步长为1的一维卷积核,填充方式为零填充。增加全局池化层替代LSTM的时序建模功能,再接入全连接层。
对于训练好的CNN模型,轴承1_3实际寿命与预测寿命百分比的对比如下图7所示,预测值在真实值下方波动,重合部分较少。
Figure 7. Comparison of predicted life before and after smooth bearing 1_3 with actual life
图7. 轴承1_3平滑前后预测寿命与实际寿命对比图
平滑处理后的数据充分线性拟合的结果如下图8所示,真实值与拟合值之间差距较大,在实际中轴承在预测失效的时间后还能运行。
Figure 8. Prediction results of remaining life of bearing 1_3
图8. 轴承1_3剩余寿命预测结果
4.5. 基于CNN + LSTM的滚动轴承剩余使用寿命预测
采用CNN + LSTM网络模型对轴承提取信号中的所有信息,并对剩余使用寿命进行预测,根据多次实验尝试,确定模型结构为3个卷积层,3个池化层,3个LSTM层,全连接层和ReLU激活函数层,增强模型的表达能力。3个卷积层的卷积核数目分别为64、64、128。卷积核采用大小为3、步长为1的一维卷积核,填充方式为零填充。池化函数采用最大值池化2 × 2。3层LSTM层神经元个数分别为256、128、64。其模型超参数设置如下表5所示。
Table 5. Hyperparameter setting based on CNN + LSTM model
表5. 基于CNN + LSTM模型的超参数设定
超参数名称 |
参数类别/数目 |
批量大小 |
32 |
学习率 |
0.00001 |
优化器 |
Adam |
损失函数 |
MSE |
为了验证所提出的模型对不同工况下的滚动轴承所构建的健康指标都能很好地反应其退化趋势,以滚动轴承1_3和1_7为例,它们的轴承剩余寿命预测结果如下图9和图10所示。
Figure 9. Comparison of predicted life and actual life before and after smooth bearing 1_3
图9. 轴承1_3平滑前后预测寿命与实际寿命对比图
Figure 10. Comparison of smooth prediction and actual life of bearing 1_7
图10. 轴承1_7平滑前后预测与实际寿命对比图
对结果进行移动平均(MA)平滑滤波方法处理,并将平滑处理后的结果充分线性拟合,其结果如下图11和图12所示。
Figure 11. Prediction results of remaining life of bearing 1_3
图11. 轴承1_3剩余寿命预测结果
Figure 12. Prediction results of remaining life of bearing 1_7
图12. 轴承1_7剩余寿命预测结果
可以清晰地展现出预报结果在未来的变化趋势,对于轴承1_3在开始预测的时候,所得的结果存在微弱的偏差,但对于整体的结果影响并不大,在后期的预测结果与真实值基本相符。而对于轴承1_7,在开始预测时,出现部分异常低估或高估的情况,并且整个趋势有较大波动,但在最后预测结果与真实值基本相符。
将LSTM模型、CNN模型和CNN + LSTM模型的预测结果进行对比,结果如表6所示。在实验中,CNN的核心作用是提取局部特征,LSTM的核心作用是捕捉时序特征。
Table 6. Prediction results of remaining service life
表6. 剩余使用寿命预测结果
轴承标号 |
LSTM |
CNN |
CNN + LSTM |
MAE |
MAE |
MAE |
B1_3 |
0.0609 |
0.17 |
0.0756 |
B1_5 |
0.1375 |
0.1416 |
0.1326 |
B1_6 |
0.183 |
0.1682 |
0.1237 |
B1_7 |
0.0453 |
0.0788 |
0.0572 |
B2_3 |
0.138 |
0.1837 |
0.1048 |
B2_4 |
0.1764 |
0.1246 |
0.1775 |
B2_5 |
0.251 |
0.3848 |
0.1964 |
B2_6 |
0.1777 |
0.3883 |
0.1791 |
B2_7 |
0.2174 |
0.1666 |
0.2046 |
B3_3 |
0.4003 |
0.4217 |
0.2397 |
均值 |
0.1538 |
0.2032 |
0.1296 |
Score |
0.1438 |
-0.2869 |
0.2086 |
根据表6知基线CNN和LSTM两种方法对轴承剩余使用寿命的预测结果可以看出,其平均MAE分别为0.2032、0.1538。LSTM模型的平均MAE比CNN低24.3%,说明在本实验中时序特征对轴承寿命预测的贡献远大于局部特征。
根据表6中CNN + LSTM和CNN两种方法对轴承剩余使用寿命的预测结果可以看出,CNN + LSTM与单一CNN模型相比,仅CNN,误差最大且得分小于零;加入LSTM后,误差显著降低,并且得分为正,有效降低了风险。说明时序特征是决定预测精度的关键。
根据表6中LSTM和CNN + LSTM两种方法对轴承剩余使用寿命的预测结果可以看出,相较于单一LSTM网络而言,在LSTM基础上新加入CNN模块后,平均绝对误差整体上降低了15.7%,总得分提高了31.1%。表明虽然单独用局部特征效果差,但与时序特征结合时,能进一步优化精度,降低轴承故障带来的影响。
5. 结论
本论文以滚动轴承为研究对象,结合深度学习的相关方法,对其寿命预测展开研究。主要结论如下:
(1) 针对传统时域分析在故障表征信息挖掘方面的局限性,提出对原始信号进行FFT操作转化为频域信号增强滚动轴承振动信号的特征提取效果,以更全面地捕捉信号中的故障特征。
(2) 提出一种基于LSTM和CNN + LSTM两种滚动轴承剩余使用寿命预测的方法。将寿命百分比作为趋势性量化指标,在移动平均平滑处理后采用线性拟合,实现轴承对剩余使用寿命的预测。通过对比分析,单模型LSTM的总得分为0.1438,基于CNN + LSTM模型总得分为0.2086,提高了0.0648,展现在特征提取模块加入CNN网络模型的优势所在。CNN + LSTM模型更适合应用到轴承剩余使用寿命预测领域。
(3) 加入基线CNN模型,其平均MAE为0.2032最高,表明在本实验中时序特征对轴承寿命预测的贡献远大于局部特征,是任务的核心。
在本文中所提到的预测方法只是针对本文所用的数据集进行的研究,并没有对其他轴承数据进行实证分析。在未来的研究可以从以下几个方向进一步深化:一是提高数据采集与预处理技术,确保获取更高质量的运行数据;二是加强多模态数据融合,结合振动、温度、声音等多种传感数据进行综合分析;三是探索更加高效且具备较强鲁棒性的预测模型,以应对复杂多变的实际应用场景。