1. 引言
进入新世纪以来,我国的油气管道建设工业发展迅猛,近年来伴随着能源结构调整,管道运输仍然是解决东西部能源分布不均衡的重要一环,作为国内距离最长、口径最大的西气东输工程,每年通过管道向内地输送近120亿立方米天然气,俨然成为国民经济的中流砥柱,沿线在扩大内需、增加就业,促进电力、化工冶金等相关行业的发展做出重要贡献 [1] 。长输油气管道一般由金属材料加工而成,由于分布环境复杂,不可避免的会被油气腐蚀或制管缺陷放大,造成很多管道网线出现老化,出现了安全隐患甚至爆炸,严重影响了人民安全,因此对管道的安全检测有着重要的意义。
在20世纪60年代研发智能清管器由美国Knapp公司和Girard公司共同研发,缺点是对缺陷位置的确定误差较大 [2] ,SoldevilaL [3] 利用了贝叶斯网络稳定的效率,在验证中提出一种与时间参数结合的利用贝叶斯进行分类器,降低了建模的不确定性和传感器本身误差的影响,进一步提高了分类性能和定位精度。徐蒋明等 [4] 用3种基于小波包变换(WPT)的特征提取方法,对焊缝缺陷回波信号提取特征,并将其作为BP神经网络的输入,达到了85.71%的缺陷识别率。2017年,Vaswanis [5] 等人提出了Transformer模型,广泛应用于自然语言处理领域,人工智能领域取得了卓越的成绩。2022年,韩飞 [6] 提出了一种Adam-S的优化算法,通过复用前后两个梯度的二阶动量增强了预测的准确性。基于上述理论研究,本文通过搭建Keras深度学习多标签分类框架,并结合线下采集的2077个管道缺陷图像,采用新Adam-S算法将模型应用于6个缺陷特征的分类,并通过分析优化模型的影响因素提高了其泛化能力,为管道缺陷的现代化检测,生产过程的有效监督提供了一定的社会价值。
2. Keras框架及多标签分类问题
2.1. Kreas简介
作为深度学习较为热门的框架之一,Keras是一个高层次的神经网络API,基于Tensorflow、Theano以及CNTK后端编写,它的模型可以理解为各个层的序列分布或数据运算,可同时配置自定义模块,用户可以自由组合,这些模型包括各网络层、不同分布的损失函数、优化器以及初始策略管理器等,具有较好的模型构建能力,并且扩展性能较为出色,更适合与先进的研究工作。
2.2. Adam-S优化器
Adam是基于实现神经网络的反向传播过程,通过训练数据迭代更新所在层的权重参数矩阵,是可以替代随机梯度下降的优化算法 [7] 。Adam算法和传统的随机梯度法的区别在于,随机梯度下降在迭代更新过程中参数保持恒定,Adam算法则会通过计算各梯度动量值针对特定的学习率,适应参数的改变,文献 [8] 证明了Adam算法的学习率主要是有二阶动量控制的,二阶动量会随时间变化而变化,且变化是非单调的,导致网络在训练期间学习率产生震荡使模型无法收敛。在Adam-S中,考虑了时间变量的影响,修正偏差及更新参数如下,其中
是一阶动量,
为当前梯度的二阶动量,
、
分别为
和
在步骤t下的动量值,
为模型相关收敛参数,
为偏差因子。
(1)
(2)
2.3. ECA注意力机制
ECA算法作为一种用于卷积神经网络特征增强表达的方法,目的是将不同的权重参数分配到不同的特征数据,使得网络能够哟选择性的关注某一特征或忽略某种特诊,SENet [9] 在网络中引入ECA注意力机制,显著提高了模型的性能。研究过程发现基于EfficientNet与ECA机制结合,结合了新的算法具有更快的训练速度和模型轻量化作用,并且可有效增强模型对管道缺陷特征的提取能力,部分Fused-MBconv (MBconv)结构图如图1所示。

Figure 1. Partial Fused-MBconv schematic diagram
图1. 部分Fused-MBconv (MBconv)示意图
2.4. 多标签分类问题
针对本文6个管道缺陷样本标签,2077个样本数量,X为样本集,Y为特征集,那么假设其数学表示为:
(3)
(4)
其中x为每个图像样本的特征矩阵,y分别对应分类需求的6个标签,对于该多分类输出层采用softmax作为激活函数,softmax激活函数的思想是将最后得到的全连接层即N维的实数向量缩减至一个6维实数向量,经过非线性变换后,使得图像每个元素大小值都在0~1之间,并且满足归一化条件,通过神经网络对样本初步建模模型的输出为
(5)
其中P为x中的某个样本对应正确标签的概率,
即表示图像样本。
3. 深度学习CNN模型的搭建
3.1. 金属管道缺陷图像特征的采集
管道材料加工表面通过工业高帧率工业相机拍摄,产品参数如表1所示。采集样本主要包括月牙间隙、油斑、夹杂物、卷坑、表面腐蚀、加工划伤6类特征,并将其归类做数据集的预处理。

Table 1. Modal frequency and mode characteristics of frame
表1. 高帧率工业相机参数
3.2. 图像数据的预处理
对于采集的原始数据,处理方式如图2所示。通过预处理工作,使得图像具有相同的尺寸,将RGB三个通道均转换为神经网络可识别的矩阵形式。

Figure 2. Pipeline defect image preprocessing process
图2. 管道缺陷图像预处理流程
3.3. 卷积神经网络的搭建
卷积神经网络是由卷积层和若干子采样层(池化层)构成的特征提取器,本实验设计结构图如图3所示,即输入图像数据后,经卷积层、池化层、全连接层以及Dropout选择性断点结合,大大简化了模型的复杂度,提高了运算效率,输出后的数据会被储存。

Figure 3. Pipeline defect image preprocessing process
图3. 管道缺陷图像预处理流程
在卷积网络构建的过程中,应用深度可分离卷积 [10] 的方法,可优化模型计算过程参数。对于一个输入和输出参数都不变的多层网络,考虑单个卷积核与多个卷积核灵活应用,可实现计算参数量的数量级降低,同时提高模型的计算速度。
4. 模型预测实验
4.1. 环境模型参数
模型详细参数如表2所示。
本研究实验环境为Intel(R)Corei7-9750@2.60Ghz处理器,NVIDIA GeForce 1660Ti和16GRAM,软件环境为Windows操作系统,基于Keras-Tensorflow2.1搭建神经网络模型。
4.2. 对比实验
4.2.1. 学习率

Figure 4. Learning rate lr = 0.01 Model accuracy curve
图4. 学习率lr = 0.01模型准确率曲线
通过侧重的应用层面,对比了该卷积网络结构设计的3种学习率对模型参数的影响,学习率分别是0.01、0.001以及0.0001,训练和验证的准确率曲线如图4~6所示。对比结果可知,学习率数值越大,曲线也会出现较大波动,学习率数值越小,模型计算的步进长度越小,数值也更加精密,但验证集和训练集的差值不断增大,迭代到第50次与第135次临界,图像趋于直线,但是出现了过拟合现象,因此需要对模型进一步改进。

Figure 5. Learning rate lr = 0.001 model accuracy curve
图5. 学习率lr = 0.001模型准确率曲线

Figure 6. Learning rate lr = 0.0001 model accuracy curve
图6. 学习率lr = 0.0001模型准确率曲线
4.2.2. Dropout策略
Hinton和Srivastava于2012年提出了Dropout思想,来解决前馈神经网络过拟合的问题,以提高神经网络的性能。为了使神经网络计算细节更加直观,规定学习率learning rate = 0.0001,实验过程中对两个全连接层分别随机删除50%以及25%的神经元,之后再将神经元通过修改后的网络正向传播,最后再将下一步的结果反馈给上一级,是模型更加具有泛化性。两种方案的模型曲线如图7和图8所示。

Figure 7. Set 3 * Dropout = 0.25 (lr = 0.0001)
图7. 设定3 * Dropout = 0.25 (lr = 0.0001)

Figure 8. Set 3 * Dropout = 0.5 (lr = 0.0001)
图8. 设定3 * Dropout = 0.5 (lr = 0.0001)
通过曲线可以看出Dropout机制对神经网络的影响,随机剔除神经元数目越少,验证数据的损失率不断升高,而验证集的准确率趋于常数,约为75%,相反,如果增大删除神经元的数目,那么不可避免的也会造成数据特征丢失,但从曲线来看,训练准确率是保持稳步上升的,验证数据的损失也随着神经网络的运行先降低后升高,而后出现波动,可通过网络结构的微调以改善该情况。
4.3. 常规化预测模型
将权重参数矩阵导出,建立预测模型,从处理好的未参加训练及测试的数据中选择几组图像,导入模型进行预测,对于6个特征预测的准确率如图9所示。
从图中可以看出,神经网络对表面腐蚀以及加工划伤预测准确率较高,分别为96.19%和94.57%,对管道夹杂物以及月牙间隙的识别率分别为86.73%以及88.93%,可判断是由于管道所处环境的复杂性决定的,夹杂物的多态性,对模型的识别效果产生了很大程度的影响。
4.4. 不同模型算法的性能对比
为了验证本文Adam-S-改进ECA-CNN算法的优越性,在相同实验条件下,选取了传统的Adam-CNN-ECA,传统的Adam-CNN以及应用较为普遍的ResNet18网络模型作为对照,训练参数设置同上,实验结果如表3所示。

Table 3. Performance comparison of different models
表3. 不同模型性能比较
由表3可得,Adam-S-改进ECA卷积网络的训练准确率比传统Adam-CNN提升了接近4.2%,对于表面腐蚀缺陷分类准确度最高达到了96.19%,其训练速度有了大幅提升,相同的实验条件下,与ResNet18相比,虽然训练时间接近,但该算法有着较高的训练精度。综合评估,本研究提出的Adam-S-改进ECA-CNN模型算法在识别与分类油气管道缺陷图像数据集上具有更优异的性能。
5. 结论
1) 本文通过概述Keras软件深度学习框架,包括从原始数据采集到神经网络结构搭建,再通过多次迭代得到网络模型的实际预测率,完成了深度学习在管道缺陷的应用,为现有铺设管道以及在制管道的现代化检测提供了一定的应用价值。
2) 实验过程中通过控制时间变量,量化对比了目前应用较为普遍的ResNet18以及改进前的Adam-CNN算法,有效验证了Adam-S-改进ECA-CNN算法的优越性能。
3) 通过对比实验两个关键参数,比较了学习率以及Dropout机制对神经网络结构的影响,同时应用较小的学习率细化了模型的计算细节,后续通过微调神经网络结构,提高了模型的泛化性,后续实验将其导入移动设备或在线设备中。
参考文献