1. 引言
船舶作为全球供应链的核心运输载体,长期处于高腐蚀性的海洋环境中。其金属结构在航行过程中持续受到多种环境因素的协同作用,包括高浓度盐雾侵蚀、干湿循环效应以及温度剧烈波动等,这些因素共同诱发金属电化学腐蚀过程[1]。尽管海上船舶智能监测系统可以进行实时监测,但是船舶的腐蚀依旧是船舶所面临的重大挑战之一[2]。这种材料性能的渐进式劣化不仅会削弱船体结构强度,还可能造成重大安全事故,对船员生命安全、货物运输安全以及海洋生态环境构成多重威胁。
在腐蚀监测技术方面,传统的检测手段主要采用人工巡检配合常规无损检测技术(如超声波及磁粉探伤等)。然而,这些方法普遍存在检测效率低下、结果易受主观判断影响、难以全面检测结构隐蔽部位等技术瓶颈[3]。针对上述技术瓶颈,融合人工智能的智能腐蚀诊断系统成为重点研发方向,特别是卷积神经网络在视觉感知领域的革新,为构建船舶表面状态分析平台提供了理论支撑[4]。
得益于计算机目标识别及视觉领域的突破性进展,基于深度学习的智能检测方法逐渐成为该领域的研究重点[5]。其中,Mask R-CNN框架凭借其优异的实例分割性能,在复杂环境下的多目标识别任务中表现出独特优势,这为船舶腐蚀的智能化检测提供了新的技术路径[6]。
从技术演进角度看,Faster R-CNN通过创新性地采用区域生成网络(RPN)提高了检测速度,但其在像素级分割方面存在局限[7]。相比之下,Mask R-CNN架构通过增设掩码预测分支,实现了检测与分割的同步优化,特别适合处理多尺度目标的识别问题[8]。于宪煜等人相关研究表明,在滑坡体识别任务中,Mask R-CNN的综合性能指标(包括准确率、召回率及F1值)均显著优于Faster R-CNN [9]。类似地,江佳霖团队通过架构改进(融合可变形卷积与注意力模块),在复杂地质样本分析中取得了89%的检测精度,证实了该算法在细小目标识别方面的有效性[10]。
针对大尺寸图像的检测挑战,特征金字塔网络(FPN)通过多层次特征融合机制显著提升了模型性能[11]。舒江鹏等学者开发的基于FPN的裂缝检测系统,通过多尺度特征保留策略,实现了对细微结构缺陷的高精度识别(交并比达0.78)。这些技术突破为船舶腐蚀检测中的类似问题提供了重要借鉴。
综上所述,在具体算法选择上,整合FPN的Mask R-CNN架构能够有效应对船舶腐蚀检测中的关键挑战,包括多尺度目标识别和复杂背景干扰等问题[12]。该方案通过特征金字塔结构与ROIAlign层的协同作用,成功解决了传统方法在曲面结构边缘检测中的精度不足问题。后续研究应着重优化模型计算效能,并结合实际应用场景开发轻量化部署方案。
2. 基于Mask R-CNN的船舶腐蚀检测
2.1. 数据集构建
本研究构建的船舶腐蚀影像数据库严格遵循国际标准,其中视觉素材选自BIGIBIGWORK聚合平台下的Pixabay图库(遵循CC0 1.0通用公共领域协议),专业数据取自RoboFlow平台发布的船舶腐蚀(Corrosion)数据集(遵循Roboflow开源协议),通过多阶段清洗流程最终形成标准化数据集。
该数据库共纳入135组高分辨率样本,采用分层交叉验证策略进行数据划分:训练集,包含92张图像(占总数据量的68.1%),用于模型参数的优化和特征学习;验证集,由33张图像组成(占总数据量的24.4%),主要用于超参数调优和训练过程中的模型性能监控;测试集,包含10张具有挑战性的图像样本(占总数据量的7.4%),专门用于最终评估模型的泛化能力和实际应用性能。
该划分方案满足深度学习数据量基本准则(n > 50),又能保证验证和测试过程的统计显著性。所有子集的划分均通过分层抽样完成,确保每个子集中各类腐蚀形态的比例与原始数据集保持一致,从而避免因数据划分引入的系统偏差。
2.2. 数据预处理
为了提高数据集的质量并增强模型的泛化性能,本研究构建了图像预处理体系,通过三阶联级处理流程实现数据质量优化。该流程依次包括中值滤波去噪、灰度世界白平衡、直方图均衡化及,旨在消除图像噪声、校正色彩偏差、增强对比度并标准化数据分布,如图1。
1) 中值滤波去噪
针对船舶图像采集过程中可能存在的环境噪声干扰问题,对RGB三通道分别应用固定窗口大小(3 × 3)的中值滤波。该方法在去除脉冲噪声的同时,较好地保留了边缘细节,相较于传统高斯滤波,均方误差降低了9.05%。
2) 灰度世界白平衡
基于标准灰度世界假设,通过计算RGB三通道的平均值,并调整各通道的增益系数,使整体色彩趋于均衡,从而补偿光照偏差。经处理后,图像在CIEDE 2000标准下的色差指数从27.19降至23.28,色彩保真度提升14.38%,有效增强了锈蚀区域的色度可分性。
3) 直方图均衡化
采用全局直方图均衡化增强图像对比度,该方法通过调整像素灰度值的分布,扩展图像的动态范围,从而提升图像整体的视觉可分性,特别是增强了锈蚀区域与背景的对比度。经处理后,腐蚀区域与背景的Weber对比度从0.1335提升至0.2746。其数学表达式为:
(1)
其中,rk为输入灰度级,sk为输出灰度级,nj为j级灰度的像素数,N为总像素数。
Figure 1. Data preprocessing image
图1. 数据预处理图像
2.3. 数据标注
为了训练Mask R-CNN模型以精准识别并分割船舶腐蚀区域,本研究选用Labelme作为数据标注工具,使用的是其中的多边形标注法。该工具因其直观易用的多边形标注方式、广泛的格式兼容性及开源可定制特性,能够有效支持复杂腐蚀边缘的精细化标注需求,实现对不规则船舶腐蚀区域的精确轮廓刻画。
通过优化多边形标注流程并结合自动化转换脚本,本研究构建了高质量的船舶腐蚀实例分割数据集,其中每个腐蚀区域都通过多边形顶点精确定位,为Mask R-CNN模型的训练奠定了坚实的数据基础。这种基于多边形标注的数据构建方法不仅适用于腐蚀检测,未来该标注框架还可进一步拓展至其他船舶缺陷检测任务,如涂层剥落、结构裂纹等不规则缺陷的标注工作。
2.4. 模型训练与优化
2.4.1. 模型选择
在目标检测与实例分割领域,Faster R-CNN和Mask R-CNN系列算法因其优异的性能而被广泛应用。本研究重点对比分析以下三种算法架构:
1) Faster R-CNN C4:使用ResNet-50-C4作为主干网络,采用C4特征金字塔,主要用于目标检测。
2) Mask R-CNN C4:在Faster R-CNN C4的基础上增加了掩码分支,用于生成像素级的目标分割掩码。
3) Mask R-CNN FPN:使用ResNet-50-FPN作为主干网络,采用特征金字塔网络,相比C4结构,FPN在多尺度目标检测上表现更优,并同样增加了掩码分支。
2.4.2. 数据增强
本研究依托Mask R-CNN框架开展船舶腐蚀检测工作,通过迁移学习,制定了系统化的数据增强策略,以解决船舶腐蚀检测数据集合数量不足的问题。研究中以镜像翻转作为主要增强方法,严格确保图像与标注mask之间的空间对应关系,同时规避可能引入物理不合理性的增强方式。
基础训练集由92张精细标注的原始图像构成,其中选取79张具有代表性的图像进行增强,使样本数量增至原始的两倍,即158张,最终形成包含171张图像的数据集。翻转增强不仅有效模拟了实际检测场景下船舶不同方位的观测视角,还保持了腐蚀形貌的物理真实性,避免几何失真,显著提升了数据集多样性。
2.4.3. 相关参数的设定
1) 损失函数
针对船舶腐蚀检测中的多任务学习需求,本研究在Detectron2框架中默认使用了一种集成化损失函数框架,统一优化目标分类、边界框回归以及像素级分割三个关键子任务。该框架基于深度卷积神经网络的特征共享机制,通过联合优化策略促进各任务间的协同学习,提高检测性能。
2) 优化算法
在Detectron2框架中,SGD被设定为默认优化器,这是一种基于梯度下降的优化算法,其原理是计算损失函数的梯度以更新模型参数。相较于批量梯度下降,SGD每次仅使用单个或少量样本进行参数更新,因此具备更快的收敛速度,同时降低了内存占用。其更新规则可表示为:
(2)
其中,θt表示第t次迭代时的模型参数,η表示学习率,L (θt; xi, yi)表示在第t次迭代时,使用样本(xi, yi)计算得到的损失函数值,∇θL (θt; xi, yi)表示损失函数关于模型参数的梯度。
基础学习率也是影响模型收敛速度与训练效果的关键超参数。在本研究的实验设置中,基础学习率被设定为0.0025,该值基于实验经验以及小批量训练的特点进行选择,既能保证模型快速收敛,又能避免过大的学习率导致训练过程的不稳定性。
同时,为防止模型在训练过程中出现过度拟合,并进一步提升泛化能力,本研究还引入了学习率衰减策略。其公式可表示为:
(3)
其中,ηold表示衰减前的学习率,ηnew表示衰减后的学习率,γ表示衰减因子。在本实验中,γ被设置为一个小于1的常数,以确保学习率能够逐步降低。
本研究使用的优化策略能够有效加快模型的收敛速度,并提升泛化能力。特别是在小批量训练环境下,当基础学习率设为0.0025时,模型表现尤为优异。
3) 超参数调整
ROIAlign是在Mask R-CNN中提出的一种区域特征聚集方式,它解决了ROI Pooling操作中两次量化造成的区域不匹配问题,通过双线性插值的方式,在遍历取样点的数量上虽然不多,但却能够获得更好的性能。
在基于Mask R-CNN的船舶腐蚀检测任务中,本研究使用的数据集包含大量的目标检测与分割任务样本,ROIAlign作为关键的特征提取模块,其参数配置直接影响模型的检测精度和计算效率。为了公平比较不同ROIAlign分辨率下的模型性能,本研究保持其他超参数一致,针对其进行参数调整。
ROIAlign的分辨率决定了在特征图中池化区域的大小。本研究分别测试了64 × 64和128 × 128两种分辨率,通过调整,可以观察模型在目标分类、边界框回归和腐蚀区域分割任务上的性能变化。可以发现ROIAlign分辨率为128 × 128时,模型在目标分类和边界框回归任务上的性能略优于64 × 64的分辨率,但其计算成本也相对较高,且模型的训练时间和推理时间均有所增加。因此,在实际应用中需要根据具体需求权衡性能与计算效率。
3. 结果展示与讨论
3.1. 实验结果展示
在以上三张表中,表1系统性地展示了五种模型架构在船舶腐蚀检测任务中的平均性能指标,深入揭示了关键设计参数对检测效果的影响;表2为关键指标的最优值与最低值的对比;表3是5种模型架构的测试结果图。
Table 1. Average performance metrics of five model architectures
表1. 5种模型架构的平均性能指标
|
Backbone |
ROIAlign |
AP |
AP50 |
AP75 |
APS |
APM |
APL |
(A) Faster R-CNN |
ResNet-50-C4 |
64 |
36.3 |
69.3 |
37.9 |
30.7 |
46.4 |
54.1 |
(B) Faster R-CNN |
ResNet-50-C4 |
128 |
34.0 |
66.4 |
34.5 |
30.7 |
39.6 |
48.7 |
(C) Mask R-CNN |
ResNet-50-C4 |
64 |
34.5 |
62.9 |
32.1 |
32.3 |
43.6 |
51.6 |
(D) Mask R-CNN |
ResNet-50-FPN |
64 |
37.0 |
61.5 |
39.0 |
28.7 |
40.4 |
66.3 |
(E) Mask R-CNN |
ResNet-50-FPN |
128 |
41.4 |
69.7 |
43.8 |
34.2 |
40.0 |
66.8 |
Table 2. Comparison of APS/APM/APL metrics
表2. APS/APM/APL指标对比
指标 |
最优组 (数值) |
最差组 (数值) |
差异分析 |
APS (小目标) |
E (34.2) |
B (30.7) |
FPN + 128 × ROIAlign模块提升小目标特征保留 |
APM (中目标) |
A (46.4) |
E (40.0) |
C4结构可能更适合中等尺度目标检测 |
APL (大目标) |
E (66.8) |
B (48.7) |
FPN显著改善大目标空间连续性 |
Table 3. Test results of the five model architectures
表3. 5种模型架构的测试结果图
|
|
Faster R-RCNN |
Mask R-CNN |
|
C4 ROIAlign = 64 |
C4 ROIAlign = 128 |
C4 ROIAlign = 64 |
FPN ROIAlign = 64 |
FPN ROIAlign = 128 |
图像一 |
|
|
|
|
|
图像二 |
|
|
|
|
|
图像三 |
|
|
|
|
|
图像四 |
|
|
|
|
|
图像五 |
|
|
|
|
|
实验结果表明,Mask R-CNN结合FPN结构与128 × ROIAlign模块(配置E)为最优方案,其整体检测精度(AP = 41.4%)相较于基准配置(配置A)提升了14.0%。在高IoU阈值检测性能(AP75 = 43.8%)及极端尺度目标检测方面(APS = 34.2%, APL = 66.8%),该配置均表现优异,尤其在腐蚀区域边界定位能力上,相较于纯检测模型(配置B,AP75 = 34.5%)提升了26.9%。
但需要注意的是,配置A在中等尺寸目标检测(APM = 46.4%)方面表现尤为突出,但由于其采用单尺度特征提取(ResNet-50-C4),导致小目标信息易丢失(APS = 30.7%),同时对大目标的空间连续性建模能力较弱(APL = 54.1%)。
3.2. 架构参数耦合效应机制
IoU阈值敏感性分析表明,配置E在低IoU阈值(AP50 = 69.7%)和高IoU阈值(AP75 = 43.8%)条件下均表现出色。其中,AP50与配置A (AP50 = 69.3%)接近,但在更严格的IoU标准下(AP75)优势明显。这表明FPN结构通过多尺度特征融合,成功平衡了检测召回率与边界定位精度之间的权衡关系。
此外,目标尺度敏感性实验进一步验证了配置E的有效性,使小目标检测精度(APS)提升11.4%,大目标检测精度(APL)提高37.2%。相比之下,配置A在中目标检测(APM = 46.4%)方面的突出表现主要得益于其深层特征(ResNet-50 Stage4)具备较强的语义抽象能力。然而,由于该模型采用单尺度特征提取,难以适应船舶腐蚀区域的多尺度分布特性,限制了其在小目标检测与大目标完整性建模上的效果。
3.3. 关键设计参数影响规律
包含有特征金字塔架构的引入使检测性能全面提升,其多尺度特征融合机制有效缓解了腐蚀目标尺度跨度大带来的检测难题。空间金字塔池化与FPN的协同作用显著,128 × ROIAlign在浅层特征上保留更多边缘细节,使配置E的AP较配置D的AP提升11.9%。而对于深层特征(ResNet-50-C4),64 × ROIAlign的反向优化效应表明,紧凑采样策略更匹配中等尺度目标的固有模式。
模型类型对比显示,Mask R-CNN的分割监督使检测头学习到更精确的边界特征,这种任务耦合效应显著缓解了腐蚀区域与背景的低对比度问题,实例分割分支的正则化作用,使配置E在复杂海洋场景下仍能保持稳健的检测性能。
3.4. 尺度敏感矛盾与工程启示
实验结果揭示了尺度敏感性的矛盾,表明单尺度特征难以满足船舶腐蚀检测的多尺度需求。FPN结构通过多尺度特征融合,在APS、APM和APL指标上分别提升5.9%、7.3%和29.5%,尤其显著改善了大范围腐蚀区域的检测一致性。然而,深层特征(C4)在中等尺度目标上的优越表现表明,未来可探索混合尺度特征融合策略,以进一步增强模型的鲁棒性。此外,本研究提出的轻量化部署方案,为船舶智能运维系统提供了技术支撑,所构建的标准化数据集与优化的模型训练策略,不仅提升了检测精度,也为深度学习在海洋工程领域的应用落地提供了有力支持。
4. 研究总结与创新贡献
本研究构建了专门针对于船舶腐蚀检测的数据集合,提出了一种基于深度学习的智能检测方案。在算法层面上,本文选择了多个模型,并在专门的船舶腐蚀检测数据集合上进行有针对性的训练和优化,进行对比分析后选择出最合适船舶腐蚀检测领域的模型组合。研究成果不仅验证了深度学习在船舶腐蚀检测中的可行性,还通过模型架构优化与工程实践改进,提升了检测精度并拓展了应用边界。
本研究构建了融合多尺度特征与动态ROIAlign优化的检测框架。引入特征金字塔网络,实现从浅层细节特征到深层语义特征的多尺度融合。特别是针对小尺寸腐蚀区域易被忽略的难题,在浅层特征引入128 × 大尺寸ROIAlign,从而提升小目标检测精度,有效增强了图像边缘特征的提取能力,使模型在光照不足、锈迹干扰等复杂工况下仍保持稳定的检测性能。
更进一步,本研究将实例分割技术整合到检测框架中,建立了检测与分割任务耦合的训练框架。实验结果表明,分割监督有助于检测头学习更精细的边界特征,使AP75指标相较于纯检测模型平均提升14.9%。这种协同训练策略成功缓解了腐蚀区域与背景区分度低的难题,大幅提升了模型在复杂海洋环境中的鲁棒性。
综上,本研究提出的多尺度特征融合与动态优化检测方案,不仅实现了船舶腐蚀检测的高精度要求,其通用性设计还可应用于海洋工程结构损伤评估、水下目标识别等多个相关领域。通过理论创新与实际应用的有机结合,本研究为船舶腐蚀检测技术的智能化发展提供了可靠的技术支持。
基金项目
本文是上海海事大学2024市级大学生创新创业训练计划项目(项目编号:S20240613)。