1. 引言
铁路信号系统是保障运输安全与高效运行的关键[1],其室内组合架端子区域的接线结构复杂,对后续接线状态分析有重要影响。传统依靠人工核查的方式效率低、一致性差,难以适应高精度与自动化检测需求。因此,实现对端子区域线缆的准确、高效分割,成为提升系统运维自动化水平的重要技术基础。
随着深度学习的兴起,基于卷积神经网络的图像分割方法在线缆分割领域发挥着越来越重要的作用。王松等[2]提出了一种结合深度学习与区域生长的柔性线缆视觉分割方法,通过后处理策略缓解语义分割网络对线缆细长结构建模不足的问题,但该方法对前端语义分割结果仍具有较强依赖性。柏亚鑫等[3]基于DeepLabV3+网络开展柔性线缆实例分割研究,通过虚拟数据集训练并结合拓扑关系分析与相似性约束,有效改善了复杂交叉场景下线缆分割不连续和实例混淆的问题。王军文等[4]通过上下文信息融合与模型轻量化设计实现了客机机舱线缆的高效语义分割,在一定程度上缓解了复杂背景下线缆分割精度与效率之间的矛盾,但该方法整体结构较为复杂,对特定场景和任务仍具有一定依赖性。曹国群等[5]通过引入RGB-D双模态融合与SAGate特征校正机制显著提升了线缆语义分割精度,但该方法依赖深度信息输入,在实际工程部署中对硬件条件具有一定要求。
尽管现有研究在线缆语义分割领域取得了一定进展,但多数方法侧重于分割精度提升,未能兼顾模型复杂度与推理效率,限制了其在实际工程场景中的应用。在线缆检测与维护等任务中,线缆在形态和尺度上的细微差异对分析结果具有重要影响,而传统目标检测方法难以提供精确的目标轮廓,难以满足精细化应用需求。因此,设计一种兼具高分割精度与轻量化特性的线缆分割算法具有重要意义。
本文以YOLOv11分割模型为基线,从轻量化骨干网络设计和多尺度特征建模两方面对模型进行改进,通过引入轻量化主干网络降低模型计算开销,并结合简化空间金字塔池化模块增强多尺度特征表达能力,在保证模型轻量化的同时提升了线缆分割性能。
2. 相关工作
随着语义分割模型在移动端和嵌入式设备中的应用需求不断增加,模型的实时性与计算效率对网络结构设计提出了更高要求。为降低计算开销,研究者提出了多种轻量化骨干网络,如MobileNet [6]、ShuffleNet [7]等,通过引入深度可分离卷积和组卷积有效减少模型参数量和计算复杂度。此外,GhostNet [8]和EfficientNet [9]系列网络在参数压缩与精度平衡方面取得了一定进展。然而,在复杂线缆分割场景中,目标往往呈现细长结构、尺度变化明显且背景干扰较强,上述方法在计算效率与特征表达能力之间仍难以兼顾。为此,ShuffleNetV2 [10]针对实际硬件部署场景对网络结构进行了系统优化,在保证较低计算复杂度的同时具备更高的推理效率,更适用于对实时性和算力约束要求较高的线缆分割任务。因此,如何在保证分割精度的同时进一步降低模型计算量,以适配嵌入式设备的算力限制,仍有待深入研究。
在语义分割任务中,目标尺度变化和上下文信息不足是影响分割性能的重要因素。为增强模型对多尺度目标的表达能力,研究者提出了多种多尺度特征建模方法。空间金字塔池化(Spatial Pyramid Pooling, SPP) [11]通过在不同感受野下对特征进行池化操作,实现了多尺度上下文信息的有效融合;在此基础上,简化空间金字塔池化模块(Spatial Pyramid Pooling-Fast, SPPF) [12]模块通过对传统SPP结构进行简化与重组,在保持多尺度特征融合能力的同时显著降低了计算开销,已被广泛应用于目标检测与分割任务。进一步地,为适应轻量化网络对计算效率的更高要求,部分研究在SPPF基础上提出了更加简化的SimSPPF [13]结构,在减少冗余计算的同时保留关键尺度信息表达能力。然而,传统多尺度模块往往引入额外的分支结构和计算复杂度,在轻量化分割模型中仍可能带来一定的计算负担。尤其在目标结构细长、尺度变化显著且背景复杂的线缆分割场景下,如何在增强多尺度上下文建模能力的同时进一步简化模块结构、降低计算量,仍是值得关注的问题。
3. 模型设计
3.1. YOLO11-seg实例分割算法
YOLO11 [14]是Ultralytics团队于2024年开源的新一代目标检测框架,包含n/s/m/l/x五个版本,通过调整网络深度和宽度平衡精度与效率。其延续了YOLOv8的骨干、颈部和头部网络,并进行了多项优化。骨干网络采用轻量化的C3k2模块,保持丰富的梯度流信息;在SPPF模块后加入C2PSA结构以获取全局特征并降低计算量。颈部采用PAN-FPN结构实现多尺度特征融合,通过自顶向下和自底向上的特征传递增强语义表达和空间定位能力。检测头继承分类与定位解耦结构,并将卷积替换为深度可分离卷积与逐点卷积,有效减少计算量的同时保持精度。
YOLO11-seg在YOLO11网络基础上添加了用于实例分割的原型(Proto),使得模型不仅能够识别图像中的目标位置,还能计算生成像素级别的分类信息,为线缆分割提供了解决思路。YOLO11-seg网络结构如图1所示。
3.2. 改进算法
尽管YOLOv11在多种应用场景中展现出了良好的性能,但在线缆分割任务中仍面临目标结构细长、尺度变化显著以及背景复杂等挑战,导致模型在多尺度特征表征与计算效率方面仍存在改进空间。为此,本文从模型轻量化与多尺度特征建模两个方面对YOLOv11进行改进:一方面,引入ShuffleNetV2主干网络以降低模型参数量和计算复杂度;另一方面,采用简化空间金字塔池化模块(SimSPPF)增强多尺度上下文特征融合能力,从而在保证模型轻量化的同时提升线缆分割性能。改进算法网络结构如图2所示。
Figure 1. YOLO11-seg network structure
图1. YOLO11-seg网络结构
Figure 2. Network structure of improved model
图2. 改进模型网络结构
3.2.1. ShuffleNetV2模块
为了在计算资源有限的条件下实现高效的图像分割,本文采用ShuffleNetV2模块替换原始骨干网络中的C3K2模块,提高计算的效率。ShuffleNetV2通过优化卷积操作和通道设计,实现了计算精度和速度的平衡,使得在计算资源受限的情况下,依然能够保持良好的表现。
ShuffleNetV2通过引入分组卷积(Group Convolution)与通道混洗(Channel Shuffle)机制,在保证计算效率的同时有效增强了特征表达能力。分组卷积使得每个输出通道仅与同组内的输入通道相关联,从而显著降低模型参数量与计算复杂度。然而,单纯使用分组卷积会限制不同通道组之间的信息交互。为此,ShuffleNetV2进一步引入通道混洗操作,通过对通道进行重排,实现跨组特征的信息交换,增强网络对全局特征的建模能力。图3展示了这一创新机制的实现过程。
Figure 3. Innovative mechanism of ShuffleNetV2
图3. ShuffleNetV2的创新机制
在本文的线缆分割任务中,该结构在保持模型轻量化特性的同时,融合不同通道组中的局部细节与全局语义信息,从而提升细长目标的特征表达能力,提高分割结果的准确性与稳定性。图4展示了ShuffleNetV2基本单元的架构,结合了多个操作以提升模型的性能。
图4(a)和图4(b)给出了ShuffleNet原始结构中的基本单元和下采样单元。该网络通过引入分组卷积(Group Convolution, GConv)与通道洗牌(Channel Shuffle)机制,在减少计算量的同时提升了特征计算效率。图4(c)和图4(d)展示了本文采用的ShuffleNetV2网络结构。与原始ShuffleNet不同,ShuffleNetV2取消了分组卷积操作,采用标准的1 × 1卷积以加强不同通道之间的信息交互能力,并通过通道划分(Channel Split)与深度可分离卷积(Depthwise Convolution, DWConv)构建双分支特征提取结构,从而在保持网络轻量化特性的同时提升特征表达能力。此外,如图4(d)所示,改进的下采样单元采用DWConv实现特征降采样,替代传统池化操作,在降低模型复杂度的同时有效减少特征信息损失。该结构更有利于细粒度特征的提取,为复杂线缆分割任务提供了高效且稳定的特征表示。
3.2.2. 高效特征融合金字塔(SimSPPF)
针对线缆分割任务中目标呈细长结构、尺度变化大的问题,本文在YOLOv11-Seg模型中引入SimSPPF模块以增强多尺度上下文建模能力。线缆通常在图像中跨越较大空间范围,仅依赖局部特征容易导致分割结果不连续。SimSPPF通过串行多尺度池化在保持较低计算开销的同时有效扩大特征感受野,有助于模型从全局结构层面理解线缆的整体走向,从而提升分割结果的连通性与完整性。此外,该模块结构简洁,与YOLOv11的轻量化设计理念一致,适合于实际工程场景中的线缆分割应用。
SimSPPF模块由两个主要部分组成:一系列卷积操作:包括一个初始的SimConv卷积层用于将输入特征图进行初步处理,降低通道数为原来的一半。多次最大池化和拼接操作:通过多次最大池化操作和拼接操作,实现对不同尺度特征的融合,最后再经过一个SimConv卷积层将融合后的特征图转换为指定的输出通道数。SimSPPF网络结构图如图5所示。
Figure 4. Basic computational cell architecture of ShuffleNetV2
图4. ShuffleNetV2 的基本单元架构
Figure 5. Architecture of the SimSPPF module
图5. SimSPPF网络结构图
通过以上设计,SimSPPF模块能够有效地提取多尺度特征,并融合这些特征以增强模型对不同大小物体的识别能力。同时,简化的设计使得计算效率更高,适用于对实时性要求较高的计算机视觉任务。
4. 实验结果
4.1. 数据集
针对端子接线颜色的实际情况,本文选取出现频率最高的蓝、红、白三色线缆作为数据集主要样本。数据采集阶段通过变化光照条件、拍摄角度并引入线缆遮挡情况,以增强数据多样性并模拟实际复杂环境。
最终构建的数据集包含1290张图像,覆盖黑白背景及单/多端子不同场景。所有图像均使用Labelme进行精细标注,记录每个端子的类别与位置信息,为模型特征学习提供关键信息。部分数据示例如图6所示。
为保障训练过程规范可靠,将数据集按8:1:1随机划分为训练集、验证集和测试集,确保模型训练与性能评估的数据独立性。
Figure 6. Sample images in the dataset
图6. 数据集中的样本图像
4.2. 实验环境
本研究构建的深度学习模型基于Ubuntu Linux 20.04操作系统,依托PyTorch 2.0.0这一强大的深度学习框架,并采用Python 3.11版本进行编程实现。实验的硬件配置中,搭载了高性能的NVIDIA Tesla T4显卡与英特尔Xeon 8255处理器,确保了计算效率与处理速度。在模型训练过程中,我们设置了300个训练轮次(Epochs),图像尺寸确定为640像素,每批次(Batch Size)的大小为16,以平衡训练速度与内存消耗。初始学习率定为0.001,采用Adam优化器来调整模型参数,以期达到更优的训练效果和收敛速度。
此外,为验证模型在嵌入式端的适用性,选用野火LubanCat-5开发板作为测试平台。该设备基于瑞芯微RK3588芯片,集成四核Cortex-A76与四核Cortex-A55处理器,内置6 TOPS算力的NPU,配备16 GB内存,并运行Ubuntu 20.04操作系统。
4.3. 评价指标
本研究通过对比改进模型与原始模型在相同实验设置下的图像分割结果,评估算法性能。评价指标包括精确率(P)、mAP50:95、浮点运算次数(FLOPs)和参数量。精确率衡量模型预测为正样本中真正例的比例,召回率表示实际正样本中被模型正确识别的比例。其计算公式如下:
(1)
其中TP指被正确识别为正例的实例,FP表示被错误分类为正例的实例,FN则代表实际为正例但被错误分类为负例的实例。
平均精度均值(mAP)通过对各类别平均精度(AP)进行平均计算,用于综合评估模型的分割性能。本文采用mAP0.5:0.95作为评价指标,即在IoU阈值从0.5到0.95 (步长为0.05)的条件下计算并取平均值,以全面反映模型在不同重叠精度要求下的分割效果。计算公式如下:
(2)
(3)
GFLOPs指每秒执行的浮点运算次数(以十亿计),为资源受限环境下的适用性提供参考依据。参数量(Params)通过量化模型中可学习参数的规模,直观反映模型的复杂程度,是评估模型存储开销及训练计算资源需求的重要指标。这些指标相互补充,从多维度为改进模型性能、开展性能验证提供全面深入的分析视角。
4.4. 消融实验
为进一步验证各改进模块对模型性能的影响,本文设计了三组消融实验,分别分析ShuffleNetV2主干网络和SimSPPF模块在模型中的作用与贡献。虽然理论计算量(GFLOPs)和参数量在一定程度上能够反映模型的复杂度,但二者并不能完全等价地刻画模型在真实嵌入式硬件平台上的运行效率。为全面评估所提出模型在边缘设备上的实际部署可行性及其实时推理性能,有必要在具体嵌入式平台上对模型进行推理测试与性能评估。基于相同的训练集、验证集和测试集配置,各组消融实验的结果汇总如表1所示。
Table 1. Results of ablation experiments
表1. 消融实验结果
模型 |
SimSPPF |
ShufflenetV2 |
准确率 |
mAP@0.5:0.95 |
浮点运算量/GFLOPs |
参数量/M |
FPS (嵌入式平台) |
1 |
× |
× |
0.978 |
0.896 |
9.6 |
2.83 |
16.93 |
2 |
√ |
× |
0.979 |
0.91 |
9.6 |
2.83 |
17.44 |
3 |
× |
√ |
0.973 |
0.894 |
8.0 |
2.33 |
21.11 |
4 |
√ |
√ |
0.984 |
0.918 |
8.0 |
2.32 |
21.99 |
由模型1与模型2的对比可以看出,在模型参数量和计算量保持不变的前提下,引入SimSPPF模块后,模型的mAP@0.5:0.95由0.896提升至0.910,准确率由0.978提升至0.979,同时嵌入式平台上的推理速度由16.93 FPS提升至17.44 FPS。该结果表明,SimSPPF模块能够在不增加模型复杂度的情况下有效增强多尺度上下文特征的表达能力,对分割性能和实际推理效率均具有积极作用。
进一步对比模型1与模型3可以发现,当采用ShuffleNetV2作为主干网络后,模型参数量由2.83 M降低至2.33 M,计算量由9.6 GFLOPs降至8.0 GFLOPs,显著降低了模型复杂度。尽管分割精度略有下降,但嵌入式平台上的推理速度由16.93 FPS显著提升至21.11 FPS,提升幅度约为24.6%,验证了ShuffleNetV2在模型轻量化和嵌入式实时推理方面的显著优势。
当同时引入SimSPPF模块与ShuffleNetV2主干网络(模型4)时,模型在保持较低参数量(2.32 M)和计算量(8.0 GFLOPs)的同时,mAP@0.5:0.95提升至0.918,准确率达到0.984,嵌入式平台推理速度进一步提升至21.99 FPS,相较基线模型提升约29.9%,取得了分割精度与实时性能的最佳平衡。上述结果表明,SimSPPF模块与ShuffleNetV2在增强模型特征表达能力和降低模型复杂度方面具有良好的互补性,使得改进后的模型能够在复杂背景下实现高精度、实时的线缆分割,为后续的边缘设备部署提供了有力支撑。
原始模型推理结果 加入ShuffleNetv2后的推理结果
Figure 7. Ablation results illustrating the effect of the ShuffleNetV2 module
图7. ShuffleNetV2模块对模型性能的影响
从图7可以观察到,在未采用ShuffleNetV2主干网络时,模型对线缆区域的预测置信度整体偏低,尤其在线缆边缘及局部细节处响应不稳定。引入ShuffleNetV2后,在分割结构基本保持一致的情况下,模型对线缆区域的响应更加集中,预测置信度显著提升,分割结果更加清晰可靠。这表明ShuffleNetV2并非主要通过提升模型表达能力来提高分割精度,而是依托高效的通道分裂与重排机制,在降低参数量和计算复杂度的同时,使特征传递更加高效稳定,从而提升模型对细长线缆目标的响应一致性。该结论也与消融实验结果一致:由模型1与模型3的对比可知,采用ShuffleNetV2后,模型参数量由2.83 M降至2.33 M,GFLOPs从9.6降至8.0,嵌入式平台上的推理速度提升约24.6%,而分割精度仅出现轻微变化,验证了其在轻量化与推理效率方面的有效性。
原始模型推理结果 加入SimSPPF模块后的推理结果
Figure 8. Ablation results illustrating the effect of the SimSPPF module
图8. SimSPPF模块对模型性能的影响
如图8所示,原始分割模型在复杂背景下对线缆与套管目标的分割结果存在明显不足,主要表现为分割断裂、单一目标被预测为多个实例,以及相邻套管之间的误融合等问题。这主要是由于线缆类目标具有细长结构特性,局部外观相似度较高,仅依赖局部特征容易导致上下文理解不足。引入SimSPPF模块后,模型能够有效融合不同尺度的空间上下文信息,显著增强对目标整体结构的建模能力,从而减少分割断裂和实例混淆现象。对比结果表明,改进后的模型在保持计算效率的同时,显著提升了实例分割结果的完整性与稳定性。
4.5. 对比实验结果
为验证所提出模型的有效性,本文将其与多种主流轻量化分割模型进行对比实验,实验结果如表2所示。可以看出,所提出模型在分割精度和计算效率之间取得了更优的平衡。
Table 2. Comparison of experimental results
表2. 对比实验结果数据
模型 |
准确率 |
mAP@0.5:0.95 |
浮点运算量/GFLOPs |
参数量/M |
YOLOv11n-seg |
0.973 |
0.894 |
9.6 |
2.83 |
YOLOv8n-seg |
0.977 |
0.897 |
12.0 |
3.26 |
YOLOv12n-seg [15] |
0.98 |
0.875 |
10.2 |
2.81 |
Mask-RCNN |
0.972 |
0.862 |
46.5 |
9.56 |
Ours |
0.984 |
0.918 |
8.0 |
2.32 |
相比YOLO11n-seg,本文方法在保持浮点运算量基本不变(8.0 GFLOPs)和参数量几乎一致(2.32 M vs 2.33 M)的情况下,准确率由0.973提升至0.984,mAP@0.5:0.95提升至0.918,表明所提出的结构改进能够在不增加模型复杂度的前提下显著增强特征表达能力。
与YOLOv8n-seg和YOLOv12n-seg相比,本文模型在参数量和计算开销明显更低的情况下,仍取得了更高的分割精度,进一步验证了其在轻量化分割任务中的优势。上述结果表明,本文方法在保证模型轻量化的同时,有效提升了分割性能,具有较好的工程应用价值。
4.6. 可视化实验结果
为了直观评估模型的分割性能,本文对分割结果进行了可视化对比分析。如图9所示,与基线模型相比,改进模型在复杂线缆场景下能够更准确地提取线缆区域,其分割结果在边界完整性和结构连续性方面均表现出明显优势。基线模型在部分细长线缆区域容易出现分割断裂或误分现象,而改进模型能够
Figure 9. Visualization results
图9. 可视化结果
较好地保持线缆结构的连贯性。同时,改进模型在对应线缆区域给出的预测置信度整体更高,表明模型对目标区域的判别更加可靠。这表明所提出的方法在复杂场景下具有更强的特征表达能力和更好的分割稳定性。
5. 总结
本文提出了一种融合ShufflenetV2引入轻量化主干网络和简化空间金字塔池化模块的线缆分割网络。使用ShufflenetV2轻量化主干网络,旨在减少降低模型参数量和计算复杂度,为分割模型在边缘设备部署提供解决思路。在特征融合金字塔部分使用SimSppf模块,旨在增强多尺度上下文特征融合能力,从而在保证模型轻量化的同时提升线缆分割性能。在自建线缆数据集上的实验结果表明,该模型的准确率和浮点运算次数均优于基线YOLO11n-seg和其他对比模型。通过消融实验,证明了融合ShufflenetV2模块和简化空间金字塔池化模块的有效性。这一改进为线缆分割提供了新的思路。未来工作将进一步从模型结构优化与应用场景扩展两方面入手,在保持轻量化优势的基础上提升复杂场景下的分割鲁棒性,并探索模型在实际工程环境中的应用潜力。