1. 引言
相位敏感光时域反射仪(Phase-sensitive Optical Time Domain Reflectometer, φ-OTDR)作为分布式光纤振动传感的核心技术[1],通过解调背向瑞利散射的相位变化,可实现亚米级空间分辨率的事件检测,在周界安防、管道泄漏监测及铁路沿线安全预警中具有不可替代的作用[2] [3]。然而,复杂环境下多类型事件(如机械挖掘、人员行走、车辆通行)会导致信号呈现非线性、非平稳及低信噪比特性,传统基于阈值判决[4]或浅层机器学习如支持向量机[5]等方法面临特征表征能力不足与泛化性能受限的挑战。
近年来,φ-OTDR信号处理研究逐步从单一事件检测向局部-全局协同分析演进。在局部事件精细化识别方向,Chen等[6]提出了一种基于信号特征空间的φ-OTDR事件识别方法,该方法能有效构建类边界并缩小类内距离;同时,更精确的类边界有助于剔除未知类样本,进而提升未知类的分类准确率。Meng等[7]基于XGBoost模型提出数据驱动识别方法,在高频外部入侵事件中实现了高达98.5%的平均识别准确率;刘念超等[8]提出了一种基于时域振幅特征提取和无监督聚类的方法,通过计算相邻数据点差值、提取关键特征,并使用层次聚类对振动事件进行分类,相较于主流神经网络算法,需要更少样本且无需手动标记;Zhang等[9]提出端到端高精度光纤振动信号检测与识别算法,将一维振动信号序列及其二维图像分别输入一维卷积神经网络与二维神经网络进行自动特征提取。随后通过多头自注意力机制的多层Transformer编码器结构融合时域与频域的多模态特征,并输入多层感知器进行分类;Li等[10]提出了一种振动事件识别网络模型,整合卷积神经网络、双向门控循环单元及注意力机制,其中注意力机制同时关注二维空间提取的特征。采用两种交叉注意力机制融合二维特征。最终通过全连接层与softmax激活函数输出分类概率;Tian等[11]提出基于通道注意机制的时间卷积网络,结合空间注意机制与双向长短期记忆网络,用于相位敏感光时域反射仪信号识别。
在全局监测与多事件协同分析方向,研究聚焦于长距离信号衰减补偿、多事件并发定位及跨模态验证。Jia等[12]提出一种结合极端学习机与费雪评分特征选择的事件识别方法,用于降低基于相敏光时域反射仪的光纤分布式干扰传感器的误报率。彭怀敏等[13]提出一种基于小波包降噪与特征投影的相位敏感光时域反射仪振动定位算法,利用φ-OTDR进行光缆长度定位,有效应对实际光缆线路中的干扰信号问题。Zhang等[14]采用白鲸优化算法(BWO)优化极端学习机(ELM)初始参数,构建BWO-ELM多分类φ-OTDR曲线分析故障模式识别方法,可获取光纤故障点的直线距离与类型,为故障定位奠定基础;Gan等[15]提出适用于小数据集的φ-OTDR系统融合特征提取方法。基于VGGish框架的迁移学习方法提取频域信号的高维特征。通过整合12个不同空间采样点的特征,可反映信号的空间分布特性。这些特征与时空特征融合后,经样本特征校正算法处理,最终应用于支持向量机分类器进行事件识别;Li等[16]提出基于端到端卷积神经网络–长短期记忆混合模型与双三次缩放的轻量化模型与数据组合方法,实现了空间信息与时间相关信息的融合。相较于仅利用单一图像结构信号训练的传统方法,该轻量化方案能更快实现更高验证精度;臧益鹏等[17]通过对小波去噪算法进行改进,获得新的阈值选取方式和阈值判断函数,结合小波模极大值法和斜率法定位测量光纤发生事件位置和光纤始末端位置,计算事件衰减损耗的同时对事件进行分隔和误判消除;李笑等[18]者提出了强度和相位二维信号混合输入的模式识别方法,有效降低干涉衰落对模式识别准确率的影响。
为了进一步提高光纤传感事件检测精度,本文提出一种ResNet-Mamba双分支协同模型,通过ResNet模块提取多尺度局部时空特征,结合Mamba模型的选择性状态空间机制建模全局动态关联,并设计跨模态注意力融合模块实现特征自适应交互。
2. 相关理论
2.1. ResNet模型
ResNet模型是具有代表性的深度卷积神经网络模型,该模型拥有捕捉图像中的细微特征和信息的能力,在构建非常深的神经网络模型的同时提高了参数的利用效率,其核心思想在于在卷积神经网络之中加入了残差块,残差块通过在结构中增加跳跃连接,实现了高层直接对低层进行信息传递,使得网络可以更好地捕获不同层次的特征。残差块的结构如图1所示。
Figure 1. Diagram of residual block structure
图1. 残差块结构图
输入值
经过两次权重层的映射得到
,然后再与自身的恒等映射叠加得到
,将学习目标转换为
和自身恒等映射
的差值,即
。残差模块的数学运算表达式如公式(1)和(2)所示。
(1)
(2)
其中,
和
为网络中第
层的输入与输出,
表示恒等映射函数
为残差模块,
为权重矩阵,
为激活函数。对于任意一个深度残差网络深层
到浅层
的表达式表示为公式(3)形式。
(3)
基本的残差块结构能够有效的降低卷积神经网络训练的复杂度,加速网络收敛,极大的促进了深度卷积神经网络的发展,有效地提高了网络的性能。
2.2. Mamba
状态空间模型(State Space Model, SSM)可以表示任何具有潜在状态的循环过程。它使用一阶微分方程来描述系统的内部状态演化,并使用另一组方程将潜在状态与输出和输入序列联系起来。
可以通过潜在状态
映射到输出序列
,如等式(4)和(5)所示:
(4)
(5)
其中,矩阵
,
,
是可学习的。连续序列以步长
离散化,得到离散SSM模型:
(6)
其中
和
分别为:
,
。用线性递归方法可以有效地计算从
连续形式到
离散形式的过渡。在SSM的基础上,序列结构化状态空间(S4)模型利用分层多项式投影算子(Hierarchical Polynomial Projection Operators, HiPPO)进行初始化,为状态矩阵A添加结构,以改善长距离依赖建模。
在S4的基础上,Mamba引入了一种选择机制,使参数
,
,
成为输入的函数,并利用动态随机存取存储器和静态随机存取存储器的特性有效地实现了选择性SSM。在S4的基础上,Mamba引入了一个选择机制,基本单元Mamba Block如图2所示。
Figure 2. Mamba block
图2. Mamba块
3. OTDR事件检测模型
3.1. 模型设计
为了验证Mamba在OTDR事件检测中的适用性,本文提出了一种基于ResNet18和Mamba的深度学习模型。该模型以一维光时域反射(Optical Time Domain Reflectometer, OTDR)信号作为输入。首先,信号通过一个二维卷积层(卷积核大小7 × 7,步长2,输出通道数64)进行初步特征提取,并采用批量归一化(BatchNorm)和ReLU激活函数。随后,特征经过3 × 3最大池化层(步长2)进行下采样,并输入到四个连续的残差块序列中。每个残差块由一个带有降采样的ConvBlock (步长2)和一个IdentityBlock组成,以提取更深层的特征信息。第一、第二、第三和第四个残差块的卷积滤波器数量分别为64、128、256和512。
提取的层次化特征随后被输入到全局特征提取模块Mamba中,以增强时序依赖性并捕捉远程特征信息。最终,经过全局平均池化层处理后,特征输入到全连接的softmax分类器,实现OTDR事件的分类。该模型的具体架构如图3所示。
Figure 3. Structure of ResNet-Mamba network
图3. ResNet-Mamba网络结构
3.2. 模型工作流程
该模型分为两个阶段:训练和测试。模型训练和测试的工作流程如图4所示,采用公开数据进行性能验证[19],具体包括以下步骤:
1) 对获取到的OTDR信号进行归一化处理,将按8:2的比例划分为训练集和测试集,数据集包含六种类型的OTDR事件,包括背景噪声(2946个样本)、挖掘(2512个样本)、敲击(2530个样本)、浇水(2253个样本)、摇动(2728个样本)和行走(2450个样本),总共15,419个样本。
2) 在训练阶段,在模型输入数据并通过前向传播计算结果。CNN-Mamba网络接收OTDR信号,利用提取的特征并输出事件类别。同时,模型通过计算模型预测结果与真实标签之间的误差即损失值来进行反向传播处理,通过优化器更新模型参数。重复这个过程,通过调整权重,提升模型的事件检测能力。
3) 在每个训练周期结束后,采用验证集对模型的准确率进行评估。当模型的准确率达到设定阈值,或损失值幅度在连续多个epoch下降较小,则终止训练,防止过拟合。如果模型的准确率没有达到阈值,则进一步进行训练直到达到最大迭代次数。
4) 训练完成后,保存模型参数以便后续使用测试集进行评估使用。将OTDR测试集信号输入模型,计算分类准确率、损失值等指标。如果测试结果满足符合应用需求,则将模型用于OTDR事件检测,否则采用调整网络结构、增强数据集或改进训练策略等进一步优化。在测试阶段使用混淆矩阵分析模型在不同类别上的表现,评估每个类别的准确率、召回率和 F1 分数,从而判别模型的强项与弱点,进一步提升其检测性能。
Figure 4. Diagram of work flow
图4. 工作流程图
4. 实验结果与分析
φ-OTDR事件检测的常用评价指标包括F1评分、准确率、精确率和召回率。其中,F1得分和准确率是评价事件检测模型的最关键指标。在表1中,传统事件检测算法的总体准确率低于90%。CNN表现最好,BiLSTM其次,SVM表现最差。基于改进深度学习的事件检测算法的整体性能优于传统事件检测算法,准确率在94%以上。基于ResNet的φ-OTDR事件检测算法准确率高于94%,加入Mamba块后的ResnNet-Mamba模型准确率达到99.74%,表明模型的整体性能优良。很明显,基于ResnNet-Mamba的φ-OTDR事件检测模型的性能优于CNN、SVM、BiLSTM和ResNet,这表明选择性ResnNet-Mamba提高了模型的整体性能。
Table 1. Comparison of different algorithms
表1. 不同算法比较
模型 |
准确率 |
精确率 |
召回率 |
F1 |
CNN |
93.23% |
93.15% |
92.87% |
92.98% |
SVM |
83.24% |
84.51% |
82.55% |
82.99% |
BiLSTM |
87.87% |
87.88% |
87.87% |
87.86% |
ResNet |
94.94% |
94.84% |
94.83% |
94.45% |
ResNet-Mamba |
99.74% |
99.73% |
99.74% |
99.74% |
为了直观地观察不同的基于深度学习的事件检测方法在训练过程中损失和准确率的变化,我们将这些方法在训练和验证过程中的损失减少和准确率可视化,如下图5所示。
Figure 5. Loss value and accuracy of different models
图5. 不同模型的损失值和准确度
图5(a)和图5(c)表示训练和验证的损失值变化曲线,损失值曲线的下降趋势反映模型在训练数据上逐渐学习到数据的规律和模式,即模型对训练数据的拟合程度,损失值在训练和验证收敛过程中的曲线震荡很大,表明数据提供的信息对于训练任务来说可能包含无用的信息,在训练达到100轮后,相对于其他三种算法,ResnNet-Mamba算法的损失值最小,表面模型对φ-OTDR事件检测的效果最好,展现出更好的拟合效果。训练和验证的准确率曲线如图5(b)和图5(d)所示,总体而言,五条曲线均呈逐步上升趋势, 并最终实现了收敛,所提的ResnNet-Mamba算法的收敛速度最快,最终准确率也最高,达到99.74%,改进前的ResNet准确率也达到94.94%,而传统的BiLSTM算法准确率最低。
为了观察不同方法对不同类型振动信号的分类性能,我们使用混淆矩阵可视化不同模型的诊断结果,如图6所示。混淆矩阵纵轴表示真实标签,横轴表示分类模型的分类标签,改进型ResnNet-Mamba算法模型的分类结果相比原始ResNet模型,在背景噪声、挖掘、敲击、浇水、摇动和行走六个类别上分别多预测正确5、40、10、9、29和69个样本。改进后的ResnNet-Mamba算法模型对每个类别的分类效果相近,没有出现对某一类分类很差的情况。与其他方法相比,基于改进后的ResnNet-Mamba的模型具有更高的诊断准确性。
Figure 6. Diagnostic confusion matric of different models
图6. 不同模型的诊断混淆矩阵
5. 结束语
本文提出了一种基于ResNet-Mamba的改进φ-OTDR事件检测模型。该模型在ResNet网络的基础上,首先针对OTDR信号特点优化残差块结构,以减少计算冗余并提升特征提取能力;然后结合Mamba状态空间模型,引入全局状态建模机制,以增强模型对长时序依赖关系的捕获能力,提升对弱事件信号的识别能力。分类性能评估实验结果表明,与其他深度学习模型相比,改进后的ResNet-Mamba模型准确率波动最小且表现稳定;在准确率、精确率、召回率和F1分数上,相较于ResNet模型提高了4.8%,相较于CNN、SVM、BiLSTM等传统方法提高了6.51%~16.5%。该模型有效增强了对φ-OTDR信号事件的特征提取和分类能力,可应用于光纤传感安防监测等场景,实现对复杂环境下的振动事件精准检测,从而提高光纤传感系统的智能化水平。
基金项目
中国南方电网有限责任公司科技项目(GZKJXM20232598)。