1. 引言
在地震勘探作业中,实际采集的地震数据会受到多种噪声的干扰,这些噪声的频率范围广泛,给后续的地震数据处理带来了显著挑战。如何从充满噪声的数据中精准提取有效信号,从而提升地震数据的信噪比与分辨率,已成为地震信号处理领域的重点研究方向。
传统降噪方法中,Liu等[1]提出了中值滤波器,用具有差异化变动特性的滤波窗口,依据不确定性灵活调整窗口参数,降低数据中的高频随机噪声干扰。频率–波数(f-k)域滤波[2]则依托一种关于视速度能量分布差异化的特点,将有用信号及噪声按照该域内的区域分离出来,以达到理想的信噪解构效果。徐云霞等[3]在f-x域基础上成功衰减了多次波,而Gülünay [4]直截了当地优化了f-x反褶积算法,使得其可以更强力压制随机噪声。数学变换方法也能实现噪声与有效信号分离,如经验模式分解[5] (EMD)、傅里叶变换[6]、奇异值分解[7] (SVD)以及剪切波(Shearlet)变换[8]等。Liu等[9]通过综合曲波变换与压缩感知,调节稀疏系数来优化信号与噪声的分离。Li等[10]结合改进的经验模态分解和小波阈值,深入分析了信号特征信息的储存方式以提升信号净化效果。Zhu等[11]通过多尺度结构与稀疏性原则实现地震信号降噪,其多尺度设备表征可以有效地从稀疏系数中获得相关特征。Chen等[12]以一种双稀疏字典阐明了如何能更高效减少随机背景噪声造成的影响。
随着神经网络的出现,传统降噪方法由于低下的处理效率和复杂的参数设定[13] [14],难以应对大规模多区域地震数据普遍性的去噪需求。李海山等[15]尝试将一种深度残差网络应用于叠前地震数据以实现随机噪声的调控。陈天等[16]使用深度卷积神经网络模型学习地震数据的噪声,能够有效地抑制地震数据中的随机噪声。U-Net是一种卷积神经网络架构,因其高效且灵活的特性被广泛应用于计算机视觉任务。但其网络结构相对简单,特征的提取和利用方式较为有限,对复杂的噪声分布学习不够充分,难以准确地调整参数以去除所有类型的噪声,特别是当噪声的强度和分布在不同区域变化较大时。王钰清等[17]结合数据增广与U-Net网络,通过对现实世界收集的数据进行标注,以此来达到有效去除其中随机噪声的目的。张岩等提出一种基于特征强化U-Net的地震速度反演方法[18]。罗仁泽等[19]提出一种残差U型网络(RU-Net)结构的创新方法,与现有去噪策略进行比较,其在完整性上表现出超越性的去噪能力并增加了抵抗失灵状态的稳健性。
为解决上述问题,本文提出了CBAM-U-Net++网络模型用于地震数据去噪,即引入U-Net++模型架构,采用嵌套和分层的密集连接以及优化的跳跃连接,在不同尺度上进行多层次的特征融合,提升对重要特征的捕获能力;融合卷积注意力机制CBAM,针对通道与空间特征进行注意力建模,构建双维度上的语义依赖关系,抑制复杂噪声的表征能力,从而提升去噪的精度与效率。在以理想地震数据图像与实际地震数据图像为自制数据集上训练与测试后,验证了该模型能够更高效、更精确地降低地震数据中噪声的影响,对地震数据的智能化监测与检测具有重要的意义。
2. 研究方法
2.1. U-Net
U-Net主要由编码器-解码器和跳跃连接组成,网络结构如图1所示。编码器由5组卷积模块与4个压缩层组成,每组卷积块都配置有双3 * 3卷积操作,以及搭配的ReLU激活函数,用以挖掘图像特征。下采样过程中,通过单个2 * 2最大池化实现对特征图的降维。这些额外卷积与激活功能的堆叠,提升网络表达力的同时,也保存了局部的特征信息;最大池化层则有效减少了计算的复杂度,提高了计算效率。解码与编码类似,由4组卷积框架及上采样层支持,通过2 * 2转置卷积恢复尺寸,逐级还原先前被压缩的震动信号。逐级效率确保着分割环节不牺牲任何细节信息,结合跳跃连接装置能够充分融合编程建立高精细特色,强化排除噪声的表现。
Figure 1. Structure of the U-Net network
图1. U-Net网络结构
但U-Net模型在地震数据去噪任务中仍面临着制约与困境,主要源于地震讯息成套的复杂波型与不同频率组件。研究显示,该模型在进行卷积时受限于视野范围,识别整条数据的连贯性与交互能力受到影响,从而造成部分关键特征的提取不足;另外,卷积架构未能在最大程度上利用特征图各通道之间的复杂关联关系,在地震信号提取时,无法有效增强该领域信号特点并压制那些无意义背景信息,如微弱环境噪声等,从而难以准确清晰地划分地震信号与背景的界限。
2.2. U-Net++
针对上述问题,本次研究引入了U-Net++模型,结构如图2所示。U-Net++模型可以采用深度监督机制,即在不同深度进行监督训练,对不同层次的解码器输出都计算损失并进行反向传播,这使得模型在训练过程中,每个层次都能够得到优化和调整,而不仅仅是依赖于最终的输出层。U-Net++的跳跃连接综合了长连接和短连接,不仅存在编解码器之间的连接,还存在解码器内部的连接,形成一种嵌套、密集、多层次的特征融合结构,减少了编解码器之间特征映射的语义差距,使得特征能够在不同的尺度和层次之间更加灵活地流动和融合。其中,编码器部分对原始地震信号进行了多层下采样操作,逐级提取出多层次的抽象特征,这些特征涵盖了从简单的局部波形特征到与震源、地震波传播宏观特性相关的高级语义特征,但同时也不可避免地丢失了大量细节信息,信号特征可能存在混杂、模糊的情况。
Figure 2. Structure of the U-Net++ network
图2. U-Net++网络结构
2.3. CBAM-U-Net++
本文提出的CBAM-U-Net++模型是在引入U-Net++的基础上,于多层次下采样操作中的每一卷积块内都添加基于卷积的注意力模块(Convolutional Block Attention Mechanism, CBAM),增强网络的特征表达能力,结构如图3所示。
Figure 3. Structure of the CBAM-U-Net++ network
图3. CBAM-U-Net++网络结构
图4(a)展示了CBAM注意力模块的结构。该模块架构在通道和空间双维度上,通过CAM与SAM两种机制构建语义依赖关系,对空间位置与特征通道全方位关注,以此增进图像分割任务的精确性及系统稳定性。CAM专注于夯实不同通道中的联结关系,通过全局平均池化层与全连接层自适应调整通道权重,使得信号之间的差异性更为显著,有效激发震动信息的特征表达能力,其结构如图4(b)所示。更新特征图F'的计算公式为:
(1)
式中:
为加权后的特征图;C为通道数;H和W分别为特征图的高度和宽度;i和j分别为特征图中的行数和列数;
和
为2个全连接层的权重矩阵;R是ReLU激活函数;σ是sigmoid函数。
Figure 4. Structure of Convolutional Block Attention Mechanism
图4. CBAM注意力机制结构
而SAM解决了传统U-Net模型在细节特征提取上不足的问题,主要利用7 × 7卷积核聚焦空间关键区域,增强对重要特征的关注力,抑制不相关的背景信息,来提高对地震信号细节特征的捕捉能力,其结构如图4(c)所示。更新特征图F"的计算公式为:
(2)
式中:
;
为通道数;i,j分别为行数和列数;Conv7×7为7×7的卷积核;σ为Sigmoid激活函数,用于将卷积输出映射到[0, 1]之间。
3. 实验验证
3.1. 数据集准备
本文提出的去噪模型,其训练集由两部分组成:即纯净信号数据集及其噪声数据集,由人工合成记录和实际观测记录(7m_shots_0201_0329等)而得,数据集为亚马逊S3不同研究机构和开放的项目数据。为增广数据集合,使用Numpy工具进行一系列操作,包括对分块后数据的旋转、水平或垂直翻转,以及交替顺序翻转旋转等方式,以完成数据增强处理后,再施加归一化处理。此外,该噪声集合包含多层次高斯白噪音与实况杂噪声记录。在网络输入方面,从中选取30,000个尺寸大小40 × 40的含噪数据,在测试阶段则采用不同于训练集合的人工生成数据,以及未知噪音的真实地震资料。噪声公式为:
(3)
x是原始数据,y是加入噪声后的数据,
是与x同维度的随机噪声矩阵,
表示噪声矩阵中的每个元素,
服从高斯分布。
3.2. 参数设置
通过训练与学习,以及参数的评估,本文选择参数设置如表1所示。主要参数设置如下:批量大小32,迭代次数为50,卷积层深度为9层(4层上采样,4层下采样,1层中间层),学习率为10−3,在15,30,45迭代次数时在原有学习率基础上乘0.2使用Adam优化器。
Table 1. Parameter setting of the network
表1. 网络参数设置
网络参数 |
|
Patch size |
40 × 40 |
Epoch |
50 |
Network depth |
9 |
Batch size |
32 |
Learning rate |
10-3 |
Learning rate |
10-3 |
4. 结果分析
4.1. 理想地震记录测试结果
研究利用Tesseral软件构建了一个理想状态下的纯净地震记录模型。该模型包含64道地震道,每道地震道的采样点数为64,采样时间间隔设定为0.004秒,满足地震信号时域采样和空间分辨率的需求。如图5所示为该地震剖面的平均振幅频谱曲线,从图中可以观察到,地震信号的主要频率能量集中分布于20 Hz至40 Hz之间,频谱特征呈现出较为明显的主频峰值,说明所模拟的地震记录具有典型的中低频特征。此外,频谱在40 Hz以上逐渐衰减,表明模型信号中高频成分较弱,符合实际地震资料中信号的频率特征。
为验证CBAM-U-Net++模型在地震信号去噪的性能,选取传统地震去噪中的小波变换、F-k滤波、KSVD算法进行对比。图6中(a)为纯净合成地震数据,选取数据的前500道,每道包含187个采样点,采样间隔时间0.01秒。在(a)中添加50%的高斯白噪声得到噪声数据(b),随机噪声的分布严重干扰了有效信号,难以识别地震信号中的真实信息。KSVD算法去噪后的数据整体更清晰,但黄色区域中仍能察觉到残留的噪声迹象。小波变换在有效去除噪声的同时,较好地保留了数据的重要特征,黄色方框内的有用信号清晰可辨,相较于KSVD算法,噪声残留更少,但局部细节的清晰度略有不足。F-k滤波在一定程度上减少了噪声的影响,但黄色方框区域出现了波形扭曲的状况,表明该算法在去噪过程中对数据的原始形态产生了影响,使信号的结构发生了改变。U-Net模型提升了数据的视觉效果,黄色方框内的噪声明显减少,有效信号的轮廓基本保留,但仍存在一些细小的噪声点,细节处理上不够完美。U-Net++模型噪声去除更为彻底,黄色方框内的有效信号特征保留得较为完整,相比U-Net在细节处理上更加精细,然而在复杂噪声区域的处理效果还有待提升。CBAM-U-Net++模型处理后的数据,从整体来看噪声几乎被完全消除,黄色方框内的信号细节丰富且层次分明,实现高效去噪的同时也最大程度地保留了信号特征。
Figure 5. Spectrum of seismic section
图5. 地震剖面频谱
Figure 6. Denoising results of ideal seismic records
图6. 理想地震记录去噪结果
为验证在不同噪声水平下改进模型的去噪性能,在训练集和测试集分别加入不同水平的噪声,并计算PSNR值和SSIM值,表2展示了不同噪声水平下的量化指标。F-k滤波在低噪声水平下表现较优,但其PSNR随噪声强度增加显著下降,表明其对非线性噪声建模能力不足;KSVD算法高水平噪声下PSNR升高,但其SSIM整体偏低,反映结构信息保留能力较弱;小波变换在中等噪声下表现稳定,但高噪声下性能迅速退化,凸显多尺度阈值策略的敏感性。CBAM-U-Net模型在全噪声范围内PSNR显著优于传统方法,但其SSIM在高噪声场景下仍有待提升;CBAM-U-Net++模型凭借密集跨层连接与注意力机制的协同作用,在全部噪声水平下均实现最优性能,PSNR下降幅度较小,SSIM始终高于0.88,验证了动态特征加权对噪声抑制与结构保真的平衡能力。
Table 2. PSNR and SSIM of different algorithms under different noise levels
表2. 不同算法在不同噪声水平下的PSNR和SSIM
噪声水平 |
评价指标 |
Input |
F-k滤波 |
KSVD |
小波变换 |
CBAM-U-Net |
CBAM-U-Net++ |
σ = 20 |
PSNR |
28.13 |
32.66 |
27.64 |
30.75 |
32.85 |
35.29 |
|
SSIM |
0.75 |
0.90 |
0.79 |
0.90 |
0.89 |
0.92 |
σ = 30 |
PSNR |
24.61 |
31.53 |
27.76 |
29.12 |
31.28 |
34.67 |
|
SSIM |
0.63 |
0.86 |
0.78 |
0.85 |
0.83 |
0.92 |
σ = 40 |
PSNR |
22.12 |
29.07 |
27.10 |
27.38 |
30.83 |
33.51 |
|
SSIM |
0.53 |
0.78 |
0.75 |
0.80 |
0.83 |
0.91 |
σ = 50 |
PSNR |
20.17 |
28.05 |
28.32 |
27.10 |
29.99 |
32.02 |
|
SSIM |
0.45 |
0.74 |
0.78 |
0.76 |
0.81 |
0.88 |
4.2. 消融实验结果
为研究影响网络性能的因素,本文通过几个方面进行消融实验分析:探讨空间注意力机制和通道注意力机制以及CBAM混合注意力机制在U-Net++模型中的去噪效果,以及传统U-Net模型和改进模型U-Net++的去噪效果。
如表3所示,在运用通道注意力机制时,PSNR和SSIM指标均有显著提升,这表明模型能够更为精准地筛选与利用通道信息,有效增强了对重要特征的捕捉能力,进而提升图像的像素质量与结构相似性;而空间注意力机制模型聚焦于图像空间位置信息,在一定程度上优化了去噪效果。
Table 3. Experimental results of ablation between modules
表3. 模块之间的消融实验结果
通道注意力机制 |
空间注意力机制 |
CBAM |
U-Net++ |
PSNR |
SSIM |
|
|
|
√ |
31.02 |
0.83 |
√ |
|
|
√ |
33.12 |
0.88 |
|
√ |
|
√ |
32.44 |
0.87 |
|
|
√ |
√ |
35.29 |
0.92 |
如表4所示,表格中对比了原模型与改进模型的性能,可以看出改进后的模型对于噪声去除效果更好。同时又对比了原模型与改进模型融合CBAM注意力机制后的性能对比,可以看出融合了CBAM注意力机制的模型对于噪声识别以及有效信号的抓取上都有很大提升。
Table 4. Experimental results of ablation between models
表4. 模型之间的消融实验结果
CBAM |
U-Net |
U-Net++ |
PSNR |
SSIM |
|
√ |
|
28.99 |
0.80 |
√ |
√ |
|
32.85 |
0.89 |
|
|
√ |
31.21 |
0.83 |
√ |
|
√ |
35.29 |
0.92 |
4.3. 实际地震记录测试结果
为分析CBAM-U-Net++模型在实际记录中的泛化能力,继续对实际地震记录测试结果进行分析。图7所示为实际地震记录信号,该记录共281道,每道有1750个采样点,采样间隔为0.004秒,为了信号更清晰,本文截取了部分信号进行展示,并且放大了其中一部分信号便于观察。F-k滤波能初步压制噪音,增强信号连贯性,但残留部分噪点。小波变换可凸显信号细节,不过离散噪点较多。KSVD算法在去噪同时规整信号形态,在细节处理上欠佳。传统U-Net模型运用深度学习,较好保留信号特征,但其对信号幅度变化的呈现不够明显。U-Net++模型在此基础上优化了细节处理,信号边缘更清晰。CBAM-U-Net模型结合注意力机制,突出重要信号区域,显著提升信号辨识度。相比之下,CBAM-U-Net++模型在去除大部分噪音的同时,也最大程度保留了信号细节,使信号的完整性与清晰度远超其他方法。总体而言,传统方法在去除噪声和特征保留上存在一定的局限性,而深度学习尤其是融合了注意力机制的算法,在处理这类信号数据时优势明显,为信号处理提供了更高效、精准的解决方案。
Figure 7. Denoising results of actual earthquake records
图7. 实际地震记录去噪结果
为验证模型更强大的去噪能力,选取实际记录中噪声偏大的数据进行去噪,如图8所示为强噪声环境下的实际地震记录信号,共256道,每道有1750个采样点,采样间隔0.004秒。由图中可以看出,F-k滤波虽能增强信号连续性,但残留噪声较多;小波变换易产生离散噪点;KSVD算法对细节特征保留不足;传统U-Net模型通过编解码结构有效提取出了信号特征,但依然存在幅度信息弱化问题;U-Net++模型通过密集跳跃连接优化多尺度特征融合,提升了边缘清晰度;结合注意力机制的CBAM-U-Net模型则强化了关键信号区域的权重分配,显著提升目标辨识度。进一步整合密集连接与注意力机制的CBAM-U-Net++模型,在噪声抑制与细节保留间实现了最佳平衡,其深层网络通过非线性映射精准解耦噪声与信号,注意力模块定向增强弱信号特征。
Figure 8. Denoising results of actual earthquake records (strong noise)
图8. 实际地震记录去噪结果(强噪声)
5. 结论
1) 针对传统U-Net模型在地震数据去噪问题中的不足,引入U-Net++模型构建密集性跳跃连接,并于每个节点融合卷积块与CBAM注意力机制,提出了一种基于改进U-Net模型的地震数据去噪方法;
2) U-Net++模型在编码器和解码器之间新增了多层密集性跳跃连接,有助于减少特征映射之间的语义差距,以便更好地捕捉多尺度特征信息,从而提高模型的表征能力和上下文感知能力。实验结果表明,U-Net++模型相比传统U-Net模型在细节处理上更加精细,在整体效果上噪声去除更加彻底,对于有效信号保留更加完整;
3) CBAM注意力机制协同了通道注意力(CAM)与空间注意力(SAM)的作用,模型动态强化了有效信号区域的语义依赖关系,独特的连接方式增强了特征融合与复杂噪声抑制能力。实验结果表明,CBAM模块的融合使得PSNR与SSIM分别提升了6.3 dB和0.12,模型对20%高斯噪声的PSNR达到了35.29 dB,SSIM达到了0.92。
在实际地震记录处理中,CBAM-U-Net++模型能够精准恢复微弱信号边缘,在强噪声环境下仍能保持高水平的保真度,该模型为地震信号去噪领域提供了一种高效、精准的方案,为后续的偏移成像与储层反演提供了高质量数据基础,在实际应用中极具潜力。
基金项目
廊坊市科学技术局资助项目(编号:2024011090)。