基于深度学习的煤岩识别GPR信号去噪方法研究
Research on Denoising Method of GPR Signal for Coal-Rock Identification Based on Deep Learning
摘要: 煤岩识别研究可以定位煤层和岩层的分界面,确定截割位置,从而指导采煤机自动调高,实现更高水平的智能化无人开采。探地雷达是一种无损的探测手段,可以获取地下岩层的信息,识别岩性。但是探地雷达的分辨率受到信号频率和波长的限制,不同设备测量得到的数据存在差异,且信号容易被噪声干扰。本研究使用了一种U-Net结构的神经网络算法处理无线天线探地雷达数据,使其信号质量接近有线天线测得的信号水平,并使用改进的U-Net网络对信号进行去噪处理,实现了无线到有线转换和去噪后的图像。结果表明,经过U-Net处理,无线信号质量得到了较大的提升,雷达信号图像的平均峰值信噪比(PSNR)提高了约4 dB、平均结构相似性指数(SSIM)达到了0.935,证明了降低数据差异的GBR数据具有更好的去噪效果。
Abstract: The research on coal-rock identification can locate the interface between coal and rock seams and determine the cut-off position, thus guiding the coal miner to automatically adjust the height and realize a higher level of intelligent unmanned mining. Ground-penetrating radar (GPR) is a non-destructive means of detection, which can obtain the information about underground rock layers and identify the lithology. However, the resolution of GPR is limited by signal frequency and wavelength, the data obtained from different equipment measurements differ, and the signal is easily interfered by noise. In this study, a neural network algorithm with a U-Net structure is used to process the wireless antenna GPR data, so that the signal quality is close to the level of the signal measured by a wired antenna, and the signal is denoised using an improved U-Net network to realize the wireless-to-wired conversion and denoised image. The results show that after U-Net processing, the quality of the wireless signal is greatly improved, the average peak signal-to-noise ratio (PSNR) of the radar signal image is improved by about 4 dB and the average structural similarity index (SSIM) reaches 0.935, which proves that the GBR data with reduced data discrepancy has a better denoising effect.
文章引用:蒲明松, 姜绪超. 基于深度学习的煤岩识别GPR信号去噪方法研究[J]. 软件工程与应用, 2024, 13(4): 488-500. https://doi.org/10.12677/sea.2024.134051

1. 引言

煤作为我国一种重要的能源资源和工业原料,为国家工业化进程提供了坚实的能源基础。由于煤层结构及赋存特征复杂,现有技术无法准确识别煤层变化趋势,现场采掘机械作业仍需要人工干预,尚未实现高度的智能化和全面的无人化。智能截割无人化开采的关键技术,实现智能截割需要准确的煤岩分界信息,而探地雷达可以准确识别煤岩分界面,实现综采工作面的煤岩识别[1]。探地雷达检测技术[2]是属于勘探技术的电磁波探测,在煤岩识别的研究中扮演着重要角色,由于其有着高分辨率、无损、效率高和图像直观等特点,在众多探测方法中脱颖而出。由于现场环境复杂多变,雷达在探测过程中信号有较大干扰,所以需要去噪。关于信号去噪的理论一直在不断发展,涵盖了多个应用领域并提出了一系列去噪方法,从传统的数学方法到最新的深度学习技术等,都在为解决去噪问题提供着丰富的理论和实践支持。

在去噪的研究方面,目前的主流去噪手段有基于时间频率分析的方法[3]、基于滤波的方法[4]、奇异值分解的方法[5]、基于小波阈值去噪的方法[6]和结合机器学习的研究方法等。近年来,深度学习[7]方法在图像去噪领域取得了显著的进展。使用卷积神经网络(CNN)和生成对抗网络(GAN) [8]等技术,能够学习到复杂的噪声模型,并有效地去除噪声。

深度学习[9]在去噪上提供了新的思路,深度学习的自适应学习能力为煤矿领域带来了便利。常用的深度学习去噪模型主要有自动编码器(AE) [10]和U-Net等。U-Net网络结构通过图像压缩和重构实现去噪,U-Net结构包含了编码器和解码器两部分,其中编码器用于提取图像的高级特征,而解码器则将这些特征映射回原始图像大小。因此,U-Net能够充分利用图像的上下文信息,从而有助于更准确地去除图像中的噪声。但数据集的预处理是一个至关重要的步骤,数据集的优劣性会对结果产生影响,甚至是严重的偏差。在深度学习关于GBR图像的处理上,需要大量的数据训练模型,但实地采集数据效率低且受场地限制,同时雷达探测的数据由于存在人为、环境因素的干扰,差异性过大;通过合成仿造模拟真实GPR图像太过于理想,不够真实。本文提出一种采用多类型雷达实地采集数据,通过U-Net算法找出数据间的映射关系,从而降低数据的差异性。

因此,本文运用深度学习去噪技术,融合多类型雷达实地采集煤岩界面数据,提出基于深度学习和探地雷达融合的煤岩界面图像去噪方法研究。采用改进的U-Net算法找出数据间的映射关系,通过深度学习算法U-Net进行训练图像去噪,以提高煤岩识别的准确率。

2. 基于U-Net的无线天线信号增强

2.1. 数据集制作

为了模拟出煤矿真实场景,搭建了两个长方体状模型(如图1(a)),作为煤岩模型。2个煤岩模型均由煤粉和水泥组成,模型的上层为煤层,下层为岩层。其中,模型一长5.0米,宽1.7米,高1.5米;模型二长4.0米,宽1.7米,高1.8米。为了模拟真实煤矿的环境,在模型的煤层上制作了小孔和裂隙,以还原真实煤岩的结构特征。煤岩模型的结构和尺寸信息如图1(b)图1(c)所示。

(a) 煤岩模型实拍照片

(b) 模型一的结构和尺寸

(c) 模型二的结构和尺寸

Figure 1. Coal-rock model structure and dimensions (Unit: cm)

1. 煤岩模型结构和尺寸(单位:cm)

采集数据使用了大连中睿公司的TGPR-400、TGPR-600、TGPR-900三套探地雷达设备,频率分别为400 Hz、600 Hz、900 Hz,其中TGPR-600、TGPR-900是有线信号雷达设备,TGPR-400是无线信号雷达设备。为了增加数据多样性,我们将三台雷达设备的时窗设置为40 ns和50 ns,并且分别进行了悬空10 cm和贴地探测。为了记录温度的影响,本次实验在两个时间段进行数据采集,第一个时间段在11月份,第二个时间段在3月份。如图2所示,通过在东西方向和南北方向各布置了测线,标记为L1至L5和N0至N450,间隔分别为25 cm和50 cm。每条测线都设置了正向和反向的测量路线,以研究不同方向对实验结果的影响。三个雷达在设置参数一致下分别在每条测线采集5次,测量得到数据5220份,其中1740份为无线数据。

Figure 2. Layout of measuring lines

2. 测线布置

为了使U-Net模型有更好的泛化能力与鲁棒性,训练时需要大量的GPR图像。将1740份无线数据和对应的有线数据通过随机裁剪和亮度调整,获得7684张尺寸为1024 × 228的灰度图像。

通过将采集的无线数据和有线数据输入U-Net模型中,经过深度学习训练,寻找出无线和有线数据的映射关系,这种映射关系让模型准确地预测新的输入数据所对应的标签。

2.2. GPR无线和有线图像

图3原图展示1可知,无线数据总体呈现模糊,其中的一些细节不明显,所以对其增强细节和特征,通过将采集的无线数据和有线数据输入U-Net模型中,经过深度学习训练,寻找出无线和有线数据的映射关系,这种映射关系让模型准确地预测出其与有线数据的差距,从而达到数据相关特征的一致。经过模型的预测优化展示2所示,图像显示的细节更为清晰可见,特征更为明显,质量得到了较大提升。

原图展示1 优化展示2

Figure 3. Wireless data and optimized post-presentation

3. 无线数据和优化后展示

信噪比(SNR) [11]是描述信号强度相对于背景噪声强度的度量,通常用分贝(dB)表示,公式为:

SNR=10× log 10 ( P 1 P 2 )

其中,P1是信号的功率,P2是噪声的功率。通过分析,初始的有线和无线数据的信噪比由38 dB提高至43 dB,信噪比提升了约5 dB,降低了数据差异性。

3. 基于U-Net图像去噪数据集及算法构建

3.1. U-Net网络结构

U-Net是一种经典的卷积神经网络结构[12],最初设计用于图像语义分割任务[13],然而在实践中也成功地应用于图像去噪任务。由于U-Net结构由对称的编码器和解码器组成,使得网络能够同时捕捉全局上下文和局部细节信息。编码器逐渐减小图像的尺寸和提取高级特征,而解码器则通过上采样操作逐渐恢复图像大小并逐层融合特征。这种结构使U-Net具有较强的特征提取和上下文信息传递能力,有助于去噪任务中重建清晰的图像。同时,在U-Net结构中,编码器和解码器之间的层之间存在跳跃连接,将低级和高级特征进行融合,这种结构可以帮助网络学习并保留图像中的细微纹理和边缘信息。通过跳跃连接和上采样操作,U-Net网络可以将不同层次的特征进行融合,包括低级特征和高级抽象特征。这种多尺度特征融合可以使网络更好地去除噪声,并恢复图像的细节和特征。

模型由编码器和解码器组成。编码器逐步下采样输入图像,在每层卷积中添加残差块提取特征信息,每一层的信息融合都会结合前面所有层的输入,并使用级联方式将当前所有层的特征传播至后续的所有层。然后通过解码器将这些特征解码成与原始图像相同尺寸的输出,同时恢复图像的细节和空间信息。解码器通过反卷积层进行上采样,并与编码器的特征图进行合并,以重新注入细节和上下文信息。模型学习了图像中的噪声分布和内容之间的关系,去除噪声的同时,保留了原始信息,输出去噪后的图像。结构参数如图4所示。

Figure 4. Residual block U-Net network framework

4. 残差块U-Net网络框架

3.2. 数据清洗

为了丰富数据集的数量,使深度学习模型具有更好的泛化能力,可以进行数据增强(Data Augmentation) [14],通过对GPR图像进行随机变换生成新的训练样本,包括裁剪、旋转、缩放、翻转、平移、亮度调整等。为了清晰展示去噪效果,对所有数据添加随机高斯噪声作为训练数据,因为高斯噪声能模拟各种真实世界的噪声,具有良好的随机性质,能有效地表示图像中的不确定性。

3.3. 去噪原理

通过对无噪图像加入加性噪声,即无噪图像设为X,噪声为n,所以一个含噪声的GPR图像可表示为:

Y=X+n

从而达到:

1) 对数据进行校准,以补偿由于采集系统不同导致的信号强度和相位差异。这可以通过比较两种系统在相同条件下的输出并调整其读数来实现。

2) 采用改良的U-Net算法去除输入图像Y中的噪声n,实现信号优化。通过编码器的下采样操作,使用PReLU激活函数和卷积池化处理提取特征 α 并压缩尺寸,然后通过跳跃连接,解码器恢复图像大小并融合特征,得到与Y同等大小的纯噪声图 β 。为了使 β 更加地接近噪声n,一般可将损失函数作为评价指标,即均方误差(MSE),通常损失函数越小,输出的噪声就越准确。最后将Y减去 β ,便可得到去噪后的图X,即:

Yβ=X

3.4. 图像质量评估指标

为了说明所展示的去噪效果,将峰值信噪比(Peak Signal-to-Noise Ratio, PSNR) [15]和结构相似性(Structural Similarity, SSIM) [16]作为本次去噪前后的对比。PSNR是衡量图像重建质量的常用指标之一,特别适用于图像压缩领域。它通过比较两幅图像的像素差异来计算。首先计算两幅图像之间的均方误差(MSE),MSE越小,表示图像越相似。根据MSE计算PSNR。SSIM是评估两幅图像相似度的指标,常用于衡量图像失真前后的相似性,也用于评估模型生成图像的真实性。其中,MSE计算公式为:

MSE= 1 N i N ( x i y i ) 2

其中的图像元素分别记为 x i y i ,其中N表示样本数量,进行图像质量评估时,MSE越小,表明待评估的图像质量越好。

PSNR计算公式为:

PNSR=10 log 10 L 2 MSE

由于PSNR公式将MSE放在了分母上,所以在进行图像质量评估时,PSNR数值越大,表明待评估的图像质量越好,这一点与MSE相反。PSNR公式中的L是一个常数,它表示图像数据类型的最大动态范围。

在SSIM的计算中,其中图像的相似性由三部分构成:luminance (亮度)、contrast (对比度)和structure (结构)。luminance计算公式为:

L( x,y )= 2 μ x μ y + c 1 μ x 2 + μ y 2 + c 1

contrast计算公式为:

C( x,y )= 2 σ x σ y + c 2 σ x 2 + σ y 2 + c 2

structure计算公式为:

S( x,y )= σ xy + c 3 σ x σ y + c 3

SSIM常用计算公式为:

SSIM=[ L ( x,y ) α C ( x,y ) β S ( x,y ) γ ]

其中,x表示第一张图像的数据,y表示第二张图像的数据。 μ x μ y 表示xy的均值, σ x σ y xy的方差, σ xy xy的协方差, c 1 = ( k 1 l ) 2 c 2 = ( k 2 l ) 2 c 3 = c 2 /2 k 1 k 2 一般取0.01和0.03,l为图像范围。SSIM在0到1范围内,值越大,图像越相似。

4. 实验结果分析

实验环境

基于Ubuntu 22.04.3 LTS操作系统,开发语言为Python,采用的深度学习框架为Pytorch 1.10。显卡的配置是RTX A6000,CPU采用Intel Core i7-10700k。

实验结果与分析。效果展示如图5所示。

(a) (b) (c)

(d) (e) (f)

(g) (h) (i)

Figure 5. Original image-predicted image-noise

5. 原图–预测图–噪声

将制作好的训练数据以8.5:1:0.5随机划分为训练集、测试集和验证集。激活函数使用PReLU,学习率为0.001,批次大小设置为10,迭代系数为180。

由图可知,迭代次数在达到100轮迭代后,噪声基本完全消除,图像更加清晰可见。图5(a)图5(d)为原图;图5(b)图5(e)为去除噪声后的预测图片;从噪声图中消除的噪声如图5(c)图5(f)所示,可见训练好的模型能够精准去除噪声,保留图像的信息。取出特征较为明显的区域观察图(图5(g)~(i)),噪声基本完全已经去除,并且呈现的图像的特征清晰可见。

再对比添加的噪声和通过模型消除的噪声,添加的噪声为均值为0、方差为1.5的高斯噪声,消除的噪声通过将添加的噪声图片经过模型预测出无噪图片,将有噪图片的像素值减去无噪图片对应位置的像素值得到。如图6图7所示,消除的噪声由于采用减像素值得来,更加清晰可见,而添加的噪声相对比较光滑自然,但噪声的分布大致相同,表明有很好的去噪效果,同时不会由于去噪而损失图片的特征。

Figure 6. Eliminated noise

6. 消除的噪声

Figure 7. Added noise

7. 添加的噪声

通过在原始图像上添加高斯噪声,噪声图像是通过在原始图像上添加高斯噪声(均值为0,标准差为0.05~0.15),这个数值使得噪声对图像质量的影响较为显著,但仍保留了图像的可识别性。并利用特定的CNN去噪模型进行处理,比较了两种噪声的影响和去噪效果。结果显示,添加高斯噪声后,噪声图像具有明显的高斯噪声,导致图像细节模糊,边缘模糊不清。如图6所示,我们展示了几个样本的噪声图像示例,以展示其低质量的特点。经过去噪模型处理后,图像恢复了一定程度的清晰度和准确性,但仍然存在一定程度的残留噪声。与原始图像相比,去噪后的图像在视觉上更接近原始图像(图8图9)。然而,我们也注意到,去噪模型在某些情况下可能会导致图像细节损失或过度平滑,可能是由于模型参数选择不当或图像特征缺失所致。因此,强调了在选择和优化去噪模型时的重要性,并提出了未来研究的改进方向。

Figure 8. Noise figure

8. 噪声图

Figure 9. Prognostic figure

9. 预测图

未降低数据差异的数据集与降低数据差异的数据集下算法的PNSR和SSIM对比。峰值信噪比(PSNR)通常用于衡量图像的质量,数值越高,表示图像质量越好。PSNR值在30左右是一个较好的质量。结构相似性指数(SSIM)用于衡量两幅图像之间的结构相似度[16],其值在0到1之间,值越接近1,表示两幅图像越相似。如表1所示,将有线和无线数据集的差异降低,PNSR和SSIM可以取得一个更加优秀的指标,表中五个示例在差异降低之后均取得更高的指标。可见在数据集的处理上,采集的数据尽管在各类参数一致的情况下,无线和有线数据依旧受到各种因素的干扰,会存在一些差异性,在进行深度学习训练时,会导致模型在特征提取上受到影响。

Table 1. Comparison of different processes on the same dataset

1. 同一数据集不同处理对比

数据集优化

PNSR (dB)

SSIM

优化

优化

实测一

29.32

32.90

0.924

0.937

实测二

30.69

32.88

0.927

0.941

实测三

30.31

32.57

0.916

0.928

实测四

31.66

32.87

0.921

0.945

实测五

29.51

31.85

0.930

0.944

表2所示,优化后的U-Net的PNSR和SSIM五个示例均取得更高的指标。比起AE和传统U-Net网络结构去噪效果上,PNSR (dB)大约提升了4 dB,SSIM也是提升了将近0.2。在数据集一致的情况下,优化后的U-Net的网络结构具有更好的去噪效果。

损失函数变化曲线起始由于随机参数的选取,导致波动较大,但模型的损失函数的变化方向总体呈现下降趋势,具有非常良好的收敛性,Training loss在接近0.003达到了稳态和Val loss在接近0.005达到了稳态(图10)。

Figure 10. Decline curve of loss function

10. 损失函数下降曲线

Table 2. Comparison of different algorithms on the same dataset

2. 同一数据集不同算法对比

PNSR (dB)

SSIM

AE

U-Net

优化U-Net

AE

U-Net

优化U-Net

实测一

27.84

27.32

31.90

0.854

0.904

0.937

实测二

25.36

27.69

32.88

0.880

0.917

0.941

实测三

28.92

28.31

32.57

0.850

0.896

0.928

实测四

26.91

27.66

32.87

0.867

0.907

0.945

实测五

28.13

26.51

31.85

0.868

0.900

0.944

5. 结论

1) 数据集的预处理和选取对结果的影响非常大,在煤岩识别研究上,实地采集的数据不同于理想的环境,会面临着温度、噪声等许多干扰,同等参数一致下,也会有差异性的存在。即对数据的差异性降低可以在去噪上获得更好的效果。

2) 通过在U-Net架构上添加残差块和注意力机制,加强了对GBR图像特征的提取和解决过拟合问题,比传统U-Net架构具有更好的去噪效果。

未降低数据差异的数据集与降低数据差异的数据集下算法的PNSR和SSIM对比。峰值信噪比(PSNR)通常用于衡量图像的质量,数值越高,表示图像质量越好。PSNR值在30左右是一个较好的质量。结构相似性指数(SSIM)用于衡量两幅图像之间的结构相似度[16],其值在0到1之间,值越接近1,表示两幅图像越相似。

参考文献

[1] 张强, 张润鑫, 刘峻铭, 等. 煤矿智能化开采煤岩识别技术综述[J]. 煤炭科学技术, 2022, 50(2): 1-26.
[2] 任望, 姚振岸, 陈龙凤, 等. 浅析探地雷达技术的发展历程[J]. 江西科学, 2024, 42(1): 100-107.
[3] Nekkanti, A. and Schmidt, O.T. (2021) Frequency-Time Analysis, Low-Rank Reconstruction and Denoising of Turbulent Flows Using SPOD. Journal of Fluid Mechanics, 926, A26.
https://doi.org/10.1017/jfm.2021.681
[4] 刘国宏, 郭文明. 改进的中值滤波去噪算法应用分析[J]. 计算机工程与应用, 2010, 46(10): 187-189.
[5] 崔玲丽, 刘银行, 王鑫. 基于改进奇异值分解的滚动轴承微弱故障特征提取方法[J]. 机械工程学报, 2022, 58(17): 156-169.
[6] 陈晓曦, 王延杰, 刘恋. 小波阈值去噪法的深入研究[J]. 激光与红外, 2012, 42(1): 105-110.
[7] 孙志军, 薛磊, 许阳明, 等. 深度学习研究综述[J]. 计算机应用研究, 2012, 29(8): 2806-2810.
[8] 陈景霞, 林文涛, 龙旻翔, 等. 基于UNet 3+生成对抗网络的视频异常检测[J]. 计算机工程与设计, 2024, 45(3): 777-784.
[9] Chua, L.O. (1998) CNN: A Paradigm for Complexity. World Scientific.
https://doi.org/10.1142/9789812798589
[10] 杜渺勇, 于祥雨, 周浩, 等. 基于自编码卷积神经网络的图像去噪算法[J]. 杭州师范大学学报(自然科学版), 2021, 20(1): 95-101.
[11] 钟建军, 宋健, 由长喜, 等. 基于信噪比评价的阈值优选小波去噪法[J]. 清华大学学报(自然科学版), 2014, 54(2): 259-263.
[12] 蒲秋梅, 殷帅, 李正茂, 等. U型卷积网络在乳腺医学图像分割中的研究综述[J]. 计算机科学与探索, 2024, 18(6): 1383-1403.
[13] Huang, H., Lin, L., Tong, R., Hu, H., Zhang, Q., Iwamoto, Y., et al. (2020). UNet 3+: A Full-Scale Connected UNet for Medical Image Segmentation. 2020 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), Barcelona, 4-8 May 2020, 1055-1059.
https://doi.org/10.1109/icassp40776.2020.9053405
[14] 杜松杰, 刘宏哲, 潘卫国, 等. 基于深度学习的低光照图像增强研究综述[C]//中国计算机用户协会网络应用分会2023年第二十七届网络新技术与应用年会. 中国计算机用户协会网络应用分会2023年第二十七届网络新技术与应用年会论文集. 2023: 34-37.
[15] 刘利平, 乔乐乐, 蒋柳成. 图像去噪方法概述[J]. 计算机科学与探索, 2021, 15(8): 1418-1431.
[16] Palubinskas, G. (2016) Image Similarity/Distance Measures: What Is Really behind MSE and SSIM? International Journal of Image and Data Fusion, 8, 32-53.
https://doi.org/10.1080/19479832.2016.1273259