1. 引言
煤作为我国一种重要的能源资源和工业原料,为国家工业化进程提供了坚实的能源基础。由于煤层结构及赋存特征复杂,现有技术无法准确识别煤层变化趋势,现场采掘机械作业仍需要人工干预,尚未实现高度的智能化和全面的无人化。智能截割无人化开采的关键技术,实现智能截割需要准确的煤岩分界信息,而探地雷达可以准确识别煤岩分界面,实现综采工作面的煤岩识别[1]。探地雷达检测技术[2]是属于勘探技术的电磁波探测,在煤岩识别的研究中扮演着重要角色,由于其有着高分辨率、无损、效率高和图像直观等特点,在众多探测方法中脱颖而出。由于现场环境复杂多变,雷达在探测过程中信号有较大干扰,所以需要去噪。关于信号去噪的理论一直在不断发展,涵盖了多个应用领域并提出了一系列去噪方法,从传统的数学方法到最新的深度学习技术等,都在为解决去噪问题提供着丰富的理论和实践支持。
在去噪的研究方面,目前的主流去噪手段有基于时间频率分析的方法[3]、基于滤波的方法[4]、奇异值分解的方法[5]、基于小波阈值去噪的方法[6]和结合机器学习的研究方法等。近年来,深度学习[7]方法在图像去噪领域取得了显著的进展。使用卷积神经网络(CNN)和生成对抗网络(GAN) [8]等技术,能够学习到复杂的噪声模型,并有效地去除噪声。
深度学习[9]在去噪上提供了新的思路,深度学习的自适应学习能力为煤矿领域带来了便利。常用的深度学习去噪模型主要有自动编码器(AE) [10]和U-Net等。U-Net网络结构通过图像压缩和重构实现去噪,U-Net结构包含了编码器和解码器两部分,其中编码器用于提取图像的高级特征,而解码器则将这些特征映射回原始图像大小。因此,U-Net能够充分利用图像的上下文信息,从而有助于更准确地去除图像中的噪声。但数据集的预处理是一个至关重要的步骤,数据集的优劣性会对结果产生影响,甚至是严重的偏差。在深度学习关于GBR图像的处理上,需要大量的数据训练模型,但实地采集数据效率低且受场地限制,同时雷达探测的数据由于存在人为、环境因素的干扰,差异性过大;通过合成仿造模拟真实GPR图像太过于理想,不够真实。本文提出一种采用多类型雷达实地采集数据,通过U-Net算法找出数据间的映射关系,从而降低数据的差异性。
因此,本文运用深度学习去噪技术,融合多类型雷达实地采集煤岩界面数据,提出基于深度学习和探地雷达融合的煤岩界面图像去噪方法研究。采用改进的U-Net算法找出数据间的映射关系,通过深度学习算法U-Net进行训练图像去噪,以提高煤岩识别的准确率。
2. 基于U-Net的无线天线信号增强
2.1. 数据集制作
为了模拟出煤矿真实场景,搭建了两个长方体状模型(如图1(a)),作为煤岩模型。2个煤岩模型均由煤粉和水泥组成,模型的上层为煤层,下层为岩层。其中,模型一长5.0米,宽1.7米,高1.5米;模型二长4.0米,宽1.7米,高1.8米。为了模拟真实煤矿的环境,在模型的煤层上制作了小孔和裂隙,以还原真实煤岩的结构特征。煤岩模型的结构和尺寸信息如图1(b)和图1(c)所示。
(a) 煤岩模型实拍照片
(b) 模型一的结构和尺寸
(c) 模型二的结构和尺寸
Figure 1. Coal-rock model structure and dimensions (Unit: cm)
图1. 煤岩模型结构和尺寸(单位:cm)
采集数据使用了大连中睿公司的TGPR-400、TGPR-600、TGPR-900三套探地雷达设备,频率分别为400 Hz、600 Hz、900 Hz,其中TGPR-600、TGPR-900是有线信号雷达设备,TGPR-400是无线信号雷达设备。为了增加数据多样性,我们将三台雷达设备的时窗设置为40 ns和50 ns,并且分别进行了悬空10 cm和贴地探测。为了记录温度的影响,本次实验在两个时间段进行数据采集,第一个时间段在11月份,第二个时间段在3月份。如图2所示,通过在东西方向和南北方向各布置了测线,标记为L1至L5和N0至N450,间隔分别为25 cm和50 cm。每条测线都设置了正向和反向的测量路线,以研究不同方向对实验结果的影响。三个雷达在设置参数一致下分别在每条测线采集5次,测量得到数据5220份,其中1740份为无线数据。
Figure 2. Layout of measuring lines
图2. 测线布置
为了使U-Net模型有更好的泛化能力与鲁棒性,训练时需要大量的GPR图像。将1740份无线数据和对应的有线数据通过随机裁剪和亮度调整,获得7684张尺寸为1024 × 228的灰度图像。
通过将采集的无线数据和有线数据输入U-Net模型中,经过深度学习训练,寻找出无线和有线数据的映射关系,这种映射关系让模型准确地预测新的输入数据所对应的标签。
2.2. GPR无线和有线图像
由图3原图展示1可知,无线数据总体呈现模糊,其中的一些细节不明显,所以对其增强细节和特征,通过将采集的无线数据和有线数据输入U-Net模型中,经过深度学习训练,寻找出无线和有线数据的映射关系,这种映射关系让模型准确地预测出其与有线数据的差距,从而达到数据相关特征的一致。经过模型的预测优化展示2所示,图像显示的细节更为清晰可见,特征更为明显,质量得到了较大提升。
原图展示1 优化展示2
Figure 3. Wireless data and optimized post-presentation
图3. 无线数据和优化后展示
信噪比(SNR) [11]是描述信号强度相对于背景噪声强度的度量,通常用分贝(dB)表示,公式为:
其中,P1是信号的功率,P2是噪声的功率。通过分析,初始的有线和无线数据的信噪比由38 dB提高至43 dB,信噪比提升了约5 dB,降低了数据差异性。
3. 基于U-Net图像去噪数据集及算法构建
3.1. U-Net网络结构
U-Net是一种经典的卷积神经网络结构[12],最初设计用于图像语义分割任务[13],然而在实践中也成功地应用于图像去噪任务。由于U-Net结构由对称的编码器和解码器组成,使得网络能够同时捕捉全局上下文和局部细节信息。编码器逐渐减小图像的尺寸和提取高级特征,而解码器则通过上采样操作逐渐恢复图像大小并逐层融合特征。这种结构使U-Net具有较强的特征提取和上下文信息传递能力,有助于去噪任务中重建清晰的图像。同时,在U-Net结构中,编码器和解码器之间的层之间存在跳跃连接,将低级和高级特征进行融合,这种结构可以帮助网络学习并保留图像中的细微纹理和边缘信息。通过跳跃连接和上采样操作,U-Net网络可以将不同层次的特征进行融合,包括低级特征和高级抽象特征。这种多尺度特征融合可以使网络更好地去除噪声,并恢复图像的细节和特征。
模型由编码器和解码器组成。编码器逐步下采样输入图像,在每层卷积中添加残差块提取特征信息,每一层的信息融合都会结合前面所有层的输入,并使用级联方式将当前所有层的特征传播至后续的所有层。然后通过解码器将这些特征解码成与原始图像相同尺寸的输出,同时恢复图像的细节和空间信息。解码器通过反卷积层进行上采样,并与编码器的特征图进行合并,以重新注入细节和上下文信息。模型学习了图像中的噪声分布和内容之间的关系,去除噪声的同时,保留了原始信息,输出去噪后的图像。结构参数如图4所示。
Figure 4. Residual block U-Net network framework
图4. 残差块U-Net网络框架
3.2. 数据清洗
为了丰富数据集的数量,使深度学习模型具有更好的泛化能力,可以进行数据增强(Data Augmentation) [14],通过对GPR图像进行随机变换生成新的训练样本,包括裁剪、旋转、缩放、翻转、平移、亮度调整等。为了清晰展示去噪效果,对所有数据添加随机高斯噪声作为训练数据,因为高斯噪声能模拟各种真实世界的噪声,具有良好的随机性质,能有效地表示图像中的不确定性。
3.3. 去噪原理
通过对无噪图像加入加性噪声,即无噪图像设为X,噪声为n,所以一个含噪声的GPR图像可表示为:
从而达到:
1) 对数据进行校准,以补偿由于采集系统不同导致的信号强度和相位差异。这可以通过比较两种系统在相同条件下的输出并调整其读数来实现。
2) 采用改良的U-Net算法去除输入图像Y中的噪声n,实现信号优化。通过编码器的下采样操作,使用PReLU激活函数和卷积池化处理提取特征
并压缩尺寸,然后通过跳跃连接,解码器恢复图像大小并融合特征,得到与Y同等大小的纯噪声图
。为了使
更加地接近噪声n,一般可将损失函数作为评价指标,即均方误差(MSE),通常损失函数越小,输出的噪声就越准确。最后将Y减去
,便可得到去噪后的图X,即:
3.4. 图像质量评估指标
为了说明所展示的去噪效果,将峰值信噪比(Peak Signal-to-Noise Ratio, PSNR) [15]和结构相似性(Structural Similarity, SSIM) [16]作为本次去噪前后的对比。PSNR是衡量图像重建质量的常用指标之一,特别适用于图像压缩领域。它通过比较两幅图像的像素差异来计算。首先计算两幅图像之间的均方误差(MSE),MSE越小,表示图像越相似。根据MSE计算PSNR。SSIM是评估两幅图像相似度的指标,常用于衡量图像失真前后的相似性,也用于评估模型生成图像的真实性。其中,MSE计算公式为:
其中的图像元素分别记为
、
,其中N表示样本数量,进行图像质量评估时,MSE越小,表明待评估的图像质量越好。
PSNR计算公式为:
由于PSNR公式将MSE放在了分母上,所以在进行图像质量评估时,PSNR数值越大,表明待评估的图像质量越好,这一点与MSE相反。PSNR公式中的L是一个常数,它表示图像数据类型的最大动态范围。
在SSIM的计算中,其中图像的相似性由三部分构成:luminance (亮度)、contrast (对比度)和structure (结构)。luminance计算公式为:
contrast计算公式为:
structure计算公式为:
SSIM常用计算公式为:
其中,x表示第一张图像的数据,y表示第二张图像的数据。
和
表示x和y的均值,
和
是x和y的方差,
是x和y的协方差,
、
和
,
和
一般取0.01和0.03,l为图像范围。SSIM在0到1范围内,值越大,图像越相似。
4. 实验结果分析
实验环境
基于Ubuntu 22.04.3 LTS操作系统,开发语言为Python,采用的深度学习框架为Pytorch 1.10。显卡的配置是RTX A6000,CPU采用Intel Core i7-10700k。
实验结果与分析。效果展示如图5所示。
(a) (b) (c)
(d) (e) (f)
(g) (h) (i)
Figure 5. Original image-predicted image-noise
图5. 原图–预测图–噪声
将制作好的训练数据以8.5:1:0.5随机划分为训练集、测试集和验证集。激活函数使用PReLU,学习率为0.001,批次大小设置为10,迭代系数为180。
由图可知,迭代次数在达到100轮迭代后,噪声基本完全消除,图像更加清晰可见。图5(a)和图5(d)为原图;图5(b)和图5(e)为去除噪声后的预测图片;从噪声图中消除的噪声如图5(c)和图5(f)所示,可见训练好的模型能够精准去除噪声,保留图像的信息。取出特征较为明显的区域观察图(图5(g)~(i)),噪声基本完全已经去除,并且呈现的图像的特征清晰可见。
再对比添加的噪声和通过模型消除的噪声,添加的噪声为均值为0、方差为1.5的高斯噪声,消除的噪声通过将添加的噪声图片经过模型预测出无噪图片,将有噪图片的像素值减去无噪图片对应位置的像素值得到。如图6和图7所示,消除的噪声由于采用减像素值得来,更加清晰可见,而添加的噪声相对比较光滑自然,但噪声的分布大致相同,表明有很好的去噪效果,同时不会由于去噪而损失图片的特征。
Figure 6. Eliminated noise
图6. 消除的噪声

Figure 7. Added noise
图7. 添加的噪声
通过在原始图像上添加高斯噪声,噪声图像是通过在原始图像上添加高斯噪声(均值为0,标准差为0.05~0.15),这个数值使得噪声对图像质量的影响较为显著,但仍保留了图像的可识别性。并利用特定的CNN去噪模型进行处理,比较了两种噪声的影响和去噪效果。结果显示,添加高斯噪声后,噪声图像具有明显的高斯噪声,导致图像细节模糊,边缘模糊不清。如图6所示,我们展示了几个样本的噪声图像示例,以展示其低质量的特点。经过去噪模型处理后,图像恢复了一定程度的清晰度和准确性,但仍然存在一定程度的残留噪声。与原始图像相比,去噪后的图像在视觉上更接近原始图像(图8、图9)。然而,我们也注意到,去噪模型在某些情况下可能会导致图像细节损失或过度平滑,可能是由于模型参数选择不当或图像特征缺失所致。因此,强调了在选择和优化去噪模型时的重要性,并提出了未来研究的改进方向。
Figure 8. Noise figure
图8. 噪声图

Figure 9. Prognostic figure
图9. 预测图
未降低数据差异的数据集与降低数据差异的数据集下算法的PNSR和SSIM对比。峰值信噪比(PSNR)通常用于衡量图像的质量,数值越高,表示图像质量越好。PSNR值在30左右是一个较好的质量。结构相似性指数(SSIM)用于衡量两幅图像之间的结构相似度[16],其值在0到1之间,值越接近1,表示两幅图像越相似。如表1所示,将有线和无线数据集的差异降低,PNSR和SSIM可以取得一个更加优秀的指标,表中五个示例在差异降低之后均取得更高的指标。可见在数据集的处理上,采集的数据尽管在各类参数一致的情况下,无线和有线数据依旧受到各种因素的干扰,会存在一些差异性,在进行深度学习训练时,会导致模型在特征提取上受到影响。
Table 1. Comparison of different processes on the same dataset
表1. 同一数据集不同处理对比
数据集优化 |
PNSR (dB) |
SSIM |
无 |
优化 |
无 |
优化 |
实测一 |
29.32 |
32.90 |
0.924 |
0.937 |
实测二 |
30.69 |
32.88 |
0.927 |
0.941 |
实测三 |
30.31 |
32.57 |
0.916 |
0.928 |
实测四 |
31.66 |
32.87 |
0.921 |
0.945 |
实测五 |
29.51 |
31.85 |
0.930 |
0.944 |
如表2所示,优化后的U-Net的PNSR和SSIM五个示例均取得更高的指标。比起AE和传统U-Net网络结构去噪效果上,PNSR (dB)大约提升了4 dB,SSIM也是提升了将近0.2。在数据集一致的情况下,优化后的U-Net的网络结构具有更好的去噪效果。
损失函数变化曲线起始由于随机参数的选取,导致波动较大,但模型的损失函数的变化方向总体呈现下降趋势,具有非常良好的收敛性,Training loss在接近0.003达到了稳态和Val loss在接近0.005达到了稳态(图10)。
Figure 10. Decline curve of loss function
图10. 损失函数下降曲线
Table 2. Comparison of different algorithms on the same dataset
表2. 同一数据集不同算法对比
|
PNSR (dB) |
SSIM |
|
AE |
U-Net |
优化U-Net |
AE |
U-Net |
优化U-Net |
实测一 |
27.84 |
27.32 |
31.90 |
0.854 |
0.904 |
0.937 |
实测二 |
25.36 |
27.69 |
32.88 |
0.880 |
0.917 |
0.941 |
实测三 |
28.92 |
28.31 |
32.57 |
0.850 |
0.896 |
0.928 |
实测四 |
26.91 |
27.66 |
32.87 |
0.867 |
0.907 |
0.945 |
实测五 |
28.13 |
26.51 |
31.85 |
0.868 |
0.900 |
0.944 |
5. 结论
1) 数据集的预处理和选取对结果的影响非常大,在煤岩识别研究上,实地采集的数据不同于理想的环境,会面临着温度、噪声等许多干扰,同等参数一致下,也会有差异性的存在。即对数据的差异性降低可以在去噪上获得更好的效果。
2) 通过在U-Net架构上添加残差块和注意力机制,加强了对GBR图像特征的提取和解决过拟合问题,比传统U-Net架构具有更好的去噪效果。
未降低数据差异的数据集与降低数据差异的数据集下算法的PNSR和SSIM对比。峰值信噪比(PSNR)通常用于衡量图像的质量,数值越高,表示图像质量越好。PSNR值在30左右是一个较好的质量。结构相似性指数(SSIM)用于衡量两幅图像之间的结构相似度[16],其值在0到1之间,值越接近1,表示两幅图像越相似。