1. 引言
随着浅部矿产资源逐渐枯竭,为了满足不断增长的矿产需求,研究人员纷纷将目光投向地球深部区域 [1] 。在这一探索过程中,大地电磁作为一种天然被动源电磁勘探方法崭露头角。该方法通过采集地球自然生成的电场和磁场数据,以推断地下电性结构,为生产生活中的多个领域提供了广泛应用 [2] 。这些应用包括地下水资源探测、地热资源开发以及对地球深部构造的深入研究 [3] 。
在当前研究中,我们需要进一步探讨并提出一种更加高效、准确且自适应的反演方法,以克服传统方法中存在的问题,提高反演结果的可靠性和稳健性。为了从观测数据中推断地下电性结构分布,反演是一种重要手段,传统的电磁反演问题往往具有很强的非唯一性,即单个观测数据可能对应多个可能的反演模型 [4] [5] 。针对这一问题,前人进行了大量的研究,目前主流的反演方法可以分为基于梯度类的优化方法以及基于全局搜索类的优化方法,前一种方法主要包括非线性共轭梯度法,高斯牛顿法,拟牛顿内存法 [6] 。这种方法通过基于梯度信息在每次迭代过程中更新模型来获得最优算法,但其反演方法十分依赖于对初始模型的选择,且对其余参数如权重因子也往往依赖于人为经验的选取,且在反演过程中可能陷入局部最小 [7] 。全局类反演方法通常基于大量采样计算,通过不断降低数据拟合差来获取最优解,其方法包括遗传算法,模拟退火算法,粒子群算法 [8] 。这类方法虽然理论上能获取最优解,但在计算过程中对计算资源消耗太大,且与前面算法一样,在反演参数选择中依赖于人为经验 [9] 。
随着人工智能技术的飞速发展,基于深度学习理论的反演方法迅速成为地球物理学研究的热点。深度学习网络的理论特性使其能够灵活地拟合各种复杂的非线性函数,在地球物理反演领域展现出极为重要的潜力 [10] 。与传统反演方法相比,基于深度学习的方法在网络预测阶段具有快速输出反演模型的优势,因此被广泛认为具备巨大的应用前景 [11] [12] 。前人对此进行了大量的研究:Wang等基于先验信息构建了面向目标区域的二维地下样本集,并采用深度学习方法进行了二维快速反演 [13] ;范涛等运用长短时记忆网络成功实现了瞬变电磁方法的一维反演,同时深入探讨了样本集数量对反演结果的影响 [14] ;Li等则通过残差卷积网络实现了大地电磁数据的一维反演,通过引入不同等级的噪声验证了反演方法的鲁棒性 [15] 。针对一维大地电磁反演问题,本文提出了一种创新性的基于U-Net网络的快速反演方法,通过创建大地电磁层状样本集并进行网络训练,实现了对一维问题的高效反演。这一创新性的方法有望为大地电磁反演领域带来更加精准和迅速的解决方案。
2. 方法理论
2.1. 网络搭建
在搭建神经网络结构时,深度是一个非常重要的因素。网络结构越深,能够提取的特征就越丰富且抽象。因此,在设计结构时,研究人员倾向于使用更深的网络结构。由于深度网络是通过堆叠多层非线性函数形成的,整个深度网络的结构可以被看作是一个复合非线性多变量函数。在计算不同层权重的损失函数时,偏导数将通过梯度下降的链式法则相乘,使得梯度随深度的变化呈指数级增加。如果导数后的激活函数在输出层附近的梯度值大于1,随着层数的增加,最终梯度将呈指数级增加,导致梯度爆炸。相反,如果梯度值小于1,则在链式法则后梯度将衰减到0,导致梯度消失。针对这一问题,我们采用U-Net网络结构,如图1所示,U-Net的设计灵感源自于残差神经网络,旨在解决图像分割等任务 [13] 。U-Net结构包含对称的编码器和解码器部分,中间连接的“U”形状形成了网络的整体结构。在U-Net中,编码器部分通过堆叠多个卷积层和池化层,逐渐减少图像分辨率,同时提取丰富抽象的特征。然后,解码器部分通过上采样和反卷积操作,逐步恢复图像的分辨率,同时将高层特征与低层特征进行连接,实现了信息的跨层传递。整个U-Net结构可以视为一个复合的非线性多变量函数。在本次实验中,我们搭建了一个能处理大地电磁输入与输出数据的网络结构,如下图所示,其主要部分由编码器部分,中间部分,解码器部分相组成。其中编码部分由通道不断增加的卷积网络构成,编码器负责将输入图像进行层级的特征提取和下采样。每个编码器阶段通常包括卷积层、激活函数和池化层,逐渐减小特征图的尺寸。在每个编码器阶段,提取的特征图包含了越来越抽象和高级的图像特征;中间部分则是编码器的最后一层特征图连接到解码器的对应层,形成U形状的结构。这种跳跃连接的设计有助于将高级特征信息传递给解码器,从而提高分割性能;在解码器部分,解码器负责通过上采样和反卷积操作逐步还原图像分辨率。每个解码器阶段通常包括反卷积层、卷积层、激活函数和特征图连接操作。解码器逐渐将特征图的尺寸还原到原始输入图像的大小,针对本文的研究目标,在编码器部分我们将大地电磁响应数据输入,在解码器部分得到预测的真实地下电阻率参数。

Figure 1. The network structure of U-Net
图1. U-Net网络结构图
2.2. 大地电磁正演理论
根据地下电阻率模型分布,基于麦克斯韦方程求解地表的电磁场响应称为正演,对应大地电磁一维正演计算来说,其具有解析解,根据等可知其视电阻率和阻抗相位分别为:
(1)
(2)
(3)
其中,E和H分别表示由地下电阻率r和平面波频率ω中获取的电场和磁场数据,通过电场比上磁场我们可以获取阻抗Z,在计算得到阻抗数据后,我们进一步可以获取视电阻率
和阻抗相位数据ϕ,基于上述理论,我们制作大量大地电磁一维样本集来用于反演。
2.3. 样本生成
对于深度学习方法来说,样本集的质量决定了最终反演效果的好坏,因此为了提高网络的泛化性与准确性,我们基于如下方法来建立样本:首先,考虑到深度学习网络是固定输入与输出结构,因此我们将地下划分为固定的层数,本次将地下划分为40层,同时考虑到大地电磁探测的分辨率随着频率的降低而逐渐减小,我们按照指数变化特征来划分每层的厚度,其厚度可以表示为:
(4)
其中i表示所划分的层号。对于电阻率参数,基于先验信息,我们将每层的电阻率范围设置为
,其赋值方法为:首先,在地下四十层中随机选取五层模型,对这五层模型从上述电阻率范围中随机赋值,在这五层模型赋值完成后,对于其余层电阻率,我们采用线性插值方法对其赋值。通过不断重复这一方法,我们总共生成了总计500,000个样本用于后续的训练。
2.4. 网络训练
在完成样本集的构建后,为了优化深度学习网络的训练过程并提高网络的收敛速度,我们采用了数据归一化的预处理步骤。数据归一化是一种常见的数据预处理手段,它有助于消除不同特征之间的尺度差异,从而提高深度学习模型的稳定性和收敛速度。通过将数据缩放到相对较小的范围,我们能够防止某些特征的数值范围过大对网络参数更新产生过大的影响,从而更有效地进行权重调整,提高训练的效率。这种归一化处理的应用在地球物理领域的深度学习研究中尤为重要,因为地球物理数据通常涉及多个物理量,这些物理量可能具有不同的量纲和数值范围 [16] 。通过统一将视电阻率和电阻率数据映射到标准的0~1范围,我们能够确保网络更好地适应各个特征,并更有效地学习地下结构的复杂性。这一预处理步骤为我们后续的深度学习模型提供了更为稳健和高效的训练基础,本文采用的归一化方法如下:
(5)
在完成数据归一化后,我们将其输入神经网络进行训练。值得注意的是,本次实验中我们选择采用Adam优化器对网络进行参数优化。Adam优化器结合了梯度的一阶矩估计和二阶矩估计,具有较好的收敛性和适应性,特别适用于处理地球物理数据等复杂场景。为了防止在训练过程中出现过拟合现象,我们引入了一项“早停”策略。具体而言,设定一个阈值,例如验证集性能连续多个周期没有显著提升时触发早停。这个阈值可以是一个固定的数值,也可以是一个相对变化的百分比,本次实验我们设置损失函数值在25步不下降则判定网络训练已经完成,并在此时终止训练过程,并保存当前网络的参数。这种策略有助于提前终止训练,防止网络在过度学习训练数据的同时失去对新数据的泛化能力,从而保证模型的泛化性能。在实验中,我们设置了初始学习率为0.01。
同时在损失函数的选择方面,尤其在考虑到本次训练旨在实现大地电磁反演的背景下。由于这是一个回归问题,我们需要选择适合此类任务的目标损失函数。因此,我们选择采用RMSE (均方根误差)作为我们的目标损失函数。RMSE是一种广泛用于回归问题的损失函数,它能够衡量预测值与实际观测值之间的拟合程度。通过采用RMSE作为目标损失函数,旨在最小化模型对地球物理数据的预测误差,确保反演结果与实际观测值之间的差异尽可能小。这种损失函数的选择有助于模型更好地适应数据的复杂性,并使得网络能够更准确地还原地下结构的电磁特性,其可以表示为:
(6)
其中
表示神经网络预测结果,
表示真实模型数据,n表示预测样本数量。本次实验基于Python代码实现,计算平台为GPU NVIDIARTX3090 with 24 G video memory。
通过进行150轮次的训练,我们成功完成了最终的网络训练。损失函数的收敛曲线如下图2所示。我们对比了训练集和验证集在训练过程中的损失函数变化情况,从中可以明显观察到一系列变化趋势。首先,在训练的初期阶段,训练集和验证集的损失函数都表现出较大的波动。这表明网络在初始阶段积极学习并适应了样本数据,捕捉到了数据的复杂模式。这种高度的学习程度在网络的早期训练阶段得到了显著展示。随着训练的进行,我们观察到损失函数的变化幅度逐渐减小,特别是在后期。这说明网络逐渐完成了对样本数据的拟合,学到了数据的潜在特征,使得损失函数的变化趋于稳定。网络在这一阶段已经具备了较好的泛化能力,能够较好地适应新的、未见过的数据。最终,经过一百多轮次的训练,我们观察到损失函数值不再呈现明显下降趋势,此时我们判定网络训练已经完成,此时结束网络训练并保存此时的网络参数。

Figure 2. The convergency curve of the average loss function for the training and Validation sets during the network training phase
图2. 网络训练过程中训练集和验证集的平均损失函数值随训练次数的收敛曲线
3. 模型测试
在网络训练完成后,在完成网络训练后,我们进行了一系列样本模型的测试以验证U-Net网络的有效性。
验证集模型测试
首先,我们从验证集中挑选了若干个样本模型,随后将已经训练完成的网络参数加载到U-Net网络中。紧接着,我们将这些样本模型的大地电磁响应数据输入到网络中,通过网络的前向传播过程,获得了对应的预测模型。这一测试阶段的目的在于评估U-Net网络在未见过的数据上的泛化能力和预测准确性。通过选择具有代表性的验证集样本模型,我们能够全面而有针对性地检验网络的性能。将训练得到的参数应用到U-Net网络,并通过模型的输出获取相应的预测结果,有助于确认网络是否成功学习并捕捉了地球物理数据中的关键特征,图3展示了验证集中部分模型与真实模型的拟合情况,通过观察可以发现,网络的预测结果与真实模型基本吻合。特别是在模型的一些细节处,网络呈现出较好的拟合效果,这直观地表明网络在训练过程中取得了良好的效果。

Figure 3. The prediction model of the network in the validation set.
图3. 验证集部分网络预测模型
通过对比验证集的模型与真实模型的匹配程度,我们可以得出结论,网络能够准确地捕捉到地球物理数据中的关键特征。这种准确性体现在模型在验证集上的整体拟合表现,以及在一些细节上的高度吻合。这也意味着网络在训练期间成功地学到了数据的抽象表示,具备了对地下结构的较为准确的推断能力。这一定性和定量的验证结果为我们提供了对U-Net网络性能的清晰认识,同时也强化了网络在地球物理领域的可靠性。值得注意的是,全部预测结果输出仅耗时0.2 s,这表明U-Net网络对于一维大地电磁数据反演具有很强的即时性,因此在野外实际应用具有很大的潜力。
4. 结论与建议
本研究提出了一种基于U-Net网络的一维大地电磁反演方法,首先我们构建了针对大地电磁一维反演而设计的U-Net网络。该网络能够接收大地电磁响应数据,并在输出端迅速生成地下层状模型的电阻率参数。此外,我们采用随机扰动方法创建了大量地下层状电阻率模型,并运用大地电磁正演程序进行计算,生成了大量的样本集并进行了保存。随后,我们将这些数据用于网络训练,并采用了早停策略以防止过拟合现象的出现。最终,在网络训练完成后,我们对部分预测模型与真实模型进行对比验证,以验证网络的可靠性。值得一提的是,在预测过程中,我们不再需要依赖于初始模型,展现了这种方法的独特优势。
尽管基于深度学习的反演方法具有反演速度快、精度高等优势,但仍然存在一些需要在后续工作中解决的缺点。首先,网络泛化性的问题值得深入探讨。由于地下模型具有极高的复杂性,建立一个真实且大规模的地下样本集是解决这一问题的关键。其次,考虑到网络的输入与输出是固定的,该方法仅适用于特定频率范围的大地电磁响应数据进行反演。对于超出该频率范围的响应数据,反演效果可能会受到限制,因此需要进行更深入的研究来解决这一局限。
参考文献