1. 引言
地球是人类生存的唯一家园,深入探究其内部结构与组成是地质学、地球科学等多领域学者的重要追求,这既源于对自然奥秘的探索欲,也关乎资源的获取与保障。在我国,经济快速发展与科技进步加剧了对矿产资源的渴求[1]。目前,地表及浅部易发现矿产资源日益减少,深部找矿成为必然趋势[2]。因此,研究深部成矿规律、创新预测技术,在矿产资源勘探中占据越来越重要的位置。
“大数据”的崛起在媒体间掀起了广泛的讨论热潮,随着计算机技术日新月异的进步,机器学习与深度学习已成为研究和应用大数据的焦点技术,它们在处理矿产资源预测评价等问题时也表现出了极高的适应性。刘艳鹏等将卷积神经网络引入深部矿产预测领域,应用已知模型预测未知区域,实现了地球单元素的预测[3]。徐述腾和周永章将卷积神经网络模型应用于地质领域,实现镜下矿石矿物自动识别与分类[4]。张帅等人搭建用CAE支持的卷积神经模型,使其更能识别属于单一矿物系统的矿床的空间特征[5]。Yang等应用卷积神经网络证明数据增强方法的有效性,采用三种不同的卷积神经网络模型来提取多源矿石指示因素和矿床之间的关系,并进一步讨论不同参数对预测性能的影响,其中卷积神经网络通过集成模拟的证据层来生产矿产前景图,以支持高潜力区域的未来矿产勘探[6]。
2. 区域地质背景
甘肃早子沟金矿位于扬子板块的西秦岭褶皱带,在南秦岭被动陆缘早古生代褶皱带的北缘,是秦岭地表盆地中北部与被动陆缘早古生代褶皱带的过渡区。影响该地区矿物形成的主要因素是构造活动和岩浆作用[7]。区域构造向西北方向扩展,褶皱和断裂发育,地质构造复杂,见图1 [8]。
该区金属矿物含量较高,已有的勘测数据丰富,可以很好地为卷积神经网络模型提供训练与检测。对其地形条件,成矿因素的研究已有较多的物料支持,能更好地对预测结果进行辅助说明。因此选定该地区的勘测数据来进行模型的演练。
Figure 1. Regional geological map [8]
图1. 区域地质简图[8]
3. 卷积神经网络相关方法
卷积神经网络(Convolutional Neural Network,CNN)是一种深度学习模型,主要用于图像、语音识别、自然语言处理等领域。它可以自动提取研究对象的特征,并且具有平移不变性和局部连接性。同时,CNN一般由多个卷积层、池化层和全连接层构成,具有很好的扩展性。卷积层是CNN的核心部分,它通过卷积操作提取图像中的特征。池化层用于降低特征图的维度,减少计算量。全连接层用于将特征图转换为分类结果。其基本结构如图2所示[9]。
基于这样的结构,CNN可以解决比较复杂的分类与识别问题,并且得到更好的效果[10]。CNN采用的是一种权值共享的方式,也就是在同一个输入特征图和同一个输出特征图中,使用相同的卷积核。具体在第i个卷积层中的第j个特征图中,(x, y)位置的值
根据公式计算得到。
Figure 2. Classic CNN structure diagram
图2. 经典的CNN结构图
其中,Pi和Qi为卷积核的大小,m为i − 1层特征图个数;
为i − 1层中第k个特征图(x + p, y + q)位置的值,
为与i − 1层第k个特征图相连接的卷积核,bij为偏置,f(·)为激活函数。
池化层通过对卷积层输出特征图进行下采样操作,实现了特征对平移、尺度和形状的不变性,并且有效减少了训练参数。通过对输入数据进行滑动窗口操作,池化层能够提取每个窗口内的数据的平均值、最大值等统计量作为输出,从而有效地降低输入数据的空间维度,减少模型对输入数据的敏感性,并且可以有效地减少模型的过拟合现象。
4. 卷积神经网络
CNN最初是基于视觉系统中神经机制的启发而设计的多层感知机,它在二维视觉图像分类和识别方面取得了巨大成功。然而,当用于分析空间数据时,它存在一定的局限性。传统的二维CNN主要处理二维图像数据,其卷积核仅在高度和宽度两个维度上移动,这限制了其在捕捉空间数据的深度信息方面的能力。以往的研究往往采用单一的点位数据,忽视了点位数据的空间分布。此外,基于非监督神经网络的矿床预测方法,由于未考虑成矿地质条件的差异,使得预测结果与真实矿床存在一定的偏差。
相比之下,CNN在处理空间数据方面具有显著优势。CNN能够在三个维度上处理数据,其卷积核在三个维度上移动,从而能够捕捉更多的空间信息。这种能力使得CNN能够更全面地理解和分析复杂的空间数据,CNN可结合成矿地质条件的差异,对不同地质条件下的矿产资源进行更精准的预测。因此,本文通过构建基于卷积神经网络的矿产资源预测模型,充分利用了CNN在处理空间数据方面的优势,克服了传统CNN在空间数据处理中的局限性,为矿产资源预测提供了新的方法和思路。
鉴于此,本文将继续研究卷积神经网络在矿产预测上的应用,并加入成矿地质特征对预测结果进行约束,通过有监督的方式来解决找矿预测问题,将地质信息向量化,借助深度学习算法将地质信息与勘测数据综合进行矿产资源预测,期望能为以后不同地区进行实际勘测提供参考。
4.1. 卷积神经网络基本结构
卷积神经网络由三部分构成:输入层、隐藏层和输出层,可以处理视频、医学图像等数据。输入层输入的数据是一个张量,通常表示为(帧数,高度,宽度,通道数)。在处理视频时,帧数表示视频的时间维度。CNN利用卷积和池化操作从数据中提取特征,再通过全连接层进行分类或回归等任务。输出层的全连接层将数据特征映射到类别得分上,通常使用softmax函数将得分转化为概率分布。CNN的隐藏层通常指卷积层和池化层,它们是提取数据特征的核心层。卷积层通过卷积操作提取输入数据的特征,每个卷积层包含多个卷积核,每个卷积核可以提取不同的特征。池化层则用于降低特征图的维度,减少计算量,同时保留重要的特征信息。下面对其进行分别介绍。
卷积层是CNN结构的核心部分,其主要作用是从输入数据中提取出目标的重要特征。卷积层通过在输入数据形成的空间中进行滑动,使用卷积核进行内积运算。每次滑动都会在空间窗口内进行一次内积运算。当卷积核遍历整个输入数据空间后,就可以得到卷积结果,也就是输出特征。需要注意的是,卷积层的滑动步长和卷积核的大小可以根据具体情况进行调整[11]。
下采样操作后,池化层能够有效地减少特征维度并去除冗余信息。在确定池化窗口后,可以使用不同的计算方式(如最大池化、平均池化等)进行池化操作,获得池化后的结果,以适应不同的应用场景。
全连接层位于神经网络的末端,其主要作用是将前面各层处理的特征整合起来,消除空间拓扑结构,减少特征位置信息对结果的影响,并完成分类或其他任务。
典型的CNN架构包括四个基本组件:本地接受域、共享权重、池化和全连接层[12]。1D CNN可以从数据中提取光谱特征,2D CNN可以从输入数据中提取空间特征。而3D CNN可以同时利用1D和2D CNN,从输入体积中同时提取光谱和空间特征,这些3D CNN特征在深部矿产预测中非常有用。3D CNN的数学公式与2D CNN非常相似,只是3D CNN的卷积核是多维的,可以在三个方向上进行卷积操作。3D CNN的基本架构如图3所示[13]。
Figure 3. Typical architecture of CNN
图3. CNN的典型构架
4.1.1. 卷积神经网络的构建
本文卷积神经网络结构和二维卷积神经网络的结构类似,但CNN的卷积层和池化层的输入与输出都是的特征体,如图4。
Figure 4. Basic CNN structure diagram
图4. 基础CNN结构图
4.1.2. 卷积层
假设输入x的CNN的维数为M × N × D,迭代器为i,j,k。维数为n1 × n2 × n3的核ω具有迭代器a,b,c。将
和
表示为输出,将偏置单位表示为第
层。为了计算非线性输入
到(i, j, k)某层中的指定单元,将前一层的权重贡献相加见第3节中的公式,则指定卷积层中第(i, j)个单元的输出如公式:
在卷积层,前一层的输出特征图(Feature map)与一个可学习的卷积核进行卷积运算,然后通过激活函数(Activation function),就可以得到输出特征图。常用的激活函数有ReLU、Sigmoid、Tanh、LeakyReLU等,具体选择哪种激活函数取决于具体的任务和数据。本文的任务可近似看作是二分类问题,因此选用的激活函数为Sigmoid函数。
4.1.3. 最大池化层
池化操作可以在减少特征数量的同时,保持特征的局部不变性。最常见的池化操作包括最大池化和平均池化。假设我们有一个卷积神经网络,其中第l层是卷积层,第l + 1层是3D池化层。该层的输入为上一层卷积层输出的特征图,
。对于最大池化层操作,它选取立方体内最大值,并生成抽象输出
,其中(X, Y, Z)和(X′, Y′, Z′)分别是最大池化特征抽取前后的尺寸。K为特征空间数目。通过池化层后,特征空间将会减少到
[14]。
4.1.4. 全连接层
在卷积神经网络中,全连接层通常被用于将卷积层和池化层的输出转换为最终的分类或回归结果。全连接层输入的一维向量包含了卷积层和池化层输出的所有特征图的像素值,经过全连接层的处理,输出一个包含类别或回归目标的得分或预测值的一维向量。
全连接层的计算过程可以表示为矩阵乘法加上偏置项的形式,即公式
其中,W是全连接层的参数矩阵,input是卷积层和池化层输出的一维向量,b是全连接层的偏置向量。在训练过程中,全连接层的参数和偏置项会被反向传播算法更新,以最小化损失函数。
在卷积神经网络中,通常会在网络的末尾几层添加全连接层,以将卷积层和池化层的输出转换为分类或回归输出[15]。
4.1.5. Softmax层
Softmax层是CNN的输出层,通过Softmax回归计算每个分类c的概率,计算公式为:
hL代表最后一层的神经元向量,C为目标分类数,
是神经元向量的第c个元素。Softmax层的激励函数输出为(0, 1)之间的正值,且和为1 [16]。
4.1.6. 训练过程
根据随机梯度下降算法,权重θ进行学习,即每次迭代中参数更新都基于训练样本。初始学习率为0.001,每迭代700次,学习率会下降50%。如果训练样本较少,为了避免过拟合,可以在卷积层和全连接层中引入dropout,丢弃率设置为0.8。
4.2. 卷积神经网络的基础模型结构
Ji等人[17]针对视频分析的行为识别任务,首次提出了卷积神经网络,从此开启了该领域研究的新篇章。Tran等人[18]针对视频理解任务提出了C3D,进一步扩展了模型深度,并引入了多维池化的概念,并获得了更加优良的性能。这便形成了CNN的基础模型,许多学者基于此提出许多不同的优化工作,在各个领域取得了良好的效果。
4.3. 卷积神经网络的优化
吕晓琪等人提出了基于卷积神经网络的低剂量肺结节检测算法。Roy等人[19]为了在高光谱图像上获得更好的精度,设计了混合CNN模型,并在HIS分类实验中取得了令人满意的效果。
从整体上来看,读取三个维度的卷积神经网络比两个维度的具有更强的表达能力,但同时也具有计算成本高,计算复杂程度高导致的运算速率低问题。为了有效解决这些问题,提出了不同的解决方案。
(1) 跳跃连接是一种常见的网络改进方法,它包括残差连接、密度连接和半密度连接等多种方式[20]。其中,残差连接的作用是将浅层信息直接传递到网络深层,并通过单位加操作与深层特征进行合并,从而有效地简化学习过程,缓解网络退化的问题。这种方法的优点在于可以提高网络的训练速度和准确性,同时也能够更好地适应各种复杂的任务和数据集。
(2) 网络性能的提升可以通过网络宽度方向的改进来实现,其中包括整体宽度和局部宽度的拓宽。通过增加多支路网络,可以扩展整体宽度,从而获取更多的特征信息,从而提高网络的性能。Sedaghat等人[21]提出多支路网络(ECO),获得了较高的模型计算速度和行为识别精度。扩展网络局部宽度通过扩展各个局部模块的宽度,对数据进行不同处理,再整合或重分配,同时提升网络的普适性和特征提取能力。Lu等人[22]提出基于3D-Attentional Inception网络的检测方案,以3D Inception v1为基础模块提升网络鲁棒性,使用通道和时空注意力模块提高检测能力,提升效果显著。多路聚合单元结构是一种用于行为识别的深度学习模型,它能够有效地利用残差切分单元将特征沿通道方向分为多个部分并进行独立处理。这种结构利用了多路复用器中的两个卷积实现支路间信息共享和重分配,从而提高了模型的效率和准确性。此外,3D自适应注意力模块能够获取重点关注的特征位置,进一步提高了模型的性能。最后,不同的卷积模块能够处理对应支路的特征,从而实现了显著提升行为识别速率和准确率的效果。胡正平等人[23]就以多路聚合单元为基础构建网络并以此完成行为识别任务。
5. 地球化学数据及数据处理
5.1. 地球化学数据
本文所使用的数据为甘肃早子沟金矿的实地勘测数据,将研究区已知矿体的数据网格化处理后作为训练集的正样本共36,523条并赋予1标签,正样本比例为0.4999。将已知无矿化区域内提取的勘测数据作为训练集的负样本共36,531条并赋予−1标签,负样本比例为0.5001。与成矿相比,异常事件的样本在集中和有限的空间中分布,而无矿是一种常见的现象,所以在选择负样本的时候,要尽量随机、均匀地分布在整个研究区的范围中。将该73,054条已知是否有矿的数据作为预测的训练集,同时额外选取78,779个网格区数据作为测试集进行预测。由X、Y、Z三列坐标表示空间位置关系,5个变量与成矿密切相关。
研究区地球化学数据源于甘肃省地矿局第三地质矿产勘查院,比例尺为1:50,000,采样介质为水系沉积物。每件样品包含Cu、Pb、Co、Zn、Bi、Sb、Hg、As、Au、W、Mo、Ba、Ag共13种元素,共计9041件。
5.2. 数据预处理
5.2.1. 归一化
为了突出原始数据的主要特征,弱化次要特征的影响,同时为了提升模型的收敛迭代速度,对采集的原始数据进行标准化和归一化处理。本文采用min-max法来进行处理,将数据范围映射到0~1之间,见公式:
5.2.2. 因子分析
在对地球化学数据进行因子分析时,通常采用探索性因子分析模型,该模型的求解过程需要通过多次调整模型参数,直至获得一个合理的解释结果。经过反复测试与对比,最终确定提取的公因子数量为4个,其他参数设置为:因子载荷抽取方法采用主成分分析法,载荷矩阵旋转采用最大方差旋转法,最大收敛迭代次数设定为25次。根据表1的数据,这4个因子共同解释了原始12个变量总方差的68.04%。各因子地质意义如下:F1:中温元素组合(Cu、Pb、Zn、Ag、Bi);F2:Au-多金属硫化物阶段核心标志(Au、As、Sb);F3:高温元素(Mo);F4:构造相关元素(Sb、Hg)。剖面分析表明,F2与已知矿体空间吻合度高,F4与构造深部延伸证据一致。
Table 1. Chemical element factors explain the total variance of existing variables
表1. 化学元素因子解释原有变量总方差情况
特征值及方差贡献 |
特征值 |
4.12 |
1.57 |
1.36 |
1.12 |
方差贡献率% |
34.33 |
13.07 |
11.3 |
9.35 |
累积方差贡献率% |
34.33 |
47.4 |
58.7 |
68.04 |
在本研究中,选择第四主成分(F4)作为重要分析因子,主要基于其在地质意义上的独特作用以及与构造控制和深部矿化的空间关系。F4因子的载荷因子主要为Sb和Hg,其中,Sb通常以辉锑矿形式存在,是金矿成矿过程中常见的元素,尤其与金矿床的前缘晕区具有显著关联。Hg则与构造活动密切相关,常作为深部矿化作用的指示元素。F4因子所代表的Sb-Hg元素组合能够有效反映构造影响及深部矿化特征,对矿体的空间分布和构造控制作用提供重要信息。二者分别与辉锑矿和构造活动密切相关。Sb在石英-辉锑矿脉中占比达93.33%,Hg常反映断裂带热液活动,二者组合可作为成矿构造背景的直接标志。前三个主因子F1~F3虽贡献了63.69%方差,但未涵盖构造驱动的成矿要素,F4因子解释了剩余9.35%方差,其代表的深部构造信号对矿床勘探具有独特价值。相关剖面显示,F4因子分布与断裂带走向一致,能够指示矿化热液运移路径及深部岩浆活动痕迹,弥补了其他因子在构造分析中的不足。
通过与勘探线剖面数据的对比,F4因子与已知矿体的空间分布呈现较好的契合,进一步验证了其在深部矿化勘探中的应用价值。尽管F4因子的方差贡献率为9.35%,相对较低,但其地质意义远超其他因子,特别是在揭示矿体深部延伸、构造控制及矿化潜力方面的作用,具有较强的实用性。因此,F4因子被选为关键分析因子,以指导深部成矿构造及找矿模型的构建。
5.3. 训练集数据
对数据进行网格化可将空间上分散的数值转化成规则分布的网格数据,抑制局部噪音,并按规则对空白网格赋予数值,得到统一的空间结构,能反映客体变量的空间模式。由于探究的是空间,设置的网格单元大小为10 m × 10 m × 10 m,得到矿产探测网格化数据,总网格单元数为73,054个,详情如表2所示。
Table 2. Grid standardization of geochemical data training set
表2. 地化数据训练集网格化标准
坐标 |
最小值/m |
最大值/m |
间距/m |
X |
34,573,400 |
34,574,802 |
10 |
Y |
3,870,600 |
3,871,500 |
10 |
Z |
600 |
3330 |
10 |
首先,通过主成分分析来对原始数据降维,得与成矿密切相关的成分指标,并计算出每条网格数据各成分对成矿的贡献率(如表1)。并绘制出成分数据值的分布情况如图5~7。
由贡献率可知,前缘晕、尾晕对成矿贡献率是最大的,且呈正向作用;Au含量的贡献率排第二位,总体呈现正向总用;成矿元素组合的贡献率则排在第三位,整体呈正向作用;而第四主成分的贡献率则最小,且总体呈负向作用。此为作为分类指标,是否在缓冲区也是成矿预测中的重要因素,如表3。
Figure 5. Histogram of Au content contribution rate
图5. Au含量贡献率直方图
Figure 6. Histogram of fourth principal component contribution rate
图6. 第四主成分贡献率直方图
Figure 7. Histogram of contribution rates of various combinations of ore forming elements
图7. 成矿元素各种组合贡献率直方图
Table 3. Training set component indicator contribution rate
表3. 训练集成分指标贡献率
|
最小值 |
最大值 |
均值 |
标准偏差 |
偏度 |
峰度 |
Au的含量 |
−0.9163 |
8.6431 |
3.131546 |
1.470184 |
−0.116 |
−0.469 |
第四主成分(Sb、Hg) |
−3.24481 |
3.4941 |
−0.02257 |
0.637656 |
0.174 |
0.321 |
成矿元素组合 (Au、Ag、Cu、Pb、Zn) |
−3.2659 |
2.638093 |
0.027994 |
0.714475 |
−0.757 |
0.941 |
前缘晕、尾晕 |
0.304414 |
46020.88 |
142.4487 |
600.2738 |
20.364 |
853.901 |
是否在缓冲区作为二分类指标之一,对成矿的影响是易于观测的,计算出二者的斯皮尔曼相关系数为0.743,属于高度相关,通过假设检验。同时结合根据表3的结果可推测,但从是否在缓冲区的角度出发,当勘测点在缓冲区时,有极大概率是有矿存在的;当勘测点在缓冲区外时,约有77%的概率是无矿的,33%的概率是有矿的,还需进一步研究其它四种主成分指标对成矿的作用,见表4。
Table 4. Intersection table of buffer zone and mineral presence
表4. 是否在缓冲区与有无矿交叉表
|
无矿 |
有矿 |
合计 |
不在缓冲区 |
36,531 |
10,564 |
47,095 |
在缓冲区 |
0 |
25,959 |
25,959 |
合计 |
36,531 |
36,523 |
73,054 |
5.4. 测试集数据
表5展示测试集数据结果,得到测试集的网格化标准,对比训练集无较大差异,说明用训练集训练的模型对测试集的预测有较好的表示。
Table 5. Grid standardization of geochemical data test set
表5. 地化数据测试集网格化标准
坐标 |
最小值/m |
最大值/m |
间距/m |
X |
34,574,800 |
34,574,800 |
10 |
Y |
3,870,600 |
3,871,500 |
10 |
Z |
600 |
3390 |
10 |
在训练集中,四类成分指标贡献率情况如表6所示,其中贡献程度最高的是前缘晕、尾晕,呈正向影响;第二贡献率是Au的含量,整体呈正向反馈;其次是第四主成分,整体呈正向反馈;最低贡献度为成矿元素组合,整体呈现负向反馈。
Table 6. Test set component indicator contribution rate
表6. 测试集成分指标贡献率
|
最小值 |
最大值 |
均值 |
标准 偏差 |
偏度 |
峰度 |
Au的含量 |
−1.8971 |
10.1226 |
2.733799 |
1.514625 |
0.202 |
−0.296 |
第四主成分(Sb、Hg) |
−7.2383 |
7.6895 |
0.03745 |
0.680019 |
0.005 |
1.847 |
成矿元素组合 (Au、Ag、Cu、Pb、Zn) |
−6.54883 |
5.070905 |
−0.02564 |
0.927251 |
−0.195 |
3.013 |
前缘晕、尾晕 |
0.012707 |
29243.72 |
41.64313 |
203.3982 |
96.824 |
12341.23 |
6. 基于卷积神经网络的成矿预测
卷积神经网络(CNN)作为一种常见的深度学习算法,能够有效地提取样本数据中的特征规则,并利用多层卷积运算,能够有效地提取出样本数据中的复杂规律,包括物体之间的相对位置、形状、大小等。本文使用python3进行编程,调用使用PyTorch框架来进行卷积神经网络的设计。
本文搭建的卷积神经网络模型处理的数据具有空间属性和物理属性。空间属性(X, Y, Z)表示勘测点所处的空间位置;物理属性记为P,在本文中P = 5,表示五个与成矿有关的因素。从已有的研究中可知,卷积神经网络在学习处理数据之间的位置关系比一维和二维的卷积神经更优异,相比于一维和二维卷积神经网络,本文的卷积神经网络能够更好地学习数据之间的空间位置关系。在成矿预测任务中,成矿位置的空间信息是非常重要的,而卷积神经网络能够更好地利用这些信息,从而在成矿预测任务中具有独特的优势。本文流程如图8所示。
6.1. 网络结构
本文设计的卷积神经网络结构为四个部分:输入层、卷积层、归一化批处理层和输出层。
输入层:由于卷积神经网络通常用于图像识别,而本文所使用的数据是存储到Excel表中的数据,因此需要通过程序将数据导入模型内,之后将数据还原带有坐标信息的立体数据。示意图如图9所示。
卷积层(Conv):本文使用的卷积核的尺寸为是3 × 3 × 3,其计算量相较于其他大小的卷积核来说较小,能一定程度上提高计算效率并且可以减少模型的参数量,从而减少过拟合的风险,此外还可以覆盖更广的感受野,使得模型能更好地捕捉数据局部特征。3 × 3 × 3是三维CNN的常用配置,可在保证局部特征提取的同时控制计算复杂度。same填充确保输入与输出尺寸一致,适用于如矿产预测需保留空间坐标的场景。
Figure 8. Design ideas for mineral prediction based on CNN
图8. 基于CNN的矿产预测设计思路
Figure 9. Schematic diagram of stereoscopic data
图9. 数据立体化示意图
步长,即卷积核在每个维度上的移动尺度设置为1。步长1可最大化特征覆盖,避免信息遗漏。填充设置为1,表示在输入张量的周围填充一圈0,以保证输出张量的大小和输入张量相同,输出数据的通道数设置为16。为了更贴合实际情况,需要加入激活函数引入非线性,使得模型能够学习到实际任务中的非线性信息,本文所用的代码中使用ReLU激活函数结合批标准化层。
归一化批处理层:用于加速网络的训练和提高网络的泛化能力,使用PyTorch深度学习框架中的BatchNorm3d函数实现。
输出层:输出网络结果。使用了1个卷积核,大小和步长都为3,padding为1,表示输出一个单通道的张量,输出的结果将用于后续的二分类预测任务。
6.2. 网络的训练和测试
用损失函数来衡量模型预测结果与真实结果之间的差距,在一定程度上影响着模型的训练效果和预测能力,本文的损失函数图如图10。由于预测有无矿产是一个分类问题,因此本研究选用的损失函数为二元交叉熵损失。损失函数图像如,呈现下降趋势,说明模型的性能在训练过程中不断提升,且损失函数值较小,说明模型的预测结果与真实结果之间得到差异也较小,模型的性能较好。
优化器通过更新网络参数的算法,使得网络的输出结果与真值之间的误差最小化。选择Adam优化器,相比于传统的梯度下降算法,计算更高效且能适应不同的数据分布和模型结构。
为进一步提高模型的训练效果,加入学习率调度器来动态地调整学习率。本文选用StepLR调度器,在每个训练时期结束时将学习率乘以gamma (0.92),从而逐渐降低学习率。这种方法可以在训练的早期采用较大的学习率,以加快收敛速度,在训练的后期采用较小的学习率,以便于对参数进行更细致的调整。
Figure 10. Binary cross entropy loss function
图10. 二元交叉熵损失函数
具体参数结构如表7所示,其中输入层的通道数量表示数据的属性个数,输出层的通道数表示最后的预测结果。
Table 7. Model parameter structure table
表7. 模型参数结构表
结构 |
卷积核大小 |
步长 |
填充 |
输入层 |
|
|
same |
conv_1 |
3,3,3 |
1,1,1 |
same |
conv_2 |
3,3,3 |
1,1,1 |
same |
conv_3 |
3,3,3 |
1,1,1 |
same |
输出层 |
3,3,3 |
1,1,1 |
same |
7. 结果和讨论
使用二元交叉熵损失函数,学习率为0.001的Adam优化器,对建立的CNN模型进行训练。绘制出的ROC曲线如图11,拟合效果很好,准确率达95%。
输出层的输出通道为1,代表最后的预测结果,是勘测点有矿的置信度,使用Sigmoid函数使得该置信度控制在(0, 1)范围内,该值越接近1,说明该矿点有矿的概率越大。将模型计算所得的预测得分用Voxler 建模工具进行插值,将预测结果进行立体可视化还如图12(a)所示,颜色越深说明成矿的概率越大,可以发现在研究区深部有矿的概率很高,可以在其延伸处进一步划定靶区。
图12展示的成矿可能性高的区域大体上与已知的矿体情况较为吻合,卷积神经网络预测精度较高,结果有较高的可信度。因此圈定了两个靶区Ⅰ和Ⅱ,在海拔2000 m附近预测出较高的成矿概率,且从靶区Ⅰ可见,有向深部1500 m海拔的延伸的趋势,可以初步判定该处是成矿有利位置,后续可以对该延伸区进行重点勘查。
Figure 11. ROC curve
图11. ROC曲线图
Figure 12. CNN-based deep mineral prediction map and target area delineation
图12. 基于CNN的深部矿产预测图及靶区圈定
8. 结论
本文通过定量配置找矿预测因子,构建了深部地质、地球化学综合定量矿产预测模型,采用了深度学习中的卷积神经网络技术,对早子沟金矿区域的深部矿产资源进行了定量预测研究,得出了以下主要结论:
(1) 基于对原始勘测数据集的精心预处理(包括标准化、归一化)及主成分分析,本文定量提取了早子沟金矿区域的关键成矿元素组合。该元素组合准确地反映了研究区矿产地的空间分布特征,是指导深部矿产预测的重要区域指示性指标。
(2) 构建了包含了成矿元素组合在内的综合区域定量矿产预测数据集,通过应用卷积神经网络模型,在研究区内成功圈定了两个高潜力找矿靶区,特别是在海拔2000 m附近区域。进一步分析显示,其中Ⅰ号靶区有向更深层(1500 m)延伸的趋势,提示其作为重点成矿研究区的极高价值。使用二元交叉熵损失函数和优化器(Adam,学习率0.001)对CNN模型进行训练后,模型达到了95%的准确度,验证了该方法在深部矿产预测中的高效性和准确性。
综上所述,卷积神经网络与定量预测因子的结合,在深部矿产资源预测中展现了强大的技术支撑作用。预测结果不仅符合地质成矿规律,还显著提高了矿产资源的开发效率和质量,为类似区域的矿产勘查工作提供了可借鉴的范例,具备广泛的推广应用前景。