1. 引言
激发极化法以不同岩、矿石在电流下的激电效应来寻找矿场的一种物探方法。它可分为频率域激发极化法和时间域激发极化法。它在地质构造探测,水文、岩土工程、环境地质调查等众多领域广泛应用。但常规激发极化法存在着难以区分与那些金属硫化物有相同物性产出的碳质、硫化物等非目标体和各种电磁耦合效应影响的两大难题。加上没有充分利用其中蕴含的信息,使得常规激发极化法的找矿效果受到了很大的影响。1978年,Pelton等 [1] 通过对岩(矿)石标本和露头的研究,证明Cole-Cole模型满足近似描述IP效应,模型中的4个参数:ρ0为电阻率;c为频率相关系数;m为充电率;τ为时间常数。随着不断深入研究,发现频谱参数在地球物理勘探中都具有重要意义。Pelton [1] ,Zonge [2] ,罗延钟 [3] 等发现不同的岩(矿)石具有不同的频谱参数特征,有无电磁耦合时的参数也同样存在差异;Major [4] ,吴之训 [5] ,Kemma [6] 等利用Cole-Cole模型频谱参数,有效区分出了引起激电异常的地质体,但认为其成败在于观测精度;随后Nordsiek [7] ,Grisseman [8] 等发现充电率 m可有效反映了可极化物质的含量,而可极化颗粒和孔隙大小都与时间常数τ有着密切关系;Revil [9] [10] ,Titov [11] 等研究发现岩(矿)石土中水的传导性、毛细管压力等都与频谱参数大小有关。在参数反演和真谱分解方面,罗延钟等 [3] 提出用视谱参数来确定真谱参数的解析计算方法;阮百尧和罗润林 [12] 提出只要四个频点数据就可求出模型参数的一种递推分解算法;Ghorbani [13] 提出贝叶斯模型对Cole-Cole模型反演,但反演实测数据效果不理想;随后他又提出对去除电磁耦合后的数据直接反演Cole-Cole模型参数的算法研究。罗润林等 [14] 采用最小二乘法从时域激电数据中反演出频谱参数信息,并实践中得到良好的效果。刘崧 [15] 对时域激电的一些案例分析和研究认为要解决诸如改进时域激电反演技术等问题。由于当前测量仪器的限制,在观测时间跨度大,观测时间变化无规律等问题上,很难做出相应改进。故充分利用时间常数信息可提高反演质量。
人工神经网络是1940年后出现的,它被认为是一种可行完全的非线性反演方法,故国内外地球物理工作者对此进行了大量研究。BP (Back Propagation)算法是人工神经网络中的一种监督式的学习算法。王鹤 [16] 等利用BP神经网络有效的提高了二维大地电磁的反演速度,但网络容易出现局部最优解。随后王鹤 [17] 又利用遗传算法对BP神经网络进行修改,并将反演结果跟最小二乘法反演对比,验证了遗传算法对二维大地电磁非线性反演的可行性和有效性。BP神经网络应用领域广泛,在自动控制、信号处理、医疗、经济和数据挖掘等领域,都取得较好的应用成果。本文基于MATLAB神经网络工具箱编写Cole-Cole模型参数训练与预测程序,探究了BP神经网络对Cole-Cole模型参数训练结果与预测效果的影响,最后确定了适合本文情况的BP神经网络训练预测的各项参数。用四组随机Cole-Cole模型参数样本训练和预测,预测结果验证了BP神经网络学习对于理论上Cole-Cole模型参数是可行的、有效的。
2. 原理
2.1. BP神经网络
BP神经网络是一种按误差逆传播算法训练的多层前馈神经网络。它是由众多的神经元可调的连接权值连接而成的,具有大规模并行处理、分布式信息存储、良好的自组织自学习能力等特点。其学习过程分为两个部分,第一部分是信号的前向传播,从输入层经过隐含层,再到达输出层;第二部分是误差的逆向传播,从输出层经过隐含层,再到输入层,依次调节隐含层到输出层的权重和偏置,输入层到隐含层的权重和偏置。
从图1看出,一个完整的BP神经网络模型由输入层、隐含层和输出层三部分组成。隐含层可以是一层或多层。图1是N × K × S的三层BP神经网络模型。输入层神经元个数与输入数据的维数相同,输出层神经元个数与需要拟合的数据个数相同,隐含层神经元个数与层数就需要自己根据一些规则和目标来设定。
Figure 1. Multilayer BP neural network model
图1. 多层BP神经网络模型
2.2. Cole-Cole模型的充电率正演计算
时间域激电视充电率mi定义为:
(1)
式(1)中:V0为供电时测量得到的一次场电位;
为第i个延时观测时段;V(t)为断电后t时刻的电位延时曲线。
根据时域中Cole-Cole模型的表达式,同时考虑D. Guptasarma [18] 数字滤波算法,即可以由式(1)计算出不同延时段的视充电率,得到式(4):
(2)
式中:I0为供电电流;Г(x)为伽马函数;ρ0为频率为零时的电阻率;c为频率相关系数;m为充电率;τ为时间常数。
3. BP神经网络训练与预测Cole-Cole模型参数
3.1. 训练集的参数选取
如表1所示。分别生成5000组,10,000组,20,000组和80,000组等四个样本集数据即分别为Ⅰ、Ⅱ、Ⅲ、Ⅳ组,由于c,m,τ都是随机取值故在得出的视充电率数据中可能存在一些较大异常值,需要对算出视充电率数据进行验证与处理。通过对数据归一化处理,可有效提升神经网络训练效率。
Table 1. Cole-Cole model spectrum parameter selection values
表1. Cole-Cole模型频谱参数选取值
本文设计了三种BP神经网络结构做对比,输入层的神经元节点为4,输出层的神经元节点为3,隐含层分别是单隐含层,双隐含层和三隐含层,其对应的神经元节点分别为 [12] ,[16,9],[8,16,12],即分别为4-[12]-3,4-[16,9]-3和4-[8,16,12]-3的神经网络结构。
3.2. 网络训练
由图2可发现5000组样本的BP神经网络训练预测反演结果形态基本一致。其中单隐含层BP神经网络结构预测c,m,τ对应的相关系数分别为0.57966,0.40077,0.92737,而均方误差损失函数(MSE)的值分别为0.00975,0.01821,0.18839,总均方误差损失函数(MSE)的值0.07212;双隐含层BP神经网络结构预测c,m,τ对应的相关系数分别为0.78055,0.42318,0.94492,而均方误差损失函数(MSE)的值分别为0.00864,0.01779,0.17494,总均方误差损失函数(MSE)的值0.06712;三隐含层BP神经网络结构预测c,m,τ对应的相关系数分别为0.78066,0.44937,0.95129,而均方误差损失函数(MSE)的值分别为0.00643,0.01541,0.13998,总均方误差损失函数(MSE)的值0.05394。表明BP神经网络训练Cole-Cole模型的5000组样本数据具有较高的精确度,数值接近,误差较小。
Figure 2. Schematic diagram of the parameter fitting effect of BP neural network training prediction model for 5000 sets of samples. (a) Single-hidden layer BP neural network structure training prediction parameters; (b) prediction parameters for structural training of double-hidden layer BP neural networks; (c) prediction parameters for structural training of BP neural networks in three hidden layers
图2. 5000组样本的BP神经网络训练预测模型参数拟合效果示意图。(a) 单隐含层BP神经网络结构训练预测参数;(b) 双隐含层BP神经网络结构训练预测参数;(c) 三隐含层BP神经网络结构训练预测参数
由图3可发现10000组样本的BP神经网络训练预测反演结果形态基本一致。其中单隐含层BP神经网络结构预测c,m,τ对应的相关系数分别为0.66055,0.41914,0.93884,而均方误差损失函数(MSE)的值分别为0.00684,0.01633,0.16642,总均方误差损失函数(MSE)的值0.06320;双隐含层BP神经网络结构预测c,m,τ对应的相关系数分别为0.71455,0.41914,0.94055,而均方误差损失函数(MSE)的值分别为0.00698,0.01626,0.17704,总均方误差损失函数(MSE)的值0.06676;三隐含层BP神经网络结构预测c,m,τ对应的相关系数分别为0.76923,0.52794,0.94372,而均方误差损失函数(MSE)的值分别为0.00601,0.01430,0.13935,总均方误差损失函数(MSE)的值0.05322。表明BP神经网络训练Cole-Cole模型的10000组样本数据具有较高的精确度,数值接近,误差较小。
从表2中可以看出,BP神经网络训练Cole-Cole模型参数c,m,τ的相关系数较高,均方误差损失函数(MSE)值较低,预测效果较好。对比三种不同BP神经网络结构训练预测结果可发现,使用三隐含层的BP神经网络结构,训练模型更加稳定,因此本文的预测反演精确度较高,误差较小,结果可靠。
Figure 3. Schematic diagram of the parameter fitting effect of BP neural network training prediction model with 10000 sets of samples. (a) Single-hidden layer BP neural network structure training prediction parameters; (b) prediction parameters for structural training of double-hidden layer BP neural networks; (c) prediction parameters for structural training of BP neural networks in three hidden layers
图3. 10000组样本的BP神经网络训练预测模型参数拟合效果示意图。(a) 单隐含层BP神经网络结构训练预测参数;(b) 双隐含层BP神经网络结构训练预测参数;(c) 三隐含层BP神经网络结构训练预测参数
Table 2. BP neural network training Cole-Cole model correlation coefficient and mean squared error MSE
表2. BP神经网络训练Cole-Cole模型相关系数及均方误差MSE
3.3. 应用
图4为某矿区物探实际材料图。该区虽经多期构造运动作用,但次级褶皱不甚发育,而以大致平行地层走向的北东向断裂为主。多期次活动特点,派生、次级断裂发育,断裂多为压扭性、张性,是该区的矿液运移通道和储矿构造。该区构造运动频繁且强烈,岩浆作用多,褶皱断裂发育,变质作用强烈,是该区成矿的有利条件。
Figure 4. Actual material diagram of geophysical prospecting in a mining area
图4. 某矿区物探实际材料图
图5是该矿区实测数据代入BP神经网络中训练与预测结果图。应用Cole-Cole模型反演得到Cole-Cole模型参数后,可发现本测区频率相关系数c,充电率m,时间常数τ、视充电率ms和视电阻率ρs异常基本都呈带状分布,通过频谱参数对其进行划分,可划分为C1~C5的频率相关系数异常、M1~M5的充电率异常、T1~T5的时间常数异常和N1~N5的视充电率异常,由视电阻率可分为R1~R4的视电阻率异常。从图5可以看到C1、M1、T1、N1在同一异常为I异常,该异常位于测区北部,10线~23线中部,呈北东走向,视充电率大于5%,异常区域视电阻率值小于1000 Ω∙m,对应在R3低视电阻率异常带,属于低频率相关系数、高充电率、高时间常数、高视充电率、低阻异常带,可能是由黑云母花岗岩与围岩接触蚀变引起的,从异常的形态上,推测黑云母花岗岩体向北倾;C2、M2、T2、N2在同一异常为II异常,该异常位于测区西部,0线~23线西端,呈北东走向,视充电率大于6%,12线~23线西端异常区域视电阻率值大于1000 Ω∙m,对应R1的高视电阻率异常带,0线~11线西端异常区域视电阻率值小于600 Ω∙m,局部小于200 Ω∙m,在R3低视电阻率异常带内,属于低频率相关系数、高充电率、高时间常数、高视充电率异常带,可能为矿化引起的,推断断层向西倾;C3、M3、T3、N3在同一异常为III异常,该异常位于测区的西部,9线~17线最西端,视充电率小于5%,异常区域视电阻率值大于1000 Ω∙m,对应在R1的高视电阻率异常带,属于高频率相关系数、低充电率、低时间常数、低视充电率、高阻异常带,主要是花岗岩体及其与围岩接触变质等引起的;C4、M4、T4、N4在同一异常为IV异常,该异常带位于测区东部,11线~23线后部,呈北东走向,视充电率小于5%,异常区域视电阻率值大于1200 Ω∙m,局部大于2800 Ω∙m,对应在R2的高视电阻率异常带,属于高频率相关系数、低充电率、低时间常数、低视充电率、高阻异常带,可能是由黑云母花岗岩与围岩接触蚀变引起的;C5、M5、T5、N5在同一异常为V异常,该异常贯穿整个测区,呈北东走向,视充电率小于5%,其中0线~11线最东端异常带区域的视电阻率总体较低,一般小于600 Ω∙m,局部小于200 Ω∙m,在R4的低视电阻率异常带,正好与已知黄铁矿对应。而0线~11线的中部异常带区域的视电阻率值大于1200 Ω∙m,在R2高视电阻率异常带内,12线~23线的中东部异常区域视电阻率值小于800 Ω∙m,局部小于200 Ω∙m,在R3低视电阻率异常带内,该异常属于高频率相关系数、低充电率、低时间常数、低视充电率异常带。
4. 结论
1) 本文由视电阻率定义结合Cole-Cole模型表达式推导频谱参数并利用BP神经网络来代替传统正演算法,发现BP神经网络计算所需时间远少于传统正演算法计算时间,在训练与预测反演结果基本保持一致保持大体一致的情况下,能极大的减少用于反演计算的时间,提高效率优化反演。
2) 在对BP神经网络进行训练前需要对数据进行归一化处理,避免预测反演结果的均方误差损失函数过大,而影响反演精度。
3) 使用BP神经网络训练模型,需要多次设计不同隐含层和不同隐含层神经元节点数进行训练,才能确定适合训练该模型的隐含层参数。
4) 本文利用4个时间窗口的观测数据进行训练,预测反演Cole-Cole模型频谱参数的准确性可能不够高。若能获得更多时间窗口的观测数据,预测反演可能更好。