1. 引言
微地震信号监测的过程包括了数据预处理、初至拾取、震源反演定位这三个阶段,其中,初至拾取的准确度会直接决定事件识别的精确度,是微地震信号监测的重点。为了解决在人工进行初至拾取时准确度不高,效率较低的问题,许多研究者提出了各种比较有效的方法,其中包括了自回归Akaike信息准则(AR-AIC)方法 [1],长短时窗平均比值法 [2],基于高阶统计量的方法 [3] [4] 等。然而这些传统方法在拾取时需要进行较多人工干预,因此在处理较大数据时效率不高,这仍然是一个很大的问题。
近年来,将机器学习应用到地震学领域中的方法引起了广泛关注,机器学习可以改进传统地震检测和震相识别方法,提高传统方法的识别效率和识别精度 [5]。因此,研究者们也开发出了很多利用机器学习进行初至拾取的方法,其中将卷积神经网络(CNN)和递归神经网络(RNN)应用到震相识别中的方法较为典型。与传统方法相比,利用神经网络进行震相识别有着更低的误检与漏识率,并且训练好的模型输出能力非常稳定,不需要根据噪声水平频繁调整阈值 [6]。而与RNN相比 [7] [8],CNN在震相自动拾取设计方面更有吸引力,并在地震数据处理方面得到了更多的研究 [9] [10]。
在以往的CNN在地震数据处理的应用研究中,人们往往都是对较大数据量的地震记录进行网络训练和地震波到时拾取。虽然有许多优秀的网络能对地震波进行较为精确的拾取,但如果将其网络应用于小数据集的地震波拾取,其拾取准确率会大大降低。一般将CNN应用于地震波拾取是对P波,S波同时进行到时拾取,这就要求网络对数据提取的特征较多,所以对训练数据量的需求也就较大。
为了解决CNN网络训练样本需求量大,难以应用于小数据集地震记录这一问题,本文提出的小数据集的微地震信号的震相拾取模型只使用CNN完成P波到时拾取,然后对地震数据进行极化,旋转和希尔伯特变换等处理后完成S波到时拾取,从而减少CNN网络对训练样本的需求。
2. 震相拾取模型
本文设计的震相拾取模型如图1所示,首先对原始数据进行CNN网络训练,完成对P波到时的拾取,然后依次对原始数据进行极化处理和旋转,希尔伯特变换等处理,从而得到较为理想的S波特征,以进行S波到时拾取。
此模型将P波拾取和S波拾取进行分离,降低了深度卷积神经网络的模型复杂性,可以在保证微震信号自动识别及到时拾取准确率较高的前提下降低训练所需数据量。

Figure 1. Flow chart of seismic phase pickup model
图1. 震相拾取模型流程图
3. 基于极化处理的S波特征提取
3.1. P波到时拾取网络的设计
CNN算法叫做卷积神经网络,是在人工神经网络的基础上发展而来的一种深度学习,是由多个卷积层、池化层及全连层构成的特征分类器,CNN是一种监督学习技术,可以直接应用于提取地震数据分类的幅度数据,相对于其他监督分类方法的主要优点是其空间感知和自动特征提取。
本文所用U-Net网络结构如图2所示,主要由输入层、输出层、一维卷积层(步长为1)、最大池化层(下采样)、反卷积层(上采样)以及ReLU非线性激活函数组成,其中输入层通道为3,对应三分量;输出层通道2,一通道为P的拾取的概率分布,另一通道为非p拾取的概率分布。

Figure 2. CNN network structure diagram
图2. CNN网络结构图
网络左侧为一个下采样过程,用以提取三通道微震信号的特征,由6个一维卷积层(紫色箭头)和2个最大池化层组成(棕色箭头),每经过一个最大池化层,数据缩小为原来的1/2。网络右侧是一个上采样过程,可以理解为一个解码器,将特征进行解码还原为需要的信息。上采样过程使用的是2个反卷积(绿色箭头),每次上采样将数据扩展为原来的2倍,然后将对应层的特征进行剪裁和复制,然后合并到上卷积的结果上(灰色箭头)。
3.2. 地震数据的极化处理和旋转
在空间坐标系中,一个矢量u的位置应该由它与坐标轴的三个夹角所决定,这三个夹角对应u的三个方向余弦,当这三个方向余弦平方和为1时它们也就正好对应了u的三个坐标标量,从而可以证明在空间坐标系中一个质点偏振的主要方向就是其主特征向量所代表的方向,其中主特征向量是指特征值最大的特征向量。
本文中,选取P波区段N组三分量数据计算P波的偏振主轴,首先,对于三分量的地震数据,需要计算它的协方差矩阵,后计算协方差矩阵的特征值
及特征向量
,
即为P波的偏振主轴。然后将坐标轴旋转使z轴与偏振主轴重合,旋转公式如下:
(1)
其中i为P波的入射角,
为P波的方位角。
3.3. 基于希尔伯特变换的S波特征提取
对于S波到时拾取,希尔伯特变换的方法有着较为显著的效果 [11],利用此方法可以得到S波的特征曲线,从而完成S波到时拾取的目的。首先将数据经过极化处理,后利用希尔伯特变换求取两个水平分量轨迹的分析轨迹
,
,即将极化处理后的X,Y分量数据
,
分别加上各自希尔伯特变换结果的i倍如公式(2),(3)所示,其中
,
代表X,Y分量的希尔伯特变换结果:
(2)
(3)
其中
,
代表经过极化处理后的X,Y分量数据,H代表进行希尔伯特变换,后计算瞬时协方差矩阵
,
对于每一个j而言都有两个特征值
,
且有
,然后取得S波特征函数:
(4)
S波的特征曲线如图3所示。
4. 模型性能分析
4.1. 实际数据的应用效果
在以上模型构建完成后,将实际数据带入模型进行性能分析。如图4所示,画出实际数据剖面图,并添加拾取结果,其中绿色点为P波到时,红色点为S波到时。可以看出此方法对P波和S波的拾取结果均较为准确,具有较好的泛用性。

Figure 3. Hilbert transform result. (a) Original x component seismic records; (b) Original y component seismic records; (c) Original z-component seismic records; (d) S Wave sign curve
图3. 希尔伯特变换结果。(a) x分量原始地震记录;(b) y分量原始地震记录;(c) z分量原始地震记录;(d) S波特征曲线

Figure 4. Application results of seismic phase pickup model
图4. 震相拾取模型应用结果
4.2. 与传统短长时窗法的对比
采用传统短长时窗法对此实际数据进行P波、S波到时拾取,用以与本文所构建模型进行性能对比。如图5所示,以其中一道地震记录为例,前三条曲线为地震三分量原始数据;第四条绿色曲线为CNN网络对P波的波形模拟结果;第四条红色曲线为经过极化、旋转及希尔伯特变换等处理后得到的S波特征曲线;第五条曲线为传统短长时窗法对两种波的拾取结果。
不难看出,本文所用方法对对P波和S波的到时拾取都较为精准。相对而言传统短长时窗法对两种波的拾取准度较差,且受噪声影响较大,即在拾取准度和抗噪声强度这两个地震记录处理方法中重要的方面上,本文所用方法的性能均优于传统短长时窗法。

Figure 5. Performance comparison of the two methods. (a) Original x component seismic records; (b) Original y component seismic records; (c) Original z-component seismic records; (d) The characteristic curve obtained by the model in this paper; (e) STA/LTA characteristic curve
图5. 两种方法性能对比。(a) x分量原始地震记录;(b) y分量原始地震记录;(c) z分量原始地震记录;(d) 本文模型得到的特征曲线;(e) STA/LTA特征曲线
4.3. 与一般CNN网络的对比
一般使用CNN网络对微震信号进行拾取会构建较为复杂的网络,对P波,S波同时进行到时拾取。本文所用对比CNN网络由8个一维卷积层,4个最大池化层,4个反卷积层组成,与本文所用CNN网络相比更为复杂,对训练样本数据量的需求也更大。如图6所示,将其对P波与S波的拾取结果与本文所用模型得到结果进行对比,可以看出两者对两种波的拾取效果相差不多,但本文所用网络的训练样本需求量大大降低,达到了本文的研究目的。

Figure 6. Comparison of performance of two CNN networks. (a) Original x component seismic records; (b) Original y component seismic records; (c) Original z-component seismic records; (d) The characteristic curve obtained by the model in this paper; (e) Characteristic curve obtained by general CNN
图6. 两种CNN网络性能对比。(a) x分量原始地震记录;(b) y分量原始地震记录;(c) z分量原始地震记录;(d) 本文模型得到的特征曲线;(e) 一般CNN得到的特征曲线
5. 结论与讨论
本文利用深度卷积神经网络,一系列地震资料处理方法及递归短长时窗法,设计了一套微震信号的自动识别与拾取流程,从结果可以看出,在保证准确率的前提下,本文所用方法实现了小样本的微震信号自动识别的机器学习训练,改善了一般CNN所面临的训练样本需求量大的问题。
当然,一般CNN在使用了大的训练样本的情况下可以不太依赖专业知识。即使缺乏专业知识和经验,也可能取得不错的效果。而本文所用方法需要在一定程度上依赖于使用者的专业知识和经验。不过对于专业人员来说,并没有地震专业知识方面的障碍,只要选取了好的特征向量,此方法就能够在较小的样本下获得很高的准确率和较强的泛化能力,在数据量不是绝对大的情况下有明显优势。
致谢
感谢煤炭资源与安全开采国家重点实验室的资金支持,感谢郑晶和吴志祥对本文CNN网络设计的指导和预测模型的提供。
基金项目
国家重点研发计划(2018YFB0605503),中国矿业大学(北京)大学生创新训练项目(2018TDB065503)。