1. 引言
随着机器学习法在多方面的有效进展与实际运用,国内学者根据其方法原理,将其应用于岩性识别、产能预测以及非常规油气储层评价,在应对复杂井眼与地层建模以及提高测井解释效率方面取得实质性的进展[1]-[7]。此外,国外学者运用机器学习法在流体识别、标准化测井曲线、页岩气甜点区域预测及自动解释等领域展开了探索[8]。国内有关滩相碳酸盐岩测井解释方法主要有两种,一种是运用声波时差与孔隙度交会图建立孔隙度模型,利用孔渗关系计算对应的渗透率[9],另一种则是通过赋予目的层初始值,通过反算相应的理论测井值[10],有关滩相的物性预测方面较难,运用机器解释滩相碳酸盐岩进行储层物性方面还未实践。
目前JN区块储层物性测井解释主要依赖传统储层测井解释方法,由于传统AC-POR方法忽略多参数非线性关系导致误差较大,拟合程度较不准确,导致孔隙度预测值精确度较低。本文旨在通过智能机器学习方法进行较为精确的储层物性参数测井解释,运用LightGBM法和梯度提升树法(GBDT)对JN区块飞三段孔隙度和渗透率进行模型建立,获得更为准确的测井参数解释结果。
2. 研究区概况
JN区块位于湖北利川与重庆石柱交界处,地处川东褶皱带石柱复向斜中部,毗邻川东高产气区,如大池干、高峰场等,其区域构造位于川东褶皱带与湘鄂西褶皱带结合处[11]-[13]。区内包含石柱复向斜、齐岳山复背斜等次级构造单元[14]-[16]。JN区块勘探活动始于1970年,其主要的产气层为嘉一段、飞三段、长二段以及石炭系的黄龙组。其中,飞三段是最为关键的工业产气层[17]。JN区块的飞三气藏特征表现为低孔隙度、低渗透率、常压以及中–深层碳酸盐岩气藏。飞仙关组的沉积相被细分为碳酸盐台地相、台地边缘相和盆地相[18] [19]。区块构造内主要涉及56口井,以飞三段为主要目地层[20] (图1)。
Figure 1. Regional tectonic location map of JN block (According to Liang Xiwen, 2021 modified)
图1. JN地区区域构造位置图(据梁西文,2021修改)
3. AC-POR预测法
在测井作业中,孔隙度是用于量化地层岩石中孔隙空间所占的总体积比例的重要参数,是进行储量评估、产能预测以及测井解释的重要参数之一,通过声波、中子和密度等测井方法可以获得孔隙度数据,为油气储层的评价和开发提供有力支持。
Figure 2. The AC-POR diagram of the Fei-3 member in the JN block
图2. JN区块飞三段AC-POR关系图
依据研究区7口井飞三段的声波时差与实测孔隙度数据建立飞三段声波时差和孔隙度关系图(图2),飞三段孔隙度与声波时差呈现一定的正相关关系,R = 0.671,拟合程度偏低。由于飞三段储层非均质性强,单一AC参数难以表征孔隙结构复杂性,且未考虑GR、DEN等参数的协同影响,通过传统的储层参数预测方法得到的参数结果偏差较大,预测结果准确率较低。
4. 机器学习回归原理方法
4.1. LightGBM模型回归
LightGBM为微软公司于2017年开发的快速机器学习算法,其基础构建于梯度提升决策树(GBDT) [21] [22],采用直方图算法高效选择最优分裂点,并用带深度限制的按叶生长(Leaf-wise)策略,提升训练效率并减少了内存的占用[23]。
4.1.1. LightGBM算法原理
(1) 直方图算法
LightGBM引入直方图算法,将连续特征值离散化为“直方图箱”,通过统计各箱子样本数量及一、二阶梯度平均、平方和来精确反映样本分布。利用直方图构建决策树时,LightGBM评估各特征箱子的增益[23]。遵循最大化增益与最小化数据遍历量的原则选择最优分裂点,采用“近似贪心”算法从候选分裂点中挑选[24]。
(2) 带有深度限制的按叶生长(Leaf-wise)策略
决策树构建策略主要有按层生长(Level-wise)与按叶生长(Leaf-wise)两种(表1)。按叶生长策略不预设每层节点数,依据数据集复杂度和分布特性灵活生成节点,优先生长最大增益节点[21]。
Table 1. Comparison of leaf-by-leaf and layer-by-layer growth characteristics
表1. 按叶生长与按层生长特性对比
特性 |
按叶生长(Leaf-wise) |
按层生长(Level-wise) |
分裂策略 |
每次分裂增益最大的叶子节点 |
逐层分裂所有节点 |
树结构 |
非对称,深度可能更大 |
对称,宽度优先 |
计算效率 |
更高(减少冗余计算) |
较低(需遍历所有节点) |
内存占用 |
更低 |
更高 |
适用场景 |
大数据集、特征维度高 |
小数据集、需要平衡树结构的场景 |
过拟合风险 |
较高(需调参控制) |
较低 |
4.1.2. LightGBM模型构建
(1) 参数初始化:设定回归任务参数,选择损失函数,设置基础参数,正则化参数。
(2) 模型训练与验证:输入训练集,调整迭代次数,记录训练集和验证集的损失变化曲线,观察是否出现过拟合。对训练集进行K折交叉验证,评估模型稳定性,优化超参数。
(3) 性能指标计算:计算R2 (解释方差)、MAE (平均绝对误差)、RMSE (均方根误差)等指标。绘制预测值与真实值散点图、残差分布图,检查是否存在系统性偏差。
(4) 特征重要性分析:输出LightGBM的特征重要性排序,验证AC、GR对孔隙度的贡献是否符合地质规律。
4.2. 梯度提升树法回归
4.2.1. 梯度提升树算法原理
梯度提升决策树(GBDT)是一种基于Boosting思想的集成学习算法,通过结合多个弱学习器(决策树)逐步优化模型预测结果,性能优越,备受关注[25]-[27]。GBDT基于决策树的集成线性回归,由多棵回归树综合输出,广泛应用于回归预测[28]。
4.2.2. 梯度提升树模型构建
训练样本集A包括测井数据Xmn和渗透率Y,其中Xmn含m个样本,每样本n维特征。明确样本集后,按GBDT流程[25] [27]进行渗透率预测:
(1) 初始化弱学习器
:
(1)
式中:
为损失函数,
为常数。
(2) 启动迭代训练,每次迭代中k,对任意样本xin,采用绝对损失函数以减少干扰[26]-[29]。损失函数形式:
(2)
残差估计值为:
(3)
(3) 用CART(Classification and Regression Tree)回归树拟合,划分叶节点区域Cjk,计算各区域的最佳拟合值
,强化当前弱学习器,得到强学习器
。
(4) 输出最终模型:
(4)
5. 测井解释模型构建
5.1. 储层孔隙度解释模型
Figure 3. LightGBM porosity regression model training set sample comparison chart
图3. LightGBM孔隙度回归模型训练集样本对比图
基于机器学习方法LightGBM建立了飞三段孔隙度的回归模型(图3,图4),考虑模型在区内的普适性,仅引入AC、GR两种测井参数作为回归基本变量,建立模型的样本数为36个,训练集测试集样本数比为7:3,数据随机洗牌。模型分析认为:AC特征重要性为38.3%,GR特征重要性为61.7% (GR反映泥质含量,高GR值指示飞三段台地边缘相中泥质夹层发育,间接影响孔隙度计算)。由模型评估结果可见训练集及测试集精确率(R)分别为90.8%以及85.7%。
Figure 4. LightGBM porosity regression model test set sample comparison diagram
图4. LightGBM孔隙度回归模型测试集样本对比图
5.2. 储层渗透率解释模型
渗透率是衡量流体通过岩石的能力,在测井作业中,渗透率的测定能够揭示储层的渗流能力,为油气勘探与开发提供关键依据,有助于预测油气井的产量及开采效率,为制定科学的开采策略提供重要指导。
Figure 5. Comparison of training set samples of gradient boosting tree permeability regression model
图5. 梯度提升树渗透率回归模型训练集样本对比图
基于机器学习方法梯度提升树(GBDT)建立了飞三段渗透率的回归模型(图5,图6),考虑模型在区内的普适性,仅引入AC、GR、LightGBM机器学习解释后的孔隙度三种测井参数作为回归基本变量,建立模型的样本数为50个,训练集测试集样本数比为7:3,数据随机洗牌。模型分析认为:孔隙度特征重要性为50.6%,AC特征重要性为29.3%,GR特征重要性为20.1%。由模型评估结果可见训练集及测试集精确率(R)分别为100%以及96.4%。
Figure 6. Comparison chart of test set samples of gradient boosting tree permeability regression model
图6. 梯度提升树渗透率回归模型测试集样本对比图
6. 应用实例
Figure 7. Comprehensive histogram of logging interpretation model of the Fei-3 member in Well J61
图7. J61井飞三段测井解释模型综合柱状图
J61井位于JN构造高部位,属于飞三段台地相至盆地相过渡带。基于上述建立的测井解释模型,利用J61井AC、GR测井数据解释出飞三段物性参数如图7所示,其中运用LightGBM机器回归法解释孔隙度,梯度提升法(GBDT)解释渗透率,通过对比实测物性数据与解释出的孔隙度和渗透率进行分析,模型拟合效果较好,实测数据与解释模型基本吻合。将传统AC-POR储层预测模型和LightGBM解释模型比较,显然LightGBM解释模型更加吻合。利用J25井AC、GR测井数据解释出飞三段物性参数如图8所示,对比实测物性数据和机器学习解释的孔隙度和渗透率,预测数据与实测数据吻合程度较高。对比传统AC-POR预测方法和LightGBM解释方法,LightGBM预测结果吻合度更高。
Figure 8. Comprehensive histogram of logging interpretation model of the Fei-3 member in Well J25
图8. J25井飞三段测井解释模型综合柱状图
结合JN区块预测方法效果对比结果可知(表2),传统AC-POR交会预测法绝对误差范围为−2.106%至0.916%,相对误差范围为−61.76%至99.55%,误差波动较大,部分层位(如J25井T1f33层)预测值显著低于实测值,而XD2井T1f32b层预测值偏高。LightGBM回归预测法绝对误差范围为−0.816%至0.288%,相对误差范围为−39.61%至31.25%,误差范围显著小于AC-POR交会法,稳定性更高,最大负误差出现在J35-3井T1f31层。梯度提升树回归预测法绝对误差范围为−0.078 mD至0.014 mD,相对误差范围为−55.98%至23.47%,低渗透率样本相对误差较大,模型对小值预测敏感度不足。与传统储层物性测井解释方法相比,机器学习法解释物性吻合度更高。
Table 2. JN block prediction method effect comparison
表2. JN区块预测方法效果对比
井号 |
层位 |
深度段 |
实测孔隙度 |
AC-POR交会法 |
LightGBM回归法 |
实测渗透率 |
GBDT回归法 |
孔隙度 |
绝对误差 |
相对误差 |
孔隙度 |
绝对误差 |
相对误差 |
渗透率 |
绝对误差 |
相对误差 |
m |
% |
% |
% |
% |
% |
% |
% |
mD |
mD |
mD |
% |
J25 |
T1f33 |
3432.26~3476.92 |
0.470 |
0.801 |
0.331 |
70.370 |
0.506 |
0.036 |
7.711 |
0.060 |
0.074 |
0.014 |
23.469 |
T1f32b |
3476.92~3511.88 |
1.260 |
1.836 |
0.576 |
45.706 |
1.208 |
−0.052 |
−4.165 |
0.060 |
0.069 |
0.009 |
15.493 |
T1f32a |
3511.88~3555.31 |
0.920 |
1.836 |
0.916 |
99.554 |
1.208 |
0.288 |
31.252 |
0.140 |
0.062 |
−0.078 |
−55.981 |
J61 |
T1f32b |
3236.5~
3268 |
2.710 |
1.396 |
−1.314 |
−48.487 |
2.414 |
−0.296 |
−10.932 |
0.120 |
0.120 |
0.000 |
0.017 |
T1f32a |
3268~
3304 |
2.060 |
1.523 |
−0.537 |
−26.050 |
2.078 |
0.018 |
0.886 |
0.060 |
0.060 |
0.000 |
0.034 |
J68x |
T1f33 |
3781~
3839 |
1.600 |
1.116 |
−0.484 |
−30.225 |
1.735 |
0.135 |
8.410 |
0.072 |
0.060 |
−0.012 |
−16.638 |
XD1 |
T1f33 |
3231~
3267.5 |
1.162 |
0.917 |
−0.245 |
−21.122 |
1.068 |
−0.094 |
−8.105 |
0.068 |
0.060 |
−0.008 |
−11.734 |
T1f32b |
3267.5~
3309 |
1.115 |
0.948 |
−0.168 |
−15.037 |
1.053 |
−0.062 |
−5.570 |
0.065 |
0.060 |
−0.005 |
−7.232 |
XD2 |
T1f32b |
3229.95~3772 |
3.847 |
1.741 |
−2.106 |
−54.747 |
3.954 |
0.107 |
2.790 |
0.165 |
0.140 |
−0.025 |
−15.140 |
J35-3 |
T1f33 |
4242~
4312 |
3.106 |
1.195 |
−1.911 |
−61.520 |
2.360 |
−0.746 |
−24.016 |
0.133 |
0.060 |
−0.073 |
−54.872 |
T1f32b |
4312~
4375.8 |
2.061 |
0.788 |
−1.273 |
−61.758 |
1.245 |
−0.816 |
−39.606 |
0.109 |
0.060 |
−0.049 |
−44.935 |
T1f32a |
4375.8~
4468.3 |
2.045 |
0.782 |
−1.263 |
62.354 |
1.275 |
−0.770 |
−37.646 |
0.100 |
0.060 |
−0.040 |
−39.979 |
T1f31 |
4468.3~
4532 |
2.217 |
1.094 |
−1.123 |
91.930 |
2.038 |
−0.179 |
−8.070 |
0.129 |
0.060 |
−0.069 |
−53.472 |
7. 结论
(1) 传统AC-POR预测法精确度较低,预测的孔隙度准确性较差,主要是由于物性影响因素较多,单一测井参数线性回归误差较大。
(2) 基于LightGBM回归方法解释的孔隙度模型精确度高,训练集及测试集精确率(R)分别为90.8%以及85.7%,J61井应用该模型的拟合程度高,实测数据与解释数据基本能一一对应。
(3) 基于梯度提升树回归法解释渗透率,其模型精确度高,训练集及测试集精确率(R)分别为100%以及96.4%,对J61井应用该模型,其渗透率解释效果好,与实测数据拟合程度高。
(4) 模型依赖高质量测井数据,对低信噪比数据敏感;未来需验证其在其他碳酸盐岩区块(如礁滩相)的适用性。
基金项目
国家自然科学基金(41572130)及中石化科技部项目(P24155)资助。