滩相碳酸盐岩储层测井物性参数智能机器解释——以JN区块飞三段为例
Intelligent Machine Interpretation of Logging Physical Parameters of Beach Facies Carbonate Reservoir —Taking Fei-3 Member of JN Block as an Example
DOI: 10.12677/ojns.2025.136122, PDF, HTML, XML,    国家自然科学基金支持
作者: 马婷婷, 谢润成, 陈 成, 白皓瀚, 李思远:成都理工大学能源学院(页岩气现代产业学院),四川 成都;付晓飞:中石化江汉油田分公司勘探开发研究院,湖北 武汉
关键词: JN区块飞三段LightGBM模型回归梯度提升树决策树(GBDT)孔隙度渗透率JN Block Fei-3 Member LightGBM Model Regression Gradient Boost Decision Tree (GBDT) Porosity Permeability
摘要: 滩相碳酸盐岩储层因强烈的非均质性和复杂的孔隙结构,其测井物性参数解释一直是研究的难点和重点。目前的研究主要集中在通过岩心、成像测井、核磁共振等特殊资料,结合机器学习等新技术,建立针对不同岩石物理相和孔隙结构的解释模型,以实现储层参数精细计算和有效性评价。传统AC-POR预测方法难以准确解释储层的孔隙度,为准确了解JN区块飞三段储层的孔隙度和渗透率,更精确地评估储层的含油性和产能,本文基于录井、测试等资料,利用AC、GR、DEN等测井数据,通过机器学习回归法(LightGBM模型回归和梯度提升决策树(GBDT)),对JN区块飞三段储层孔隙度和渗透率进行解释模拟,显著提高了测井参数预测的准确性。结果表明,与传统方法相比,机器学习模型显著提高了测井参数的预测精度,为JN区块飞三段储层评价与开发提供了可靠依据。
Abstract: Due to the strong heterogeneity and complex pore structure of beach carbonate reservoirs, the interpretation of logging physical parameters has always been a difficulty and focus of research. The current research mainly focuses on the establishment of interpretation models for different rock physical phases and pore structures through special data such as core, imaging logging, and nuclear magnetic resonance, combined with new technologies such as machine learning to achieve fine calculation and effectiveness evaluation of reservoir parameters. The traditional AC-POR prediction method is difficult to accurately explain the porosity of the reservoir. In order to accurately understand the porosity and permeability of the reservoir in the Fei-3 Member of the JN Block and more accurately evaluate the oil content and productivity of the reservoir, this paper is based on data from mud logging and testing. Using AC, GR, DEN and other logging data, through machine learning regression method (LightGBM model regression and gradient boosting decision tree (GBDT)), the porosity and permeability of the Fei-3 Member of the JN Block are explained and simulated, which significantly improves the accuracy of logging parameter prediction. The results demonstrate that the machine learning models significantly improve the prediction accuracy of logging parameters compared to conventional methods, providing a reliable foundation for reservoir evaluation and development in the Fei-3 Member of the JN Block.
文章引用:马婷婷, 谢润成, 付晓飞, 陈成, 白皓瀚, 李思远. 滩相碳酸盐岩储层测井物性参数智能机器解释——以JN区块飞三段为例[J]. 自然科学, 2025, 13(6): 1166-1176. https://doi.org/10.12677/ojns.2025.136122

1. 引言

随着机器学习法在多方面的有效进展与实际运用,国内学者根据其方法原理,将其应用于岩性识别、产能预测以及非常规油气储层评价,在应对复杂井眼与地层建模以及提高测井解释效率方面取得实质性的进展[1]-[7]。此外,国外学者运用机器学习法在流体识别、标准化测井曲线、页岩气甜点区域预测及自动解释等领域展开了探索[8]。国内有关滩相碳酸盐岩测井解释方法主要有两种,一种是运用声波时差与孔隙度交会图建立孔隙度模型,利用孔渗关系计算对应的渗透率[9],另一种则是通过赋予目的层初始值,通过反算相应的理论测井值[10],有关滩相的物性预测方面较难,运用机器解释滩相碳酸盐岩进行储层物性方面还未实践。

目前JN区块储层物性测井解释主要依赖传统储层测井解释方法,由于传统AC-POR方法忽略多参数非线性关系导致误差较大,拟合程度较不准确,导致孔隙度预测值精确度较低。本文旨在通过智能机器学习方法进行较为精确的储层物性参数测井解释,运用LightGBM法和梯度提升树法(GBDT)对JN区块飞三段孔隙度和渗透率进行模型建立,获得更为准确的测井参数解释结果。

2. 研究区概况

JN区块位于湖北利川与重庆石柱交界处,地处川东褶皱带石柱复向斜中部,毗邻川东高产气区,如大池干、高峰场等,其区域构造位于川东褶皱带与湘鄂西褶皱带结合处[11]-[13]。区内包含石柱复向斜、齐岳山复背斜等次级构造单元[14]-[16]。JN区块勘探活动始于1970年,其主要的产气层为嘉一段、飞三段、长二段以及石炭系的黄龙组。其中,飞三段是最为关键的工业产气层[17]。JN区块的飞三气藏特征表现为低孔隙度、低渗透率、常压以及中–深层碳酸盐岩气藏。飞仙关组的沉积相被细分为碳酸盐台地相、台地边缘相和盆地相[18] [19]。区块构造内主要涉及56口井,以飞三段为主要目地层[20] (图1)。

Figure 1. Regional tectonic location map of JN block (According to Liang Xiwen, 2021 modified)

1. JN地区区域构造位置图(据梁西文,2021修改)

3. AC-POR预测法

在测井作业中,孔隙度是用于量化地层岩石中孔隙空间所占的总体积比例的重要参数,是进行储量评估、产能预测以及测井解释的重要参数之一,通过声波、中子和密度等测井方法可以获得孔隙度数据,为油气储层的评价和开发提供有力支持。

Figure 2. The AC-POR diagram of the Fei-3 member in the JN block

2. JN区块飞三段AC-POR关系图

依据研究区7口井飞三段的声波时差与实测孔隙度数据建立飞三段声波时差和孔隙度关系图(图2),飞三段孔隙度与声波时差呈现一定的正相关关系,R = 0.671,拟合程度偏低。由于飞三段储层非均质性强,单一AC参数难以表征孔隙结构复杂性,且未考虑GR、DEN等参数的协同影响,通过传统的储层参数预测方法得到的参数结果偏差较大,预测结果准确率较低。

4. 机器学习回归原理方法

4.1. LightGBM模型回归

LightGBM为微软公司于2017年开发的快速机器学习算法,其基础构建于梯度提升决策树(GBDT) [21] [22],采用直方图算法高效选择最优分裂点,并用带深度限制的按叶生长(Leaf-wise)策略,提升训练效率并减少了内存的占用[23]

4.1.1. LightGBM算法原理

(1) 直方图算法

LightGBM引入直方图算法,将连续特征值离散化为“直方图箱”,通过统计各箱子样本数量及一、二阶梯度平均、平方和来精确反映样本分布。利用直方图构建决策树时,LightGBM评估各特征箱子的增益[23]。遵循最大化增益与最小化数据遍历量的原则选择最优分裂点,采用“近似贪心”算法从候选分裂点中挑选[24]

(2) 带有深度限制的按叶生长(Leaf-wise)策略

决策树构建策略主要有按层生长(Level-wise)与按叶生长(Leaf-wise)两种(表1)。按叶生长策略不预设每层节点数,依据数据集复杂度和分布特性灵活生成节点,优先生长最大增益节点[21]

Table 1. Comparison of leaf-by-leaf and layer-by-layer growth characteristics

1. 按叶生长与按层生长特性对比

特性

按叶生长(Leaf-wise)

按层生长(Level-wise)

分裂策略

每次分裂增益最大的叶子节点

逐层分裂所有节点

树结构

非对称,深度可能更大

对称,宽度优先

计算效率

更高(减少冗余计算)

较低(需遍历所有节点)

内存占用

更低

更高

适用场景

大数据集、特征维度高

小数据集、需要平衡树结构的场景

过拟合风险

较高(需调参控制)

较低

4.1.2. LightGBM模型构建

(1) 参数初始化:设定回归任务参数,选择损失函数,设置基础参数,正则化参数。

(2) 模型训练与验证:输入训练集,调整迭代次数,记录训练集和验证集的损失变化曲线,观察是否出现过拟合。对训练集进行K折交叉验证,评估模型稳定性,优化超参数。

(3) 性能指标计算:计算R2 (解释方差)、MAE (平均绝对误差)、RMSE (均方根误差)等指标。绘制预测值与真实值散点图、残差分布图,检查是否存在系统性偏差。

(4) 特征重要性分析:输出LightGBM的特征重要性排序,验证AC、GR对孔隙度的贡献是否符合地质规律。

4.2. 梯度提升树法回归

4.2.1. 梯度提升树算法原理

梯度提升决策树(GBDT)是一种基于Boosting思想的集成学习算法,通过结合多个弱学习器(决策树)逐步优化模型预测结果,性能优越,备受关注[25]-[27]。GBDT基于决策树的集成线性回归,由多棵回归树综合输出,广泛应用于回归预测[28]

4.2.2. 梯度提升树模型构建

训练样本集A包括测井数据Xmn和渗透率Y,其中Xmn含m个样本,每样本n维特征。明确样本集后,按GBDT流程[25] [27]进行渗透率预测:

(1) 初始化弱学习器 f 0 ( x )

f 0 ( x )=argminα i=1 m L( y i ,α ) (1)

式中: L( y i ,α ) 为损失函数, α 为常数。

(2) 启动迭代训练,每次迭代中k,对任意样本xin,采用绝对损失函数以减少干扰[26]-[29]。损失函数形式:

L( y,f( x ) )=| yf( x ) |= i=1 m 1 ( y i f( x in ) )+ i= m 1 +1 m ( f( x in ) y i ) (2)

残差估计值为:

L( y,f( x ) ) f( x ) =2 m 1 m (3)

(3) 用CART(Classification and Regression Tree)回归树拟合,划分叶节点区域Cjk,计算各区域的最佳拟合值 β jk ,强化当前弱学习器,得到强学习器 f k ( x in )

(4) 输出最终模型:

F( x )=median( Y )+ k=1 K j=1 J β jk ·η (4)

5. 测井解释模型构建

5.1. 储层孔隙度解释模型

Figure 3. LightGBM porosity regression model training set sample comparison chart

3. LightGBM孔隙度回归模型训练集样本对比图

基于机器学习方法LightGBM建立了飞三段孔隙度的回归模型(图3图4),考虑模型在区内的普适性,仅引入AC、GR两种测井参数作为回归基本变量,建立模型的样本数为36个,训练集测试集样本数比为7:3,数据随机洗牌。模型分析认为:AC特征重要性为38.3%,GR特征重要性为61.7% (GR反映泥质含量,高GR值指示飞三段台地边缘相中泥质夹层发育,间接影响孔隙度计算)。由模型评估结果可见训练集及测试集精确率(R)分别为90.8%以及85.7%。

Figure 4. LightGBM porosity regression model test set sample comparison diagram

4. LightGBM孔隙度回归模型测试集样本对比图

5.2. 储层渗透率解释模型

渗透率是衡量流体通过岩石的能力,在测井作业中,渗透率的测定能够揭示储层的渗流能力,为油气勘探与开发提供关键依据,有助于预测油气井的产量及开采效率,为制定科学的开采策略提供重要指导。

Figure 5. Comparison of training set samples of gradient boosting tree permeability regression model

5. 梯度提升树渗透率回归模型训练集样本对比图

基于机器学习方法梯度提升树(GBDT)建立了飞三段渗透率的回归模型(图5图6),考虑模型在区内的普适性,仅引入AC、GR、LightGBM机器学习解释后的孔隙度三种测井参数作为回归基本变量,建立模型的样本数为50个,训练集测试集样本数比为7:3,数据随机洗牌。模型分析认为:孔隙度特征重要性为50.6%,AC特征重要性为29.3%,GR特征重要性为20.1%。由模型评估结果可见训练集及测试集精确率(R)分别为100%以及96.4%。

Figure 6. Comparison chart of test set samples of gradient boosting tree permeability regression model

6. 梯度提升树渗透率回归模型测试集样本对比图

6. 应用实例

Figure 7. Comprehensive histogram of logging interpretation model of the Fei-3 member in Well J61

7. J61井飞三段测井解释模型综合柱状图

J61井位于JN构造高部位,属于飞三段台地相至盆地相过渡带。基于上述建立的测井解释模型,利用J61井AC、GR测井数据解释出飞三段物性参数如图7所示,其中运用LightGBM机器回归法解释孔隙度,梯度提升法(GBDT)解释渗透率,通过对比实测物性数据与解释出的孔隙度和渗透率进行分析,模型拟合效果较好,实测数据与解释模型基本吻合。将传统AC-POR储层预测模型和LightGBM解释模型比较,显然LightGBM解释模型更加吻合。利用J25井AC、GR测井数据解释出飞三段物性参数如图8所示,对比实测物性数据和机器学习解释的孔隙度和渗透率,预测数据与实测数据吻合程度较高。对比传统AC-POR预测方法和LightGBM解释方法,LightGBM预测结果吻合度更高。

Figure 8. Comprehensive histogram of logging interpretation model of the Fei-3 member in Well J25

8. J25井飞三段测井解释模型综合柱状图

结合JN区块预测方法效果对比结果可知(表2),传统AC-POR交会预测法绝对误差范围为−2.106%至0.916%,相对误差范围为−61.76%至99.55%,误差波动较大,部分层位(如J25井T1f33层)预测值显著低于实测值,而XD2井T1f32b层预测值偏高。LightGBM回归预测法绝对误差范围为−0.816%至0.288%,相对误差范围为−39.61%至31.25%,误差范围显著小于AC-POR交会法,稳定性更高,最大负误差出现在J35-3井T1f31层。梯度提升树回归预测法绝对误差范围为−0.078 mD至0.014 mD,相对误差范围为−55.98%至23.47%,低渗透率样本相对误差较大,模型对小值预测敏感度不足。与传统储层物性测井解释方法相比,机器学习法解释物性吻合度更高。

Table 2. JN block prediction method effect comparison

2. JN区块预测方法效果对比

井号

层位

深度段

实测孔隙度

AC-POR交会法

LightGBM回归法

实测渗透率

GBDT回归法

孔隙度

绝对误差

相对误差

孔隙度

绝对误差

相对误差

渗透率

绝对误差

相对误差

m

%

%

%

%

%

%

%

mD

mD

mD

%

J25

T1f33

3432.26~3476.92

0.470

0.801

0.331

70.370

0.506

0.036

7.711

0.060

0.074

0.014

23.469

T1f32b

3476.92~3511.88

1.260

1.836

0.576

45.706

1.208

−0.052

−4.165

0.060

0.069

0.009

15.493

T1f32a

3511.88~3555.31

0.920

1.836

0.916

99.554

1.208

0.288

31.252

0.140

0.062

−0.078

−55.981

J61

T1f32b

3236.5~ 3268

2.710

1.396

−1.314

−48.487

2.414

−0.296

−10.932

0.120

0.120

0.000

0.017

T1f32a

3268~ 3304

2.060

1.523

−0.537

−26.050

2.078

0.018

0.886

0.060

0.060

0.000

0.034

J68x

T1f33

3781~ 3839

1.600

1.116

−0.484

−30.225

1.735

0.135

8.410

0.072

0.060

−0.012

−16.638

XD1

T1f33

3231~ 3267.5

1.162

0.917

−0.245

−21.122

1.068

−0.094

−8.105

0.068

0.060

−0.008

−11.734

T1f32b

3267.5~ 3309

1.115

0.948

−0.168

−15.037

1.053

−0.062

−5.570

0.065

0.060

−0.005

−7.232

XD2

T1f32b

3229.95~3772

3.847

1.741

−2.106

−54.747

3.954

0.107

2.790

0.165

0.140

−0.025

−15.140

J35-3

T1f33

4242~ 4312

3.106

1.195

−1.911

−61.520

2.360

−0.746

−24.016

0.133

0.060

−0.073

−54.872

T1f32b

4312~ 4375.8

2.061

0.788

−1.273

−61.758

1.245

−0.816

−39.606

0.109

0.060

−0.049

−44.935

T1f32a

4375.8~ 4468.3

2.045

0.782

−1.263

62.354

1.275

−0.770

−37.646

0.100

0.060

−0.040

−39.979

T1f31

4468.3~ 4532

2.217

1.094

−1.123

91.930

2.038

−0.179

−8.070

0.129

0.060

−0.069

−53.472

7. 结论

(1) 传统AC-POR预测法精确度较低,预测的孔隙度准确性较差,主要是由于物性影响因素较多,单一测井参数线性回归误差较大。

(2) 基于LightGBM回归方法解释的孔隙度模型精确度高,训练集及测试集精确率(R)分别为90.8%以及85.7%,J61井应用该模型的拟合程度高,实测数据与解释数据基本能一一对应。

(3) 基于梯度提升树回归法解释渗透率,其模型精确度高,训练集及测试集精确率(R)分别为100%以及96.4%,对J61井应用该模型,其渗透率解释效果好,与实测数据拟合程度高。

(4) 模型依赖高质量测井数据,对低信噪比数据敏感;未来需验证其在其他碳酸盐岩区块(如礁滩相)的适用性。

基金项目

国家自然科学基金(41572130)及中石化科技部项目(P24155)资助。

参考文献

[1] 任义丽, 周相广. 基于机器学习的储集层含油气性评价[J]. 信息系统工程, 2019(6): 21-22.
[2] 曹志民, 吴云, 韩建, 等. 测井数据岩相分类的机器学习方法和大数据岩相分类探讨[J]. 化工自动化及仪表, 2017, 44(8): 717-720+729.
[3] 马文礼, 李治平, 孙玉平, 等. 基于机器学习的页岩气产能非确定性预测方法研究[J]. 特种油气藏, 2019, 26(2): 101-105.
[4] 杨森, 吴时国, 王吉亮, 等. 基于机器学习方法的天然气水合物稳定带厚度计算[J]. 天然气地球科学, 2018, 29(11): 1679-1690.
[5] 张东晓, 陈云天, 孟晋. 基于循环神经网络的测井曲线生成方法[J]. 石油勘探与开发, 2018, 45(4): 598-607.
[6] 柴明锐, 程丹, 张昌民, 等. 机器学习方法对砂砾岩岩屑成分的预测——以西北缘X723井百口泉组为例[J]. 西安石油大学学报(自然科学版), 2017, 32(5): 22-28+61.
[7] 李克文, 周广悦, 路慎强, 等. 一种基于机器学习的有利区评价新方法[J]. 特种油气藏, 2019, 26(3): 7-11.
[8] 程希, 程宇雪, 程佳豪, 等. 基于机器学习与大数据技术的地球物理测井系统[J]. 西安石油大学学报(自然科学版), 2019, 34(6): 108-116.
[9] 区舫, 杨辉廷, 黄晓兵. X气田飞仙关组礁滩相储层测井解释方法应用[J]. 油气藏评价与开发, 2021, 11(5): 744-752.
[10] 靳秀菊. 普光气田礁滩相储层非均质性定量表征技术研究[D]: [博士学位论文]. 北京: 中国石油大学(北京), 2017.
[11] 由凯, 杨知敏, 王思航, 等. 建南气田飞仙关组飞三段储层特征研究[J]. 重庆科技学院学报(自然科学版), 2014, 16(2): 5-8.
[12] 毕海龙, 李斌, 彭军, 等. 四川盆地东北部飞仙关组优质储层特征[J]. 海相油气地质, 2010, 15(2): 30-35.
[13] 黄强, 高秀娥, 吴丽萍. 对建南构造南飞三气藏储层地质特征的认识[J]. 江汉石油职工大学学报, 2011, 24(2): 6-7+18.
[14] 彭美霞, 冯琼. 建南气田碳酸盐岩储层测井解释方法研究[J]. 资源环境与工程, 2007(5): 520-523.
[15] 张建勇, 刘文汇, 腾格尔, 等. 建南气田长兴组-飞仙关组天然气特征及气源分析[J]. 天然气地球科学, 2010, 21(6): 1004-1013.
[16] 李爱荣, 李净红, 张金功. 建南气田天然气地球化学特征及成因[J]. 石油学报, 2015, 36(10): 1199-1209+1298.
[17] 万云强, 殷文洁, 陈明剑. 建南地区低孔低渗储集层改造技术应用效果分析[J]. 石油天然气学报(江汉石油学院学报), 2005(2): 249-250.
[18] 马登峰, 康红, 刘漪. 建南气田北部下三叠统飞仙关组飞三段白云岩成因[J]. 天然气勘探与开发, 2014, 37(1): 5-9+95.
[19] 曾庆立. 建南气田周缘地区飞仙关组沉积特征与勘探目标[J]. 江汉石油职工大学学报, 2004(2): 8-9, 22.
[20] 梁西文, 张莉. 川东建南地区须家河组储层特征及发育控制因素研究[J]. 华南地质, 2021, 37(1): 53-63.
[21] Ke, G., Meng, Q., Finley, T., et al. (2017) LightGBM: A Highly Efficient Gradient Boosting Decision Tree. Proceedings of Conference on Neural Information Processing Systems, Long Beach, 4-9 December 2017, 569-577.
[22] Friedman, J.H. (2002) Stochastic Gradient Boosting. Computational Statistics & Data Analysis, 38, 367-378. [Google Scholar] [CrossRef
[23] Luo, Y., Xu, Q., Li, W., Jiang, F. and Xiao, B. (2021) A Multi-Step Decision Prediction Model Based on LightGBM. 2021 IEEE International Conference on Big Data (Big Data), Orlando, 15-18 December 2021, 5714-5718. [Google Scholar] [CrossRef
[24] 肖晓, 闫建平, 郭伟, 等. 基于LightGBM算法的页岩气储层甜点参数预测方法[J]. 中国煤炭地质, 2023, 35(10): 28-37.
[25] Liao, Z., Huang, Y., Yue, X., Lu, H., Xuan, P. and Ju, Y. (2016) In Silico Prediction of Gamma-Aminobutyric Acid Type-A Receptors Using Novel Machine-Learning-Based SVM and GBDT Approaches. BioMed Research International, 2016, Article ID: 2375268. [Google Scholar] [CrossRef] [PubMed]
[26] Ma, X., Ding, C., Luan, S., Wang, Y. and Wang, Y. (2017) Prioritizing Influential Factors for Freeway Incident Clearance Time Prediction Using the Gradient Boosting Decision Trees Method. IEEE Transactions on Intelligent Transportation Systems, 18, 2303-2310. [Google Scholar] [CrossRef
[27] Zhang, C., Zhang, Y., Shi, X., Almpanidis, G., Fan, G. and Shen, X. (2019) On Incremental Learning for Gradient Boosting Decision Trees. Neural Processing Letters, 50, 957-987. [Google Scholar] [CrossRef
[28] 葛恭豪. 机器学习算法原理及效率分析[J]. 电子世界, 2018(1): 65-66.
[29] Farebrother, R.W. (1991) A Simple Bayesian Estimation Problem with Laplace Disturbances and Absolute-Error Loss Function-Solution. Econometric Theory, 7, 140-141. [Google Scholar] [CrossRef