跳转到主要内容gydF4y2Ba

原始研究的文章gydF4y2Ba

前面。地球科学。,20J一个nu一个ry2023gydF4y2Ba
秒。沉积学、地层学和成岩作用gydF4y2Ba
卷11 - 2023 |gydF4y2Ba https://doi.org/10.3389/feart.2023.1095611gydF4y2Ba

岩相的测井识别强烈异构深埋水库基于改进贝叶斯反演:侏罗纪砂岩越低,准噶尔盆地中部,中国gydF4y2Ba

www.雷竞技rebatfrontiersin.orggydF4y2BaZongyuan郑gydF4y2Ba 1、2、3gydF4y2Ba www.雷竞技rebatfrontiersin.orggydF4y2BaLikuan张gydF4y2Ba 1、2gydF4y2Ba*gydF4y2Bawww.雷竞技rebatfrontiersin.orggydF4y2Ba明程gydF4y2Ba1、2gydF4y2Ba www.雷竞技rebatfrontiersin.orggydF4y2Ba宇鸿LeigydF4y2Ba1、2gydF4y2Ba www.雷竞技rebatfrontiersin.orggydF4y2BaZengbao张gydF4y2Ba4gydF4y2Ba www.雷竞技rebatfrontiersin.orggydF4y2Ba挚萍曾gydF4y2Ba4gydF4y2Ba www.雷竞技rebatfrontiersin.orggydF4y2Ba新城任gydF4y2Ba4gydF4y2Ba www.雷竞技rebatfrontiersin.orggydF4y2Ba蓝宇gydF4y2Ba5gydF4y2Ba www.雷竞技rebatfrontiersin.orggydF4y2Ba杨绣gydF4y2Ba6gydF4y2Ba www.雷竞技rebatfrontiersin.orggydF4y2Ba曹国伟李gydF4y2Ba 1、2gydF4y2Ba www.雷竞技rebatfrontiersin.orggydF4y2BaNaigui刘gydF4y2Ba1、2gydF4y2Ba
  • 1gydF4y2Ba石油资源研究的重点实验室,地质与地球物理研究所,中国科学院,北京,中国gydF4y2Ba
  • 2gydF4y2Ba创新学院地球科学,中国科学院,北京,中国gydF4y2Ba
  • 3gydF4y2Ba中国科学院大学,北京,中国gydF4y2Ba
  • 4gydF4y2Ba中石化胜利油田公司,东营,山东,中国gydF4y2Ba
  • 5gydF4y2Ba中石化石油勘探和生产研究所,北京,中国gydF4y2Ba
  • 6gydF4y2BaLysaker AspenTech地下科学与工程,挪威gydF4y2Ba

深埋碎屑低渗透性储层非均质性强的特征可能导致很大的风险在油气勘探和开发中,这使得准确识别储层岩相改进获得的勘探结果的关键。由于从深钻获得的核心数据非常有限,岩相测井识别已成为最重要的方法,全面获取岩石深埋水库和信息是一项基本的任务进行储层特征和地质建模。在这项研究中,一种机器学习方法介绍给岩相测井识别、探索一个精确的岩相识别方法深fluvial-delta砂岩储层岩相变化频繁。罗在中国中央准噶尔盆地作为一个例子。少数K-means-based合成(k - means击打)是采用过采样技术解决问题关于岩相不平衡数据分类用于校准记录数据,和一个概率标定方法引入正确的似然函数。解决的情况下,传统的机器学习方法忽略了地质沉积过程中,我们引入一个沉积之前控制垂直传播过程基于马尔可夫链,提出一种改进的贝叶斯反演过程的训练日志数据来识别岩相。一系列的实验结果表明,与传统的机器学习方法相比,新方法提高了识别精度20%,和岩相垂直分布预测结果符合地质约束。此外,击杀和概率校准可以有效地处理数据不平衡问题,这样可以充分了解不同类别。之前的介绍地质对总体布局产生积极的影响,大大提高了该方法的准确性和召回率。根据这一综合分析,该方法大大提高了识别三工的岩相分布。 Therefore, this method can provide a tool for logging lithofacies interpretation of deep and strongly heterogeneous clastic reservoirs in fluvial-delta and other depositional environments.

1介绍gydF4y2Ba

岩相之间建一座桥水库的微观和介观特征,进而为宏观尺度地质研究提供了基础;因此,岩相在储层建模和储层特征参数是重要的。最深层碎屑岩储层有着更复杂的成分和快速岩相变化比传统水库在较浅的深度,和如此强烈的储层非均质性导致油气勘探重大风险(gydF4y2Ba布洛赫et al ., 2002gydF4y2Ba;gydF4y2BaZhang et al ., 2021gydF4y2Ba)。准确描述储层的岩相分布对油气勘探的成功至关重要。由于深井取心的高成本和钻井作业的安全风险,可用的核心数据和提供的岩相分布信息往往是非常有限的。因此,日志岩相识别是一个重要的方法获取从深层储层岩相信息(gydF4y2Ba周et al ., 2016gydF4y2Ba;gydF4y2Ba刘et al ., 2020gydF4y2Ba)。gydF4y2Ba

传统的岩相测井识别方法依赖解释模式如砂岩分类方法使用t - s图(gydF4y2Ba托马斯et al ., 1977gydF4y2Ba)和测井曲线重叠(gydF4y2Ba赖et al ., 2020gydF4y2Ba)。此外,特定的参数(例如,岩电)协助介绍了岩相识别。这些方法有更好的应用程序特定的地质问题,但往往需要简化地质属性(gydF4y2Ba出版社et al ., 2007年gydF4y2Ba;gydF4y2Ba徐,2013gydF4y2Ba)。gydF4y2Ba

近年来,大量的学者试图运用数据驱动的测井解释方法为不同地区岩相识别和储层的类型;这些方法主要分为无监督学习方法和监督学习方法。无监督学习方法主要有因子分析方法(gydF4y2BaAsfahani 2014gydF4y2Ba),主成分分析(PCA) (gydF4y2Ba李et al ., 2022gydF4y2Ba),聚类分析方法(gydF4y2Ba陈和Hiscott, 1999年gydF4y2Ba)和高斯混合模型方法(gydF4y2Ba邓纳姆et al ., 2020gydF4y2Ba),它更关注测井响应的统计数据本身。监督学习方法更关心地质属性和测井响应之间的相关性。这些包括贝叶斯反演(gydF4y2Ba秦et al ., 2018gydF4y2Ba;gydF4y2Ba冯,2021gydF4y2Ba)、决策树(gydF4y2Ba任et al ., 2022gydF4y2Ba)、支持向量机(gydF4y2Ba苏et al ., 2020gydF4y2Ba)、神经网络(gydF4y2Ba顾et al ., 2019gydF4y2Ba),梯度增强算法(gydF4y2Ba顾et al ., 2021gydF4y2Ba;gydF4y2BaAl-Mudhafar et al ., 2022gydF4y2Ba;gydF4y2Ba郑et al ., 2022gydF4y2Ba),随机森林(gydF4y2BaAntariksa et al ., 2022gydF4y2Ba),和新兴深度学习方法(gydF4y2Ba歌et al ., 2020gydF4y2Ba;gydF4y2Ba刘先生和刘,2022年gydF4y2Ba)。在这些方法中,贝叶斯反演可以应用不同的可能性之前框架和模型,以避免不恰当的转换在不同岩相在地质学和岩石学(gydF4y2Ba锤et al ., 2012gydF4y2Ba)。贝叶斯反演是一种基于贝叶斯理论的不确定性反演方法,它不仅旨在寻找最优解,也评估和分析反演结果。gydF4y2Ba

虽然以前的研究工作的快速发展做出了巨大贡献,岩相识别方法从大测井资料,应用大数据方法时遇到的一些问题仍在强烈异构水库岩相分类。最突出的问题是,不同岩相的比例相应垂直向上和测井资料有很大的波动,这数据不平衡的问题会影响模型的分类(gydF4y2Ba他和加西亚,2009年gydF4y2Ba;gydF4y2Ba布兰科et al ., 2016gydF4y2Ba)。例如,学习模型gydF4y2Ba先天的gydF4y2Ba信息训练集样本的比例,这实际的预测将专注于大多数样本(这将导致更好的准确性与少数的样品相比)。先前的作者通常包含少数岩相在考虑这个问题,但这些少数类往往更重要的是对油气储层描述和建模的影响。例如,泥岩厚砂岩可以作为流体流动的障碍和困惑。同时,高质量的岩相往往不代表在形成和容易受到数据不平衡。值得注意的是,这些少数岩相不应该被忽略。因此,有必要减少日志数据集的数据不平衡问题(gydF4y2Ba胡锦涛和太阳,2020gydF4y2Ba;gydF4y2Ba金姆和Byun, 2020年gydF4y2Ba;gydF4y2Ba周et al ., 2020gydF4y2Ba)。gydF4y2Ba

另一个问题是,传统的机器学习方法缺乏地质约束,与样本是相互独立的,上逐点详述的识别(gydF4y2Ba锤et al ., 2012gydF4y2Ba)。因此,解释结果不匹配实际地层的分布条件下,和一些地质岩相序列甚至可能出现。已经认识到,更多的应该引入地质约束;更具体地说,准确的地质先验应该引入学习过程(gydF4y2Ba拉森et al ., 2006gydF4y2Ba)。事实上,为了解决这些问题,初步探索涉及地震数据体进行研究表明,应用马尔可夫链方法的贝叶斯框架会导致gydF4y2Ba先天的gydF4y2Ba模型与形成的岩相分布一致(gydF4y2BaKjønsberg et al ., 2010gydF4y2Ba;gydF4y2Ba冯et al ., 2018gydF4y2Ba)。这些研究工作提供有价值的参考如何引入地质约束在岩相测井识别。gydF4y2Ba

非均质性越强,越模糊边界的一维岩相之间的区别。这是一个复杂的非线性分类问题在强烈异构水库、岩相测井识别,目前大多数发表的方法很难实现准确预测深异构储层岩相。因此,目前的研究解决了机器学习方法准确识别强烈的岩相异构水库利用常规测井资料,准噶尔盆地中部深fluvial-delta水库为例。具体目标包括:1)解决数据不平衡问题的识别岩相在异构水库等水库由于相对不同岩相的比例;2)引入沉积框架使用马尔可夫链方法为预测提供地质约束岩相分布;和3)提出了一种贝叶斯反演过程,也就是说,适用于异构水库深处强烈。最后,开发预测方法应用于识别水库中央准噶尔盆地的三工提高记录的准确性预测深层强烈异构水库。gydF4y2Ba

2研究区gydF4y2Ba

研究领域是Moxizhuang在中国中央准噶尔盆地西北部地区。地质构造上位于Zhongguai隆起之间,Dabazon隆起,Mosowan凸起(gydF4y2Ba图1gydF4y2Ba)(gydF4y2Ba陈et al ., 2005gydF4y2Ba)。Moxizhuang区域覆盖大约240公里gydF4y2Ba2gydF4y2Ba已探明石油储量约2059万吨。较低的侏罗系三工是最重要的勘探目标区,通常与埋藏深度超过4000米。十八Moxizhuang地区的油井已经完成,和一个完整的序列获得传统的日志。此外,14井三工一直在空心的面积。丰富的日志记录和核心数据源于这些井为本研究提供了信息。gydF4y2Ba

图1gydF4y2Ba
www.雷竞技rebatfrontiersin.orggydF4y2Ba

图1gydF4y2Ba。在研究区区域构造位置。gydF4y2Ba(一)gydF4y2Ba准噶尔盆地的位置。gydF4y2Ba(B)gydF4y2Ba准噶尔盆地的细分和Moxizhuang区域的位置。gydF4y2Ba(C)gydF4y2Ba油井位置Moxizhuang地区。绿色区域显示了油田。gydF4y2Ba

钻井数据显示,第二个成员(JgydF4y2Ba1gydF4y2Ba年代gydF4y2Ba2gydF4y2Ba三工)的侏罗纪主要分为上下两部分根据其岩性特征,和上面的次要成分(JgydF4y2Ba1gydF4y2Ba年代gydF4y2Ba2gydF4y2BaUgydF4y2Ba)主要是thick-layered泥岩薄砂岩。较低的次要成分(JgydF4y2Ba1gydF4y2Ba年代gydF4y2Ba2gydF4y2BalgydF4y2Ba)主要是砂岩和砾岩。Moxizhuang地区侏罗系三工已经被先前的研究人员和仔细沉积学的研究通常被解释为fluvial-deltaic沉积系统(gydF4y2BaZhang et al ., 2000gydF4y2Ba)。在JgydF4y2Ba1gydF4y2Ba年代gydF4y2Ba2gydF4y2Ba,湖盆的收缩和强水动力条件下,大规模与辫状河流沉积砂体delta-meandering河流三角洲Moxizhuang地区开发的转换。JgydF4y2Ba1gydF4y2Ba年代gydF4y2Ba2gydF4y2BalgydF4y2Ba辫状河流三角洲的额,分流砂很发达,纵向叠置砂和泥沉积。JgydF4y2Ba1gydF4y2Ba年代gydF4y2Ba2gydF4y2BaUgydF4y2Ba蜿蜒的河流三角洲的额,水位升高和降低材料供应;开发了上部泥岩,水下分流河道和河口砂条砂沉积在底部(gydF4y2Ba曹et al ., 2017gydF4y2Ba;gydF4y2Ba王et al ., 2021gydF4y2Ba)。gydF4y2Ba

砂岩储层在JgydF4y2Ba1gydF4y2Ba年代gydF4y2Ba2gydF4y2Ba展示强大的异构特征(见gydF4y2Ba图2gydF4y2Ba),有效储层岩石相互作用gydF4y2Ba通过gydF4y2Ba紧夹层过渡的分流河道,河道间和河口栏(见gydF4y2Ba图3gydF4y2Ba)。受控于沉积微相的变化,这个成员的岩相主要由中砂岩和细砂岩,泥岩和集团开发相对不同的比例;此外,有大型物理差异不同的岩相,孔隙度主要从2.0%到20.0%不等(平均11.9%)和渗透率主要从0.01到500.0 mD(平均32.1医学博士;这些通常可以划分为致密储层)。根据其油气显示,砂储层的分布是不连续的,紧的夹层作为主要障碍;油藏的油水分布复杂、频繁交替的石油,干燥和水的区域,这表明,储层的非均质性强有重大影响油气成藏。gydF4y2Ba

图2gydF4y2Ba
www.雷竞技rebatfrontiersin.orggydF4y2Ba

图2gydF4y2Ba。孔隙度和渗透率的频率直方图和联合概率分布的第二部分t JgydF4y2Ba1gydF4y2Ba年代gydF4y2Ba2gydF4y2Ba在Moxizhuang地区。gydF4y2Ba(一)gydF4y2Ba水平渗透率频率直方图。gydF4y2Ba(B)gydF4y2Ba有效孔隙度频率直方图。gydF4y2Ba(C)gydF4y2Ba联合概率分布的有效孔隙度和水平渗透率(不同的颜色代表不同的成员)。gydF4y2Ba(D)gydF4y2Ba有效孔隙度和水平渗透率交会图法(次要情节是内核密度图)。gydF4y2Ba

图3gydF4y2Ba
www.雷竞技rebatfrontiersin.orggydF4y2Ba

图3gydF4y2Ba。单井J的柱状图gydF4y2Ba1gydF4y2Ba年代gydF4y2Ba2gydF4y2BaMoxizhuang地区壮族103 (IC在河道间沉积微相列表示,DC代表了分流河道,和EB代表河口栏)。gydF4y2Ba

3数据和方法gydF4y2Ba

3.1数据gydF4y2Ba

本研究主要考虑粒度和组成的影响在储层质量和分类岩相从测井识别的可行性的角度根据核心的观察提供地质测井识别标签。根据粒度标准(gydF4y2BaKrumbein 1934gydF4y2Ba;gydF4y2BaMiall 1977gydF4y2Ba),整个罗水库是桑迪的晶粒尺寸,包括极细砂、细砂、中砂、粗砂,其中中期和细粒度砂岩类型占主导地位;少量的含砾石砂岩、泥砾砂岩和砾岩也在场,如所示gydF4y2Ba表1gydF4y2Ba。岩相识别分类方案帮助使用日志记录时不失沉积特征。为方便可视化,序列号是利用岩相。gydF4y2Ba

表1gydF4y2Ba
www.雷竞技rebatfrontiersin.orggydF4y2Ba

表1gydF4y2Ba。岩相分类比较表的三工Moxizhuang区域。gydF4y2Ba

壮族的核心数据类别7,壮族101年,壮族102年,壮族105年,壮族6,壮族3和郑11 Moxizhuang地区完成,和目标的测井资料部分完成,所以这些井主要提取的数据进行分析的目的。基于灵敏度分析和日志的完整性系列,九个常规测井曲线伽马射线(GR)、自然电位(SP),卡尺(CAL),密度(穴),声波测井(AC),补偿dual-spacing中子(CN), Latero日志8 (RFOC),感应测井电阻率(RILD)和介质感应测井电阻率(RILM)选择岩性分类。gydF4y2Ba

此外,不同时期、测井系列、环境和日志设备会导致差异日志数据,还有不完整的核之间的通信和日志记录深度由于取心的时滞。因此,预处理和核心深度处理日志数据之前需要校正。在这项研究中,我们正确的核心深度深度Techlog转移函数和比较GR曲线拉伸后产生深度变化表,平移的核心配置文件。gydF4y2Ba

3.2方法gydF4y2Ba

3.2.1朴素贝叶斯gydF4y2Ba

朴素贝叶斯方法是一个监督学习算法基于贝叶斯理论,假定特性参数是相互独立的(gydF4y2Ba张,2004gydF4y2Ba)。从日志数据没有严格独立于彼此,他们无法轻易用作直接输入数据分类器。因此,在本文中,原始日志数据进行奇异值分解使用主成分分析(PCA)方法(gydF4y2Ba星,2000gydF4y2Ba)和投影到一个低维空间与一个线性变换,以获得不相关的变量X {gydF4y2Ba xgydF4y2Ba 1gydF4y2Ba ,gydF4y2Ba xgydF4y2Ba 2gydF4y2Ba ⋯gydF4y2Ba ⋯gydF4y2Ba ,gydF4y2Ba xgydF4y2Ba ngydF4y2Ba }。gydF4y2Ba

贝叶斯理论的数学表达式如下:gydF4y2Ba

PgydF4y2Ba ygydF4y2Ba |gydF4y2Ba xgydF4y2Ba 1gydF4y2Ba ,gydF4y2Ba …gydF4y2Ba ,gydF4y2Ba xgydF4y2Ba ngydF4y2Ba =gydF4y2Ba PgydF4y2Ba ygydF4y2Ba PgydF4y2Ba xgydF4y2Ba 1gydF4y2Ba ,gydF4y2Ba …gydF4y2Ba xgydF4y2Ba ngydF4y2Ba |gydF4y2Ba ygydF4y2Ba PgydF4y2Ba xgydF4y2Ba 1gydF4y2Ba ,gydF4y2Ba …gydF4y2Ba ,gydF4y2Ba xgydF4y2Ba ngydF4y2Ba (gydF4y2Ba 1gydF4y2Ba )gydF4y2Ba

在哪里gydF4y2Ba ygydF4y2Ba 类别标签;gydF4y2Ba xgydF4y2Ba 1gydF4y2Ba ......gydF4y2Ba xgydF4y2Ba ngydF4y2Ba 代表了特征参数;gydF4y2Ba PgydF4y2Ba ygydF4y2Ba |gydF4y2Ba xgydF4y2Ba 1gydF4y2Ba ,gydF4y2Ba …gydF4y2Ba ,gydF4y2Ba xgydF4y2Ba ngydF4y2Ba 是一组观测的条件概率对应于一个特定类别gydF4y2Ba ygydF4y2Ba ,这是后验分布;gydF4y2Ba PgydF4y2Ba ygydF4y2Ba 类别的先验概率是吗gydF4y2Ba ygydF4y2Ba 从核心的观察,可以获得;和gydF4y2Ba PgydF4y2Ba xgydF4y2Ba 1gydF4y2Ba ,gydF4y2Ba …gydF4y2Ba xgydF4y2Ba ngydF4y2Ba |gydF4y2Ba ygydF4y2Ba 似然函数。gydF4y2Ba

自从朴素贝叶斯假设状态特征参数是相互独立的,gydF4y2Ba PgydF4y2Ba xgydF4y2Ba 1gydF4y2Ba ,gydF4y2Ba …gydF4y2Ba ,gydF4y2Ba xgydF4y2Ba ngydF4y2Ba 是一个常数,和情商。gydF4y2Ba1gydF4y2Ba等价于:gydF4y2Ba

PgydF4y2Ba ygydF4y2Ba |gydF4y2Ba xgydF4y2Ba 1gydF4y2Ba ,gydF4y2Ba …gydF4y2Ba ,gydF4y2Ba xgydF4y2Ba ngydF4y2Ba ∝gydF4y2Ba PgydF4y2Ba ygydF4y2Ba ∏gydF4y2Ba 我gydF4y2Ba =gydF4y2Ba 1gydF4y2Ba ngydF4y2Ba PgydF4y2Ba xgydF4y2Ba 我gydF4y2Ba |gydF4y2Ba ygydF4y2Ba (gydF4y2Ba 2gydF4y2Ba )gydF4y2Ba

在哪里gydF4y2Ba ∏gydF4y2Ba 我gydF4y2Ba =gydF4y2Ba 1gydF4y2Ba ngydF4y2Ba PgydF4y2Ba xgydF4y2Ba 我gydF4y2Ba |gydF4y2Ba ygydF4y2Ba 是输入变量的联合概率是X条件类别gydF4y2Ba ygydF4y2Ba 。gydF4y2Ba

对于每个组X,类别gydF4y2Ba ygydF4y2Ba ^gydF4y2Ba 最大化gydF4y2Ba PgydF4y2Ba ygydF4y2Ba |gydF4y2Ba xgydF4y2Ba 1gydF4y2Ba ,gydF4y2Ba …gydF4y2Ba ,gydF4y2Ba xgydF4y2Ba ngydF4y2Ba 被选中作为输出类别当作出决定:gydF4y2Ba

ygydF4y2Ba ^gydF4y2Ba =gydF4y2Ba 一个gydF4y2Ba rgydF4y2Ba ggydF4y2Ba 米gydF4y2Ba 一个gydF4y2Ba xgydF4y2Ba ygydF4y2Ba PgydF4y2Ba ygydF4y2Ba ∏gydF4y2Ba 我gydF4y2Ba =gydF4y2Ba 1gydF4y2Ba ngydF4y2Ba PgydF4y2Ba xgydF4y2Ba 我gydF4y2Ba |gydF4y2Ba ygydF4y2Ba (gydF4y2Ba 3gydF4y2Ba )gydF4y2Ba

贝叶斯原理的方法,众所周知,该方法的关键是获得适当的之前gydF4y2Ba PgydF4y2Ba ygydF4y2Ba 和似然函数gydF4y2Ba PgydF4y2Ba xgydF4y2Ba 我gydF4y2Ba |gydF4y2Ba ygydF4y2Ba ,这通常是通过使用最大gydF4y2Ba后验gydF4y2Ba概率(MAP)估计和马尔可夫链蒙特卡罗(密度)的方法。然而,贝叶斯推理使之前调整通过应用贝叶斯规则在不同的数据集(gydF4y2BaDymarski 2011gydF4y2Ba),所以这个过程可以独立于特定的方法。gydF4y2Ba

各种可能性的假设功能不同,分类也不同。由于每个岩相都有输入参数的特征更明显的正态分布,本文使用高斯概率函数找到联合分布。每个特性的公式如下:gydF4y2Ba

PgydF4y2Ba xgydF4y2Ba 我gydF4y2Ba |gydF4y2Ba ygydF4y2Ba kgydF4y2Ba =gydF4y2Ba 1gydF4y2Ba 2gydF4y2Ba πgydF4y2Ba σgydF4y2Ba ygydF4y2Ba kgydF4y2Ba ,gydF4y2Ba 我gydF4y2Ba 2gydF4y2Ba egydF4y2Ba −gydF4y2Ba xgydF4y2Ba 我gydF4y2Ba −gydF4y2Ba μgydF4y2Ba ygydF4y2Ba kgydF4y2Ba ,gydF4y2Ba 我gydF4y2Ba 2gydF4y2Ba 2gydF4y2Ba σgydF4y2Ba ygydF4y2Ba kgydF4y2Ba ,gydF4y2Ba 我gydF4y2Ba (gydF4y2Ba 4gydF4y2Ba )gydF4y2Ba

在哪里gydF4y2Ba μgydF4y2Ba ygydF4y2Ba kgydF4y2Ba ,gydF4y2Ba 我gydF4y2Ba 表示的意思是特性gydF4y2Ba xgydF4y2Ba 我gydF4y2Ba 样本的类别gydF4y2Ba ygydF4y2Ba kgydF4y2Ba 和gydF4y2Ba σgydF4y2Ba ygydF4y2Ba kgydF4y2Ba ,gydF4y2Ba 我gydF4y2Ba 2gydF4y2Ba 表示特性的方差gydF4y2Ba xgydF4y2Ba 我gydF4y2Ba 样本的类别gydF4y2Ba ygydF4y2Ba kgydF4y2Ba 。的参数gydF4y2Ba μgydF4y2Ba ygydF4y2Ba ,gydF4y2Ba 1gydF4y2Ba …gydF4y2Ba ngydF4y2Ba ,gydF4y2Ba σgydF4y2Ba ygydF4y2Ba ,gydF4y2Ba 1gydF4y2Ba …gydF4y2Ba ngydF4y2Ba 2gydF4y2Ba 为每个类别gydF4y2Ba ygydF4y2Ba 可以极大似然估计的方法。gydF4y2Ba

3.2.2的马尔可夫链提高了先验概率gydF4y2Ba

现代地质研究发现,迭代的确定性关系如节奏、螺旋、岩层周期和随机关系中形成沉积通常会产生的地层序列一个马尔可夫链的属性(gydF4y2Ba韦斯曼和福格,1999年gydF4y2Ba;gydF4y2BaElfeki和卡片,2001gydF4y2Ba;gydF4y2BaEidsvik et al ., 2004gydF4y2Ba)。马尔可夫性质反映在岩相剖面,它可以提供一个准确的估计的概率gydF4y2Ba PgydF4y2Ba ygydF4y2Ba 不同岩相的分布在工作区域内的水库。gydF4y2Ba

这个属性表示如下:未来时刻的条件分布仅与当前状态有关,如果现状是已知的,即:gydF4y2Ba

πgydF4y2Ba YgydF4y2Ba tgydF4y2Ba +gydF4y2Ba 1gydF4y2Ba =gydF4y2Ba 我gydF4y2Ba ngydF4y2Ba +gydF4y2Ba 1gydF4y2Ba |gydF4y2Ba YgydF4y2Ba tgydF4y2Ba =gydF4y2Ba 我gydF4y2Ba ngydF4y2Ba ,gydF4y2Ba YgydF4y2Ba tgydF4y2Ba −gydF4y2Ba 1gydF4y2Ba =gydF4y2Ba 我gydF4y2Ba ngydF4y2Ba −gydF4y2Ba 1gydF4y2Ba ,gydF4y2Ba YgydF4y2Ba 1gydF4y2Ba =gydF4y2Ba 我gydF4y2Ba 1gydF4y2Ba ,gydF4y2Ba YgydF4y2Ba 0gydF4y2Ba =gydF4y2Ba 我gydF4y2Ba 0gydF4y2Ba =gydF4y2Ba πgydF4y2Ba {gydF4y2Ba YgydF4y2Ba tgydF4y2Ba +gydF4y2Ba 1gydF4y2Ba =gydF4y2Ba jgydF4y2Ba |gydF4y2Ba YgydF4y2Ba tgydF4y2Ba =gydF4y2Ba 我gydF4y2Ba }gydF4y2Ba (gydF4y2Ba 5gydF4y2Ba )gydF4y2Ba

在哪里gydF4y2Ba πgydF4y2Ba 是概率,gydF4y2Ba YgydF4y2Ba tgydF4y2Ba 状态的时刻吗gydF4y2Ba tgydF4y2Ba 马尔可夫链,gydF4y2Ba 我gydF4y2Ba ,gydF4y2Ba jgydF4y2Ba 价值被误认为是它的状态。之间有一个线性对应关系形成的时间和深度,所以gydF4y2Ba YgydF4y2Ba tgydF4y2Ba =gydF4y2Ba YgydF4y2Ba hgydF4y2Ba 上面的方程,它表示状态的位置gydF4y2Ba hgydF4y2Ba 马尔可夫链。gydF4y2Ba

考虑到更浅地层深度后出现的岩相对应,一个向上的马尔可夫链建立单井岩相序列。推断未来位置状态需要通过转移矩阵,实现的概率gydF4y2Ba PgydF4y2Ba 传输的状态gydF4y2Ba 我gydF4y2Ba 来gydF4y2Ba jgydF4y2Ba 是:gydF4y2Ba

PgydF4y2Ba 我gydF4y2Ba ,gydF4y2Ba jgydF4y2Ba =gydF4y2Ba PgydF4y2Ba 我gydF4y2Ba →gydF4y2Ba jgydF4y2Ba =gydF4y2Ba πgydF4y2Ba YgydF4y2Ba tgydF4y2Ba +gydF4y2Ba 1gydF4y2Ba =gydF4y2Ba jgydF4y2Ba ∣gydF4y2Ba YgydF4y2Ba tgydF4y2Ba =gydF4y2Ba 我gydF4y2Ba (gydF4y2Ba 6gydF4y2Ba )gydF4y2Ba

转换的数量在整个分类过程计算基于自下而上的核心数据和规范化评估转移概率,以便向上转移概率矩阵gydF4y2Ba PgydF4y2Ba 可以获得。随机序列传输矩阵gydF4y2Ba 年代gydF4y2Ba 获得根据岩相的比例,这个矩阵是用来确定每种类型的岩相的转移概率的较低;然后,传递矩阵gydF4y2Ba PgydF4y2Ba 被修改。gydF4y2Ba

在构建马尔可夫转移矩阵gydF4y2Ba PgydF4y2Ba ,最初的岩相分布概率gydF4y2Ba πgydF4y2Ba 0gydF4y2Ba 是随机给的;然后,概率gydF4y2Ba πgydF4y2Ba tgydF4y2Ba =gydF4y2Ba πgydF4y2Ba tgydF4y2Ba −gydF4y2Ba 1gydF4y2Ba PgydF4y2Ba =gydF4y2Ba …gydF4y2Ba =gydF4y2Ba πgydF4y2Ba 0gydF4y2Ba PgydF4y2Ba tgydF4y2Ba 形成不同状态的时间吗gydF4y2Ba tgydF4y2Ba 。后gydF4y2Ba ngydF4y2Ba 迭代很长一段时间,gydF4y2Ba πgydF4y2Ba tgydF4y2Ba 可以获得不同的迭代过程。当gydF4y2Ba ngydF4y2Ba 是足够大,gydF4y2Ba πgydF4y2Ba tgydF4y2Ba 变得非常接近真正的岩相分布,从而确定先验概率分布为:gydF4y2Ba

PgydF4y2Ba YgydF4y2Ba =gydF4y2Ba jgydF4y2Ba =gydF4y2Ba limgydF4y2Ba ngydF4y2Ba →gydF4y2Ba ∞gydF4y2Ba PgydF4y2Ba 我gydF4y2Ba ,gydF4y2Ba jgydF4y2Ba ngydF4y2Ba =gydF4y2Ba ∏gydF4y2Ba tgydF4y2Ba =gydF4y2Ba 0gydF4y2Ba tgydF4y2Ba =gydF4y2Ba ngydF4y2Ba pgydF4y2Ba πgydF4y2Ba tgydF4y2Ba +gydF4y2Ba 1gydF4y2Ba ∣gydF4y2Ba πgydF4y2Ba tgydF4y2Ba ∣gydF4y2Ba =gydF4y2Ba πgydF4y2Ba jgydF4y2Ba ,gydF4y2Ba jgydF4y2Ba ∈gydF4y2Ba 我gydF4y2Ba (gydF4y2Ba 7gydF4y2Ba )gydF4y2Ba

在哪里gydF4y2Ba 我gydF4y2Ba 和gydF4y2Ba jgydF4y2Ba 岩相类型,gydF4y2Ba ngydF4y2Ba 迭代的数量,是状态空间吗gydF4y2Ba 我gydF4y2Ba =gydF4y2Ba 0gydF4y2Ba ,gydF4y2Ba 1gydF4y2Ba ,gydF4y2Ba 2gydF4y2Ba ,gydF4y2Ba …gydF4y2Ba 代表的岩相类型总数,gydF4y2Ba πgydF4y2Ba jgydF4y2Ba 岩相的概率是gydF4y2Ba jgydF4y2Ba 近似的迭代。gydF4y2Ba

此外,在计算先验概率gydF4y2Ba PgydF4y2Ba YgydF4y2Ba ,需要考虑如何将马尔可夫链组成的多个井计算传递矩阵,这应该由深度加权获得的先验概率Moxizhuang区域。因为所代表的概率gydF4y2Ba PgydF4y2Ba YgydF4y2Ba 本质上不是岩相分布的频率,而是不同岩相的厚度分布的地层的决心,前者是由采样间隔的强烈影响,而后者是一个固有财产的形成。与传统的贝叶斯方法相比,岩相分布在不同深度点之间的空间关系(由传递矩阵特征)被认为是在这gydF4y2Ba先天的gydF4y2Ba模型,从而更好地约束的时空关系沉积岩。gydF4y2Ba

3.2.3改善的可能性基于函数合成少数过采样技术和等张校准gydF4y2Ba

当执行似然函数的参数估计,模型会有偏见,因为似然函数不能准确地描述少数类分布由于不平衡的数据集的影响,而少数类样本数据不够充分学习的分类器特征(gydF4y2Ba布兰科et al ., 2016gydF4y2Ba)。应对这一问题的方法之一是产生新的样品在弱势阶层,也称为采样过密。gydF4y2Ba

本文中使用的过采样方法(k - means击杀gydF4y2Ba乔et al ., 2002gydF4y2Ba;gydF4y2BaBlagus社,2013年gydF4y2Ba集群),它使用k - means算法的输入数据集类和执行集群内打很多安全关键领域的少数类样本的输入空间,从而避免噪音的产生,有效克服之间的失衡和内部类(gydF4y2BaDouzas et al ., 2018gydF4y2Ba)。k - means杀包括三个步骤:集群、过滤和过采样,如所示gydF4y2Ba图4gydF4y2Ba。gydF4y2Ba

图4gydF4y2Ba
www.雷竞技rebatfrontiersin.orggydF4y2Ba

图4gydF4y2Ba。k - means击打oversamples安全领域和打击在类不平衡(gydF4y2BaDouzas et al ., 2018gydF4y2Ba)。gydF4y2Ba(一)gydF4y2Ba输入数据。gydF4y2Ba(B)gydF4y2Ba找到gydF4y2BakgydF4y2Ba= 3集群和计算不平衡比率(IR)。gydF4y2Ba(C)gydF4y2Ba使用杀oversample集群红外> 1,生成更多的样本稀疏集群。gydF4y2Ba(D)gydF4y2Ba。采样过量数据纠正决策边界。gydF4y2Ba

在聚类步骤中,输入空间集群gydF4y2Ba kgydF4y2Ba 集群使用k - means聚类方法。gydF4y2Ba kgydF4y2Ba 是最重要的在k - means hyperparameter方法,并找到合适的k值对k - means击杀的有效性至关重要,因为它影响的少数类簇的数量在过滤步骤。gydF4y2Ba

过滤步骤选择采样过量的集群,并确定有多少样本在每个集群生成,与过采样的目的只在集群几类占主导地位,同时避免尽可能多的噪音和分配新生成的样本更稀疏的几个类集群比密集的集群。这可以控制不平衡比率(gydF4y2Ba 我gydF4y2Ba RgydF4y2Ba )和抽样权重(gydF4y2Ba αgydF4y2Ba ogydF4y2Ba 年代gydF4y2Ba ),如下:gydF4y2Ba

我gydF4y2Ba RgydF4y2Ba =gydF4y2Ba majCountgydF4y2Ba cgydF4y2Ba +gydF4y2Ba 1gydF4y2Ba minCountgydF4y2Ba cgydF4y2Ba +gydF4y2Ba 1gydF4y2Ba (gydF4y2Ba 8gydF4y2Ba )gydF4y2Ba

在哪里gydF4y2Ba cgydF4y2Ba 集群是集群标签,gydF4y2Ba 米gydF4y2Ba 一个gydF4y2Ba jgydF4y2Ba CgydF4y2Ba ogydF4y2Ba ugydF4y2Ba ngydF4y2Ba tgydF4y2Ba 是集群的多数类样本计数,gydF4y2Ba 米gydF4y2Ba 我gydF4y2Ba ngydF4y2Ba CgydF4y2Ba ogydF4y2Ba ugydF4y2Ba ngydF4y2Ba tgydF4y2Ba 是少数类样本计算集群,和不平衡比率(gydF4y2Ba 我gydF4y2Ba RgydF4y2Ba )的比率gydF4y2Ba 米gydF4y2Ba 一个gydF4y2Ba jgydF4y2Ba CgydF4y2Ba ogydF4y2Ba ugydF4y2Ba ngydF4y2Ba tgydF4y2Ba 来gydF4y2Ba 米gydF4y2Ba 我gydF4y2Ba ngydF4y2Ba CgydF4y2Ba ogydF4y2Ba ugydF4y2Ba ngydF4y2Ba tgydF4y2Ba 对于一个特定的集群gydF4y2Ba cgydF4y2Ba 。gydF4y2Ba

αgydF4y2Ba ogydF4y2Ba 年代gydF4y2Ba =gydF4y2Ba NgydF4y2Ba rgydF4y2Ba 米gydF4y2Ba /gydF4y2Ba NgydF4y2Ba 米gydF4y2Ba (gydF4y2Ba 9gydF4y2Ba )gydF4y2Ba

在哪里gydF4y2Ba NgydF4y2Ba rgydF4y2Ba 米gydF4y2Ba 是少数类样本的数量重新采样后,gydF4y2Ba NgydF4y2Ba 米gydF4y2Ba 是多数类样本的数量重新采样后,然后呢gydF4y2Ba αgydF4y2Ba ogydF4y2Ba 年代gydF4y2Ba 对应的比例gydF4y2Ba NgydF4y2Ba rgydF4y2Ba 米gydF4y2Ba 来gydF4y2Ba NgydF4y2Ba 米gydF4y2Ba 重采样。当执行多元分类,区分多数和少数类是必要的。gydF4y2Ba

在过采样步骤中,击杀应用于每个选择的集群来提高比例gydF4y2Ba αgydF4y2Ba ogydF4y2Ba 年代gydF4y2Ba 之间的少数和多数样本的数量。打有以下流。首先,一个随机的少数类的观察gydF4y2Ba xgydF4y2Ba 我gydF4y2Ba 被选中时,和样品吗gydF4y2Ba xgydF4y2Ba zgydF4y2Ba 我gydF4y2Ba 选择在其gydF4y2BakgydF4y2Ba最近的少数类的邻居;新样品是由以下方程:gydF4y2Ba

xgydF4y2Ba ngydF4y2Ba egydF4y2Ba wgydF4y2Ba =gydF4y2Ba xgydF4y2Ba 我gydF4y2Ba +gydF4y2Ba λgydF4y2Ba ×gydF4y2Ba xgydF4y2Ba zgydF4y2Ba 我gydF4y2Ba −gydF4y2Ba xgydF4y2Ba 我gydF4y2Ba (gydF4y2Ba 10gydF4y2Ba )gydF4y2Ba

在哪里gydF4y2Ba λgydF4y2Ba 是一个随机重量(0,1),然后呢gydF4y2Ba xgydF4y2Ba 我gydF4y2Ba 和gydF4y2Ba xgydF4y2Ba zgydF4y2Ba 我gydF4y2Ba 是原始的少数类样本选择的集群。gydF4y2Ba

事实上,应用过采样方法可能会导致其他问题产生的模型(gydF4y2Ba木豆Pozzolo et al ., 2015gydF4y2Ba):方差增加(由于样本量的变化)和后验分布扭曲(由于对先验概率的影响)。第一个问题可以通过使用平均解决策略来减少方差(gydF4y2Ba华莱士et al ., 2011gydF4y2Ba),而第二个问题需要校准的先验概率似然函数和更新。根据贝叶斯原理,用部分示例反演获得的后验概率保证数据独立性也可以视为复位术的先验概率。因此,可以纠正这个错误校正后最初的反演结果的概率。gydF4y2Ba

概率校准方法不仅使用最大后验概率的歧视,也包括一个拟合回归量映射的后验概率分类器输出(0,1)获取校准概率;也就是说,对于一个给定的样本分类器输出gydF4y2Ba fgydF4y2Ba 我gydF4y2Ba ,校准器预测gydF4y2Ba pgydF4y2Ba ygydF4y2Ba 我gydF4y2Ba =gydF4y2Ba 1gydF4y2Ba ∣gydF4y2Ba fgydF4y2Ba 我gydF4y2Ba (二进制分类)。多类分类问题,one-vs。-rest-classifier策略是用于处理,其中包括合适的分类器对于每个类,也就是说,安装在所有其他类(gydF4y2BaZadrozny和埃尔坎,2002gydF4y2Ba)。等张回归是一种常用的概率标定方法,即非参数回归模型的方法,认为单调递增函数空间(gydF4y2BaDe Leeuw et al ., 2010gydF4y2Ba),所以预测概率gydF4y2Ba fgydF4y2Ba 我gydF4y2Ba ,真正的概率表示gydF4y2Ba ygydF4y2Ba 我gydF4y2Ba :gydF4y2Ba

ygydF4y2Ba 我gydF4y2Ba =gydF4y2Ba 米gydF4y2Ba fgydF4y2Ba 我gydF4y2Ba +gydF4y2Ba ϵgydF4y2Ba 我gydF4y2Ba (gydF4y2Ba 11gydF4y2Ba )gydF4y2Ba

在哪里gydF4y2Ba 米gydF4y2Ba 表示单调递增的函数,这也是目标函数拟合(gydF4y2Ba江et al ., 2011gydF4y2Ba),gydF4y2Ba ϵgydF4y2Ba 是常数。gydF4y2Ba

然后,决策函数修改如下:gydF4y2Ba

ygydF4y2Ba ^gydF4y2Ba =gydF4y2Ba 一个gydF4y2Ba rgydF4y2Ba ggydF4y2Ba 米gydF4y2Ba 一个gydF4y2Ba xgydF4y2Ba ygydF4y2Ba PgydF4y2Ba ygydF4y2Ba ×gydF4y2Ba 米gydF4y2Ba ^gydF4y2Ba ∏gydF4y2Ba 我gydF4y2Ba =gydF4y2Ba 1gydF4y2Ba ngydF4y2Ba PgydF4y2Ba xgydF4y2Ba 我gydF4y2Ba |gydF4y2Ba ygydF4y2Ba (gydF4y2Ba 12gydF4y2Ba )gydF4y2Ba

似然函数的修正使用等渗函数gydF4y2Ba 米gydF4y2Ba ^gydF4y2Ba :gydF4y2Ba

米gydF4y2Ba ^gydF4y2Ba =gydF4y2Ba 一个gydF4y2Ba rgydF4y2Ba ggydF4y2Ba 米gydF4y2Ba 我gydF4y2Ba ngydF4y2Ba wgydF4y2Ba ∑gydF4y2Ba ygydF4y2Ba 我gydF4y2Ba −gydF4y2Ba wgydF4y2Ba fgydF4y2Ba 我gydF4y2Ba 2gydF4y2Ba (gydF4y2Ba 13gydF4y2Ba )gydF4y2Ba

一个算法,找到一个分段常数解等张回归问题是pair-adjacent违规者(奶油水果蛋白饼)算法(gydF4y2Ba艾耶尔et al ., 1955gydF4y2Ba);上述方程可以简化为:gydF4y2Ba

fgydF4y2Ba xgydF4y2Ba =gydF4y2Ba 米gydF4y2Ba 我gydF4y2Ba ngydF4y2Ba 我gydF4y2Ba 米gydF4y2Ba 我gydF4y2Ba zgydF4y2Ba egydF4y2Ba ∑gydF4y2Ba 我gydF4y2Ba wgydF4y2Ba 我gydF4y2Ba ygydF4y2Ba 我gydF4y2Ba −gydF4y2Ba ygydF4y2Ba ^gydF4y2Ba 我gydF4y2Ba 2gydF4y2Ba ,gydF4y2Ba 年代gydF4y2Ba ugydF4y2Ba bgydF4y2Ba jgydF4y2Ba egydF4y2Ba cgydF4y2Ba tgydF4y2Ba tgydF4y2Ba ogydF4y2Ba ygydF4y2Ba ^gydF4y2Ba 我gydF4y2Ba ≤gydF4y2Ba ygydF4y2Ba ^gydF4y2Ba jgydF4y2Ba wgydF4y2Ba hgydF4y2Ba egydF4y2Ba ngydF4y2Ba egydF4y2Ba vgydF4y2Ba egydF4y2Ba rgydF4y2Ba XgydF4y2Ba 我gydF4y2Ba ≤gydF4y2Ba XgydF4y2Ba jgydF4y2Ba (gydF4y2Ba 14gydF4y2Ba )gydF4y2Ba

的权重gydF4y2Ba wgydF4y2Ba 我gydF4y2Ba 严格正的,结果应该是一个分段线性函数,修改后的似然函数可以被认为过采样后反映数据的分布特性。gydF4y2Ba

3.2.4工作流gydF4y2Ba

整个方法的流岩相分类应用程序所示gydF4y2Ba图5gydF4y2Ba。通过逐步的校准和验证,岩相信息传播的核心部分负担过重的日志部分,最后岩相来源于不同井地质匹配。这个岩相参数可用于相解释和储层建模。gydF4y2Ba

图5gydF4y2Ba
www.雷竞技rebatfrontiersin.orggydF4y2Ba

图5gydF4y2Ba。岩相分类工作流基于测井和核心数据。gydF4y2Ba

3.3指标gydF4y2Ba

在这篇文章中,一个混乱(错误)矩阵(gydF4y2Ba权力,2020gydF4y2Ba)是用来评估分类的准确性。根据定义,混乱(错误)矩阵的每一列代表了预测类别,和其总代表这一类的数据预测;每一行代表了真正的归属类别的数据,和其总代表类别的实例的数量。精度、召回和F1的分数很容易计算的基础上的混乱(错误)矩阵(gydF4y2Ba权力,2020gydF4y2Ba)。K-fold交叉验证(gydF4y2Ba艾伦,1974gydF4y2Ba)是应用于计算避免underfitting和过度拟合。方法将训练集成k小集,和为每个k“折叠集”执行以下过程:单个子样品作为验证数据,和其余的样品用于训练,重复队伍k乘以每个子样品验证一次,导致一个估计。gydF4y2Ba

4的结果gydF4y2Ba

4.1改善数据失衡gydF4y2Ba

由于日志数据的独立性差,需要PCA变换,在此基础上执行过采样。在这项研究中,k - means击打是用于处理,主要的参数gydF4y2Ba红外gydF4y2Ba和gydF4y2Ba αgydF4y2Ba ogydF4y2Ba 年代gydF4y2Ba 前控制算法,歧视不平衡集群,而后者控制特定数量的重采样操作每个类。此外,聚类步骤使用minibatch k - means算法,从而减少所需的计算时间,minibatch的大小(输入数据的一个子集)是1024。过采样步骤使用最近邻居算法来确定最近邻样本,邻居集算法的查询的数量是5,和你的邻居距离计算欧几里得度量。gydF4y2Ba

聚类步骤,一般数量的集群gydF4y2BakgydF4y2Ba应该是类似于类别的实际数量,见gydF4y2Ba图6gydF4y2Ba。看来,聚类中心时往往会偏离集群设置gydF4y2BakgydF4y2Ba= 8,所以集群的数量应该增加集群收敛。通过连续测试,我们发现当集群的数量是56,集群的分布区间可以有效聚类中心特征,和距离的平方的和最近的邻居的样品(gydF4y2Ba惯性gydF4y2Ba)是最小化。gydF4y2Ba

图6gydF4y2Ba
www.雷竞技rebatfrontiersin.orggydF4y2Ba

图6gydF4y2Ba。聚类步骤是对输入数据执行(PCA)转换。gydF4y2Ba(一)gydF4y2Ba距离平方和(gydF4y2Ba惯性gydF4y2Ba)从样本到最近的邻居是6319.79时设置gydF4y2BaKgydF4y2Ba= 8,迭代的数量是12。gydF4y2Ba(B)gydF4y2Ba从样本的距离平方和最近邻是891.84时设置gydF4y2BaKgydF4y2Ba= 56,迭代的数量是8。gydF4y2Ba

抽样的重量gydF4y2Ba αgydF4y2Ba ogydF4y2Ba 年代gydF4y2Ba ,因为这是一个多类研究,重采样的目标类指定为所有类除了绝大多数类,而且比设置为保证样品在不同的类的数量是相等的。不平衡率的红外,集群选择过程时更有选择性不平衡率阈值较大,需要和更高比例的少数样本选择集群。然而,一些少数类的比例在本文过于稀疏(小于样本总数的5%),并共同设置的阈值(通常1)使这些类找不到合适的集群采样过密,所以标准需要放松。因此,本文基于连续的阈值设置为0.25数据特性测试允许集群高的多数比例的选择。高于此阈值的集群被认为是不平衡的,需要采样过量。样品的数量为每个岩相决定基于抽样权重((0,640),(630),(687),(4,0)、(93)、(669)、(666)和(710)]。gydF4y2Ba

重采样是应用于核心数据样本研究区使用上述参数,成功扩大核心数据样本数量从2017年到6128年。新生成的分布示例所示gydF4y2Ba图7gydF4y2Ba。从观察到的变量有很高的维度,这是不利于观察,利用主成分分析法(PCA)的特性变量转换为二维变量,与gydF4y2BaxgydF4y2Ba设在主成分1和gydF4y2BaygydF4y2Ba设在主成分2;累积方差贡献率为73%。的一些功能空间并不与采样点分布,这可能与方差的损失,和主成分1和2不能完全覆盖变量空间;也有可能数据点特征或有限,全面的数据收集。gydF4y2Ba

图7gydF4y2Ba
www.雷竞技rebatfrontiersin.orggydF4y2Ba

图7gydF4y2Ba。岩相变化前后的数据分布k - means击杀(PCA)转换。gydF4y2Ba(一)gydF4y2Ba源数据重采样。gydF4y2Ba(B)gydF4y2Ba重采样使用K-mean击杀。gydF4y2Ba

左边的图中显示原始数据集的分布没有进行过采样二维变量,和正确的图中显示过采样后的数据在二维变量的分布。数据分布更均衡处理后,虽然一些离散的数据点并不会增加过滤后,如3(细砂岩)和4(中砂岩)。此外,7(集团)是稀疏,充分补充。然而,数据分布不同于原始数据分布和特征空间中的一些点相对密集分布,从而影响执行过采样时的先验概率。此外,算法本身变形的概率估计,这需要概率校准。gydF4y2Ba

4.2引入地质先验gydF4y2Ba

本文使用等距的传递矩阵计算地层单位.125米间距的方法,这是与测井曲线的采样间隔一致。纵向分布的基础上,从核心获得岩相观察,确定每个间隔点的标签,并建立了沉积序列计算后的岩相数据部分Moxizhuang地区;具体处理流程所示gydF4y2Ba图8gydF4y2Ba。在一个单一的,不同岩相之间转移的数量计算从下到上形成一个单井传递矩阵n为整个Moxizhuang区域,代表井连续核选为那些经常变化的岩相和完整的信息。这些井的转移矩阵总结根据深度加权获得相应的传递矩阵Moxizhuang区域,形成了传递矩阵P所示gydF4y2Ba表2gydF4y2Ba。gydF4y2Ba

图8gydF4y2Ba
www.雷竞技rebatfrontiersin.orggydF4y2Ba

图8gydF4y2Ba。Moxizhuang地区沉积建模过程。gydF4y2Ba

表2gydF4y2Ba
www.雷竞技rebatfrontiersin.orggydF4y2Ba

表2gydF4y2Ba。传递矩阵获得所有核心的观察第二部分的罗Moxizhuang区域。gydF4y2Ba

传递矩阵的特点,简要介绍了通过转移矩阵的第一行从所有核心观测获得的第二节三工Moxizhuang地区gydF4y2Ba表2gydF4y2Ba。核心的观察,岩相5、6和7不转化为岩相0位于粗粒度砂岩地区(包括粗砂岩、含砾石砂岩和砾岩)。超过这个深度,没有直接从沉积泥岩可以开发的观点。相比之下,岩相1、2、3和4可以接受转换为0的概率.0313,.0313,.0141和.0795分别。gydF4y2Ba

基于马尔可夫转移矩阵的结构,每个岩相的平均价值获得了核心的统计观察是设置为初始概率,并传递矩阵乘法用于迭代直到平稳分布,即与岩相对应的先验概率分布。一旦当前矩阵和矩阵的区别之前的迭代小于光滑的错误或迭代的数量达到100000,这个矩阵被接受为一个平稳分布。gydF4y2Ba

图9gydF4y2Ba给出一个示例使用马尔可夫链过程的先验概率。不同岩相的概率图中倾向于稳定当迭代的数量达到80。可以看出颜色相图的传递矩阵,泥岩相对稳定,不容易转化成其他岩相,而含砾石砂岩和泥砾砂岩很容易转换成其他岩相;这也符合他们的地质意义。泥岩相对稳定的沉积序列和结构不同于其他岩相,而含砾石砂岩和泥砾砂岩颗粒大小的范围很广,更构成有别于其他岩相,因此更容易转换。gydF4y2Ba

图9gydF4y2Ba
www.雷竞技rebatfrontiersin.orggydF4y2Ba

图9gydF4y2Ba。获得先验概率的迭代过程。gydF4y2Ba(一)gydF4y2Ba单井沉积序列(101节是壮族的一部分作为一个例子)。平是指岩相核心规模。简单平指岩相在湿润的规模。gydF4y2Ba(B)gydF4y2Ba颜色相图的传递矩阵。gydF4y2Ba(C)gydF4y2Ba个人岩相的变化概率迭代过程。gydF4y2Ba

最后的计算结果表明,岩相的先验概率是.095(泥岩).102(很细砂岩),.086(泥砾砂岩),.211(细砂岩),.231(中砂岩),.101(粗砂岩),.173(含砾石砂岩)和0.087(集团))。换句话说,在第二节三工,细砂岩、中砂岩和含砾石形成砂岩有统治地位和发生在大约20%的概率,而其他岩相是少,一般大约10%。比较的影响gydF4y2Ba先天的gydF4y2Ba修正,之前和可能性也在这项研究中根据密度计算方法,这是一个常见的方法等计算参数贝叶斯方法,和这两个参数在这一过程中发现近似。事实上,获得的先验概率相当不同于密度的方法,(。085,。101,。043,。291, .335, .058, .046, and .041), and the distribution probabilities of some lithofacies in the latter are relatively extreme and do not match well with the distribution of reservoir lithofacies in the Moxizhuang area.

4.3贝叶斯反演和概率校准gydF4y2Ba

执行贝叶斯反演,确定之前根据马尔可夫链,并可能是假定为高斯分布,在均值和方差根据最大似然估计方法。所示的结果gydF4y2Ba表3gydF4y2Ba。gydF4y2Ba

表3gydF4y2Ba
www.雷竞技rebatfrontiersin.orggydF4y2Ba

表3gydF4y2Ba。统计表的高斯特征参数(均值和Std)值相对应的输入数据不同岩相的第二部分,罗在Moxizhuang地区。gydF4y2Ba

在此基础上,概率校准用于进一步提高后验分布,和gydF4y2Ba图10gydF4y2Ba显示了概率预测的区别通过岩相的朴素贝叶斯方法4,由两个概率和概率预测的优化校准(等渗回归和乙状结肠函数校准)对不同概率分布阶段和真正的分布概率(一些点如图所示)。从图可以看到,不同岩相的概率标定方法优化了朴素贝叶斯方法的预测概率似然函数的基础上。这个校准岩相2中尤为明显,3、4和7,也对应于岩相识别结果最差的朴素贝叶斯方法。图中的对角线显示的情况预测概率就是真正的概率。橙色线在图中对应的概率,也就是说,等渗的预测概率回归校正,因此最接近真正的样本概率。因为等张回归过程本身是直接优化日志丢失,自己的训练过程使预测概率尽可能接近真实的标签。gydF4y2Ba

图10gydF4y2Ba
www.雷竞技rebatfrontiersin.orggydF4y2Ba

图10gydF4y2Ba。比较朴素贝叶斯和两个概率识别校正曲线的第二部分罗Moxizhuang地区(以细砂岩为例)。gydF4y2Ba(一)gydF4y2Ba校准块(可靠性曲线)。它情节的真实频率正标签对其预测概率,被预测。gydF4y2Ba(B)gydF4y2Ba直方图给出了一些洞察每个分类器的行为通过展示样品的数量在每个预测概率。gydF4y2Ba

形成一套改进贝叶斯反演过程基于上述研究,混乱的(错误)矩阵获得的结果是培训7井在工作区域。输出与原始的朴素贝叶斯分类的结果,如图所示gydF4y2Ba图11gydF4y2Ba。左边的图中显示结果在改善和正确的图显示改进后的识别结果。与改进前的分类器相比,混乱的程度大大降低,特别是类3、4、5和6。混乱(错误)矩阵的基础上,精确,召回和F1的分数值的识别结果,如图所示gydF4y2Ba表4gydF4y2Ba,识别精度可以达到大约0.84,基本上满足岩相识别的要求。gydF4y2Ba

图11gydF4y2Ba
www.雷竞技rebatfrontiersin.orggydF4y2Ba

图11gydF4y2Ba。比较混乱的(错误)矩阵之前和之后的改进。gydF4y2Ba(一)gydF4y2Ba朴素贝叶斯的混淆矩阵(错误)。gydF4y2Ba(B)gydF4y2Ba混乱(错误)矩阵的改进贝叶斯。gydF4y2Ba

表4gydF4y2Ba
www.雷竞技rebatfrontiersin.orggydF4y2Ba

表4gydF4y2Ba。改进的多井数据识别结果。gydF4y2Ba

5讨论gydF4y2Ba

5.1绩效评估gydF4y2Ba

视觉分析贝叶斯分类器的识别影响之前和之后执行上述改进,评估模型的偏差和方差,并测试该方法的普遍性,培训执行5井(壮族7,壮族101,壮族102,壮族105和壮族6)在Moxizhuang地区。岩相预测是进行2井(壮族3和郑11),并没有参与反演过程;特征变量是常规测井系列。gydF4y2Ba

在这项研究中,学习曲线得到使用交叉验证(gydF4y2Ba图12gydF4y2Ba和gydF4y2Ba图13gydF4y2Ba)在一个可视化模型是否overfitted或underfitted状态。理想的学习曲线应该有一个低偏差和方差,代表收敛性和较低的错误。左边的图的横轴是训练样本的数量,纵轴代表了准确率。gydF4y2Ba

图12gydF4y2Ba
www.雷竞技rebatfrontiersin.orggydF4y2Ba

图12gydF4y2Ba。贝叶斯分类器的学习曲线的反演JgydF4y2Ba1gydF4y2Ba年代gydF4y2Ba2gydF4y2Ba。gydF4y2Ba(一)gydF4y2Ba朴素贝叶斯学习曲线。gydF4y2Ba(B)gydF4y2Ba模型的可伸缩性。gydF4y2Ba(C)gydF4y2Ba模型的性能。适合时间显示模型的收敛时间培训。gydF4y2Ba

图13gydF4y2Ba
www.雷竞技rebatfrontiersin.orggydF4y2Ba

图13gydF4y2Ba。改进的朴素贝叶斯分类器的学习曲线反演的JgydF4y2Ba1gydF4y2Ba年代gydF4y2Ba2gydF4y2Ba。gydF4y2Ba(一)gydF4y2Ba改进的贝叶斯学习曲线。gydF4y2Ba(B)gydF4y2Ba模型的可伸缩性。gydF4y2Ba(C)gydF4y2Ba模型的性能。gydF4y2Ba

图12gydF4y2Ba朴素贝叶斯方法的显示精度训练集和验证集的收敛,但收敛后的精度都是大约0.62,远低于预期的准确性;这可以被认为是一个underfitting问题,需要增加模型的复杂性,如通过添加功能,增加分类器的数量,减少干扰。在这一点上,添加更多的数据不工作。中间的图中显示所需的时间模型使用不同大小的训练数据集训练;模型是相对较快,这与贝叶斯分类器的特点是一致的。此外,它可以看到从右边图,测试集的正确性率达到增加慢慢随着训练时间的增加,确凿之前的判断。gydF4y2Ba图13gydF4y2Ba表明改进的贝叶斯分类方法能够解决这个问题。牺牲一些训练时间但满足任务需求的准确性。方法的研究主要集中在应用fluvial-delta环境,尽管它的适用范围更广泛,它可以用来确定在其他沉积环境和岩相。gydF4y2Ba

5.2固定打造成的系统误差gydF4y2Ba

过采样方法可以有效地扩大数据大小达到平衡状态,但他们中的大多数增加基于本地信息的样本。虽然相对均衡实现的数量、获得的新数据集的数据分布过采样后无法保证,因为整体数据分布不考虑(gydF4y2BaLv et al ., 2018gydF4y2Ba)。事实上,击杀算法不能解决数据分布问题,会导致分配边缘化。由于样本的分布决定了可选的邻国,如果一个示例位于边缘的分布的样本集,生成的示例还将位于边缘,因此模糊不同集群之间的边界。尽管边界的模糊性提高数据集的平衡,它还增加了难以获得准确的预测结果(gydF4y2Ba李et al ., 2021gydF4y2Ba)。这个问题很难描述与一个特定的错误,但它可以用不同的方法根据纠正之前打算法的的影响和可能性。gydF4y2Ba

先验概率,击杀算法训练样本的分布变化的数据,所以需要单独计算先验概率似然函数的计算和调整函数基于presampling数据之前。gydF4y2Ba图14gydF4y2Ba显示每个岩相的改进贝叶斯概率谱之前和之后引入之前。之前的引入地质改善单点歧视率不高,但每个岩相分布的总体概率显然更符合真实值后介绍;此外,每个岩相的转变并不锋利,更好的解释精度。对于单点评价,下一步将是改善概率校准方法。正确识别单点的速度应该提高纠正预期某个类的概率。gydF4y2Ba

图14gydF4y2Ba
www.雷竞技rebatfrontiersin.orggydF4y2Ba

图14gydF4y2Ba。比较核心的标记概率谱(以壮族105井为例)。起源意味着没有抽样进行可能性和之前使用密度计算方法。IMPROCVED代表,马尔可夫链是用来计算gydF4y2Ba先天的gydF4y2Ba后,提高数据不平衡使用攻击方法。gydF4y2Ba

此外,样本重叠的问题会导致异常的参数似然函数,因此后验分布。相比之下,本文中使用的概率标定方法可以重新计算可能性之前使用原始反演结果作为改善概率分布。gydF4y2Ba图15gydF4y2Ba显示了歧视的变化概率细、中砂岩之前和之后执行概率校准,大约10%实际样品和90%样品混淆。横轴进行排序根据预测概率,这表明,该分类器能辨别困惑样品校准后更准确。事实上,所有类型的精度达到更高的改进后,和细砂岩、中砂岩、粗砂岩和含砾石砂岩,不能更好的识别通过原贝叶斯反演过程中,也得到了改善。gydF4y2Ba

图15gydF4y2Ba
www.雷竞技rebatfrontiersin.orggydF4y2Ba

图15gydF4y2Ba。两段的特定歧视性调整概率三工的校准曲线。gydF4y2Ba(一)gydF4y2Ba非常细粒度砂岩概率是作为一个例子。gydF4y2Ba(B)gydF4y2Ba中等粒度的砂岩概率是作为一个例子。输入样本根据歧视性的识别结果排序类别的概率,和在左上角图代表了日志的损失。gydF4y2Ba

6结论gydF4y2Ba

在深岩相识别强烈异构水库是一个复杂的非线性分类问题。在这项研究中,我们探索解决岩相识别过程中面临的关键问题在使用机器学习方法以常规测井资料的第二个成员罗Moxizhuang地区作为一个例子,并建立一组贝叶斯反演预测过程,适用于强烈的岩相异构水库,以核心数据为约束。主要获得以下结论。gydF4y2Ba

1)频繁的岩相变化深刻强烈异构水库构成挑战传统的逐点详述的基于机器学习识别方法。前沉积施工技术基于马尔可夫链可以更好地限制垂直岩相的沉积传播过程,以便预测垂直分布的岩相符合地质约束。gydF4y2Ba

2)强烈异构水库具有相对不同岩相的比例,形成一个数据不平衡问题导致测井资料不能完全反映少数类别的特点。似然函数校正方法,利用概率的k - means击打校准可以解决数据不平衡问题强烈异构储层的岩相识别。gydF4y2Ba

3)建立一套改进的贝叶斯岩相的演化过程,并应用于岩相识别和预测中的多个井Moxizhuang区域。这种方法的一个应用程序的fluvial-deltaic水库三工Moxizhuang地区显示新方法提高了识别精度20%,传统的机器学习方法,可以更准确地识别岩相类型的深强烈异构水库。gydF4y2Ba

本文提出的方法可以实现模式识别岩相的日志,但后续工作需要改善的准确性通过岩相的内部层次结构,将沉积前的概念引入到其他相关算法来改善它们,并进一步与自动记录分层匹配方法实现模块化的数据识别。深刻而强烈的方法可以识别岩相非齐次碎屑岩储层,并为未来的勘探和开发提供参考。gydF4y2Ba

数据可用性声明gydF4y2Ba

原始数据支持了本文的结论将由作者提供,没有过度的预订。gydF4y2Ba

作者的贡献gydF4y2Ba

ZoZ负责整个编程和写文章的。LZ负责文章的校正和总体的指导思想。MC负责指导的机器学习的部分。我们提供指导。其他作者给了图的修正和数据提供帮助。gydF4y2Ba

资金gydF4y2Ba

这项研究是由中国国家自然科学基金(42030808,42030808),和中国科学院的战略重点研究项目(XDA14010202)。gydF4y2Ba

确认gydF4y2Ba

研究不可能一直没有中石化胜利石油公司的支持,我们感谢胜利石油公司允许发表这项工作。艾克希拉诉和欣赏一些匿名评论者的关键评论和有见地的建议,大大提高文章的质量。gydF4y2Ba

的利益冲突gydF4y2Ba

作者ZeZ, ZhZ, XR是受雇于公司中石化胜利油田公司。作者LY是受雇于中石化石油勘探和生产研究所。作者王寅是受雇于AspenTech地表下的科学和工程。gydF4y2Ba

其余作者声明,这项研究是在没有进行任何商业或财务关系可能被视为一个潜在的利益冲突。gydF4y2Ba

出版商的注意gydF4y2Ba

本文表达的所有索赔仅代表作者,不一定代表的附属组织,或出版商、编辑和审稿人。任何产品,可以评估在这篇文章中,或声称,可能是由其制造商,不保证或认可的出版商。gydF4y2Ba

引用gydF4y2Ba

Al-Mudhafar w·J。,阿巴斯,m。,和Wood, D. A. (2022). Performance evaluation of boosting machine learning algorithms for lithofacies classification in heterogeneous carbonate reservoirs.3月石油地质。gydF4y2Ba145年,105886年。doi: 10.1016 / j.marpetgeo.2022.105886gydF4y2Ba

CrossRef全文gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba

艾伦,d . m . (1974)。变量选择和数据之间的关系agumentation和预测方法。gydF4y2Ba技术计量学gydF4y2Ba16 (1),125 - 127。doi: 10.1080 / 00401706.1974.10489157gydF4y2Ba

CrossRef全文gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba

Antariksa G。穆阿迈尔·R。,和lee,J。(2022). Performance evaluation of machine learning-based classification with rock-physics analysis of geological lithofacies in Tarakan Basin, Indonesia.j .石油科学。Eng。gydF4y2Ba208年,109250年。doi: 10.1016 / j.petrol.2021.109250gydF4y2Ba

CrossRef全文gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba

Asfahani, j . (2014)。统计因子分析技术通过解释描述玄武岩核和电测井数据从叙利亚南部(案例研究)。gydF4y2Ba达成。Radiat。同位素gydF4y2Ba84年,33-39。doi: 10.1016 / j.apradiso.2013.09.019gydF4y2Ba

《公共医学图书馆摘要》gydF4y2Ba|gydF4y2BaCrossRef全文gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba

昨天,M。,Brunk, H. D., Ewing, G. M., Reid, W. T., and Silverman, E. (1955). An empirical distribution function for sampling with incomplete information.安。数学。统计数据gydF4y2Ba26日,641 - 647。doi: 10.1214 /中耳炎/ 1177728423gydF4y2Ba

CrossRef全文gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba

Blagus, R。,和lu年代一个,l。(2013). SMOTE for high-dimensional class-imbalanced data.BMC Bioinforma。gydF4y2Ba14 (1),106。doi: 10.1186 / 1471-2105-14-106gydF4y2Ba

《公共医学图书馆摘要》gydF4y2Ba|gydF4y2BaCrossRef全文gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba

布洛赫,S。,l一个nder, R. H., and Bonnell, L. (2002). Anomalously high porosity and permeability in deeply buried sandstone reservoirs: Origin and predictability.中部马牛。gydF4y2Ba86 (2),301 - 328。eedabc doi: 10.1306/61 - 173 e - 11 - d7 - 8645000102 c1865dgydF4y2Ba

CrossRef全文gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba

布兰科,P。,Torgo, L., and Ribeiro, R. P. (2016). A Survey of predictive modeling on imbalanced domains.ACM第一版。测量员gydF4y2Ba49 (2),1-50。第三十一条。doi: 10.1145 / 2907070gydF4y2Ba

CrossRef全文gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba

曹,B。,luo,X。,Zhang, L., Sui, F., Lin, H., and Lei, Y. (2017). Diagenetic evolution of deep sandstones and multiple-stage oil entrapment: A case study from the lower jurassic Sangonghe Formation in the fukang sag, central Junggar Basin (NW China).j .石油科学。Eng。gydF4y2Ba152年,136 - 155。doi: 10.1016 / j.petrol.2017.02.019gydF4y2Ba

CrossRef全文gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba

乔:V。,Bowyer, K. W., Hall, L. O., and Kegelmeyer, W. P. (2002). Smote: Synthetic minority over-sampling technique.j . Artif。智能。Res。gydF4y2Ba16,321 - 357。doi: 10.1613 / jair.953gydF4y2Ba

CrossRef全文gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba

陈,C。,和Hiscott, R. N. (1999). Statistical analysis of turbidite cycles in submarine fan successions; tests for short-term persistence.j .沉积物。Res。gydF4y2Ba69 (2),486 - 504。doi: 10.2110 / jsr.69.486gydF4y2Ba

CrossRef全文gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba

陈,F。,Wang, X., and Wang, X. (2005). Prototype and tectonic evolution of the Junggar Basin, northwestern China.地球科学。前面。gydF4y2Ba12 (3),77。doi: 10.3321 / j.issn: 1005 - 2321.2005.03.010gydF4y2Ba

CrossRef全文gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba

木豆Pozzolo,。Caelen, O。,和Bontempi, G. (2015). “When is undersampling effective in unbalanced classification tasks?,” in欧洲联合机器学习与知识发现会议在数据库中gydF4y2Ba。gydF4y2Ba

CrossRef全文gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba

De Leeuw J。Hornik, K。,和米一个我r,P。(2010)。 Isotone optimization in R: Pool-adjacent-violators algorithm (PAVA) and active set methods.Softw j . Stat。gydF4y2Ba32岁的上皮。doi: 10.18637 / jss.v032.i05gydF4y2Ba

CrossRef全文gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba

Douzas G。,Bacao, F., and Last, F. (2018). Improving imbalanced learning through a heuristic oversampling method based on k-means and SMOTE.正,科学。gydF4y2Ba465年,1。doi: 10.1016 / j.ins.2018.06.056gydF4y2Ba

CrossRef全文gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba

邓纳姆,m . W。马尔科姆,。,和Welford, J. K. (2020). Improved well log classification using semisupervised Gaussian mixture models and a new hyper-parameter selection strategy.第一版。地球科学gydF4y2Ba140年,104501年。doi: 10.1016 / j.cageo.2020.104501gydF4y2Ba

CrossRef全文gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba

Dymarski, p (2011)。gydF4y2Ba隐马尔可夫模型:理论和应用程序gydF4y2Ba。德国汉堡:gydF4y2BaBoD-Books需求gydF4y2Ba。gydF4y2Ba

谷歌学术搜索gydF4y2Ba

Eidsvik, J。,米ukerj我,T., and Switzer, P. (2004). Estimation of geological attributes from a well log: An application of hidden Markov chains.数学。青烟。gydF4y2Ba36 (3),379 - 397。doi: 10.1023 / b: matg.0000028443.75501.d9gydF4y2Ba

CrossRef全文gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba

Elfeki,。,和Dekking, M. (2001). A Markov chain model for subsurface characterization: Theory and applications.数学。青烟。gydF4y2Ba33 (5),569 - 589。doi: 10.1023 /: 1011044812133gydF4y2Ba

CrossRef全文gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba

冯,R。,luth我,年代。米。Gisolf D。, and Angerer, E. (2018). Reservoir lithology classification based on seismic inversion results by Hidden Markov Models: Applying prior geological information.3月石油地质。gydF4y2Ba93年,218 - 229。doi: 10.1016 / j.marpetgeo.2018.03.004gydF4y2Ba

CrossRef全文gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba

冯,r (2021)。不确定性分析测井分类的贝叶斯长期短期记忆网络。gydF4y2Baj .石油科学。Eng。gydF4y2Ba205年,108816年。doi: 10.1016 / j.petrol.2021.108816gydF4y2Ba

CrossRef全文gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba

顾,Y。,Bao, Z., Song, X., Patil, S., and Ling, K. (2019). Complex lithology prediction using probabilistic neural network improved by continuous restricted Boltzmann machine and particle swarm optimization.j .石油科学。Eng。gydF4y2Ba179年,966 - 978。doi: 10.1016 / j.petrol.2019.05.032gydF4y2Ba

CrossRef全文gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba

顾,Y。,Zhang, D., Lin, Y., Ruan, J., and Bao, Z. (2021). Data-driven lithology prediction for tight sandstone reservoirs based on new ensemble learning of conventional logs: A demonstration of a yanchang member, ordos basin.j .石油科学。Eng。gydF4y2Ba207年,109292年。doi: 10.1016 / j.petrol.2021.109292gydF4y2Ba

CrossRef全文gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba

锤子,H。,Kolbjørnsen, O., Tjelmeland, H., and Buland, A. (2012). Lithology and fluid prediction from prestack seismic data using a Bayesian model with Markov process prior.地球物理学。的前景。gydF4y2Ba60 (3),500 - 515。doi: 10.1111 / j.1365-2478.2011.01012.xgydF4y2Ba

CrossRef全文gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba

他,H。,和Garcia, E. A. (2009). Learning from imbalanced data.IEEE反式。"。数据中。gydF4y2Ba21 (9),1263 - 1284。doi: 10.1109 / tkde.2008.239gydF4y2Ba

CrossRef全文gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba

胡,C。,和年代un,B. (2020). “Multitask learning for petrophysical attribute prediction using convolutional neural network and imbalance dataset,” in赛格国际博览会和年度会议gydF4y2Ba,gydF4y2Ba虚拟gydF4y2Ba,gydF4y2Ba2020年10月gydF4y2Ba。gydF4y2Ba

CrossRef全文gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba

江,X。Osl, M。金,J。,和Ohno-Machado, L. (2011). Smooth isotonic regression: A new method to calibrate predictive models.AMIA峰会Transl。科学。Proc。gydF4y2Ba2011年,16岁。gydF4y2Ba

《公共医学图书馆摘要》gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba

金,D。,和Byun, J. (2020). “Data augmentation using CycleGAN for overcoming the imbalance problem in petrophysical facies classification,” in赛格技术项目扩展摘要2020gydF4y2Ba,2310 - 2314。doi: 10.1190 / segam2020 - 3427510.1gydF4y2Ba

CrossRef全文gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba

Kjønsberg, H。海,R。,Kolbjørnsen, O., and Buland, A. (2010). Bayesian Monte Carlo method for seismic predrill prospect assessment.地球物理学gydF4y2Ba75 (2),O9-O19。doi: 10.1190/1.3339678gydF4y2Ba

CrossRef全文gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba

Krumbein, w . c (1934)。大小频率分布的沉积物。gydF4y2Baj .沉积物。Res。gydF4y2Ba4 (2),65 - 77。doi: 10.1306 / d4268eb9 - 2 b26 c1865d——11 - d7 - 8648000102gydF4y2Ba

CrossRef全文gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba

赖,J。,Fan, X., Liu, B., Pang, X., Zhu, S., Xie, W., et al. (2020). Qualitative and quantitative prediction of diagenetic facies via well logs.3月石油地质。gydF4y2Ba120年,104486年。doi: 10.1016 / j.marpetgeo.2020.104486gydF4y2Ba

CrossRef全文gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba

拉森,a . L。Ulvmoen, M。Omre, H。,和Buland, A. (2006). Bayesian lithology/fluid prediction and simulation on the basis of a Markov-chain prior model.地球物理学gydF4y2Ba71 (5),R69-R78。doi: 10.1190/1.2245469gydF4y2Ba

CrossRef全文gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba

李,d . Z。,刘,J。X。刘,j . (2021)。NNI-SMOTE-XGBoost:小样本分析方法对聚合物材料的性能预测。gydF4y2Ba絮凝。理论模拟gydF4y2Ba30 (5),2100010。ARTN 2100010。doi: 10.1002 / mats.202100010gydF4y2Ba

CrossRef全文gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba

李,Z。,Zhang, L., Yuan, W., Chen, X., Zhang, L., and Li, M. (2022). Logging identification for diagenetic facies of tight sandstone reservoirs: A case study in the lower jurassic ahe formation, kuqa depression of tarim basin.3月石油地质。gydF4y2Ba139年,105601年。doi: 10.1016 / j.marpetgeo.2022.105601gydF4y2Ba

CrossRef全文gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba

刘,J·J。,和刘,J。C。(2022)。集成深度学习和日志数据分析岩相致密砂岩储层的分类和3 d建模。gydF4y2BaGeosci。前面。gydF4y2Ba13 (1),101311。doi: 10.1016 / j.gsf.2021.101311gydF4y2Ba

CrossRef全文gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba

刘,J。,l我u,Z., Xiao, K., Huang, Y., and Jin, W. (2020). Characterization of favorable lithofacies in tight sandstone reservoirs and its significance for gas exploration and exploitation: A case study of the 2nd member of triassic xujiahe Formation in the xinchang area, sichuan basin.石油空洞。Dev。gydF4y2Ba47 (6),1194 - 1205。doi: 10.1016 / s1876 - 3804 (20) 60129 - 5gydF4y2Ba

CrossRef全文gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba

Lv, D。,米一个,Z., Yang, S., Li, X., Ma, Z., and Jiang, F. (2018). The application of SMOTE algorithm for unbalanced data.《2018年国际会议上人工智能和虚拟现实gydF4y2Ba。gydF4y2Ba2018年11月gydF4y2Ba。10 - 13。gydF4y2Ba

CrossRef全文gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba

Miall,公元(1977)。gydF4y2Ba岩相辫状河沉积类型和垂直剖面模型:一个总结gydF4y2Ba。gydF4y2Ba

谷歌学术搜索gydF4y2Ba

星途,t (2000)。“自动选择”PCA的维度gydF4y2Ba先进的神经信息处理系统gydF4y2Ba,13岁。gydF4y2Ba

谷歌学术搜索gydF4y2Ba

权力,d . m . (2020)。评价:从精度、回忆和F-measure民国,informedness、醒目和相关性。gydF4y2BaarXivgydF4y2Ba(预印本)2010年,16061年。可以在:gydF4y2Bahttps://arxiv.org/abs/2010.16061gydF4y2Ba。gydF4y2Ba

谷歌学术搜索gydF4y2Ba

出版社,W。,Teukolsky, S., Vetterling, W., and Flannery, B. (2007). “Gaussian mixture models and k-means clustering,” in数值的食谱。科学计算的艺术,第三版。gydF4y2Ba(gydF4y2Ba剑桥大学出版社gydF4y2Ba),843 - 846。gydF4y2Ba

谷歌学术搜索gydF4y2Ba

秦,R。,P一个n,H., Zhao, P., Deng, C., Peng, L., Liu, Y., et al. (2018). Petrophysical parameters prediction and uncertainty analysis in tight sandstone reservoirs using Bayesian inversion method.j . Nat。天然气科学。Eng。gydF4y2Ba55岁,431 - 443。doi: 10.1016 / j.jngse.2018.04.031gydF4y2Ba

CrossRef全文gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba

任,Q。,zh一个ng,H., Zhang, D., Zhao, X., Yan, L., and Rui, J. (2022). A novel hybrid method of lithology identification based on k-means++ algorithm and fuzzy decision tree.j .石油科学。Eng。gydF4y2Ba208年,109681年。doi: 10.1016 / j.petrol.2021.109681gydF4y2Ba

CrossRef全文gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba

歌,S。,Hou, J., Dou, L., Song, Z., and Sun, S. (2020). Geologist-level wireline log shape identification with recurrent neural networks.第一版。地球科学gydF4y2Ba134年,104313年。doi: 10.1016 / j.cageo.2019.104313gydF4y2Ba

CrossRef全文gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba

苏,F。,米一个,l。,luo,R。-z., and Ni, Y. (2020). Research and application of logging lithology identification based on improve multi-class twin support vector machine.掠夺。地球物理学。gydF4y2Ba35 (1),174 - 180。doi: 10.1016 / j.jappgeo.2019.103929gydF4y2Ba

CrossRef全文gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba

托马斯·E。电子商务,T。,和R一个,H. (1977).日志中砂岩和页岩分布对孔隙度的影响,含水饱和度和渗透率gydF4y2Ba。gydF4y2Ba

谷歌学术搜索gydF4y2Ba

华莱士,b . C。小,K。,Brodley, C. E., and Trikalinos, T. A. (2011). Class imbalance, redux.2011 IEEE 11日国际会议上进行数据挖掘gydF4y2Ba。gydF4y2Ba2011年12月gydF4y2Ba。gydF4y2BaIEEEgydF4y2Ba。gydF4y2Ba加拿大的温哥华BCgydF4y2Ba。gydF4y2Ba

CrossRef全文gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba

王,J。徐,S。,Ren,X。,Ch我,X。蜀,P。刘,X。, et al. (2021). Diageneses and controlling factors of Jurassic Sangonghe Formation reservoirs on the west side of the hinterland of Junggar Basin.学报的宠物。罪。gydF4y2Ba42 (3),319 - 331。可以在:gydF4y2Bahttp://www.syxb-cps.com.cngydF4y2Ba。doi: 10.7623 / syxb202103005gydF4y2Ba

CrossRef全文gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba

韦斯曼·g·S。,和Fogg, G. E. (1999). Multi-scale alluvial fan heterogeneity modeled with transition probability geostatistics in a sequence stratigraphic framework.j .水文gydF4y2Ba226 (1),48 - 65。doi: 10.1016 / s0022 - 1694 (99) 00160 - 2gydF4y2Ba

CrossRef全文gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba

徐,c (2013)。gydF4y2Ba油藏描述和well-log-based core-calibrated岩石物性岩石分类gydF4y2Ba。美国奥斯汀TX:gydF4y2Ba德克萨斯大学奥斯汀分校gydF4y2Ba。gydF4y2Ba

谷歌学术搜索gydF4y2Ba

Zadrozny B。,和Elkan, C. (2002). Transforming classifier scores into accurate multiclass probability estimates第八届ACM SIGKDD学报》国际会议上知识发现和数据挖掘gydF4y2Ba,gydF4y2Ba2002年1月gydF4y2Ba,gydF4y2Ba加拿大亚伯达省的埃德蒙顿,gydF4y2Ba。doi: 10.1145/775047.775151gydF4y2Ba

CrossRef全文gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba

张,H。,Dessimoz, J., Beyer, T. A., Krampert, M., Williams, L. T., Werner, S., et al. (2004). Fibroblast growth factor receptor 1-IIIb is dispensable for skin morphogenesis and wound healing.AAgydF4y2Ba1 (2),3-11。doi: 10.1078 / 0171-9335-00355gydF4y2Ba

《公共医学图书馆摘要》gydF4y2Ba|gydF4y2BaCrossRef全文gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba

张,M。、朱、X。,和Zhang, Q. (2000). Jurassic sedimentary system of east Junggar Basin and its hydrocarbon significance.石油天然气。青烟。gydF4y2Ba21 (3),272 - 278。doi: 10.3321 / j.issn: 0253 - 9985.2000.03.019gydF4y2Ba

CrossRef全文gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba

张,l·K。罗,x R。,你们,m Z。,Zhang, B. S., Wei, H. X., Cao, B. F., et al. (2021). Small-scale diagenetic heterogeneity effects on reservoir quality of deep sandstones: A case study from the lower jurassic ahe formation, eastern kuqa depression.GeofluidsgydF4y2Ba2021年,1 - 25。doi: 10.1155 / 2021/6626652gydF4y2Ba

CrossRef全文gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba

郑,D。侯,M。,Chen,A., Zhong, H., Qi, Z., Ren, Q., et al. (2022). Application of machine learning in the identification of fluvial-lacustrine lithofacies from well logs: A case study from sichuan basin, China.j .石油科学。Eng。gydF4y2Ba215年,110610年。doi: 10.1016 / j.petrol.2022.110610gydF4y2Ba

CrossRef全文gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba

周,Z。,Wang, G., Ran, Y., Lai, J., Cui, Y., and Zhao, X. (2016). A logging identification method of tight oil reservoir lithology and lithofacies: A case from Chang7 member of triassic yanchang Formation in heshui area, ordos basin, NW China.石油空洞。Dev。gydF4y2Ba43 (1),65 - 73。doi: 10.1016 / s1876 - 3804 (16) 30007 - 6gydF4y2Ba

CrossRef全文gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba

周,K。,Zhang, J., Ren, Y., Huang, Z., and Zhao, L. (2020). A gradient boosting decision tree algorithm combining synthetic minority oversampling technique for lithology identification.地球物理学gydF4y2Ba85 (4),WA147-WA158。doi: 10.1190 / geo2019 - 0429.1gydF4y2Ba

CrossRef全文gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba

关键词:gydF4y2Ba测井识别、机器学习、贝叶斯反演、准噶尔盆地,三、储层岩相gydF4y2Ba

引用:gydF4y2Ba程郑Z,张L, M, Lei Y, Z,曾任X, Z L,杨W,李刘C和N(2023)岩相的测井识别强烈异构深埋水库基于改进贝叶斯反演:侏罗纪砂岩越低,准噶尔盆地中部,中国。gydF4y2Ba前面。地球科学。gydF4y2Ba11:1095611。doi: 10.3389 / feart.2023.1095611gydF4y2Ba

收到:gydF4y2Ba2022年11月11日;gydF4y2Ba接受:gydF4y2Ba2023年1月10日;gydF4y2Ba
发表:gydF4y2Ba2023年1月20日。gydF4y2Ba

编辑:gydF4y2Ba

Omid Haeri-ArdakanigydF4y2Ba加拿大自然资源部gydF4y2Ba

审核:gydF4y2Ba

Mehdi OstadhassangydF4y2Ba东北石油大学,中国gydF4y2Ba
小军(Jon)gydF4y2Ba加拿大自然资源部gydF4y2Ba
Wanju元gydF4y2Ba加拿大地质调查所,加拿大gydF4y2Ba

版权gydF4y2Ba©2023郑张Cheng Lei,张曾,任,Yu Yang Li和刘。这是一个开放分布式根据文章gydF4y2Ba知识共享归属许可(CC)。gydF4y2Ba使用、分发或复制在其他论坛是允许的,提供了原始作者(年代)和著作权人(s)认为,最初发表在这个期刊引用,按照公认的学术实践。没有使用、分发或复制是不符合这些条件的允许。gydF4y2Ba

*通信:gydF4y2BaLikuan张gydF4y2Bazhanglikuan@mail.iggcas.ac.cngydF4y2Ba

下载gydF4y2Ba