您好,欢迎访问三七文档
当前位置:首页 > 机械/制造/汽车 > 综合/其它 > 测井曲线的自动分层模型
摘要在地球物理勘探中,为了了解地下地质情况,以便于对具有不同特点的地层确定研究目标,以及确定将要重点研究的地层,统一不同井号的研究范围,其中测井曲线分层是首先要完成的基础工作。本文以1号井为标准井,建立数学模型实现了测井曲线的自动分层。在建立模型过程中,对1号井的数据进行了分类:有效值、无效值、过渡值。我们采用零替换的方法处理了题中出现的无效数据,对于其他非正常数据,由于其表现出的无规律性,因此我们采用了中值滤波的处理方法减小了噪声干扰,从而提高了数据质量。鉴于测井曲线中评价指标过多的情况,首先根据数据的特点进行了初步的筛选,剔除了信息含量少的指标。对于留下的36个指标,又根据信息论的思想,计算出每一项指标的信息量,进一步剔除信息量较低的指标,最终得到22个测井曲线评价指标。该模型对这22个指标进行了主成分分析,得到五个主成分,其累计贡献率达到了80%以上,起到了降维的作用。再根据主成分的方差贡献率确定了每一个主成分的权重,然后将所有主成分加权求和得到一个新的综合指标,从而根据这一综合指标将所有的测井曲线综合为一条测井曲线,利于模型的后续处理。对于每号井的综合测井曲线,该模型采用matlab软件编程进行了趋势分析,对测井曲线进行了粗分层,确定了分界点的可能位置,然后进行了层界面归并和加权值法命名,达到了测井曲线自动分层的目的。依据建立的模型对1号井进行了自动分层,根据分层结果论证了该模型的准确性程度,得出该模型有较高的准确性。然后对2至7号井进行了自动分层,通过了人工分层结果进行对比,分析了在测井曲线分层中出现的自动分层模型的准确度问题和人工分层的主观性问题。最后,利用文中建立的模型对8至13号井进行了自动分层,给出了分层结果,并进行了对结果的分析。关键字:中值滤波;主成分分析;趋势分析一、问题重述在地球物理勘探中需要利用测井资料了解地下地质情况,其中测井曲线分层是首先要完成的基础工作。测井曲线分层的目的是为了在今后的研究中,便于对具有不同特点的地层确定研究目标,以及确定将要重点研究的地层,统一不同井号的研究范围。通常,在一个区域内,通过前期地质研究工作,结合各种测井数据,首先对最早开发的参考井进行详细研究。每一种测井数据,都反映了地质结构的特点和地层的变化,地质人员通过经验,综合各种测井数据反映的地层特点,将井从一定深度开始,对井进行井层划分和命名,如1号井从距井口深368米处开始,依次往下,定名为长31、长32、长33、长41、长42、长61、长62、长63、长71、长72、长73、长81、长82、长91、长92等地层。接着在分析随后开发的2号井时,也根据和1号井分层的特点和规律,依次定名为长31、长32、长33、长41、长42、长61、长62、长63、长71、长72、长73、长81、长82、长91、长92等地层。井的位置不同可能会导致这口井的每一个层位的深度范围也不同,甚至有可能会出现缺失中间某层的现象。如第6号井缺长31、长32层。通常这些工作都是通过人工来进行的,这就是所谓人工分层方法。该方法不仅费时费力,而且分层取值过程中受测井分析人员的经验知识和熟练程度影响较大,主观性较强,也会因为不同的解释人员的个人标准有误差,而造成不同的人员有不同的分层结果。自动分层的基本思想、实现手段是一个不断发展变化的过程。由人工分层到自动分层,除了计算机工具的引入,各种数据处理技术也被应用于自动分层。随着一个区域开发井的数量增加,我们希望利用已有分层井点数据与变化特点作为控制点,结合每口井丰富的测井曲线数据,如密度(DEN)、声波(AC)、中子(CNL)、自然伽玛(GR)、自然电位(SP)和电阻率(RT)等的变化特点,建立合理的数学模型,实现井位分层人工智能处理,也就是实现自动分层。相对于人工分层,自动分层可以避免人为分层的随意性,并可在很大程度上提高工作效率。进行具体的井位分层人工智能处理,这将极大地提高工作效率。另一方面,希望通过自动分层处理,与人工分层的结果进行比较分析,进一步提高分层精度。下面请完成以下工作:1.以1号井为标准井,根据此井的各种测井曲线数据,建立数学模型,对第2号至7号井进行自动分层,并且通过分析,与人工分层结果进行比较分析。考虑是否需要利用你所建立的数学模型,对1号井的分层结果进行说明。2.通过前面人工分层与自动分层的比较结果,以及已给的各种测井曲线数据,确定合适的数学模型对第8号井至13号井进行自动分层,并分析你的结论。二、问题分析在地球物理勘探中需要利用测井资料了解地下地质情况,其中测井曲线分层是首先要完成的基础工作。传统做法是采用人工分层方法,但是这种方法不仅费时费力,而且受分析人员的经验知识和熟练程度影响较大,主观性较强,存在明显的误差。我们现在希望利用已有分层井点数据与变化特点作为控制点,结合每口井丰富的测井曲线数据,建立合理的数学模型,实现井位分层人工智能处理,也就是实现自动分层。第一问中,要求以1号井为标准井,根据此井的已知数据,建立模型,对第2至7号井进行自动分层,并且与人工分层结果作比较。第一步,因为在1号井的测井曲线数据中有66项指标,6000多个样本点,所以我们必须剔除掉一些无关紧要的指标,否则由于数据量太大而无法进行求解。我们通过查阅资料,首先人工初步剔除掉30项指标,然后对剩余的36项指标根据每一项中所包含信息量的大小,再次剔除掉部分指标,最终确定出22项指标作为研究对象。第二步,为了消除因仪器设备引起的测量数据扰动,我们采用中值滤波的方法处理数据,得到更有效的数据。第三步,将数据标准化处理后,采用主成分分析法将多个指标综合成少数几个综合指标,即确定出几个主成分。第四步,根据每一个主成分对分层结果的贡献率确定出每个主成分的权重,再将所有主成分综合成一个综合指标,这样每一口井可以得到一条关于这个指标的测井曲线。第五步,我们对测井曲线进行趋势分析,通过计算测井曲线上各点的切线斜率,可以判断层界面的大体位置,从而完成初步分层,然后对初步分层中不必要的小薄层利用层界面归并归并为一层。第六步,我们通过计算每口井每一层的测井值,利用距离判别的思想,分别于1号井作比较,完成对井层的命名。最后,我们通过作图将第2至7号井自动分层结果与人工分层结果作比较,对比较结果作出分析,并且对1号井的分层结果进行说明。第二问中,根据第一问中已经建立的模型,结合已有的第8至13号井的测井数据,对第8至13号井进行自动分层,并且对分层的结果作出分析。三、模型假设1.测井数据真实可靠,不考虑人为因素引起的误差;2.不考虑地层变化引起的分层波动;3.以1号井为标准,它包含所有的地质分层情况。四、符号说明符号含义iH第i项指标的信息量iS第i项指标的标准差____iX第i项指标的均值ijz标准化后第j项指标第i个观测值随机向量x的均值=ijppΣ()随机向量x的协方差矩阵R主成分分析中相关系数矩阵i主成分的特征值U主成分的特征向量五、模型建立的准备5.1数据的预处理我们观察分析每口井的测井数据,发现每项指标测得的数据值可以分为以下几类,第一类,无效值,如-9999;第二类,有效值,如30.885;第三类,过渡值,此类值往往出现在从无效值到有效值的过渡段,如-6196.22。我们考虑到无效值会影响分层计算的结果,而且无效值都是相同的值,为了便于计算,将每口井的测井数据中无效值全部替换为0。而对于过渡值,因为它没有规律可循,无法一一替换,我们将在模型中采用中值滤波的方法消除它带来的噪声干扰。六、模型的建立与求解6.1问题一模型的建立与求解6.1.1人工初步剔除指标在1号井的测井数据中,一共有66项指标,由于数据量太过庞大,计算机无法在短时间内算出结果,所以必须简化指标。我们通过查阅资料,人为初步剔除了30项指标,剔除后的36项指标,如下表所示,表1人工初步剔除后的36项指标DENRILDRILMRLL8SP1R4.0SPDEViAZImGRACRMLRMNCALCNLR4.0%cnl%GR%AC%RILD%RILM%RLL8%SP1%RMN%SP%den%CAL%RML%PORTSWSHSXORTCIDCIMCIL86.1.2根据信息量的大小再次剔除指标在信息论中,如果某项指标的变化幅度越大,我们就认为这项指标所携带的信息量越大,对结果的影响越大,也就是说这项指标越重要。而在1号井的测井数据中,测井开始和测井结束时每项指标的数据都是无效的,这些数据对分层不能提供有效地信息,所以我们取从长31的底深(294)到长92的底深(857.8)这一段测井数据作为每项指标的有效观测值,然后我们定义某项指标所有有效观测值的标准差与均值的比值大小为该指标的信息量,即____iiSHiX(1,2,...,36)i.……………………………………(1)其中,iH表示第i项指标的信息量,iS表示第i项指标的标准差,____iX表示第i项指标的均值。我们在Excel中利用Average函数和STDEVP函数分别求出1号井人工初步剔除后每项指标的均值和标准差,然后代入(1)式,求得每项指标的信息量,作出如下图:图136项指标的信息量图中横坐标表示每一项指标,纵坐标表示每一项指标对应的信息量,从中可以看出有些指标的信息量非常小,完全可以剔除掉,经过再次剔除后剩余22项指标,它们的信息量如下图:图222项指标的信息量从图2中可以看出,这22项指标的信息量基本都大于0.5,我们认为这些指标携带着影响分层的主要信息,是比较重要的指标。最终选取的22项指标如下表所示:表2根据信息量大小再次剔除后的指标RILDRILMRLL8R4.0DEViAZImRMLRMNCNLR4.0%cnl%RTRILD%RILM%RLL8%CIDCIMCIL8SHRMN%RML%PORT6.1.3中值滤波为了消除因仪器设备产生的测量数据扰动,我们采用中值滤波对数据进行处理。假设有数据样本序列ix(1,2,...,)iN,当滤波窗口为21n,其中值滤波的步骤为:(1)取以第i个数据为中心的21n个数据行进行排序(顺序或逆序均可);(2)取排序后的中间值,即第1n个数据作为第i点的滤波值;(3)自上而下迭代计算离散曲线上的各点。中值滤波流程如图3所示图3中值滤波流程图滤波窗口中的的n的视目的不同而定。0n时,滤波器失效;n较小(如1n)时可保持曲线的幅度值;n较大时可只保持曲线的变化趋势。在这里,我们没有找到很好的办法确定n的大小,只能经过对不同n值的尝试,最终确定当4n时,比较合理。6.1.4标准化处理数据为了消除各项指标之间不同量纲的影响,对每项指标的观测值进行标准化处理,即:___ijjijjxxzS.……………………………………(2)输入()xN;1ii(,)(21)xininSn调用快速排序,得'S''()(1)xiSn输出'()xN开始结束iN否是式中,1,2,...,in,1,2,...,jm,ijx表示第j项指标的第i个观测值,___jX表示第j项指标所有观测值的均值,且___11njijixxn,jS表示第j项指标所有观测值的标准差,且___2211()1njijjiSxxn,ijz表示标准化处理后第j项指标的第i个观测值。根据式(2),我们对所有指标的观测值进行标准化处理。6.1.5主成分分析主成分分析法是利用降维的思想,在力保数据信息损失最少的原则下,把多个指标转化为少数几个综合指标的一种对多变量数据进行最佳综合简化的多元统计方法。设它的数据有p个指标,,分别用12,,...,pxxx表示,这p个指标构成的p维的随机向量为12(,,...,)Tpxxxx。设随机向量x的均值为,协方差矩阵为=ijppΣ()。对x进行线性变换,形成新的综合变量Y,满足下式:11112121212122221122............ppppppppppYaxaxaxYaxaxaxYaxaxax其中11121122221212......(,,...,)..
本文标题:测井曲线的自动分层模型
链接地址:https://www.777doc.com/doc-7006844 .html