您好,欢迎访问三七文档
当前位置:首页 > 机械/制造/汽车 > 综合/其它 > 基于测井曲线数据进行合理自动分层的模型
1封一答卷编号(参赛学校填写):答卷编号(竞赛组委会填写):论文题目:(C)基于测井曲线数据进行合理自动分层的模型组别:本科生参赛学校:吉林大学报名序号:(可以不填)参赛队员信息(必填):姓名所在学院及专业联系电话参赛队员1管炜汽车工程学院车辆工程420906班4209063515143086817参赛队员2曾雷汽车工程学院工业设计420907班4209073515584230962参赛队员3刘明强汽车工程学院车辆工程420903班42090337158431395362封二答卷编号(竞赛组委会填写):评阅情况(省赛评阅专家填写):省赛评阅1:省赛评阅2:省赛评阅3:省赛评阅4:省赛评阅5:基于测井曲线数据进行合理自动分层的模型3基于测井曲线数据进行合理自动分层的模型摘要本文解决的是根据各种测井曲线数据,合理自动划分地层的问题。避免了人工分层的主观性和不确定性,从而达到更为精确的分层结果。这样,在今后的研究中,就能对不同地层确定研究目标,以及确定将要重点研究的地层,统一不同井号的研究范围。对1号井分层时,我们首先建立了模型一和模型二。模型一:变量聚类模型,即对各个测井指标先进行聚类。变量幅值随深度变化大致一样的聚为一类,从每一类中挑选出具有代表性意义的指标,这样就可以有效的减少变量的个数。模型二:褶积求导分层模型,我们首先用褶积法求导代替一般意义上连续函数的求导。然后画出各个代表性指标对深度的导数曲线,找出导数的极值点,作为分层候选点。然后根据这些分层候选点,计算出层间方差和层内方差之比F,当F值达到最大时,就是最佳的分层结果。综合各个指标,我们得到1号井的分层结果如下:人工分层结果自动分层结果294290.175330331.925368366.55410405.935453.8446.3495.3494.8530.2530.8575589.175614.7606.175654.5672.425697691.55736.3738.675771.8766.3814817.8857.8832.175然后,我们以1号井为标准井,用1号井的分层方法分别对2-7号井进行自动分层(具体结果见模型求解部分)。模型三:残差分析模型,计算出我们得出的分层结果和人工分层结果之间的残差,找出与人工分层点的差别以及差别有多大。然后用模型二对8-13号井进行自动分层,并根据1-7号井的分层结果找出8-13号井的分层点(具体结果见模型求解部分)。本模型中,首先对变量进行了聚类分析,从而很有效的减少了变量个数,减小了处理难度。用褶积法求导代替一般意义上连续函数的求导,通过导数的极值点挑基于测井曲线数据进行合理自动分层的模型4选出可能分层点,并用层间方差与层内方差之比来评价、优选这些分层点。关键词:测井曲线;自动分层;聚类分析;褶积求导法;层内与层间方差比;残差分析问题重述在地球物理勘探中需要利用测井资料了解地下地质情况,其中测井曲线分层是首先要完成的基础工作。测井曲线分层的目的是为了在今后的研究中,便于对具有不同特点的地层确定研究目标,以及确定将要重点研究的地层,统一不同井号的研究范围。通常,在一个区域内,通过前期地质研究工作,结合各种测井数据,首先对最早开发的参考井进行详细研究。每一种测井数据,都反映了地质结构的特点和地层的变化,地质人员通过经验,综合各种测井数据反映的地层特点,将井从一定深度开始,对井进行井层划分和命名,如1号井从距井口深368米处开始,依次往下,定名为长31、长32、长33、长41、长42、长61、长62、长63、长71、长72、长73、长81、长82、长91、长92等地层。接着在分析随后开发的2号井时,也根据和1号井分层的特点和规律,依次定名为长31、长32、长33、长41、长42、长61、长62、长63、长71、长72、长73、长81、长82、长91、长92等地层。井的位置不同可能会导致这口井的每一个层位的深度范围也不同。通常这些工作都是通过人工来进行的,这就是所谓人工分层方法。该方法不仅费时费力,而且分层取值过程中受测井分析人员的经验知识和熟练程度影响较大,主观性较强,也会因为不同的解释人员的个人标准有误差,而造成不同的人员有不同的分层结果。因此,我们需要建立一个自动分层的数学模型。首先建立一个对1号井进行自动分层的数学模型,然后以1号井为标准井,对其他井进行自动分层,并与人工分层结果进行比较分析。根据比较结果,对已建立的模型进行改进,并确定合适的数学模型,以得到更为精确、科学的分层结果,最后分析自动分层的结果。本文要解决的问题有:1.以1号井为标准井,根据此井的各种测井曲线数据,建立数学模型,对第2号至7号井进行自动分层,并与人工分层结果进行比较分析。2.通过前面人工分层与自动分层的比较结果,以及已给的各种测井曲线数据,确定合适的数学模型对第8号井至13号井进行自动分层,并分析结论。问题分析首先考虑到测井指标有66项,变量过多,不利于我们的分析。于是我们利用测井曲线数据通过matlab画出各项指标随深度的变化曲线,发现有很多指标的变化趋势大致相同。这样我们就能把变化趋势大致相同的指标归为一类,从而减少变量个数,使得分析更加方便。对变量分类可以用R型聚类分析,通过matlab软件画出66个变量聚类图。根据聚类结果,分析把指标分成多少类,然后从这些分好类的变量中找出有代表性的指标,这样变量(指标)个就大大减少了,从而有利于我们的基于测井曲线数据进行合理自动分层的模型5分析。针对问题一:我们可以先求出测井曲线数据对深度的导数,导数值越大,说明测井数据随深度变化越明显,作为分层点的可能性越大。但由于所给指标的数据随深度变化是离散的不连续的,故用一般的求导方法不能求出某项指标的数据对深度的导数。为此,我们用褶积法求导代替一般意义下连续函数的求导(下文导数即指褶积法求出的导数)。首先我们利用导数的极值(可以规定一个导数截止值T)找出测井曲线的拐点,这些拐点即为分层候选点。通过查找资料,我们找到了层内方差和层间方差两个评价候选点指标,并定义层间方差和层内方差之比为F。层间方差反映了各层段平均值围绕总平均值的分布情况,它反映了层与层之间的物性差异,层间方差大,说明各层之间的数据差别明显,层内方差反映了层内测量值围绕该层平均值分布的特征,它反映了层内岩性不均匀程度和随机干扰,层内差小,说明层内岩性均匀,数据分布集中。因此F的值越大,分层越合理。于是我们就可以给出几个合适的导数值,分别计算F值,取F值最大时,截止导数值所分的层作为我们的分层最终结果。对1号井分好层后,以1号井为标准井,用已建立的模型对2-7号井进行自动分层。然后建立残差分析的数学模型(具体方法见模型求解部分),与人工分层结果进行对比分析,用matlab算出残差分析的各项指标,对自动分层结果进行综合评价。最后结合指标的实际含义,对1号井的分层结果进行说明。针对问题二,我们根据问题一中人工分层与自动分层的比较结果,并结合已给的各种测井曲线数据,对已建立的模型进行改进,以确定最优的分层结果,并对8-13号井进行自动分层。最后对分层结果进行总体分析。模型假设与符号说明模型假设假设1:题目所给数据(-9999.000除外)都是正确的,合理的。假设2:多个指标之间相关性大的可以选用一个具有代表性的指标。假设3:以1号井为标准井,1号井中没有的指标,其他井中不予考虑。假设4:不同岩性在曲线上有明显差别,且同一岩层的测井值应相对稳定,波动较小。假设5:相邻两个采样点之间的岩性是均匀变化的。符号说明ix某项指标第i个采样点所测得的数据f(j)滤波因子N滤波窗口n采样点总数D总体变差1D层间离差平方和2D层内离差平方和基于测井曲线数据进行合理自动分层的模型61S层间方差2S层内方差F层间方差与层内方差之比ie第i层自动分层与人工分层的残差T“导数”截止值模型的建立与模型的求解模型一的建立和求解考虑到指标数量过多,不利于我们的分析,首先我们用matlab画出各个指标随深度变化的曲线(由于数量过多,我们挑选了一些指标图作为示例)如下:1002003004005006007008009001000-4-3.5-3-2.5-2-1.5-1-0.500.51基于测井曲线数据进行合理自动分层的模型710020030040050060070080090010000510152025301002003004005006007008009001000051015202530基于测井曲线数据进行合理自动分层的模型81002003004005006007008009001000010203040506070809010010020030040050060070080090010000102030405060708090100基于测井曲线数据进行合理自动分层的模型910020030040050060070080090010001001201401601802002201002003004005006007008009001000020406080100120基于测井曲线数据进行合理自动分层的模型10100200300400500600700800900100020222426283032100200300400500600700800900100020222426283032基于测井曲线数据进行合理自动分层的模型1110020030040050060070080090010000200400600800100012001400160018002000100200300400500600700800900100000.511.522.5基于测井曲线数据进行合理自动分层的模型121002003004005006007008009001000608010012014016018010020030040050060070080090010001.41.61.822.22.42.62.8基于测井曲线数据进行合理自动分层的模型131002003004005006007008009001000-30-20-10010203040506070从这些曲线(指所有曲线)中,我们发现有些指标的幅值随深度变化是几乎一致的。于是我们建立一个对各个指标进行变量聚类的数学模型。考虑到-9999.000的特殊性(无效数据),我们先把数据分成三类,第1-40列和42、43、45、49-53列为第一类,第55、56列为第二类,第58-66列为第三类,另外第41、44、46、47、48、54、57列除-9999.000数据外,全为0,对1号井分层无任何意义。前三类数据中-9999.000的分布各不相同。为了处理数据方便(matlab中输入的数据须为矩阵),这三类中-9999.000所在层都不予考虑。先定义一个相关系数ijr,2121211]))[))((((xxxxxxxxkniikjniijnikikjijijr它反映了变量ix和jx之间的相似性程度。则每类数据所构成的矩阵中每两个指标都可以算出一个相关系数,从式中可以看出,相关系数都小于1。对相关系数进行处理,用1减去相关系数,那么这些数据可以构成一个矩阵,把它称为相关系数矩阵。然后可以根据相关系数矩阵利用MATLAB画出聚类图,如下:基于测井曲线数据进行合理自动分层的模型14其中1-48代表第一类中所对应的指标。基于测井曲线数据进行合理自动分层的模型15其中1-9代表第三类中所对应的指标。结合聚类图,我们得到的第一类的变量(指标)聚类结果如下表类数指标所在列数第1类125第2类25720232438第3类32139第4类4612132230第5类89第6类101835第7类1119第8类1426第9类1517第10类16第11类2728第12类293237第13类3140第14类33第15类3436基于测井曲线数据进行合理自动分层的模型16第16类424350第17类45第18类49第19类515253随后我们通过查找资料,找出测井曲线常用的分类指标,并结合聚类结
本文标题:基于测井曲线数据进行合理自动分层的模型
链接地址:https://www.777doc.com/doc-5320480 .html