您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > 有序地质量最优分割法
第七章有序地质量最优分割法第一节概述地层划分与对比是煤田地质勘探的主要任务之一。在地质工作中,通常是寻找地层的不整合或假整合界线,或者利用古生物化石、岩石矿物等地质特征对地层进行划分与对比。这种划分方法比较直观,适用于较大地层单元的划分与对比。当地质特征间的差异性不显著时,运用上述直观、定性的方法来解决较小地层单元的进一步划分就有一定的困难。因此,近年来开始利用有序地质量,即运用数学方法,并借于电子计算机定量地划分地层,提出了“有序地质量最优分割法”。地质数据中有相当多是有序的。这些按一定顺序排列的地质变量,叫做有序地质量。例如,沿地层露头剖面采集的岩石标本;钻孔取出的岩芯样品;与这些岩石、样品有关的岩性、物理化学和古生物数据;以及地球物理测井数据等。它们都是有序地质量。这类数据的特点是样品的前后次序不能变更。所以,一些不考虑样品排列顺序的数学处理方法,对此不适用。有序地质量最优分割法,就是对一批有序数据(地质体)进行分段的统计方法。设有n个按顺序排列的样品,每个样品测得p个变量,这批数据可用数据矩阵的形式表示为nxpnpnnppilxxxxxxxxxxX212222111211其中,ilx表示第i个样品第l个变量的取值。若对以上n个有序样品进行分割(分段),可能有121112211nnnnnccc种划分方法,每一种分法称为一种分割。在所有这些分割中,存在这样一种分割,它使得各段(组)内部样品之间的差异性最小(即样品数据的组内离差平方和最小),而使段(组)之间的差异性最大(即样品数据的组间离差平方和最大)。这种对n个样品分段并使组内离差平方和最小的分割方法,称为最优分割法。样品变量总离差平方和的分解式为BWT(7—1)式中,T为总离差平方和;W为组内离差平方和;B为组间离差平方和。由式(7—1)可知,如果n个样品分为K段,每段的样品个数为kn,若每个样品只取一个变量,则KknikikkxxW112)((7—2)KkkkKknikxxnxxBk12112)()((7—3)因此,寻求最优分割,就是用计算的分法找出使组内离差平方和(W)最小的那些分割点。这与判别分析中费歇准则相似,所以有序地质量最优分割法,有人又称为“F-分割法”或“有序样品的聚类分析”。第二节单元有序数据的最优分割若有n个有序样品,每个样品只取一个变量,则有n个有序数据序列,为nxxxX,,,21现在试图将这n个样品按顺序分割为K段,使段(组)内离平差和尽可能小,而组间离差平方和尽可能大。为此,用jiixxx,,,1表示从第i个样品数据开始至第j个样品数据为止的某段样品,其中nji1该段样品变量的离差平方和为2),(,jijijixxd(7-4)式中jixijjix11,由于),(jid能够反映样品段jiixxx,,,1内样品间差异的情况,),(jid愈小,表示段内各样品之间差异性愈小;反之,),(jid愈大,表示段内各样品之间差异性愈大。因此,又把),(jid称为ji,,段的直径。若n个样品分为K段:111211,,,nxxxkKnKKnxxxxxx,,,,,22222212,为最优K段分割。其各段离差平方和(段直径)分别为:),(1jid,),(),,(2jidjidK。根据最优分割的原则,其组内离差平方和必须满足min,.,,21112jidjidjidjixxWkKknikikk(7-5)或KkkkxjixnB12max,(7-6)在实际应用时,往往事先不知道n个有序样品客观上究竟能划分为几段。因此,必须从最优分成二段、三段、…、K段进行分析。一、最优二段分割若把n个有序样品nxxx,,,21分为两段,则有如下1n种不同的分法,即1xnxxx,,,3221,xxnxxx,,,43321,,xxxnxxx,,,54121,,,nxxxnx在上述1n种分法中,究竟哪一种方法最优?只须计算出每一种分割的组内离差平方和,并从其中找出组内离差平方和W最小的那一种分割,就是所求的最优二段分割。在n个有序样品中,对任意一个11njj都可以确定一个二段分割,即j,,1nj,,1。若把对n个样品在第j个样品处进行的二段分割的组内离差平方和记为nddjWn,21,1;2(7-7)式中,n表示被分割的样品数;2表示把n个样品分为二段;j表示以第j个样品为分割点。上述1n种分割的组内离差平方和分别为nddWn,21,11;2nddWn,32,12;2……………………………nndndnWn,1,11;2在ji,,中,当ji时,则0,2,21,1nnddd假设当1aj时,jWn;2达到最小,即jWaWnnjn;2min;2111则最优二段分割为1,,,21axxxnaxx,,1,其中iax为最优二段分割点。二、最优三段分割若把n个有序样品nxxx,,,21分为三段,其中必有两个分割点。假设第ja1和第j个样品为分割点,则三段分割为1,,1axxjaxx,,11njxx,,1若把三段分割的组内离差平方和记为:jaWn,;31,其中ja,1为两个分割点12;111njja,则njdjadadjaWn,1,1,1,;3111njdaWj,1,21显然,如果有jaWn,;31为最优三段分割,则1;2aWj必为最优二段分割,否则必存在另一个最优二段分割1;2aWj,使jaWjaWnn,;3,;311这与jaWn,;31为最优三段分割相矛盾。因此,如果对n个有序数据进行最优三段分割,必须对任意一个12njj,即前j个数据先求出其最优二段分割,为jadjadjaWj,1,1;2111若jaWaWjjjaj1111;2min;21则前j个样品的最优二段分割与njxx,,1构成一个三段分割。最后,找出一个适当的j,如2aj,使得njdaWaaWjn,1;2min,;3121jjaWnnj,;3min112则jaxx,,12,,1aaxxjnaxx,,12为n个样品的最优三段分割,其中1a和2a为最优三段分割点。三、最优K段分割若对n个有序样品数据nxxx,,,21进行最优K段分割,可先找出11njKj个样品的最优1K段最优分割,即221,,;1kjaaaKW从而得21,,1aaxxjaxxk,,12与njxx,,1构成K段分割,但不一定是最优K段分割。可选择一个适当的11njKj,如1Kaj时,使得jajajaKWaaaaKWKnnjKKKj,,,;min,,,;1221111221可得最优K段分割为1,,1axx21,,1aaxxnaxxK,,11,其中121,,,Kaaaxxx为最优K段分割点。应当指出,分割的段数K一直可做到所要求的段数K为止;或者可以预先给定一个小正数,使K段分割的组内离差平方和121,,,;knaaaKW后为止。这样得出的K就是最后的分割的段数。由图17所示,组内离差平方和是随分段段数K的增加而单调地减少。所以当nK时,组内离差平方和0,,,;121nnaaanW。因此,可根据组内离差平方和随段数增加而下降到比较稳定的时候(即图中曲线平缓时)再确定分段段数。第三节多元有序数据的最优分割为了分层,有时需要汇集样品更多的信息,采用多个变量指标。例如,采集n个有序样品,每个样品测得p个变量,原始数据可构成一个pn阶矩阵,为pnnpnnppxxxxxxxxxX212222111211在多变量情况下,人们自然会联想到是否能将单元有序数据最优分割原理引申到多元数据中来,以此对n个有序样品进行分割,一般最简单有效的办法就是把一段样品多个变量合并为一个变量来处理,统一定义“段直径”。但是,为了使不同变量间具有共同的数据基础,事先要对各个变量进行数据规范化处理,如使数据作正规化变换。原始数据矩阵中元素记为:plnixil,,2,1;,,2,1,则正规化数据为ilniilniilniililxxxxz111minmaxmin(7-8)得正规化数据矩阵pnnpnnppzzzzzzzzzZ212222111211根据正规化数据,将样品段ji,,的段直径定义为21,,jipjizzjid(7-9)式中jizijjiz11,pnji,,2,1,1(7-10)若n个有序样品分为K段,每段内有kn个样品,则多元有序数据最优分割的原理与单元有序数据最优分割一样,使组内离差平方和jidjidjidaaaKWKKn,,,,,,;21121211,KknipkkkjizzjjajajaKwKnnjK,,,,;min22111(7-11)应当指出,样品的段直径除了用式(7-9)定义外,还可用其他方法定义。如用样品数据绝对值距离来定义,即jipjixxjiD1,,(7-12)也可用其他度量空间的距离来定义。第四节最优分割法的计算步骤1.数据正规化设原始数据阵为pnnpnnppxxxxxxxxxX212222111211将X中的元素ilx变换为ilniilniilniililxxxxz111minmaxminplni,,2,1;,,2,1得正规化数据矩阵pnnpnnppzzzzzzzzzZ2122221112112.计算段直径矩阵D211,,jipnjiajizzjid其中izijjiz11,因为ijdjid,0,jiji故必须计算21nn个jid,,得nnnndnddndddD,,22,2,12,11,13.计算全部分割的组内离差平方和(或段直径和)及各种分段的最优分割1)最优二段分割由D矩阵对每一个2,,1,nnm计算相应的组内离差平方和,为mjdjidjWm,1,;21,,2,1mj找出最小值,确定相应的最优二段分割点,即jWmaWmmjm;2min;2111分割点为2,,1,111anana。从而得到n个样品nm的最优二段分割为naxxx1,,21nnaxx,,11,其中na1为最优二段分割点。2)最优三段分割根据D矩阵及最优二段分割结果,对每一个3,,1,nnm计算相应的三段分割的组内离差平方和,为mjdjaWjjaWjm,1;2,;3113,,1,1,
本文标题:有序地质量最优分割法
链接地址:https://www.777doc.com/doc-439889 .html