您好,欢迎访问三七文档
成都理工大学马英杰核数据处理第四章数理统计分析方法-2成都理工大学核自学院成都理工大学马英杰数理统计分析方法方法场晕的简易研究方法多元回归分析方法趋势面分析数学分类法成都理工大学马英杰趋势面分析基本思想用数学面拟合观测值中区域性变化的“趋势”,进而分离出局部性变化的统计分析方法。其中的数学面称为趋势面从每个观测值中减去相应的趋势面值,得到的每个点上的相应差值,称剩余值,是局部因素引起的。依据趋势值和剩余值绘制出的等值线图,分别称趋势面图和剩余图。由于两个图反映着两种相关联而又不同的地质对象,研究时,需要把二者结合起来分析。成都理工大学马英杰趋势面分析目的“提取”观测值中的趋势部分,排除随机干扰,分离出有价值的剩余值。研究对象趋势面分析可以用来描述任何具有空间特性的物理量。例如物化探场的观测值,岩石的物性参数、构造的形态参数等。成都理工大学马英杰趋势面分析解决问题研究成矿元素的空间富集规律,指示找矿方向,预测和评价远景区;研究构造形态,指示找矿元素富集部位;筛选出有价值的剩余值,缩小找矿、探矿“靶区”;其他领域。成都理工大学马英杰趋势面分析多项式趋势面分析多项式趋势面分析的数学原理,计算过程与多元回归分析类似。不同的是多项式趋势面分析中自变量是地理(空间)坐标,研究的是场晕的空间变化规律。按自变量个数可分为二维、三维多项式趋势面分析。其中,二维空间的趋势面方程中,仅出现一次项时,称一阶趋势面;出现二次项时,称二阶趋势面;依次,三阶,四阶……成都理工大学马英杰趋势面分析多项式趋势面分析多项式趋势面方程,只要经过某些数学变换就可化成多元线性回归方程。如:二阶多项式趋势面方程:五阶多项式趋势面方程:225423210zybxybxbybxbbz520419321823174165154143132212311410392827362ybxybyxbyxbyxbxbybxybyxbyxbxbybxybyxbxbzz成都理工大学马英杰趋势面分析多项式趋势面分析对二阶多项式趋势面方程作如下变换:则:从上可知:趋势面分析就是回归分析的直接推广。但多项式趋势面分析在含义上与回归分析还是有区别的,标识的是与地理坐标的关系。55443322110ubububububbz2542321;;;;yuxyuxuyuxu成都理工大学马英杰趋势面分析多项式趋势面分析——趋势面方程的建立多项式趋势面分析的数学模型:式中,z为观测值,εt为剩余值(εt的正态性假设能否满足,是多项式趋势面分析效果好坏的重要条件)B1、B2…为待定系数设拟和函数的形式是:为了使拟合值逼近观测值zi,采用最小二乘法原理,以确定b0,b1,b2…tyBxyBxByBxBBz...25423210...ˆ25423210ybxybxbybxbbz成都理工大学马英杰趋势面分析多项式趋势面分析——趋势面方程的建立最小二乘原理:得联立方程组:最小ntttnttzzQ1212)ˆ(4322322232232222342322322222322222111yxyyxyxyyyxyyxyxxyyxxyxyyxyxxyxxxxyxyyxyxyyyxyyxxxyxxxyxyxyxyxyxyxzyxyzzxyzxzzbbbbbb22543210成都理工大学马英杰趋势面分析多项式趋势面分析——趋势面方程的建立解上联立方程组,求得系数:b0,b1,b2,…,并把这些系数带入下列多项式函数,即得所求的趋势面方程。趋势面方程已经建立,但究竟这个方程拟合效果怎样?需要判断检验!!!!...ˆ25423210ybxybxbybxbbz成都理工大学马英杰趋势面分析趋势面方程的代表性与剩余值的分析拟合度检验计算拟合度C:(其中,n为测点数)C是从0到100%的数,C越接近100%,拟合度程度越高;但拟合过高,并不合适,过小也不好。因为:过高,就失去趋势面分析的意义;过小,又达不到目的。如C=12.3%,表明趋势面只反映了观测值总波动的12.3%,还有87.7%没有得到反映,而留在剩余波动中了。如何判断方程有没有显著意义?%100)()ˆ(ˆ2222zznzznC成都理工大学马英杰趋势面分析趋势面方程的代表性与剩余值的分析F检验——方程的显著性检验计算F值:式中,n为测点数;s趋为趋势平方和;s剩为剩余平方和;k=p(p+3)/2为p次趋势面的项数(常数项除外)趋势平方和:剩余平方和:剩趋剩剩趋趋kssknfsfsF)1(//kyyntt趋趋,自由度f)ˆ(s211f)ˆ(s21knyynttt剩剩,自由度成都理工大学马英杰趋势面分析趋势面方程的代表性与剩余值的分析F检验——方程的显著性检验计算F值:给定置信度α,查F分布表的临界值Fα(k,n-k-1),若FFα,则认为趋势面是显著的;否则不显著,即无实际意义。注意:当被观测变量不是随机独立变量时,F值会偏大,这时用F检验作为判断趋势面是否合适的标准就不恰当了,把剩余值作为真正有意义的“异常”就不真实了。剩趋剩剩趋趋kssknfsfsF)1(//成都理工大学马英杰趋势面分析趋势面方程的代表性与剩余值的分析剩余值的评价——为进一步对趋势面拟合的精度做出概率估计计算剩余标准差σ:用σ可以估计观测值出现在下列范围内的概率:在区间(-σ,+σ)的概率是68%;在区间(-2σ,+2σ)的概率是95%;在区间(-3σ,+3σ)的概率是99.7%;如果观测值不在上述区间内,可能是某些特殊原因引起的,应当引起重视,深入研究。)1/(kns剩zˆzˆzˆzˆzˆzˆ成都理工大学马英杰趋势面分析趋势面方程的代表性与剩余值的分析趋势图用上面确定的趋势面方程代入观测点的地理坐标计算趋势值,用趋势值绘制的等值图称趋势图。剩余等值图为了分离出异常,还需要计算剩余值用正剩余值绘制的等值图称剩余等值图成都理工大学马英杰趋势面分析多项式趋势面分析——应用实例在某岩体西翼大西江地区的108km2面积上取水样1408个,用水中铀含量作5阶多项式趋势面分析。1-趋势等值线2-剩余分量等值线3-异常点4-构造线5-岩体界限6-铀矿床北部大西江为中心的趋势隆起,其趋势值较高,是由于地形低洼,形成汇水区使水中铀含量增高所致,没有异常分量存在。成都理工大学马英杰趋势面分析多项式趋势面分析——应用实例在某岩体西翼大西江地区的108km2面积上取水样1408个,用水中铀含量作5阶多项式趋势面分析。1-趋势等值线2-剩余分量等值线3-异常点4-构造线5-岩体界限6-铀矿床沿F1、F3含矿构造带及附近,趋势隆起的值中等,且变化平缓,其长轴与构造走向基本一致.剩余值晕圈及剩余值较高的点多沿构造带断续分布,反映了深部有矿。可见,趋势面分析不仅能排除高背景值的干扰,而且能圈出铀矿化的富集区段。成都理工大学马英杰趋势面分析三维空间的多项式趋势分析在二维趋势面方程中增加一个垂直坐标作为自变量,就形成了三维趋势分析。它可以描述测井资料的空间变化趋势如:用伽玛测井资料就可研究地下空间伽玛场晕的分布趋势,指示矿化空间。在勘探阶段,可以协助施工,指示矿化的延伸方向及盲矿体富存空间位置。成都理工大学马英杰趋势面分析三维空间的多项式趋势分析——方程的建立设在(xt,yt,zt)点上的观测值为wt,则三维趋势分析的数学模型为:εt为剩余值为三维多项式函数,也是该点的趋势值一阶时:二阶时:三阶时:tttzyxww),,(ˆzbybxbbzyxw32101),,(ˆtwˆ29287652412),,(ˆ),,(ˆzbybyzbxzbxybxbzyxwzyxw3192182173162151421321221131023),,(ˆ),,(ˆzbyzbzybybxzbxyzbxybzxbyxbxbzyxwzyxwbj为待定系数,j=0,1,2,…kk=(p+1)(p+2)(p+3)/6p为多项式阶数成都理工大学马英杰数学分类法数学分类方法:是指依据研究对象的特征组分,用数学方法进行分类的统计分析技术。它能解决常遇到的两大数学分类问题:第一大类问题:是研究对象的类别已知,需判断未知归属的样品属于已知类的哪一类;第二大类问题:是研究对象的分类未知,需要对样品(变量)进行分类不同的问题,通常需要使用相应的数学分类方法判别分析聚类分析成都理工大学马英杰数学分类法二类判别分析判别分析定义:是判定一个或几个未知类别的样品究竟属于哪一个已知类的多元统计分析方法分为二类判别分析、多类判别分析基本思想:依据二类或二类以上不同的已知总体的样本,建立判别函数,然后据此函数对未知类别的样品进行分类。因此,分类的效果好坏,就决定于已知标准样品的代表性以及未知样品是否符合判别模型的应用条件。成都理工大学马英杰数学分类法二类判别分析判别原理:x1,x2分别代表两种判别变量,A,B是关于x1,x2的两类样品的散点分布显然,只用一个变量x1或x2来划分A、B两类,是难于直接从它们的观测数据上分开的,总有一部分混杂在一起。但可以用转动坐标轴的方法把两者区分开图中直线R就是这种思想指导下建立的判别函数,它很明显地把A、B两总体分开了这种思想可以推广到k维坐标系中,即A、B包含多个变量的情况成都理工大学马英杰数学分类法二类判别分析——二类判别函数建立的准则费歇准则假设有A、B两类已知归属的样品,观测值如下:设已找到一个具有k个变量的线性判别函数:式中,R为判别函数;ci为待定系数;xi为地质变量样品序号A类观测值x1,x2,…,xk样品序号B类观测值x1,x2,…,xk12…n1x11,x12,…,x1kx21,x22,…,x2k………………………xn11,xn12,…,xn1k12…n2x11,x12,…,x1kx21,x22,…,x2k………………………xn21,xn22,…,xn2kkiiikkxcxcxcxcR12211成都理工大学马英杰数学分类法二类判别分析——二类判别函数建立的准则费歇准则现在的问题是找一个能把A、B两类样品分得最合理的函数,即找一个能使每类样品的判别得分平均值之差的平方最大,同时又使每类样品内判别得分值的离散程度最小的函数。即使I尽可能大。这个准则称费歇准则。要解决这个问题,实际上就是如何确定出判别函数中的待定系数ci的问题。2121122))()(())()(())()((nttnttBRBRARARBRARI2)()(BRAR成都理工大学马英杰数学分类法二类判别分析——未知样品的分类及检验分类判别——1.确定判别分类指标R0先用判别函数分别计算A、B两类的平均判别函数值:由此确定判别分类指标R0:式中:n1,n2分为A、B类样品数kikiiiiiBxcBRAxcAR11)()()()(21210)()(nnBRnARnR成都理工大学马英杰数学分类法二类判别分析——未知样品的分类及检验分类判别2.把未知样品的观测值xi(i=1,2,…k)代入判别函数式,得到未知样品判别值R未,即:3.判别:分两种情况:如果,则当时,样品属于A类,否则属于B类;如果,则当时,样品属于B类,否则属于A类。kiiixcR1未)()(0BRRAR0RR未)()(0BRRAR0RR未成都理工大
本文标题:核数据处理b-42
链接地址:https://www.777doc.com/doc-4050539 .html