您好,欢迎访问三七文档
当前位置:首页 > 行业资料 > 能源与动力工程 > 数学地质201411
第一章绪论1、数学地质:是地质学与数学和计算机科学相互渗透、紧密结合而逐步形成的一门地质学的边缘学科。它是以数学为方法、以计算机为主要研究手段,定量研究地质学基础理论和定量探矿法的一门方法性学科2、地质概念模型:是指在对地质体系深刻理解和抽象思维的基础上,以定性方式表达地质体系发生和演化过程及其量间关系的模型。3、地质数学模型:指用定量方法描述地质体系发生、演化过程及其量间关系模型。4、地质系统:查明地质系统的数学特征,研究系统中与地质过程有关的因素即它们之间相互关系,建立地质作用过程及其产物的数学模型。5、地质过程的数学模拟:就是在对地质体系分析、归纳和逻辑思维的基础上,先提出一个表征地质体系的地质概念模型,并把它转化为一个数学模型,然后通过计算机对数学模型进行反复运算,以再现地质过程的发生和演化史,进而实现对地质过程定量描述所做的一种试验。6、数学地质主要研究内容:地质多元统计、矿产资源预测、地质数据库、地质过程的数学模拟、地质绘图自动化、人工智能和地质专家系统。7、数学地质的研究步骤:定义地质系统、建立地质概念模型、设计数学模型、模型的程序化、设计模拟实验、模型装载、模型运行、对结果作出地质解释并提交报告。第二章地质数据和地质变量1、地质数据:是表示地质信息的数、字母和符号的集合。它是用来表示地质客观事实这一地质信息的。从广义角度来看,地质数据可以是定量、定性数据,也可以是文字说明,甚至是地质图形。从狭义角度来看,地质数据主要是指定量的和定性的地质数据。2、地质数据的类型:1、观测数据:指对样品用物理、化学或直接观测的方法获得的表达样品特性的数据。(1)定性数据:它是用符号或代码表示的没有数量概念的观测数据。①名义型数据:是没有数量概念和次序之分,但彼此之间有“相等”或“不相等”关系的定性数据。②有序型数据:是没有数量概念,但彼此之间具有次序关系的定性数据。;(2)定量数据:是指能用数值大小来描述的观测数据。①间隔型数据:是有明确数量概念和地质含义的定量数据。②比例型数据:是指定量数据的比值。2、综合数据:是指由定量观测数据(或者级过定量化处理后的定性数据),经过有限次数学运算后得到的有实际意义的综合性数据。3、经验数据:是指在大量研究了地质系统的变化规律后,经过归纳或根据经验公式计算而得到的经验值。他们通常是大量地质信息的综合反映。数据的意义通常比较明确,但获取十分困难。3、地质数据的主要特点:(1)地质数据类型多,性质不一,反映地质内容丰富;量纲不统一,定量数据的数量级相差很大,各类数据的数量和精度相差悬殊。(2)地质数据往往是多种地质因素综合作用的结果,故具有混合分布特征。(3)地质数据以定量数据为主,而定性数据的定量化研究和应用目前尚不成熟。4、地质数据的预处理:指在定量研究地质问题时,预先对原始数据进行的各种处理。5、地质数据的预处理的主要内容为:定量数据的标准化、定性数据的定量化、原始数据的网格化、原始数据的简缩和增补、离群(异常)数据的识别与剔除等。6、定量数据的标准化(统一量纲的数据变换)的常用方法有:总和标准化、最大值标准化、模标准化、中心标准化、标准差标准化、极差标准化和极差正规化。7、原始数据的网格化:把平面上无规则分布的数据点Mi(xi,yi,zi)上的值分配到规则矩形网格交点上,产生规则分布的定量数据。8、离群数据:相对研究区的观测数据来说,称局部的异常高值和异常低值为离群数据(失真数据)。9、离群数据识别和处理主要步骤①判断数据体中是否存在失真数据(分布检验)②挑选出失真数据③处理失真数据离群数据的判定及处理:剔除异常值10、地质数据进行预处理的原因:由于观测书记的量纲不同及存在各种误差等原因,(压制干扰因素,突出地质作用),将原始地质观测数据直接用于计算机往往是不合适的。因此,在进行正式计算之前需要对观测数据进行预处理,形成供进一步计算使用的数据。11、地质数据进行标准化的原因:不同地质变量原始观测值的单位、量纲以及数值大小、变化范围是不同的,如果对原始数据直接使用,可能突出观测值较大地质变量的作用,降低观测值较小地质变量的作用,为克服数据中存在的这种不合理现象,在进行计算之前要将各地质变量的观测值变换到某种范围尺度之下,即定量数据的标准化。标准化的主要目的:消除量纲造成的数量级差异。12、地质变量:它是反映某地质现象在时间或空间上变化规律的量。13、地质变量的分类:由于地质现象的复杂性,导致了地质变量的多样性,一般根据地质变量所取数据的方法及性质,可将其分为观测变量(定性和定量变量)和综合变量。14、地质变量的特征:1.具有明确的地质意义:指地质变量所代表的具体地质含义或特征。2.具有明显的统计性质:多数地质变量可认为是随机变量。3.具有相关性:地质变量之间具有一定程度的相关性15、地质变量的选择目的:1)要获得一批地质意义明确、统计特征明显且与研究对象和目的有着密切关系的地质变量。(2)要达到变量结构的最优化,也就是要具有最优的变量组合。(3)使实际地质系统的有用信息损失达到最小。(4)有利于建立最优的地质概念模型和数学模型,从而获得最佳的地质效果。第三章回归分析1、回归分析:依据相关变量y、xi(i=1,2,…,m)的n组观测值(x1k,x2k,…,xmk,yk)(k=1,2,…,n),研究变量y、xi(i=1,2,…,m)间相关关系并确定近似定量关系的一种统计分析方法。2、回归分析解决的问题:①确定地质变量y与xi(i=1,2,…,m)之间是否存在相关关系,如果存在,找出表示它们之间相关关系的数学表达式。②根据xi(i=1,2,…,m)的观测值,利用确定出的数学表达式预测y的估计值,并给出预测结果的精确度。③通过回归分析确定哪些地质变量对y的作用大,哪些变量对y的影响是无足轻重的,进而化简地质研究。3、回归分析的研究对象:相关变量是存在着相互依赖性和制约性、但并没有严格数量关系的变量,它是回归分析的研究对象。4、一元回归分析:是研究两个变量(x与y)之间的相关关系,并确定其近似数学表达式的一种统计分析方法。5、最小二乘法:使偏差平方和最小确定待定系数的方法叫最小二乘法。6、总偏差平方和:,它是反映y观测值离散程度的一个指标;其中:7、偏差平方和:,它反映观测值与回归值的逼近程度;8、逐步回归分析:建立回归方程的过程中,逐步筛选变量的方法。9、方差贡献:回归方程中增加一个变量后,回归平方和的增加量等于偏差平方和的减少量,即:增加量ΔQ是变量H引入回归方程后,对t引起的波动,称为变量H对变量t的方差贡献。一般情况下,把变量xkα的方差贡献记为Vkα,它是衡量变量xkα对y作用大小的一个指标。10、逐步回归的基本思想:在回归过程中,按变量xi(i=1,2,…,m)对y作用的大小,把作用达到一定程度的变量xr(1≤r≤m)逐个“引入”回归方程,同时逐个检验已引入回归方程的变量对y的影响,若xa(xa∈xr)对y作用已不显著,就再从回归方程中“剔除”它,如此直到既没有对y作用显著的变量引入回归方程,又没有作用不显著的变量从回归方程中“剔除”。回归分析结束时,若共引入了l(l≤m)个作用大的变量,那么含有l个变量的回归方程即为:第四章趋势面分析1、趋势面分析:就是在空间中已知点Mi(xi,yi,zi)的控制下,拟合一个连续的数学曲面,并以此研究地质变量在区域上和局部范围内变化规律的一种统计方法。2、趋势面的拟合度:是指观测值与趋势值在总体上的逼近程度。3、拟合度的选择:(1)对于一组给定的数据,一般说采用趋势面的次数越高则其拟合度也越高。但并不是拟合度越高越好。(2)某地质参数的区域性变化规律表示出来后,同时还想得到在此区域背景下的局部异常,过高的拟合度会漏掉有价值的异常带。(3)拟合度很高时,所得的趋势面在观测点上吻合得较好,但在非观测点上可能产生很大的偏差。第五章聚类分析1、聚类分析:根据个体之间的亲疏程度,将它们进行逐级定量分类的一种多元统计分析方法。2、聚合法聚类分析:是按个体在性质或成因上的亲疏关系,把个体逐级聚集成类的一种多元统计分析方法。又称为点群分析。3、对样品进行分类—称Q型聚类分析;对变量进行分类—称R型聚类分析。4、聚类分析统计量:衡量个体间性质或成因亲疏(相似、相关)程度的统计指标。5、聚合分析类型:①按照客体是变量还是样品,聚类分析课分为R型和Q型。如果客体属于变量,称为R型聚类分析;如果客体属于样品,则称为Q型聚类分析。②按客体是有序客体还是无序客体,可分为有序客体聚类和无序客体聚类。③按按照聚类分析采用的方法原理不同,可分为聚合法和分解法聚类分析。6、最优k分割是指数据序列分为k段后,段内离差平方和达到最小。将记数据序列记为:nkkyyQ12)(nkkyny11nkkkyyQ121)ˆ()2(1)1(1)1(2)2(2QQQQQllkkkkkkxbxbxbby22110ˆnmnnmmmnxxxxxxxxxX2122221112117、最优k分割的基本思想:按照段内离差平方和最小的原则,依次找出数据序列X的k-1个分割点,把X分为k段。判别分析1、判别分析:根据已知的G个总体中取出的G组样品的观测值,建立总体与样品变量之间定量关系(判别函数),并据此判别未知类属样品类别的一种多元统计分析方法。2、设ag(g=1,2,…,G)表示G个总体,每个总体中分别有ng个样品,每个样品有m个变量。当G=2时,叫做两总体判别,又称为线性判别;当G2时,叫做多总体判别;筛选变量建立判别函数的方法叫做逐步判别分析。3、判别分析的基本步骤:(1)搜集来自G个总体的G组已知观测值(m个变量);(2)根据已知数据建立判别函数;(3)利用判别函数判别未知总体的样品类属。4、判别函数:一般,设样品有m个变量,那么判别函数的一般形式为:称上式为线性判别函数,它是空间中的平面。称c1,c2,…,cm为判别系数。5、费歇尔准则:使Q达到最大、H达到最小。它的含义是:Q达到最大,表明两组判别函数点的中心距最大;H达到最小,判别函数点的分布最集中。满足以上条件的判别函数可最大限度地把A和B区分开。费歇尔准则定义:要是y把总体A、B两总体有效的分开,即所求的y值在两总体之间的差异要尽可能的大,而在各总体内部的离散程度要尽可能的小,记:6、逐步判别的基本思想:逐个检验拟定变量的区分能力,把区分能力强的变量“引入”判别函数,在引入变量的过程中,随时“剔出”已引入判别函数中的区分能力变弱的变量,直到既没有区分能力强的变量引入,又没有区分能力变弱的变量剔除为止。7、判别分析的基本步骤:(1)搜集来自G个总体的G组已知观测值(m个变量);(2)根据已知数据建立判别函数;(3)利用判别函数判别未知总体的样品类属。第七章因子分析1、因子分析:是研究变量间相关关系、样品间相似关系、变量与样品间成因联系以及探索它们之间产生上述关系之内在原因的一些多元统计分析方法的总称。2、因子分析根据研究对象不同,将因子分析分为R型、Q型因子分析和对应分析三种方法。3、R型因子分析:是从研究变量的相关(相似)系数矩阵R的内部结构出发,找出m个控制变量相关性的主因子fi(i=1,2,…,m),由此把xi表示为fi的线性组合,即:其中称因子载荷矩阵。4、Q型因子分析:是从研究样品相似(相关)系数矩阵R的内部结构出发,找出n个控制样品相似性的主因子,若用前p(pn)个主因子化简样品研究系统,得到如下Q型因子分析模型:f1,f2,f3,…称为公因子,ei称为特殊因子。5、对应分析:是把上述两种因子分析方法结合起来,在同一个空间里研究样品和变量的分布规律,更有利于进行地质解释的一种多元统计分析方法。6、因子分析:是将变量(或样品)表示为公因子的线性组合。mmxcxcxcy22112)()(byayQbankkniibybyayayH1212)()()()(mimiiifafafax221
本文标题:数学地质201411
链接地址:https://www.777doc.com/doc-2331159 .html