您好,欢迎访问三七文档
名词解释数学地质:数学地质是地质学与数学和计算机科学相互渗透、紧密结合而逐步形成的一门地质学的边缘学科。它是以数学为方法、以计算机为主要研究手段,定量研究地质学基础理论和定量探矿法的一门方法性学科。地质概念模型:地质概念模型是指在对地质体系深刻理解和抽象思维的基础上,以定性方式表达地质体系发生和演化过程及其量间关系的模型。地质数学模型:地质数学模型是指用定量方法描述地质体系发生、演化过程及其量间关系的模型。地质数据:是表示地质信息的数、字母和符号的集合。离群数据:由于各种原因造成的观测数据局部异常高值和异常低值现象,这些数据称为离群数据。原始数据的均匀化:将地质数据分配到一些规则的矩形网格交点(网格点)上,就是对数据进行原始数据的均匀化(网格化)。地质变量:它是反映某地质现象在时间或空间上变化规律的量。回归分析:依据相关变量y、xi(i=1,2,…,m)的n组观测值(x1k,x2k,…,xmk,yk)(k=1,2,…,n),研究变量y、xi(i=1,2,…,m)间相关关系并确定近似定量关系的一种统计分析方法。趋势面分析:趋势面分析就是在空间中已知点Mi(xi,yi,zi)的控制下,拟合一个连续的数学曲面,并以此研究地质变量在区域上和局部范围内变化规律的一种统计方法。趋势面的拟合度:是指观测点上的趋势值与实测值在总体上的逼近程度。趋势面剩余值/偏差:观测值与趋势值之差,即iiizzzˆ聚类分析:根据个体之间的亲疏程度,将它们进行逐级定量分类的一种多元统计分析方法。判别分析:根据已知的G个总体中取出的G组样品的观测值,建立总体与样品变量之间定量关系(判别函数),并据此判别未知类属样品类别的一种多元统计分析方法。两总体判别分析:是根据总体A、B的两组样品观测值,建立用于判定样品x(x属于A或者B)所属总体的线性判别函数的多元统计分析方法。又称为线性判别。多总体判别分析:设ag(g=1,2,…,G)表示G个总体,每个总体中分别有ng个样品,每个样品有m个变量。当G2时,叫做多总体判别。逐步判别分析:筛选变量建立判别函数的方法叫做逐步判别分析。因子分析是研究变量间相关关系、样品间相似关系、变量与样品间成因联系以及探索它们之间产生上述关系之内在原因的一些多元统计分析方法的总称。变量共同和:各个变量在主公因子上的平方和叫做变量共同和。公因子方差:各个公因子在变量上的平方和叫做公因子方差。R型因子分析:它是研究变量之间的相关关系的方法,它是通过对变量的相关系数矩阵内部结构的研究,找出控制所有变量的几个主要成分,所以R型因子分析又称主成分分析。Q型因子分析:它是研究样品之间的相关关系的方法,它是通过对样品的相似系数矩阵内部结构的研究,找出控制所有样品的几个主因素,所以Q型因子分析又称主因素分析。对应分析:它是把R、Q型两种因子分析方法结合起来,在同一个空间里研究样品和变量的分布规律,更有利于进行地质解释的一种多元统计分析方法。简答数学地质主要研究内容:①地质多元统计分析②矿产资源预测③地质数据库④地质过程的数学模拟⑤地质绘图自动化⑥人工智能和地质专家系统数学地质的研究步骤:①定义地质系统②建立地质概念模型③设计数学模型④模型的程序化⑤设计模拟实验⑥模型装载⑦模型运行⑧对结果作出地质解释并提交报告地质数据的分类:据地质数据的来源,把地质数据分为观测、综合、经验数据三类。其中观测数据可分为定性、定量数据两类。定性数据又分为名义型和有序型两类。定量数据包括间隔型数据和比例型数据。地质数据的主要特点:①地质数据类型多,性质不一,反映地质内容丰富;量纲不统一,定量数据的数量级相差很大,各类数据的数量和精度相差悬殊。②地质数据往往是多种地质因素综合作用的结果,故具有混合分布特征。③地质数据以定量数据为主,而定性数据的定量化研究和应用目前尚不成熟。预处理目的:由于观测数据的量纲不同及存在各种误差等原因,将原始地质观测数据直接用于计算往往是不合适的。因此在进行计算之前需要对观测数据进行预处理,形成供进一步计算使用的数据。定量数据的标准化目的:消除量纲造成的数量级差异。原因:不同地质变量原始观测值的单位、量纲以及数值大小、变化范围是不相同的,如果对原始数据直接使用,可能突出观测值较大地质变量的作用,降低观测值较小地质变量的作用。为克服数据中存在的这种不合理现象,在进行计算之前要将各地质变量的观测值变换到某种规范尺度之下,即定量数据的标准化。地质变量类型:地质变量可分为观测变量(定性和定量变量)和综合变量。观测变量是可以直接进行观测、分析或度量的地质变量。综合变量是把二个或二个以上的观测变量按一定的方式进行组合而得到的具有综合意义的地质变量。地质变量的特征:①具有明确的地质意义:指地质变量所代表的具体地质含义或特征。②具有明显的统计性质:多数地质变量可认为是随机变量。因此,它们的观测值具有明显的统计意义。研究随机的统计分布可以从某个变量的角度去预测油气分布的规律性。地质变量的统计特征越明显,它所反映的规律性就越强。③具有相关性:地质变量之间具有一定程度的相关性。回归分析解决的问题:①确定地质变量y与xi(i=1,2,…,m)之间是否存在相关关系,如果存在,找出表示它们之间相关关系的数学表达式。②根据xi(i=1,2,…,m)的观测值,利用确定出的数学表达式预测y的估计值,并给出预测结果的精确度。③通过回归分析确定哪些地质变量对y的作用大,哪些变量对y的影响是无足轻重的,进而化简地质研究。逐步回归的基本思想:在回归过程中,按变量xi(i=1,2,…,m)对y作用的大小,把作用达到一定程度的变量xr(1≤r≤m)逐个“引入”回归方程,同时逐个检验已引入回归方程的变量对y的影响,若xα(xα∈xr)对y作用已不显著,就再从回归方程中“剔除”它,如此直到既没有对y作用显著的变量引入回归方程,又没有作用不显著的变量从回归方程中“剔除”。多项式趋势面一般形式:式中z—地质变量;x,y—观测点的地理坐标。二维1次趋势面方程:二维2次趋势面方程:二维3次趋势面方程:拟合度:记26524321yxyxyxzybxbbz321ˆ26524321ˆybxybxbybxbbz31029283726524321ˆybxybyxbxbybxybxbybxbbz;)(12niizzQ;)ˆ(121niiizzQ为趋势面的拟合度。拟合度越高,说明趋势面拟合程度越好。拟合度的选择:①对于一组给定的数据,一般说采用趋势面的次数越高则其拟合度也越高。但并不是拟合度越高越好。②某地质参数的区域性变化规律表示出来后,同时还想得到在此区域背景下的局部异常,过高的拟合度会漏掉有价值的异常带。③拟合度很高时,所得的趋势面在观测点上吻合得较好,但在非观测点上可能产生很大的偏差。因此,应根据具体情况来适当地选择拟合度。趋势面剩余值的作用:利用剩余值数据做等值线可绘制出剩余图。图中,剩余值大于0的区域叫正剩余(或正异常、正偏差)区,而剩余值小于0的区域称为负剩余(负异常、负偏差)区。引入剩余值后,原始数据被分解成为趋势值与剩余值两部分,剩余值反映局部变化特征。剩余图可反映局部异常,从它可发现低缓异常带,这对研究区域油气分布和查找实测构造图可能漏掉的构造圈闭是十分有用的。此外,剩余图零值线的区域走向往往反映了区域断裂的分布,这对研究油藏的形成条件也是十分重要的。利用剩余图可找出异常带,是找矿的重要手段。在石油天然地质中,正剩余具有重要的意义。为什么要进行趋势面拟合?实际的工作中无法得到准确的G,但却可以根据已知的观测数据:Mi(xi,yi,zi)(i=1,2,…,n),拟合一个近似于G的趋势面L。这样可从地质变量的观测值中分离出它的趋势部分和局部异常,为找矿提供信息。聚类分析类型:按照客体是变量还是样品聚类分析可分为R、Q型。如果客体属于变量称为R型聚类分析;如果客体属于样品,则称为Q型聚类分析。按照客体是有序客体还是无序客体,可分为有序客体聚类和无序客体聚类。按照聚类分析采用的方法原理不同,可分为聚合法和分解法聚类分析。聚类分析统计量:聚合法:聚合法聚类分析统计量有相似系数、相关系数和距离系数。相似系数rij越接近1,Xi与Xj的性质越相近。相关系数rij越接近1,Xi与Xj的相关程度越大。距离系数dij越接近0,Xi与Xj的性质越相近。分解法:聚合法聚类分析统计量有段内离差平方和、段间离差平方和、总离差平方和。对Xn×m的最优分割是指把Xn×m分段后,各段内数据的离差平方和最小(各段内样品的差异最小),而各段间数据的离差平方和最大(各段之间样品的差异最大)。逐步判别分析的基本思想:逐个检验拟定变量的区分能力,把区分能力强的变量“引入”判别函数,在引入变量的过程中,随时“剔出”已引入判别函数中的区分能力变弱的变量,直到既没有区分能力强的变量引入,又没有区分能力变弱的变量剔除为止。因子分析作用:(在地质研究中的作用)①压缩原始数据:因子分析使原始数据在数量上极大的精简,但并不影响研究结论的可靠性。②指示地质成因的推理方向:因子分析方法能够把庞杂的原始地质数据按照他们在地质成因上的联系进行归纳、整理、精炼乃至分类,从而可以理出几条比较客观的成因线索,为人们指出了逻辑推理方向。③分解叠加的地质过程:因子分析给出每个综合变量代表了一组在成因上密切相关的地质特征,因此可根据地质特征分解叠加的地质过程。对应分析的优点:可由R型因子分析的结果,很容易导出Q型因子分析结果,从而克服了Q型因子分析受计算机内存容量的限制并提高了计算速度,更重要的是把变量和样品反映在同一个因子空间中,便于对变量与样品统一进行地质解释和推断。;)ˆ(122niizzQ21QQQ%1002QQC因子分析类型:根据研究对象不同,将因子分析分为R型、Q型因子分析和对应分析三种方法。回归分析步骤:①根据给定数据(xk,yk;k=1,2,…,n),计算x,y,Sxx,Sxy,Syy②求出回归方程待定系数③计算检验回归方程显著性的参数R和F并检验方程的显著性④根据显著性回归方程,给定x0值,预测y值:给定y的范围21yyy调整x,实现对y的控制。最优分割步骤:①数据正规化②计算段内变差矩阵③最优二分割③最优三分割⑤最优k分割判别分析步骤:①搜集来自G个总体的G组已知观测值(m个变量)②根据已知数据建立判别函数③利用判别函数判别未知总体的样品类属。两总体判别分析步骤:①计算各组指标的平均值和均值差②计算两组的综合协方差矩阵并形成方程组③建立判别函数④计算各组判别函数的平均值和判别指标⑤显著性检验⑥回判多总体判别分析步骤:①计算各总体样本的变量平均值②计算协方差矩阵的逆矩阵③建立判别函数④对未知样品进行判断⑤判别函数的检验逐步判别分析步骤:①计算各总体样本的变量均值和总均值②计算总体内离差矩阵W、总体间离差矩阵B和总离差矩阵T③逐步筛选变量⑴已选入变量是否剔除⑵待选样品是否选入④计算判别函数⑤待判样品的总体判别⑥判别函数的检验⑴多总体判别效果检验⑵回判率检验⑶总体间显著性检验因子分析计算步骤:①收集整理好原始数据矩阵②对原始数据作数据标准化变换③计算m个变量间的相关系数,建相关系数矩阵R④求出R的特征值(0...21m并按大小排列)及相应于单位特征向量uj(j=1,2,…,m)⑤确定公因子个数p(按前p个特征值之和占特征值总和的百分数大于80%来确定个数p)⑥求出主因子载荷矩阵A=[aij],aij=uiji⑦计算共同和2ih,2ih是否接近于1,说明公因子是否已提取了变量xi的大部分变化信息。⑧将因子载荷矩阵A作方差最大正交旋转,求出旋转后的因子载荷矩阵,仍记为A。⑨计算因子得分。R、Q型因子分析步骤:①确定主因子个数②求出特征值和对应的特征向量③求出因子载荷矩阵。主成分分析步骤:①数据标准化②计算变量间的相关系数矩阵用Jacobi法③计算相关系数矩阵R的特征值及对应的特征向量,得主成分Fj④计算前p个特征值所占的累计百分比⑤计
本文标题:数学地质2
链接地址:https://www.777doc.com/doc-2331154 .html