您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > 常用地质数理统计方法说明书2007-01-13
1RGMAPGIS-常用地质数理统计方法等说明书1地球化学图1.1启动功能打开某个图幅PRB库,点击菜单“常用方法”,选择“地球化学图”。弹出“地球化学图(网格化数据)”处理对话框:21.2地球化学数字特征(1)选择地球化学图层(网格化的点图层),选择需要进行数字特征统计和绘制等值线的元素:(2)计算数字特征分为三种方式:计算数值特征、计算log10对数数字特征、计算自然对数ln数字特征。计算时需要用户填写“小于此值剔除”和“高值替代值”,默认分别为-98和9999。点击按钮“计算数值特征”,或“计算log10对数数字特征”,或计算自然对数数字特征,得到这三种方式下的数字特征:最大值、最小值、标准方差等。下图是“计算log10对数数字特征”的情况:3(3)数字特征图的表示在进行数字特征计算时,将通过数字特征图把数据划分成不同的级别,体现数据自身的特征,形成专题图,包括饼图和直方图。注:若需要定制详细的专题图,可使用“图幅PRB工程”下的“数字特征统计”功能(包括数字特征统计、用户指定子区进行统计、按子区划分进行统计)。以下是饼图的绘制情况:(4)数字特征图件的配置在图框内的数字特征图是矢量格式的图件,支持图形的放大、缩小、移动等功能(同时4支持快捷键操作:F5-放大,F6-移动,F7-缩小)。右击图件,弹出快捷菜单,即可进行操作:选择快捷菜单的“图件设置”,弹出图件设置属性框,可以进行各个图形参数的设置。详细的设置请参考“数字特征图件编辑”部分。(5)数字特征图件的配置可以将图件保存为MPJ工程文件和gif格式的图片,用户可以根据需要对工程文件进行再编辑。选择图件快捷菜单的“保存图件”:5弹出“另存为”对话框,选择需要保存的文件格式,输入文件名,点击保存即可。1.3数字特征图件编辑(1)图件标题修改:包括图件的标题、字体、颜色的设置。6(2)图件坐标轴修改:包括X、Y轴的数量单位、刻度、间距、是否显示等参数。(3)图件基本参数设置:设置图形的范围、线型、图形字体、背景颜色等。7(4)针对当前统计图的特殊参数设置:例如,当前生成的是直方图,可设置直方图的方块的颜色、大小;直方图的方块属性:通过设置宽度来调整直方图的块大小,以达到实际工作的需要。如果是曲线图,可设置曲线的颜色、线宽等。(5)标记与图例设置:设置图件的标注位置、是否显示、在图上是否显示数据表这些参数。81.4等值线极值点参数设置(1)子图号设置:点击“子图号”按钮,弹出“选择子图”对话框。(2)标注字体:点击“标注字体参数”按钮,弹出“标注字体选择对话框”。可以选择字体和颜色,可以设置字体大小。9(3)标注格式:点击“标注格式参数”,弹出“标注格式”对话框。可以选择输出标注:使用“固定小数位数”还是“科学计数法”;小数部分是几位;需要注意的是:若计算数字特征时选择了对数计算方式(数据已对数),则需要进行还原显示,如:若在计算数字特征时选择了“计算log10对数数字特征”,则此处须选择“10为底”。101.5等值线追踪输入需要生成的等值线文件名,点击“OK”按钮。若有重名文件,则提示是否翻盖旧文件。弹出“设置等值线参数”对话框,11注意:选中“等值线套区”、“绘制色阶”、“保留边界线”;选中“等值线光滑处理”;制图幅面选择“原始数据范围”;选中“示坡线”。以下是“等值线定层”各参数的设置过程:(1)等值层值点击“等值层值”,弹出对话框:可以通过以下值及起始色、终止色的设置,将这些值进行分段处理(添加、更新、删除)。也可以通过以下方法删除、添加某段:12(2)线参数配置每一等值层的线参数:(3)区参数双击该颜色,进行修改。13(4)注记参数点击“注记参数”,弹出等值线注记参数设定对话框:14选择频度为1,表示每个等值层均进行标注,注记的最大倾角表示注记与等值层线的夹角。选择“注记格式”和“注记字体”,操作方法同等值线极值点“标注字体和标注格式”。需要注意的是:若计算数字特征时选择了对数计算方式(数据已对数),则需要进行还原显示,如:若在计算数字特征时选择了“计算log10对数数字特征”,则此处须选择“10为底”。也可以直接修改是否进行注记的显示状态:双击“No”-“Yes”:15点击“确定”,进行“规则网数据等值线追踪处理”,生成的地球化学图(等值线图)如下,其中空白区表示该区的值无效。161.6地球化学图通过以上过程,可对Ag、Au等各元素进行分析,生成各种单元素异常图(点、线、区),这些图层文件存放在该图幅的“图幅PRB”目录下。根据这些单元素的等值线线图层,可以制作综合异常图。2等值线图本系统提供通用的等值线计算与绘制功能。2.1启动功能打开某个图幅PRB库,点击菜单“常用方法”,选择“等值线图”:选择用于追踪等值线的点图层:17接下来的操作除了“等值线方法选择”上与地球化学图操作有所区别外,其他的操作(包括:数字特征的计算、数字特征图、极值点参数设置等)均一样。可以参见“地球化学图”部分。2.2等值线方法选择注意:本操作必须在点击“OK”进行等值线参数设置之前进行。(1)TIN方法该方法提供无效区的剔除功能,若需要无效区剔除,选择无效区的区文件,并输入横向网格数和纵向网格数:18(2)GRID方法在方法参数栏中,用户可以选择搜索网格点的方法,包括:所有点、K-临近、四方向、八方向,用户需要输入横向网格数和纵向网格数。(3)KRG方法用户输入横向网格数和纵向网格数即可。192.3等值线生成通过等值线方法选择、等值线极值点参数设置及等值线的追踪过程,生成等值线图层,并将相关图层加入PRB库中,用户可以根据这些等值线图层进行其他工作。下图是GRID方法绘制的等值线图:203数字特征统计3.1统计的目的通过最大值、最小值、方差等基本统计量以及分级统计,以反映数据的空间分布规律。进入RGMAPGIS系统,选择某个工作图幅进入PRB库中。将目标图层数据(点)加入工程后即可通过常用方法菜单对这些数据进行操作。3.2基本数字特征统计选择需要统计的目标点图层:21在元素选择中列出了该地球化学数据具有的元素属性,如Ag、As等,选择某个元素后即可获得具有有效元素值的所有点的基本统计量,包括对数据集中趋势、数据离散程度和数据分布形态等的统计。在此基础上可以通过分级把数据划分成不同的级别,体现数据自身的特征,为应用研究及专题制图提供基础。22分级方法有:(1)自定义分级:根据应用目的设定各个级别的数值范围来实现分级。(2)模式分级:按照固定模式进行分级,级差由特定的算法自动设定。模式分级分为:等间距分级、分位数分级、等面积分级、标准差分级、自然裂变点法分级、其他分级方法(有规律的不等间距分级、按嵌套平均值分级、按面积正态分布分级)。专题图类型有:直方图、饼图、折线图。用户选择等间距分级并输入级数、选择专题图类型、选择统计方式后,生成专题图件如下:图件的设置:参考“地球化学图”的“数字特征图件编辑”部分内容。图件的保存:右击图形窗口,选择图件保存,保存为MAPGIS工程文件:233.3用户制定子区进行统计根据用户自定义的区文件,在某个划分的区域内对数据进行统计:24选择某个区文件,确定。点击图层,选择某个区图元:选择是,则统计该区范围内的地球化学数据的情况,弹出的对话框如下:25内圈,子区内的空洞的处理:如打勾选择,则考虑子区内的空洞情况,统计地球化学点时,严格判断点是否落在区域内,若落在区域的空洞内,也认为是落在区域外边。其他操作如第一部分,区别就是统计的是某个区内的信息,而不是所有点的信息。3.4按子区划分进行统计对第2部分进行扩展,用户根据需要划分的不同子区,全局浏览这些子区内的相关数据统计信息,用户也可以动态选择某个区浏览统计信息。26选择某个区文件,确定,弹出对话框:子区号:全部子区和各个子区情况浏览:274多元统计分析4.1因子分析在地质学中,由于地质对象的复杂性,往往需要较多的变量来刻划,但由于变量较多,很难看清它们之间的相互关系,不易找出起主导作用的变量。因子分析方法通过研究变量之间的协方差阵的内部结构,将原来较多的变量组合成少数的“因子”。这些因子是原始变量的线性组合。它们保留了原始变量的大部分相关信息和变异性。各因子给出了地质变量的几种基本的结合关系,往往表示对地质问题起决定作用的几个基本的地质因素。通过因子可以再现原始变量之间的相关关系。提示产生这些关系的内在原因,从而有助于探索事物的因果关系。因子分析方法在压缩地质中的原始数据,指示成因推理方向,分解叠加的地质过程方面都有许多成功的例子。(1)选择菜单“常用方法-多元统计-因子分析”:28(2)选择点图层数据:(3)因子分析参数设置对话框:该对话框的主要操作包括:因子数的设置判断是否需要正交四次幂的解判断是否需要斜交因子解判断是需要正规化解还是标准化的解变量的选择,选择几个变量进行计算因子得分数据计算结果文件的名称设定。点击“确认”按钮进行计算(4)浏览分析结果:294.2聚类分析聚类分析就是根据多个指标进行数字分类的一种多元统计分析方法。近年来,在地质上已有许多成功的应用。根据分类对象的不同,聚类分析可分为两类:一类是根据变量(指标或地质特征)对标本或样品进行分类,叫做Q型聚类分析;一类是根据变量在各标本上的观测值对变量进行分类,叫做R型聚类分析。两类分析的具体作法基本一致:首先选择一个适当的统计量,用以度量分类对象的相似性程度或非相似性程度,然后用适当方法进行聚类,建立分类谱系图。方法1通过计算计算相关系数或者相似性系数来获得R型聚类分析谱系图方法2通过选择计算距离系数的方法和聚类方案的选择进行大样本Q型系统聚类分析,内容包括数据的处理方式(数据标准化、数据规格化、不作变换),计算距离的方式(欧式距离、平方欧式距离、角距离、Bray-Curtis距离、Canberra距离),聚类的方案选择(最短距离法、最长距离法、松弛法(1)、松弛法(2)、非加权类平均法、加权类平均法、非加权类重心法、加权类重心法、平方和增量法)。结果的表达是通过选择聚类系数或者选择种子样本的方式,进行分类。以下时R型聚类分析操作。(1)选择菜单“常用方法-多元统计-聚类分析”:30(2)选择点图层数据:(3)聚类分析参数设置:针对这个对话框的操作是:数据预处理的方法选择:数据作标准化还是数据作规格化。选择相似程度的度量方式:相关系数、相似系数,还是选择距离系数(多种系数的选择)变量的选择,选取进行计算和研究的变量31计算结果的保存文件名称的设置。点击“确认”按钮,那么会弹出绘图窗口,显示绘制的聚类分析谱系图。(4)聚类分析谱系图:可以将图像结果另存到其他目录,图像为bmp格式。(5)相关结果浏览:324.3多元判别分析在判别分析中,人们希望用尽可能多的变量构造判别函数,因为它能包含较全面与判别有关的信息。但和逐步回归一样,如果包含变量过多,反而会使判别效果降低。原因是在求判别函数时,需要对协方差矩阵S求逆,S的阶数等于所含变量的个数,若包含的变量较多,阶数较高,那么计算的精度较差;特别地,当所含主量线性相关时,S接近于降秩矩阵,求逆计算的结果很不稳定,判别效果就会很差。(1)选择菜单“常用方法-多元统计-多元判别分析”:(2)选择点图层数据:33(3)模型样本的选择:针对这个对话框的操作有以下几个方面:变量水平的设置模型样本数的设置(不宜过多,程序中控制在20组以内)根据模型样本数在左边的窗口中选择变量;操作是鼠标双击认为是模型的样本号,将把这个样本选中,并且将该样本号添加到模型样本列表中参与计算的变量的选择,在变量列表中选择(多选)设置预测结果的文件名称(4)结果浏览:34(5)保存的计算结果文件内容:355人工神经网络分析5.1BP模型进行分类多阶层神经网络及误差逆传播学习算法(ErrorBack-propagation—EBP,或直接称之为前反馈神经网络—BP学习算法)是目前应用最广、实现途径最直观、运算机制最易理解、研究深入的一种人工神经网络。误差逆传播学习算法是Pal
本文标题:常用地质数理统计方法说明书2007-01-13
链接地址:https://www.777doc.com/doc-2451518 .html