您好,欢迎访问三七文档
盐城师范学院《多元统计学》课程论文2015-2016学年度关于自然盐泉是否含钾盐判别及分析学生姓名崔亚楠学院数学与统计学院专业统计学班级13(1)班学号132132052015年12月24日《多元统计学》课程论文摘要由于沉积盖层厚、基底研究程度低,在找钾历来是一个难题。早在1938年И·С·沙拉波夫就掌握了第聂泊河一下通古斯河流域、勒拿河流域西部地区的地质填图资料。他说:“这些地区的几乎所有的背斜轴部都出露有盐泉。”盐泉的卤水含钾0.069—0.486克/升,钾含量随卤水中的镁、溴含量的增高而增高。他设想在地台区的寒武纪沉降盆地中,有可能找到钾盐工业矿床。根据距离判别法判别八种天然盐泉是否含钾盐。关键词:天然盐泉,钾,判别分析,距离判别法《多元统计学》课程论文目录引言……………………………………………………………………11、距离判别法…………………………………………………………11.1马氏距离的概念………………………………………………12、距离判别法的思想及方法…………………………………………32.1两个总体的距离判别问题……………………………………33、距离判别发法在R软件中的操作…………………………………53.1结果显示………………………………………………………74、总结…………………………………………………………………85、参考文献……………………………………………………………8《多元统计学》课程论文引言钾盐广泛应用于农肥、化工、医药、纺织、印染、制革、玻璃、陶瓷、炸药等领域,耗量巨大,对国家经济建设和资源安全具有非常重要的意义,同时又是我国重要的紧缺矿物资源。目前,我国的肥料施用量已居世界第一,钾肥进口量居世界第二,近年氯化钾产量已达130多万吨,但也只能满足15%的消费量。可见,我国钾盐的紧缺态势仍很严峻,如果钾盐找矿无重大突破,长期进口钾盐局面将难以扭转,这对我国资源安全、农业发展无疑会构成较大隐患。实践表明天然盐泉中含有丰富的钾盐,根据盐泉中其他微量元素及几种不同的指标,来判别天然盐泉中是否含有钾盐。即根据历史上划分类别的有关资料和某种最有准则,确定一种判别方法,判定一个新的盐泉是否是含有钾盐的一类盐泉。1.距离判别法1.1马氏距离的概念设p维欧几里得空间中的两点(,,,)和(,,),通常我们所说的两点之间的距离,是指欧几里得距离,即《多元统计学》课程论文()()()第一,设有两个正态总体,(,)和(,),现有一个样品位于如图4.1所示的A点,距总体X的中心2远,距总体Y的中心3远,那么,A点处的样品到底离哪一个总体近呢?若按欧几里得距离来度量,A点离总体X要比离总体Y“近一些”。但是,从概率的角度看,A点位于右侧的处,而位于左侧处,应该认为A点离总体Y“近一些”。显然,后一种量度更合理些。第二,设有量度重量和长度的两个变量X与Y,以单位分别为kg和cm得到样本A(0,5),B(10,0),C(1,0),D(0,10)。今按照欧几里得距离计算,有√√,√√如果我们将长度单位变成为mm,那么,有√√,√√量纲的变化,将影响欧几里得距离计算的结果。《多元统计学》课程论文为此,我们引入一种由印度著名统计学家马哈拉诺比斯(Mahalanobis1936)提出的“马氏距离”的概念。设X和Y是来自均值向量为,协方差为∑()的总体G中的p维样本,则总体G内两点X与Y之间的马氏距离定义为()()∑()定义点X到总体G的马氏距离为()()∑()这里应该注意到,当∑(单位矩阵)时,即为欧几里得距离的情形。2、距离判别的思想及想法2.1、两个总体的距离判别问题设有协方差矩阵∑相等的两个总体和,其均值分别是和,对于一个新的样品X,要判断他来自哪个总体。一般的想法是计算新样品X到两个总体的马氏距离(,)和(,),并按照如下的判别规则进行判断{,如果(,)(,),如果(,)(,)《多元统计学》课程论文这个判别规则的等价描述为:求新样品X到的距离与到的距离之差,如果其值为正,X属于;否则X属于。我们考虑(,)(,)()∑()()∑()∑∑∑(∑∑∑)∑()∑()∑∑()()∑()()’∑()(̅)αα(̅)其中,μ̅̅̅(μμ)是两个总体均值的平均值,α∑(),记W()α(̅)则判别规则(4,4)式可表示为{,如果W()≥,如果W()(4,6)这里称W()为两总体距离判别的判别函数,由于它是X的线性函数,故又称为线性判别函数,α称为判别系数。《多元统计学》课程论文在实际应用中,总体的均值和协方差矩阵一般是未知的,可有样本均值和样本协方差矩阵分别进行估计。设()n1(n)来自总体的样本()n2(n)是来自总体的样本,和的一个无偏估计分别为̅()n1∑i()n1i=和̅()n2∑i()i=∑的一个联合无偏估计为∑̂nn(SS)其中Sα∑(i(α)̅(α))(i(α)̅(α))nαi=α此时,两总体距离判别的判别函数为Ŵ()α̂(̅)其中,̅(̅()̅());α̂∑̂(̅()̅())。这样,判别规则为{,如果Ŵ()≥,如果Ŵ()(4,7)《多元统计学》课程论文3实例例10.2.2盐泉含钾盐判别某地区经勘探证明A盆地是一个钾盐矿区,B盆地是一个钠盐矿区,其他盐盆地是否含钾盐有待作出判断今从A,B两盆地各抽取5个盐泉样品;从其他盆地抽得8个盐泉样品,18个盐泉的四个指标数值见下表.试对后8个待判盐泉进行含钾盐判别.表盐泉含钾数据《多元统计学》课程论文R程序如下w-read.table(D:/Rdata/disc.txt)names(w)=c(group,x1,x2,x3,x4)library(MASS)z-lda(group~x1+x2+x3+x4,data=w,prior=c(1,1)/2)newdata-rbind(c(8.85,3.38,5.17,26.10),c(28.60,2.40,1.20,127.0),c(20.70,6.70,7.60,30.20),c(7.90,2.40,4.30,33.20),c(3.19,3.20,1.43,9.90),c(12.40,5.10,4.43,24.60),c(16.80,3.40,2.31,31.30),c(15.00,2.70,5.02,64.00))dimnames(newdata)-list(NULL,c(x1,x2,x3,x4))newdata-data.frame(newdata)《多元统计学》课程论文predict(z,newdata=newdata)R程序结果:$class[1]BAABBAAALevels:AB$posteriorAB11.639701e-039.983603e-0121.000000e+001.932625e-8331.000000e+001.269619e-2048.302424e-029.169758e-0151.190922e-069.999988e-0161.000000e+001.129611e-1071.000000e+001.161894e-2681.000000e+007.135903e-22$xLD111.05365122-31.29855933-7.528682940.394724552.24165966-3.76392827-9.81362738-8.0017623结果说明:1)由$class可以看出8个待判样品,待判样品1,4,5属于含钾盐泉(A盆地),其余属于不含钾盐泉(B盆地);2)$x给出了线性判别函数的数值.《多元统计学》课程论文4总结判别分析就是希望利用已经测得变量数据,找出一种判别函数,使得这一函数具有某种最优性质,能把属于不同类别的样本点尽可能的区别开来。距离判别法简单便于使用可有效结决两个总体的判别问题。5参考文献:《在钾盐普查工作中应用卫星照片的成功实例》---张名堂《钾盐资源全球分布和我国找钾盐实践及方法探究》-----中国科学院青海盐湖研究所,青海西宁。王春宁,余俊清,陈良,张丽莎。《R语言统计与分析》----汤银才《应用多元统计学》-----朱建平
本文标题:多元统计学期末论文
链接地址:https://www.777doc.com/doc-2503230 .html