您好,欢迎访问三七文档
当前位置:首页 > 财经/贸易 > 资产评估/会计 > 多元统计分析实验报告
应用多元统计分析实验报告学校:曲阜师范大学___学院:统计学院_______专业:统计学_________姓名:李江豪2014411750_2016年12月8日一、实验目的及要求:(1)了解判别分析的目的和意义(2)熟悉R语言中有关判别分析的算法和基础二、实验环境:R软件并且带有MASS包。三、实验内容:R语言Fisher判别分析实验四、实验步骤:(1)收集2015年广州天气数据(2)然后提取其中部分天气数据作为样本,假设总体服从多元正态分布,进行Fisher判别。当不同类样本的协方差矩阵相同时,我们可以在R中使用MASS包的lda函数实现线性判别。当不同类样本的协方差矩阵不同时,我们在R中使用MASS包的qda函数实现二次判别。样本数据如下图所示:其中x1是湿度差,x2是气压与温度之差。五、实验结果:Call:lda(G~x1+x2,data=rt)Priorprobabilitiesofgroups:120.50.5Groupmeans:x1x212.776.9520.2511.30Coefficientsoflineardiscriminants:LD1x1-0.1392383x20.3919022(tab1=table(G,newG))newGG1211732317sum(diag(prop.table(tab1)))[1]0.85Call:qda(G~x1+x2,data=rt)Priorprobabilitiesofgroups:120.50.5Groupmeans:x1x212.776.9520.2511.30(tab2=table(G,newZ))newZG1211822218sum(diag(prop.table(tab2)))[1]0.9根据运行结果,得到线性判别lda效果和线性判别qda效果如下表所示。表1线性判别lda效果判别分类原始判别合计12117320231720合计202040合计:(17+17)/40=0.85表1线性判别qda效果判别分类原始判别合计12118220221820合计202040合计:(18+18)/40=0.9六、实验分析:通过提取广州2015年部分天气预报数据,建立Fisher线性函数进行判别,判断天气预报的准确率。在R软件中,调用lda()函数,根据运行结果,可见两类错判的各有3例,判对的共有34例,故判别符合例为(17+17)/40=0.85,判别函数为y=-0.1392383x1+0.3919022x2;调用qda()函数,根据运行结果,可见两类错判的各有2例,判对的共有36例,故判别符合例为(18+18)/40=0.9。由表可知,qda(二次判别)的效果比lda(一次判别)的效果好七、实验小结:通过本次实验我不仅了解了判别分析的目的和意义,并且熟悉了R语言中有关判别分析的基础。还加深了应用多元统计分析理论的理解,将统计学知识运用到现实生活中,真正做到了学以致用,能恰当的将应用多元统计分析课程的相关知识结合运用,以达到解决实际问题应用于实践的目的。附录:R程序代码:read.table(广州2016年天气预报.txt,header=TRUE)-rt;rtpdf('天气预测.PDF')plot(rt);attach(rt)plot(x1,x2,pch=21,col=black,cex.lab=1.2,cex.main=1.5,bg=green,axes=FALSE);text(x1,x2,G,adj=-0.8,cex=0.75)library(MASS)(ld=lda(G~x1+x2,rt))callZ1=predict(ld)newG=Z1$classcbind(G,Z1$x,newG)(tab1=table(G,newG))sum(diag(prop.table(tab1)))(qd=qda(G~x1+x2,rt))callZ2=predict(qd)newZ=Z2$classcbind(G,Z2$x,newZ)(tab2=table(G,newZ))sum(diag(prop.table(tab2)))dev.off()
本文标题:多元统计分析实验报告
链接地址:https://www.777doc.com/doc-7413549 .html