您好,欢迎访问三七文档
1判别分析法Contents12案例分析判别分析法的简介21.2判别分析法的概念1.3判别分析法的分类及概要1.4判别分析法的SPSS实现1.1引言---与聚类法的异同1判别分析法的简介31.5准确度效果评价41.1引言---与聚类法的异同相同点》分类学是人类认识世界的基础科学。聚类分析是根据事物本身的特性研究个体分类的方法。判别分析是根据表明事物特点的变量值和它们所属的类,求出判别函数。根据判别函数对未知所属类别的事物进行分类的一种分析方法。51.1引言---与聚类法的异同不同点》判别分析和聚类分析主要不同点就是:在聚类分析中一般人们事先并不知道或一定要明确应该分成几类,完全根据数据来确定。而在判别分析中,至少有一个已经明确知道类别的“训练样本”,利用这个数据,就可以建立判别准则,并通过预测变量来为未知类别的观测值进行判别了。61.1引言---与聚类法的异同比如说有两群人,一群是韩国人,另一群是日本人。现在新来了以为某甲,我们想问:某甲是韩国人,还是日本人?回答这样的问题,算是判别分析。如果我们有一大群人混在一起,这里面包括了日本、韩国、泰国,马来西亚、……,如果我们想将他们一一分辨出来,这就是集群分析法。在比如说,有一些昆虫的性别很难看出,只有通过解剖才能够判别;但是雄性和雌性昆虫在若干体表度量上有些综合的差异。于是统计学家就根据已知雌雄的昆虫体表度量(这些用作度量的变量亦称为预测变量)得到一个标准,并且利用这个标准来判别其他未知性别的昆虫。这样的判别虽然不能保证百分之百准确,但至少大部分判别都是对的,而且用不着杀死昆虫来进行判别了。71.2判别分析法的概念判别分析(DiscriminatoryAnalysis)产生于20世纪30年代,是一种统计方法,其是利用已知类别的样本建立判别模型,以判别未知类别的样本。在自然科学和社会科学的各个领域经常遇到需要对某个个体属于哪一类进行判断。如动物学家对动物如何分类的研究和某个动物属于哪一类、目、纲的判断。近年来,判别分析在自然科学、社会学及经济管理学科中都有广泛的应用。81.2判别分析法的概念判别分析的特点是根据已掌握的、历史上每个类别的若干样本的数据信息,总结出客观事物分类的规律性,建立判别公式和判别准则。当遇到新的样本点时,只要根据总结出来的判别公式和判别准则,就能判别该样本点所属的类别。判别分析的任务是根据已掌握的1批分类明确的样品,建立较好的判别函数,使产生错判的事例最少,进而对给定的1个新样品,判断它来自哪个总体。91.3判别分析法的分类及概要按判别的组数:两组判别分析和多组判别分析按所含变量个数,可以分为一元判别分析和多元判别分析按资料:定性资料的判别方法,定量资料的分析方法。采用不同的判别准则,又有距离、费歇(fisher)、贝叶斯(BAYES)、等判别方法。距离判别:由训练样本得出每个分类的中心(中心)坐标,然后对新样品求出他们离各个类别中心的距离的远近,从而归入离的最近的分类。马氏距离,欧氏距离。费歇尔判别:典则判别。基本思想是投影,即将原来在R维空间的自变量组合投影到维度较低的D维空间去,然后在D维空间中在进行分类。投影原则是使每一类内的离差尽可能小,不同类间投影的离差尽可能大。1.3判别分析法的分类及概要贝叶斯判别:在考虑先验概率的前提下,利用贝叶斯公式,按照一定准则构造一个判别函数,分别计算该样品落入各个子域的概率,所有概率中最大的一类就被认为是该样品所属的类别。先验概率,就是用概率来描述人们事先对所研究的对象的认识的程度;后验概率,就是根据具体资料、先验概率、特定的判别规则所计算出来的概率。它是对先验概率修正后的结果。12使用spss软件我们应用spss软件来建立判别分析模型,其过程为:对于分为k组的研究对象,可建立k-1个典型判别函数(原始自变量的线性组合)和k个fisher线性判别函数,然后将各样本的自变量回代到判别函数中,计算其判别分数或者属于各组的概率,根据数值的大小判别样本所属组别,对比样本的原始组别给出错分率。1.4判别分析法的SPSS实现13具体实现方法,见word文档1.5准确度效果评价自身验证外部数据验证样本二分法交互验证BOOTSTRAP验证交互验证在建立判别函数时依次去掉一例,然后用建立起来的判别函数对该例进行判别,用该方法可以非常有效地避免强影响点的干扰。BOOTSTRAP验证对原始数据进行有放回的抽取,即每个观察单位每次被抽到的概率相等,为1/n,所得样本称为bootstrap样本。从该样本可以得到一个判别分析结果,重复抽取这样的样本若干次,可以建立起来一系列判别函数,相应的每个系数都有一系列取值。谢谢!欧氏距离在二维和三维空间中的欧氏距离的就是两点之间的距离。马氏距离表示数据的协方差距离。它是一种有效的计算两个未知样本集的相似度的方法。与欧式距离不同的是它考虑到各种特性之间的联系。
本文标题:判别分析ppt
链接地址:https://www.777doc.com/doc-6764117 .html