您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 企业文化 > 判别分析SPSS操作
判别分析的SPSS操作§1.基本原理§2.基本操作§3.选项设置§4.实例分析§1.基本原理判别分析的目的是得到体现分类的函数关系式,即判别函数。基本思想是在已知观测对象的分类和特征变量值的前提下,从中筛选出能提供较多信息的变量,并建立判别函数;目标是使得到的判别函数在对观测量进行判别其所属类别时的错判率最小。判别函数的一般形式是:nnxaxaxaY2211其中,Y为判别函数判别值;nxxx,,,21为反映研究对象特征的变量;naaa,,,21为各变量的系数,即判别系数。常用的判别法有距离判别法、Fisher判别法和Bayes判别法。例1人文发展指数是联合国开发计划署于1990年5月发表的第一份《人类发展报告》中公布的。该报告建议,目前对人文发展的衡量应当以人生的三大要素为重点,衡量人生三大要素的指示分别采用出生时的预期寿命、成人识字率和实际人均GDP,将以上三个指示指标的数值合成为一个复合指数,即为人文发展指数。资料来源UNDP《人类发展报告》1995年。今从1995年世界各国人文发展指数的排序中,选取高发展水平、中等发展水平的国家各五个作为两组样品,另选四个国家作为待判样品作判别分析。使用三种判别方法进行判别,并进行研究三者之间的关系。本例中变量个数p=3,两类总体各有5个样品,即n1=n2=5,有4个待判样品,假定两总体协差阵相等。两组线性判别的计算过程如下:(1)计算两类样本均值(2)计算样本协差阵,从而求出类似地经计算(3)求线性判别函数W(X)解线性方程组得(4)对已知类别的样品判别分类对已知类别的样品(通常称为训练样品)用线性判别函数进行判别归类,结果如下表,全部判对。(5)对判别效果作检验判别分析是假设两组样品取自不同总体,如果两个总体的均值向量在统计上差异不显著,作判别分析意义就不大:所谓判别效果的检验就是检验两个正态总体的均值向量是否相等,取检验的统计量为:其中将上边计算结果代人统计量后可得:函数有效。故在检验水平下,两总体间差异显著,即判别(6)对待判样品判别归类结果如下表:2、继续用前面距离判别法例1的人文发展指数的数据作Bayes判别分析。这里组数k=2,指标数p=3,n1=n2=5代人判别函数:得两组的判别函数分别为:将原各组样品进行回判结果如下一灯片表:待判样品判别结果如下:3、利用距离判别法中例l的人文发展指数的数据作Fisher判别分析:(1)建立判别函数利用前例计算的结果,可得Fisher判别函数的系数所以判别函数为(2)计算判别临界值y0。由于所以(3)判别准则(4)对已知类别的样品判别归类上述回判结果表明:总的回代判对率为100%,这与统计资料的结果相符,而且与前面用距离判别法的结果也一致。(5)对判别效果作检验由于所以在检验水平下判别有效。(6)待判样品判别结果如下:判别结果与实际情况吻合。§2.基本操作SPSS利用“Discriminate”过程进行判别分析操作,下面给出基本操作步骤。Step1:打开主对话框。选择“Analyze”→“Classify”→“Discriminate”命令,打开“DiscriminateAnalysis”对话框,如图1.1所示图1.1“DiscriminateAnalysis”对话框,Step2:选择分组变量和自变量在变量列表中选择指定分组变量,单击右向箭头按钮,将其移动至右侧的“GroupingVariable”(分组)文本框中,并单击“DefineRange”(定义范围)按钮,出现图1.2所示的“DiscriminantAnalysis:DefineRange”(判别分析定义范围)对话框,在“Minimum”文本框中输入该分组变量的最小值,在“Maximum”文本框中输入该分组变量的最大值,单击“Continue”按钮,返回主对话框。图1.2“DiscriminateAnalysis:DefineRange”对话框在变量列表中选择判别分析的变量,单击右向箭头按钮,将其移动至“Independents”(自变量)列表框中。Step3:选择判别分析方法。在主对话框中,自变量列表框下侧显示两个单选框,用于指定选择判别分析的方法。Enterindependentstogether默认选项。当认为所有自变量都能对观测特性提供丰富的信息时,使用该选项,选择该项将不加uanz地使用所有自变量进行判别分析,建立全模型,且不需要进一步选择。Usestepwisemethod逐步分析方法。当认为不是所有自变量都能对观测量特性提供丰的信息时,选择该项,因此需要判别贡献的大小再进行选择。选中该单选按钮时,“Method”按钮被激活,可以进一步选择判别分析方法。Step4:选择变量值标识。如果需要使用一部分个案参与判别函数的推导,而且有一个变量的某个值可以作为这些观测量的标识,则用SelectVariable功能进行选择。方法为在变量列表中选择变量,单击右向箭头按钮,将其移动至“Selection”(选择变量)文本框;然后单击“Selection”文本框右侧的“Value”按钮,显示“DiscriminantAnalysis:SetValue”(判别分析:设定值)子对话框,如图1.3所示,输入选择变量的标识。单击“Continue”按钮,返回主对话框。图1.3“DiscriminantAnalysis:SetValue”Step5:执行操作。选择完毕后,单击“OK”按钮,执行判别分析操作。§3.选项设置§3.1Method选项选择“Usestepwisemethod”方法进行判别分析时,“Method”(方法)按钮将被激活,单击“Method”按钮,打开“DiscriminantAnalysis:StepwiseMethod”(判别分析:逐步分析方法)对话框,如图1.4所示在“Method”选项组中选择进行逐步判别分析的方法,可供选择的判别分析方法有5种:1.Wilks’lambdaWilks’lambda方法。默认选项,每步都是Wilk的概计量最小的进入判别函数。2.Unexplainedvariance不可解释方差方法。选择该项,表示每步都是使各类不可解释的方差和最小变量进入判别函数。3.Mahalanobis’distanceMahalanobis距离方法。选择该项,表示每步都使靠的最近的两类间Mahalanobis距离最大的变量进入判别函数。4.SmallestFratio最小F值方法。选择该项,表示每步都使任何两类间的最小的F值最大变量进入判别函数。5.Rao’sVRaoV统计量。选择该项,表示每步都使RaoV统计量产生最大增量的变量进入判别函数,可以对一个要加入到模型中的变量的V值指定一个最小增量。选择该方法时需要在该项下面的“V-to-enter”(输入V值)文本框中输入这个增量的指定值,当某变量导致的V值增量大于指定值的变量进入判别函数。“Criteria”(准则)选项组用于选择逐步判别停止的判据,可供选择的判据包括以下几项:UseFvalue默认选项。使用F值是系统默认的判据,当加入一个变量(或剔除一个变量)后,对判别分析的变量进行方差分析。当计算的F值大于指定的Entry值时,该变量保存在函数中,默认Entry值是3.84;当该变量使计算的F值小于指定的Removal值时,该变量从函数中剔除,默认Removal值是2.71。即当被加入的变量F值为3.84时,才把该变量加入到模型中,否则变量不能进入模型;或者当要从模型中移出的变量F值为2.71时,该变量才被移出模型,否则模型中的变量不会被移出。设置这两个值时应该注意Entry值和Removal值。UseprobabilityofF选择该项,表示用F检验的概率决定变量是否被加入函数或被剔除,而不是用F值加入变量的,F值概率的默认值是0.05,移出变量的F值概率是0.10。Removal值是移出变量的F值概率;Entry值是加入变量的F值概率。“Display”(显示)选项组的选项用于显示逐步变量判别法的过程设置。有以下两个复选项:Summaryofstep要求在逐步选择变量过程中的每一步之后显示每个变量的统计量。Fforpairwisedistances要求显示两两类之间的两两F值矩阵。§3.2Statistics选项在主对话框中单击“statistics”按钮,打开“DiscriminantAnlysis:statistics”(判别分析:统计量)对话框,如图1.5所示。图1.5“DiscriminantAnlysis:statistics”对话框该对话框中给出了输出结果中显示的统计量,包括如下选项。在“descriptive”(描述性)选项组中选择对原始数据的描述统计量的输出。Means均值。选择该项,可以输出各类中各自变量的均值、标准差以及各自变量总样本的均值和标准差。UnivariateANOVA单变量方差分析。选择该项,表示对每一类同一自变量均值都相等的假设进行检验,输出单变量的方差分析结果。Box’sM选择该项,表示对各类的协方差矩阵相等的假设进行检验。“FunctionCoefficients”(判别分析的系数)选项组中给出选择判别函数系数的输出形式的选项,有两个复选项:Fisher’s选择该项,表示可以用于对新样本进行判别分类的fisher系数,对每一类给出一组系数,并给出该组中判别分数最大的观测量。Unstandardized选择该项,表示未经标准化处理的判别系数。在“matrices”(矩阵)选项组中选择自变量的系数矩阵,有4个复选项:Within-groupcorrelation类内相关矩阵。它计算相关矩阵之前将各组协方差矩阵平均后,计算类内相关矩阵。Within-groupcovariance合并类内协方差矩阵,是将各组(类)协方差矩阵平均后计算的,区别与总协方差矩阵。Separate-groupscovariance协方差矩阵。Totalcovariance总样本的协方差矩阵。§3.3Classification选项在主对话框中单击“classify”按钮,显示“DiscriminantAnalysis:Classification”(判别分析:分类)子对话框,如图1.6所示。图1.6“DiscriminantAnalysis:Classification”对话框该对话框用于指定分类参数和判别结果。分别介绍各个选项组的选项。在“priorprobabilities”选项组中选择先验概率,有两个单选项供选择:Allgroupsequal表示各类先验概率相等。Computefromgroupssizes表示由各类的样本量计算决定,即各类的先验概率与其样本量成正比。在“usecovariancematrix”(利用协方差矩阵)选项组中选择分类使用的协方差矩阵,有两个单选项:Within-groups选择该项,表示指定使用合并组内协方差矩阵进行分类。Separate-groups选择该项,表示指定使用各组协方差矩阵进行分类,由于分类是根据判别函数而不是根据原始变量,因此该选择项不是总等价于二次判别。在“plots”选项组中选择要求输入的统计图形,给出3个复选项:Combined-groups选择该项,生成一张包括各类的散点图,该散点图是根据前两个判别函数值做的散点图;如果只有一个判别函数,就输出直方图。Separate-groups选择该项,根据前两个判别函数值对每一类生成一张散点图,共分为几类就生成几张散点图;如果只有一个判别函数就生成一张直方图。Territorialmap选择该项,生成用于根据函数值把观测量分到各组中去的边界图,此种统计图把一张图的平面划分出与类数相同的区域,每一类占据一个区,各类的均值在各区中用*号标出;如果仅有一个判别函数则不作此图。在“display”选项组中选择生成到输出窗中的分类结果,其中包括3个复选框:Casewiseresults要求输出每个管测量,包括判别分数实际类预测类(根据判别函数求得的分类结果)和后验概率等
本文标题:判别分析SPSS操作
链接地址:https://www.777doc.com/doc-4646682 .html