您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 企业文化 > 判别分析的一般步骤及SPSS实现
判别分析的一般步骤及SPSS实现判别分析的逻辑框图例1:为研究某地区人口死亡状况,已按某种方法将15个已知地区样品分为3类,指标含义及原始数据如下。试建立判别函数,并判定另外4个待判地区属于哪类?X1:0岁组死亡概率X4:55岁组死亡概率X2:1岁组死亡概率X5:80岁组死亡概率X3:10岁组死亡概率X6:平均预期寿命判别分析的SPSS实现1X2X3X4X5X6X类别134.167.441.127.8795.1969.31233.066.341.086.7794.0869.71336.269.241.048.9797.368.81440.1713.451.4313.88101.266.21550.0623.032.8323.74112.5263.31633.246.241.1822.9160.0165.42732.224.221.0620.7124.768.72841.1510.082.3232.84172.0665.852953.0425.744.0634.87152.0363.521038.0311.26.0727.84146.3266.821134.035.410.075.290.169.531232.113.020.093.1485.1570.831344.1215.021.0815.15103.1264.831454.1725.032.1125.15110.1463.731528.072.010.073.0281.2268.33待判50.226.661.0822.54170.665.2.待判34.647.331.117.7895.1669.3.待判33.426.221.1222.95160.3168.3.待判44.0215.361.0716.45105.364.2.表7.1各地区死亡概率表(一)操作步骤1.在SPSS窗口中选择Analyze→Classify→Discriminate,调出判别分析主界面,将左边的变量列表中的“group”变量选入分组变量中,将—选入自变量中,并选择Enterindependentstogether单选按钮,即使用所有自变量进行判别分析。图7.2判别分析主界面X1X62.点击DefineRange按钮,定义分组变量的取值范围。本例中分类变量的范围为1到3,所以在最小值和最大值中分别输入1和3。单击Continue按钮,返回主界面。判别分析的SPSS实现3.单击Statistics…按钮,指定输出的描述统计量和判别函数系数。选中FunctionCoefficients栏中的Fisher’s和Unstandardized。这两个选项的含义如下:Fisher’s:给出Bayes判别函数的系数。(注意:这个选项不是要给出Fisher判别函数的系数。这个复选框的名字之所以为Fisher’s,是因为按判别函数值最大的一组进行归类这种思想是由Fisher提出来的。这里极易混淆,请注意辨别。)Unstandardized:给出未标准化的Fisher判别函数(即典型判别函数)的系数(SPSS默认给出标准化的Fisher判别函数系数)。判别分析的SPSS实现注:由于SPSS中的判别分析没有距离判别这一方法,因此距离判别法无法在SPSS中直接实现(但可以通过Excel等软件来进行手工计算)。判别分析的SPSS实现单击Continue按钮,返回主界面。图7.3Statistics子对话框判别分析的SPSS实现4.单击Classify…按钮,定义判别分组参数和选择输出结果。选择Display栏中的Casewiseresults,输出一个判别结果表,包括每个样品的判别分数、后验概率、实际组和预测组编号等。其余的均保留系统默认选项。单击Continue按钮。图7.4Classify…子对话框5.单击Save按钮,指定在数据文件中生成代表判别分组结果和判别得分的新变量,生成的新变量的含义分别为:Predictedgroupmembership:存放判别样品所属组别的值;Discriminantscores:存放Fisher判别得分的值,有几个典型判别函数就有几个判别得分变量;Probabilitiesofgroupmembership:存放样品属于各组的Bayes后验概率值。将对话框中的三个复选框均选中,单击Continue按钮返回。判别分析的SPSS实现图7.5Save子对话框6.返回判别分析主界面,单击OK按钮,运行判别分析过程。判别分析的SPSS实现(二)主要运行结果解释1.StandardizedCanonicalDiscriminantFunctionCoefficients(给出标准化的典型判别函数系数)标准化的典型判别函数是由标准化的自变量通过Fisher判别法得到的,所以要得到标准化的典型判别得分,代入该函数的自变量必须是经过标准化的。2.CanonicalDiscriminantFunctionCoefficients(给出未标准化的典型判别函数系数)未标准化的典型判别函数系数由于可以将实测的样品观测值直接代入求出判别得分,所以该系数使用起来比标准化的系数要方便一些。见表7.2(a)。判别分析的SPSS实现由此表可知,两个Fisher判别函数分别为:实际上两个函数式计算的是各观测值在各个维度上的坐标,这样就可以通过这两个函数式计算出各样品观测值的具体空间位置。1123456212345674.991.8611.6560.8770.7980.0981.57929.4820.8671.1550.3560.0890.0540.69yXXXXXXyXXXXXX判别分析的SPSS实现表7.2(a)未标准化的典型判别函数系数判别分析的SPSS实现3.FunctionsatGroupCentroids(给出组重心处的Fisher判别函数值)如表7.2(b)所示,实际上为各类别重心在空间中的坐标位置。这样,只要在前面计算出各观测值的具体坐标位置后,再计算出它们分别离各重心的距离,就可以得知它们的分类了。FunctionsatGroupCentroids-2.5941.0139.194-.257-6.600-.756GROUP1.002.003.0012FunctionUnstandardizedcanonicaldiscriminantfunctionsevaluatedatgroupmeans表7.2(b)组重心处的Fisher判别函数值4.ClassificationFunctionCoefficients(给出Bayes判别函数系数)如表7.3所示,Group栏中的每一列表示样品判入相应列的Bayes判别函数系数。在本例中,各类的Bayes判别函数如下:第一组:第二组:第三组:11234565317.2143.9153.190.153.011.0189.3FXXXXXX21234566202.2164.7171.2100.062.512.1207.0FXXXXXX31234564982.9134.9144.585.950.010.5181.7FXXXXXX判别分析的SPSS实现将各样品的自变量值代入上述三个Bayes判别函数,得到三个函数值。比较这三个函数值,哪个函数值比较大就可以判断该样品判入哪一类。例如,将第一个待判样品的自变量值分别代入函数,得到:F1=3793.77,F2=3528.32,F3=3882.48比较三个值,可以看出第一个待判样品应该属于第三组。判别分析的SPSS实现ClassificationFunctionCoefficients-143.851-164.691-134.862153.137171.185144.462-90.088-99.976-85.94553.00962.52549.97211.00812.09410.520189.261207.003181.714-5317.234-6202.158-4982.880X1X2X3X4X5X6(Constant)1.002.003.00GROUPFisher'slineardiscriminantfunctions表7.3Bayes判别法的输出结果判别分析的SPSS实现5.CasewiseStatistics(给出个案观察结果)在CasewiseStatistics输出表针对每个样品给出了了大部分的判别结果,其中包括:实际类(ActualGroup)、预测类(PredictedGroup)、Bayes判别法的后验概率、与组重心的马氏距离(SquaredMahalanobisDistancetoCentroid)以及Fisher判别法的每个典型判别函数的判别得分(DiscriminantScores)。出于排版要求,这里给出结果表的是经过加工的,隐藏了其中的一些项目,如表7.4所示。从表中可以看出四个待判样本依次被判别为第三组、第一组、第二组和第三组。判别分析的SPSS实现CasewiseStatistics111.000.297-2.1771.364111.000.236-2.2701.375111.000.117-2.7411.32311.998.507-3.199.638111.000.418-2.582.366221.000.4699.674.231221.000.8688.332-.613221.0005.98510.128-2.518221.0004.7938.3421.760221.000.1019.491-.145331.000.139-6.687-.394331.000.322-7.163-.685331.0005.365-8.655-1.82333.8793.384-4.766-.60833.995.998-5.727-.270ungrouped31.000361.567-20.714-13.498ungrouped1.998.558-3.319.831ungrouped21.00028.66814.0082.086ungrouped31.0001.982-7.595-1.752CaseNumber12345678910111213141516171819ActualGroupPredictedGroupP(G=g|D=d)SquaredMahalanobisDistancetoCentroidHighestGroupFunction1Function2DiscriminantScores表7.4个案观察结果表6.由于我们在Save子对话框中选择了生成表示判别结果的新变量,所以在数据编辑窗口中,可以观察到产生的新变量。其中,变量dis-1存放判别样品所属组别的值,变量dis1-1和dis2-1分别代表将样品各变量值代入第一个和第二个判别函数所得的判别分数,变量dis1-2、dis2-2和dis3-2分别代表样品分别属于第1组、第2组和第3组的Bayes后验概率值。判别分析的SPSS实现例2:对国家类别的判别判别分析的SPSS实现14个国家的出生时预期寿命和成人识字率类别序号国家名称出生时预期寿命(岁)成人识字率(%)第一类(发达国家)1美国76.099.02日本79.599.03瑞士78.099.04阿根廷72.195.95阿联酋73.877.7第二类(发展中国家)6保加利亚71.293.07古巴75.394.98巴拉圭70.091.29格鲁吉亚72.899.010南非62.980.6待判样品11中国68.579.312罗马尼亚69.996.913希腊77.693.814哥伦比亚69.390.3分析分类判别基本设定:判别分析的SPSS实现相关选项刀切法的分类效果原始数据的分类效果相关选项保存分类结果结果分析:方差分析识字率在各组中差别很不显著,对分类的作用可能不大。判别分析的SPSS实现Fisher判别函数D=-16.661+0.342×预期寿命-0.09×识字率
本文标题:判别分析的一般步骤及SPSS实现
链接地址:https://www.777doc.com/doc-3685652 .html