您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 企业财务 > 多元统计分析——判别分析实验报告
学生实验报告学院:课程名称:多元统计分析专业班级:姓名:学号:学生实验报告学生姓名学号同组人实验项目判别分析□必修□选修□演示性实验□验证性实验□操作性实验□综合性实验实验地点实验仪器台号指导教师实验日期及节次一、实验目的及要求:1、目的熟悉SPSS统计软件,学会在统计软件SPSS中进行判别分析,并通过判别分析输出结果图,再进行判别分析。根据输出结果,把未分组的判给距离相近那组。2、内容及要求⑴熟悉spss软件有关判别分析的操作;⑵利用spss软件分析判别分析课后练习第六题,判定待判组的类别归属;⑶输出并解释分析结果并完成实验报告。二、仪器用具:仪器名称规格/型号数量备注计算机1有网络环境SPSS软件1三、实验方法与步骤:步骤一:将数据复制到SPSS中,经过编辑后形成某地区人口死亡状况的数据集,如图1所示。图1某地区人口死亡状况的观测数据步骤二:根据要求,采用系统聚类方法,在SPSS中选择分析-分类-判别分析如图2。图2判别分析步骤三:进行判别分析,将X1到X6全部选入自变量中,分组变量为组别,如图3。图3判别分析选项框步骤四:在统计量选项框中选择均值,单变量,Box’sM等,如图4;分类选项中勾选个案、摘要等,如图5。图4统计量选项框图5分类选项框四、实验结果与数据处理:1.检验各组的描述统计量和对各组均值是否相等:表1AnalysisCaseProcessingSummaryUnweightedCasesNPercentValid1578.9ExcludedMissingorout-of-rangegroupcodes421.1Atleastonemissingdiscriminatingvariable0.0Bothmissingorout-of-rangegroupcodesandatleastonemissingdiscriminatingvariable0.0Total421.1Total19100.0表1反映的是有效样本量为15,变量的缺失值为4。表2TestsofEqualityofGroupMeansWilks'LambdaFdf1df2Sig.X1.997.019212.981X2.990.061212.941X3.6453.301212.072X4.4387.690212.007X5.17428.557212.000X6.926.478212.631表2是对各组均值是否相等的检验,根据P值,我们可以在0.01的显著性水平上拒绝X4与X5在三组的均值相等的假设,即认为变量X4、X5在三组的均值是有显著差异的。2.典型判别函数:表3EigenvaluesFunctionEigenvalue%ofVarianceCumulative%CanonicalCorrelationdimension0159.330a98.898.8.9922.693a1.2100.0.640a.First2canonicaldiscriminantfunctionswereusedintheanalysis.表4Wilks'LambdaTestofFunction(s)Wilks'LambdaChi-squaredfSig.dimension01through2.01043.94812.0002.5914.9995.416由表3可以得出:第一判别函数解释了98.8%的方差,第二判别函数解释了1.2%的方差,两个判别函数解释了全部的方差。表4是对两个判别函数的显著性检验,由Wilkins’Lambda检验,在0.05的显著性水平上,根据P值可以得到,第一个判别函数是显著的,第二个判别函数是不显著的。3.判别函数、判别载荷和各组的重心:表5StandardizedCanonicalDiscriminantFunctionCoefficientsFunction12X1-17.046-7.677X214.7579.870X3-1.306-.513X46.381-.666X51.332.710X64.3151.833表6StructureMatrixFunction12X1.007*-.002X5.280-.394*X4.145-.201*X3.096.104*X2.007.103*X6-.035.092*表7CanonicalDiscriminantFunctionCoefficientsFunction12X1-1.950-.878X21.7481.169X3-.930-.365X4.825-.086X5.102.054X61.662.706(Constant)-78.896-30.330表8FunctionsatGroupCentroids组别Function121-2.6471.01329.444-.2593-6.797-.754表5是标准化的判别函数,表示为:Y1=-17.046X1+14.757X2-1.306X3+6.381X4+1.332X5+4.315X6Y2=-7.677X1+9.870X2-0.531X3-0.666X4+0.710X5+1.833X6表6为结构矩阵,即判别载荷,表四是反映判别函数在各组的重心表7是非标准化的判别函数,表示为:Y1=-78.896-1.950X1+1.748X2-0.930X3+0.825X4+0.102X5+1.662X6Y2=-30.330-0.878X1+1.169X2-0.365X3-0.086X4+0.054X5+0.706X64.分类的统计结果:表8ClassificationFunctionCoefficients组别123X1-159.015-181.479-149.370X2168.068187.715158.749X3-98.413-109.195-93.908X458.21768.29654.948X511.70212.86211.185X6202.770221.972194.625(Constant)-5628.382-6584.377-5266.780Fisher'slineardiscriminantfunctions表8是每组的分类函数,也称费歇线性判别函数,三组的分类函数表示为:Y1=-5628.382-159.015X1+168.068X2-98.413X3+58.217X4+11.702X5+202.770X6Y2=-6584.377-181.479X1+187.715X2-109.195X3-68.296X4+12.862X5+221.972X6Y3=-5266.780-149.370X1+158.749X2-93.908X3+54.948X4+11.185X5+194.625X6可以根据计算每个观测在各组的分类函数值,将观测分类到较大的分类函数值中。表9ClassificationResultsb,c组别PredictedGroupMembershipTotal123OriginalCount150052050530055Ungroupedcases1124%1100.0.0.0100.02.0100.0.0100.03.0.0100.0100.0Ungroupedcases25.025.050.0100.0Cross-validatedaCount150052140532035%1100.0.0.0100.0220.080.0.0100.0340.0.060.0100.0表9为分类矩阵表,通过判别函数的预测,根据原数据的所属组关系,3组观测全部被判对,未分组的变量中有一个待判样品判给第一组,有一个待判样品判给第二组,有两个待判样品判给第三组。在交叉验证中,第一组5个样品全部被判对,第二组5个样品观测中有4个被判对,第三组5个样品观测中有3个被判对。图6分类结果根据上图6分类结果可以看出:第二组样品与第一组样品和第三组样品可以很清晰地区分开,而第一组与第三组样品存在重合区域,即存在误判。CasewiseStatisticsCaseNumberActualGroupHighestGroupSecondHighestGroupDiscriminantScoresPredictedGroupP(Dd|G=g)P(G=g|D=d)SquaredMahalanobisDistancetoCentroidGroupP(G=g|D=d)SquaredMahalanobisDistancetoCentroidFunction1Function2pdfORIGINAldimension1111.84621.000.3343.00025.690-2.1971.375211.87621.000.2663.00024.876-2.2921.386311.94221.000.1193.00020.463-2.7821.330411.7562.999.5613.00114.211-3.289.628511.80021.000.4453.00018.184-2.677.346622.78921.000.4741.000159.0529.939.219722.65921.000.8351.000128.9488.594-.594822.05021.0005.9901.000181.07710.332-2.540922.09121.0004.7861.000127.6948.6271.7711022.95521.000.0921.000154.4989.728-.1511133.93621.000.1321.00020.106-6.901-.4061233.83621.000.3591.00025.430-7.393-.6931333.07621.0005.1521.00045.937-8.834-1.7561433.1782.9053.4571.0957.964-4.942-.6301533.6072.997.9981.00312.361-5.914-.28616ungrouped3.00021.000395.9031.000587.379-21.903-13.70417ungrouped1.7452.999.5883.00114.106-3.393.83418ungrouped2.00021.00031.2371.000295.30914.5022.12019ungrouped3.31021.0002.3441.00035.657-7.914-1.801CROSS-validatedadimension1111.96661.0001.3983.00025.267211.93961.0001.7763.00024.694311.98261.0001.0973.00019.351411.9336.9981.8533.00214.084511.2786.9987.4853.00220.003622.00061.00044.9901.000218.235721**.00061.000126.7782.000162.921822.00061.00050.0951.000366.046922.00061.00050.7861.000130.3541022.00061.000240.3211.000420.0331133.89861.0002.2241.00019.6831233.38761.0006.3281.00029.8081333.00061.00031.5871.000133.5531431**.08861.00011.0103.00045.4281531**.0116.95916.4783.04122.802根据上表CasewiseStatistics结果可以得出:将待判样品1(第16行)判给第三组,将待判样品2(第17行)判给第一组,将待判样品3(第18行)判给第二组,将待判样品4(第18行)判给第三组。五、讨论与结论
本文标题:多元统计分析——判别分析实验报告
链接地址:https://www.777doc.com/doc-5514285 .html