您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 企业文化 > SPSS操作方法:判别分析例题95239
1实验指导之二判别分析的SPSS软件的基本操作[实验例题]为研究1991年中国城镇居民月平均收入状况,按标准化欧氏平方距离、离差平方和聚类方法将30个省、市、自治区.分为三种类型。试建立判别函数,判定广东、西藏分别属于哪个收入类型。判别指标及原始数据见表9-4。1991年30个省、市、自治区城镇居民月平均收人数据表单位:元/人x1:人均生活费收入x6:人均各种奖金、超额工资(国有+集体)x2:人均国有经济单位职工工资x7:人均各种津贴(国有+集体)x3:人均来源于国有经济单位标准工资x8:人均从工作单位得到的其他收入x4:人均集体所有制工资收入x9:个体劳动者收入x5:人均集体所有制职工标准工资样品序号地区x1x2x3x4x5x6x7x8x9类序号G11北京170.03110.259.768.384.4926.8016.4411.90.412天津141.5582.5850.9813.49.3321.3012.369.211.053河北119.4083.3353.3911.07.5217.3011.7912.00.704上海194.53107.860.2415.68.8831.0021.0111.80.165山东130.4686.2152.3015.910.520.6l12.149.610.476湖北119.2985.4153.0213.18.4413.8716.478.380.517广西134.4698.6148.188.904.3421.4926.1213.64.568海南143.7999.9745.606.301.5618.6729.4911.83.829四川128.0574.9650.1313.99.6216.1410.1814.51.2110云南127.4193.5450.5710.55.8719.4121.2012.60.9011新疆122.96101.469.706.303.8611.3018.965.624.62G21山西102.4971.7247.729.426.9613.127.96.660.612内蒙古106.1476.2746.199.656.279.65520.1O6.970.963吉林104.9372.9944.6013.79.019.43520.616.651.684黑龙江103.3462.9942.9511.17.4l8.34210.196.452.685江西98.08969.4543.0411.47.9510.5916.507.691.086河南104.1272.2347.319.486.4313.1410.438.301.117贵州108.4980.7947.526.063.4213.6916.538.372.858陕西113.9975.650.885.213.8612.949.4926.771.279甘肃114.0684.3152.787.815.4410.8216.433.791.1910青海108.8080.4150.457.274.078.37118.985.950.8311宁夏115.9688.2l51.858.815.6313.9522.654.750.97G31辽宁128.4668.9143.4l22.415.313.8812.429.011.412江苏135.2473.1844.5423.915.222.389.66113.91.193浙江162.5380.1145.9924.313.929.5410.9013.03.474安徽111.7771.0743.6419.412.516.689.6987.020.635福建139.0979.0944.1918.510.520.2316.477.673.0826湖南124.0084.6644.0513.57.4719.1120.4910.31.76待判1广东211.30114.041.4433.211.248.7230.7714.911.12西藏175.93163.857.894.223.3717.8182.3215.70.00贝叶斯判别的SPSS操作方法:1.建立数据文件2.单击Analyze→Classify→Discriminant,打开DiscriminantAnalysis判别分析对话框如图1所示:图1DiscriminantAnalysis判别分析对话框3.从对话框左侧的变量列表中选中进行判别分析的有关变量x1~x9进入Independents框,作为判别分析的基础数据变量。从对话框左侧的变量列表中选分组变量Group进入GroupingVariable框,并点击DefineRange...钮,在打开的DiscriminantAnalysis:DefineRange对话框中,定义判别原始数据的类别数,由于原始数据分为3类,则在Minimum(最小值)处输入1,在Maximum(最大值)处输入3(见图2)。。选择后点击Continue按钮返回DiscriminantAnalysis主对话框。图2DefineRange对话框4、选择分析方法3Enterindependenttogether所有变量全部参与判别分析(系统默认)。本例选择此项。Usestepwisemethod采用逐步判别法自动筛选变量。单击该项时Method按钮激活,打开StepwiseMethod对话框如图3所示,从中可进一步选择判别分析方法。图3StepwiseMethod对话框Method栏,选择变量的统计量方法Wilks’lambda(默认)按统计量Wilksλ最小值选择变量;Unexplainedvariance:按照所有组方差之和最小值选择变量;Mahalanobis’distance:按照相邻两组的最大马氏距离选择变量;SmallestFratio:按组间最小F值比的最大值选择变量;Rao’sV按照统计量RaoV最大值选择变量。Criteria选择逐步回归的标准(略)选择系统默认项。5.单击Statistics按钮,打开Statistics对话框如图4所示,从中指定输出的统计量。Descriptives描述统计量栏Means-各类中各自变量的均值,标准差stdDev和各自变量总样本的均值和标准差(本例选择)。UnivariateANOV----对各类中同一自变量均值都相等的假设进行检验,输出单变量的方差分析结果(本例选择)。Box’sM--对各类的协方差矩阵相等的假设进行检验(本例选择)。4图4Statistics对话框Functioncoefficients选择输出判别函数系数Fisherh’s给出贝叶斯判别函数系数(本例选择)Unstandardized给出未标准化的典型判别(也称典则判别)系数(费舍尔判别函数)。Matrices栏选择给出的自变量系数矩阵Within-groupscorrelation合并类内相关系数矩阵(本例选择)Within-groupscovariance合并类内协方差矩阵(本例选择)Separate-groupscovariance各类内协方差矩阵(本例选择)Totalcovariance总协方差矩阵(本例选择)6.单击Classify按钮,打开Classify对话框如图5所示:图5Classify对话框5PriorProbabilities栏,选择先验概率。Allgroupsequal各类先验概率相等(系统默认);Computefromgroupssizes各类的先验概率与其样本量成正比.(本例选择)UseCovarianceMatrix栏,选择使用的协方差矩阵Within-groups--使用合并类内协方差矩阵进行分类(系统默认)(本例选择)Separate-groups--使用各类协方差矩阵进行分类Display栏,选择生成到输出窗口中的分类结果Casewiseresults输出每个观测量包括判别分数实际类预测类(根据判别函数求得的分类结果)和后验概率等。Summarytable输出分类的小结给出正确分类观测量数(原始类和根据判别函数计算的预测类相同)和错分观测量数和错分率(本例选择)。Leave-one-outclassification输出交互验证结果。Plots栏,要求输出的统计图Combined-groups生成一张包括各类的散点图(本例选择);Separate-groups每类生成一个散点图;Territorialmap根据生成的函数值把各观测值分到各组的区域图。(本例选择)6.单击Save按钮,打开Save对话框,见图6.图6Save对话框Predictedgroupmembership建立一个新变量,系统根据判别分数,把观测量按后验概率最大指派所属的类;(本例选择)Discriminantscore建立表明判别得分的新变量,该得分是由未标准化的典则判别函数计算。(本例选择)6Probabilitiesofgroupmembership建立新变量表明观测量属于某一类的概率。有m类,对一个观测量就会给出m个概率值,因此建立m个新变量。(本例选择)全部选择完成后,点击OK,得到输出结果如下:AnalysisCaseProcessingSummary分类样本综述UnweightedCasesNPercentValid2893.3ExcludedMissingorout-of-rangegroupcodes26.7Atleastonemissingdiscriminatingvariable0.0Bothmissingorout-of-rangegroupcodesandatleastonemissingdiscriminatingvariable0.0Total26.7Total30100.0GroupStatistics各类统计分析分类Mean均值Std.Deviation标准差ValidN(listwise)有效样本数UnweightedWeighted1人均生活费收入(元/人)139.266423.351251111.000人均国有经济单位职工工资93.091811.388291111.000人均来源于国有经济单位标准工资53.98826.805301111.000人均集体所有制工资收入11.20733.449371111.000人均集体所有制职工标准工资6.76452.896851111.000人均各种奖金、超额工资(国有+集体)19.80825.556001111.000人均各种津贴(国有+集体)17.83276.233051111.000均从工作单位得到的其他收入11.00182.561351111.000个体劳动者收入1.67361.745281111.0002人均生活费收入(元/人)107.30995.566411111.000人均国有经济单位职工工资75.90647.172331111.000人均来源于国有经济单位标准工资47.75363.420901111.000人均集体所有制工资收入9.08272.459001111.000人均集体所有制职工标准工资6.04091.772661111.000人均各种奖金、超额工资(国有+集体)11.27752.153231111.000人均各种津贴(国有+集体)15.43755.110231111.000均从工作单位得到的其他收入6.57731.383501111.0007个体劳动者收入1.3845.734281111.0003人均生活费收入(元/人)133.515017.1164266.000人均国有经济单位职工工资76.17006.0628066.000人均来源于国有经济单位标准工资44.3033.9182566.000人均集体所有制工资收入20.33334.0903166.000人均集体所有制职工标准工资12.47833.0459266.000人均各种奖金、超额工资(国有+集体)20.30335.3934466.000人均各种津贴(国有+集体)13.27324.3472266.000均从工作单位得到的其
本文标题:SPSS操作方法:判别分析例题95239
链接地址:https://www.777doc.com/doc-7454962 .html