您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 管理学资料 > spss描述性统计分析
SPSS19(中文版)统计分析实用教程电子工业出版社1第四章描述性统计分析SPSS19(中文版)统计分析实用教程电子工业出版社2主要内容4.1基本描述性统计量的定义及计算4.2频数分析4.3描述性分析4.4探索性分析4.5交叉列联表分析4.6多选项分析4.1基本描述性统计量的定义及计算SPSS19(中文版)统计分析实用教程电子工业出版社34.1基本描述性统计量简介4.1.1描述集中趋势的统计量1.均值(Mean)2.众数(Mode)3.中位数(Median)4.总和(Sum)5.百分位数(PercentileValue)SPSS19(中文版)统计分析实用教程电子工业出版社44.1基本描述性统计量的定义及计算4.1.2描述离散程度的统计量1.样本方差(Variance)2.样本标准差(Std.deviation)3.极差(Range)4.均值标准误差(StandardErrorofMean)SPSS19(中文版)统计分析实用教程电子工业出版社54.1基本描述性统计量的定义及计算4.1.3描述总体分布形态的统计量1.偏度(Skewness):是描述取值分布形态对称性的统计量;偏度系数大于0,表示其数据分布形态有一条长尾拖在右边,称为右偏或正偏,偏度系数小于0,表示其数据分布形态有一条长尾拖在左边,称为左偏或负偏。偏度系数的绝对值越大,与正态分布相比越偏斜。2.峰度(Kurtosis):是描述变量取值分布形态陡缓的统计量;峰度系数等于0,表明数据分布的陡峭程度与正态分布相同。峰度系数大于0时为尖峰分布,表明数据分布的陡峭程度比正态分布大,峰度系数小于0时为平峰分布,表明数据分布的陡峭程度比正态分布小。SPSS19(中文版)统计分析实用教程电子工业出版社64.1基本描述性统计量的定义及计算4.1.3描述总体分布形态的统计量来自于正态总体的偏度及峰度均近似为0,可以利用偏度和峰度的值是否接近0作为检验是否是正态分布的重要依据。SPSS19(中文版)统计分析实用教程电子工业出版社7主要内容4.1基本描述性统计量的定义及计算4.3描述性分析4.4探索性分析4.5交叉列联表分析4.6多选项分析4.2频数分析SPSS19(中文版)统计分析实用教程电子工业出版社84.2频率分析4.2.1基本概念及统计原理频率就是一个变量在各个变量值上取值的个案数,分析时不考虑其实际取值。基本统计分析往往从频率分析开始。通过频率分析能够了解变量取值的状况,对把握数据的分布特征是非常有用的。例如,调查消费者拥有数码产品的数量,首先分析受访者的总人数、家庭收入情况、受教育程度、性别等,获取样本是否具有总体代表性、抽样是否存在系统偏差等信息。这些可以通过频率分析来实现,经过频率分析可以得到如下结果:(1)频率分布表:该表中包含频率、各频率占总样本数的百分比、有效百分比、累计百分比。(2)统计图:用统计图形展示变量的取值状况,频率分析中提供的统计图形可以是条形图、饼图或者直方图。SPSS19(中文版)统计分析实用教程电子工业出版社94.2频率分析4.2.2SPSS实例分析【例4-1】以下是调查问卷中针对被调查人设置的两个问题:1、您的家庭月收入大约是:(请包括所有工资、奖金、津贴等在内,以人民币为单位)单选500-1000……..11000-1999……22000-2999……33000-3999……44000-4999……55000-5999……66000-6999……77000-7999……88000-8999……99000-9999……1010000及以上…112、您的教育程度:(指您受过的最高或正在接受的教育程度)单选没有受过正式教育/小学……….1初中……………………..………2高中/中专/技校………………..3大专/大学非本科/高职高专……4大学本科……………………….5研究生及以上…………………..6从问卷中收集到的数据如表4.1所示,试对收集到的数据进行频数分析SPSS19(中文版)统计分析实用教程电子工业出版社104.2频率分析第1步数据组织:根据表4.1生成SPSS数据文件,建2个变量:“收入”、“教育”,度量标准均为序号。第2步频率分析设置:选择菜单:“分析→描述统计→频率”,打开“频率(F)”对话框,将“教育”和“收入”加入到“变量”列表框中。打开“统计量”对话框,选中“百分位数”“众数”,并在“百分位数”中添加30.0、60.0、90.0;打开“图表”对话框,选中“直方图”及后面的复选框家庭月收入受教育程度3515251515……6410545表4.1SPSS19(中文版)统计分析实用教程电子工业出版社114.2频率分析第3步主要结果及分析:统计量表变量“教育”的频率分布表统计量教育收入N有效835836缺失10众数53百分位数304.003.00605.004.00905.007.00表中分别显示两个分析变量“教育”及“收入”的有效个案数、缺失值个数、及两个分析变量的“众数”及对应于30%、60%及90%的百分位数。教育频率百分比有效百分比累积百分比有效181.01.01.02394.74.75.6311413.613.719.3416519.719.839.0545654.554.693.76536.36.3100.0合计83599.9100.0缺失系统1.1合计836100.0表中显示了变量“教育”在各个取值上出现的次数(频率)、其频率占所有个案中的百分比、有效百分比及累积百分比。SPSS19(中文版)统计分析实用教程电子工业出版社124.2频数分析变量“收入”的频率分布表收入频率百分比有效百分比累积百分比有效02.2.2.218710.410.410.6215218.218.228.8315718.818.847.6413716.416.464.058810.510.574.568510.210.284.77526.26.290.98273.23.294.1991.11.195.21081.01.096.211323.83.8100.0合计836100.0100.0表中显示了变量“收入”在各个取值上出现的次数(频率)、其频率占所有个案中的百分比、有效百分比及累积百分比。SPSS19(中文版)统计分析实用教程电子工业出版社134.2频数分析变量“教育”的直方图变量“收入”的直方图表中显示了变量“教育”的直方图,从图上可以看出受访者教育程度同正态分布相比左偏,不具备明显的正态分布。表中显示了变量“收入”的直方图,从图上可以看出受访者家庭收入同正态分布相比右偏,不具备明显的正态分布。SPSS19(中文版)统计分析实用教程电子工业出版社14主要内容4.1基本描述性统计量的定义及计算4.2频数分析4.4探索性分析4.5交叉列联表分析4.6多选项分析4.3描述性分析SPSS19(中文版)统计分析实用教程电子工业出版社154.3描述性分析4.3.1基本概念及统计原理描述性分析主要用于输出变量的各类描述性统计量的值,通过上一节的学习可知,频率分析同样可以做到,都是以计算数值型单变量的统计量为主。描述性统计分析没有图形功能,也不能生成频率表,但描述性分析可以将原始数据标准化为Z分数,并以变量形式存入数据文件中,以便后续分析时应用。SPSS19(中文版)统计分析实用教程电子工业出版社164.3描述性分析4.3.2实例分析【例4-2】图3-38是5岁儿童体重、身高、胸围的部分SPSS数据,试对儿童身高作描述性统计分析。(数据文件:data3-8.sav)第1步打开数据文件data4-2.sav;第2步描述性分析设置:选择菜单“分析→描述统计→描述”,打开“描述性”主对话框,将要分析的变量“身高”加入“变量”列表框中。打开“描述:选项”对话框,选中“均值”、“标准差”、“最小值”、“最大值”、“峰度”、“偏度”及显示顺序的“变量列表”等选项。SPSS19(中文版)统计分析实用教程电子工业出版社174.3描述性分析第3步运行结果及分析:描述性分析结果表描述统计量N极小值极大值均值标准差偏度峰度统计量统计量统计量统计量统计量统计量标准误统计量标准误身高9699.3125.0109.8915.9633.350.246-.446.488有效的N(列表状态)96表中分析变量“身高”的个案数、所有个案中的极大值、极小值、均值、标准差及偏度和峰度SPSS19(中文版)统计分析实用教程电子工业出版社18主要内容4.1基本描述性统计量的定义及计算4.2频数分析4.3描述性分析4.5交叉列联表分析4.6多选项分析4.4探索性分析SPSS19(中文版)统计分析实用教程电子工业出版社194.4探索性分析4.4.1基本概念及统计原理与前面介绍的两种分析方法相比,探索性分析更加强大,它是一种在对资料的性质、分布特点等完全不清楚的情况下,对变量进行更深入研究的描述性统计方法。在进行统计分析前,通常需要寻求和确定适合所研究的问题的统计方法,SPSS提供的探索性分析是解决此类问题的有效办法。探索性分析提供了很多关于数据的概括分析和图表直观描述的方法,不仅对个案数据有效,而且还可以针对分组个案。在输出常用描述性统计量的基础之上,探索性分析增加了有关数据详细分布特征的文字与图形表述,如茎叶图、箱图等,显得更加详细、完整,还可以以方差齐性为目的的变量交换提供线索,有助于用户制定更进一步分析的方案。SPSS19(中文版)统计分析实用教程电子工业出版社204.4探索性分析4.4.2实例分析【例4-3】下表是某班3门课程对应成绩的统计数据,试对其作探索性分析并做是否服从正态分布的检验。第1步数据组织:定义2个变量,分别为:“科目”、“成绩”,“科目”的度量标准为“名义”,“成绩”的度量标准为“度量”。第2步探索分析设置:选择菜单“分析→描述统计→探索”,打开“探索”对话框,,将“成绩”字段移入“因变量列表”,“科目”移入“因子列表”。科目111111222成绩837473306095731116科目222333333成绩755619859111553256SPSS19(中文版)统计分析实用教程电子工业出版社214.4探索性分析打开“统计量”对话框,选中“描述性”及“M-估计量”选项;打开“探索:图”对话框,选中“按因子水平分组”、“茎叶图”、“带检验的正态图”等选项。打开“探索:选项”,选中“按列表排除个案”选项。第3步运行结果及分析:“成绩”按科目分组的案例处理摘要表案例处理摘要科目案例有效缺失合计N百分比N百分比N百分比成绩语文6100.0%0.0%6100.0%数学6100.0%0.0%6100.0%英语6100.0%0.0%6100.0%表中显示“成绩”按“科目”分组后各组的有效个案数、个案缺失数及缺失比例等。SPSS19(中文版)统计分析实用教程电子工业出版社224.4探索性分析描述性统计量表表中显示“成绩”按“科目”分组后各分组的描述性统计量,左表中只显示的是”语文“分组的均值、均值的95%置信区间的上下限、中值、方差、标准差、极大/小值、偏度、峰度等。描述科目统计量标准误成绩语文均值69.179.156均值的95%置信区间下限45.63上限92.705%修整均值69.91中值73.50方差502.967标准差22.427极小值30极大值95范围65四分位距34偏度-1.085.845峰度1.6171.741SPSS19(中文版)统计分析实用教程电子工业出版社234.4探索性分析M均值估计量表中提供了四种估计方法,每种估计方法的加权量在表下方给出,对于有异常值或极端值的数据,M均值估计有很好的稳定性,用M估计值代替均值或中位数,结果更准确。根据样本值的权重不同,可以得到不同的估计量M-估计器科目Huber的M-估计器aTukey的双权重bHampel的M-估计器cAndrews波d成绩语文72.5475.7872.8876.05数学41.4241.1341.6741.13英语56.6855.6055.0055.60a.加权常量为1.339。b
本文标题:spss描述性统计分析
链接地址:https://www.777doc.com/doc-4044104 .html