您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 管理学资料 > 讲座4-描述性统计分析
第4讲描述统计主要内容描述性统计分析•频率分析•对数据进行描述的图形化方法和数值方法•学习分析数据分布的方法•应用SPSS进行描述性数据分析的方法•常用统计图形的绘制方法和解释技巧描述性统计和推断性统计统计学分为描述性统计分析和推断性统计分析描述性统计•应用分类、制表、图形以及概括性数据指标来概括数据分布特征的方法。结论不能推及总体。推断性统计•推断性统计分析得到的结论适用于总体。统计量统计分析往往是从了解数据的基本特征开始的。统计上,需要把样本数据所含信息进行概括、融合和抽象,从而得到反映样本数据的综合指标,这些指标称为统计量。描述性统计分析指标统计量可分为两类•一类表示数据的中心位置,例如均值、中位数、众数等•一类表示数据的离散程度,例如方差、标准差、极差等用来衡量个体偏离中心的程度。频率分析频率分析主要通过频率分布表、条形图和直方图,以及集中趋势和离散趋势的各种统计量来描述数据的分布特征频率分析术语频率•对于定性观测值时,把它们按照某种原则分成一些组,每个观测值必须落入一个类并且只能够落入一个类中。对于给定的类,落入这个类的个案数称为频率落入该类中的个案数和个案总数的比例称为相对频率案例数据文件EmployData.sav记录了某公司职工的基本信息,例如性别、民族、出生日期、教育水平、工资水平、工作年限等。教育水平为分类变量,它有11个类别。SPSS频率分析选择【分析】→【描述统计】→【频率】频率分析选项-统计量频率分析选项-图表频率分析的结果解释频率表格条形图、直方图中心趋势的描述均值中位数众数5%截尾均值均值均值即数据的算术平均数,是数据中心趋势的主要度量指标,设变量有n个测量值,则算术均值为:12,,,nxxx12,,,nxxx1niixxn均值的特点最常用的中心位置度量受极端值影响例:1,3,5,7,9和1,3,5,7,14中位数重要的中心位置度量在递增排序后的数据列中•若数据个数为奇数,中位数是正中央的数•若数据个数是偶数,中位数是正中央的两数的平均值.不受极端值的影,例如:1,5,7,3,9众数发生频数最高的数据值不受极端值的影响众数可能不存在可能有多个众数(单峰,双峰,多峰)可用于定量或定性数据5%截尾均值避免了极端值的影响离散趋势假设我们有以下的三组观测值:•观测A:11,12,13,16,16,17,18,21•观测B:14,15,15,15,16,16,16,17•观测C:11,11,11,12,19,20,20,20这三组观测值的均值都是15.5,那么这三组数据是否相似呢?离散趋势离散趋势的描述极差(range)方差(Variance)标准差(S.d.)分位数(Percentage)变异指标极差极差=最大值-最小值受极端值影响较大方差和标准差方差标准差变异系数在比较两组数据离散程度大小时,如果数据的测量尺度相差太大,直接比较二者的标准差并不合适。需要首先消除测量尺度和量纲的影响。变异系数可以剔除这些影响,其计算公式为:分位数第p百分位数•使得至少有p%的数据小于或等于这个值,且使得至少有(100-p)%的数据大于或等于这个值•如何计算?将原数据从小到大排列计算i=(p/100)n若i是整数,则第p百分位数为第i与第i+1项的平均若i不是整数,则向上取整。总结五数最小值、第一个四分位数、中位数、第三个四分位数、最大值从这五个值可以大致看出数据分布的中心和离散程度。而箱图则是这五个数的图形表现分布的形状偏度•当偏度0时,分布为正偏或右偏,布图形在右边拖尾,分布图有很长的右尾,尖峰偏左•当偏度0,分布为负偏或左偏,即分布图形在左边拖尾,分布图有很长的左尾,峰尖偏右•当偏度为0,分布对称峰度峰度3,分布为高峰度,即比正态分布的峰要陡峭;3,分布为低峰度,即比正态分布的峰要平坦些;=0,分布为正态峰。SPSS描述性统计许多菜单均可进行描述性分析,提供描述性统计指标的输出。例如T检验、方差分析、因子分析等SPSS自定义表模块也可以产生大部分的描述性统计指标SPSS中的菜单专门的描述性统计菜单:•描述(D):该过程则进行一般性的统计描述;•探索(E):该过程用于对数据概况不清时的探索性分析;•交叉表(C):该过程完成分类数据的统计描述和一般的统计检验,我们常用的检验也包含在该对话框中。频率菜单打开EmployData.sav【分析】→【描述】→【频率】频率:实例-统计量的选择描述性子菜单探索子菜单【分析】→【描述统计】→【探索】该菜单可以对不同的组分别给出描述性统计量探索:选择统计量探索:图探索:结果解释异常值检测探索统计量界外值图形箱图默认箱身1.5倍为异常用。表示3倍为极端值用*表示数据标识异常个案设定表格表格:摘要统计量设置统计图进行描述性统计分析定性数据条形图•直方图•饼图•帕累托图定量数据•直方图•茎叶图•箱图频率:描述-频率-图表示例:数据文件DisasterReason.sav•条形图•饼图•帕累托图直方图-茎叶图-箱图描述性-探索•直方图•茎叶图•箱图示例:数据EmployData.sav•直方图•茎叶图•箱图从旧对话框作图重新完成上面两个例子中的图形(箱图除外)饼图-帕累托图频率-饼图质量控制-排列图图-图表构建程序图-旧对话框
本文标题:讲座4-描述性统计分析
链接地址:https://www.777doc.com/doc-3207374 .html