您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 管理学资料 > 2012-3-27+28应用统计学与SPSS统计软件的运用
应用统计学与SPSS统计软件的运用主讲人:郑康宁班级:旅游1001-1003,人力1001-1006课程邮箱:spss2012c@163.com邮箱密码:bf123456上课时间:2012年3月27~28日第三章样本数据特征的初步分析•3.1样本数据结构的基本特征:频次与频率•3.1.1频次与频率的基本概念•同一个数据(样本值)出现的次数(频次)。•如果样本数据集合中的数据总个数是n,那么,某个样本值出现的频率,可以表示为:3.1样本数据结构的基本特征:频次与频率3.1样本数据结构的基本特征:频次与频率•3.1.2观察样本数据基本特征(频次与频率)的图形方法•1、表示频次与频率的饼图(PieChart)•2、表示频次与频率的条形图3.1样本数据结构的基本特征:频次与频率•3.1.3样本数据的基本特征的延伸:累积频率3.1样本数据结构的基本特征:频次与频率•3.1.3样本数据的基本特征的延伸:累积频率3.1样本数据结构的基本特征:频次与频率3.2观察刻度级样本数据结构的茎叶图与直方图方法•3.2.1茎叶图的概念与做法•1、茎叶图的基本概念与适用范围•茎-叶的基本含义是,按照某个一致的规则,把所有的样本值分成“茎节”和“叶”两个部分。“茎节”在左,“叶”在右。“茎节”、“叶”之间,用小数点隔开。•例如,845,8是“茎节”,45是“叶”,其表达方式是“茎节.叶”——“8.45”。•例如,845,84是“茎节”,5是“叶”,其表达方式是“茎节.叶”——“84.5”。3.2观察刻度级样本数据结构的茎叶图与直方图方法•适用于刻度级数据:•刻度级数据(比率级数据和间距级数据)•顺序级数据•作用:展示刻度级数据的频率结构3.2观察刻度级样本数据结构的茎叶图与直方图方法3.2观察刻度级样本数据结构的茎叶图与直方图方法•茎节的宽度:茎节的宽度“10”.•茎节的长度:每个茎节所允许覆盖的“叶”的数字范围的“最大值-最小值+1”.•左图茎节的长度“9-0+1”•右图茎节的长度“4-0+1”3.2观察刻度级样本数据结构的茎叶图与直方图方法•3.2.2直方图的概念与作法•1、直方图的基本概念•直方图法是从总体中随机抽取样本,将从样本中获得的数据进行整理后,用一系列等宽的矩形来表示数据。宽度表示数据范围的间隔,高度表示在给定间隔内的数据的数目,变化的高度表示数据分布的情况。通过对数据分布形态与相对位置的研究,可以掌握过程的波动情况。3.2观察刻度级样本数据结构的茎叶图与直方图方法•2、直方图的作图步骤•某班男生身高为例3.2观察刻度级样本数据结构的茎叶图与直方图方法•直方图的作图步骤如下:•第一步,收集数据。•第二步,确定分组的组数和组距。•例3.2.1,教材783.2观察刻度级样本数据结构的茎叶图与直方图方法•注意:分组时,若组数取得太多,每组内出现的数据个数很少,甚至为零,作出的直方图过于分散或呈现锯齿状;若组数取得很少,则数据会集中在少数组中,而掩盖了数据的差异。所以分组组数取得太多或太少都不合适。3.2观察刻度级样本数据结构的茎叶图与直方图方法•第三步,确定各组界限。第一组的上下界限为(数据中最小值)±(区间长度/2),第一组的上限就是第二组的下限,第二组的上限为第二组下限加上(区间长度),其它以此类推。•第一组为16±0.5/2,第二组为(16±0.5/2)+0.5.3.2观察刻度级样本数据结构的茎叶图与直方图方法•第四步,制作频数分布表。各组频数填好后检查一下其总数是否与数据总数相符,避免重复或遗漏。•第五步,画直方图。•以横坐标表示质量特性,纵坐标为频数,在横轴上标明各组距为底,频数为高,画出一系列的直方柱,就成了直方图。3.2观察刻度级样本数据结构的茎叶图与直方图方法•条形图与直方图:•条形图不对数据进行分组•直方图需要对数据进行分组3.3样本数据的位置特征:对数据中心的描述•3.3.1样本众数•定义1:样本数据出现频次最高的那个样本值,称为样本众数。在一般情况下,“样本众数”被简称为“众数”。•如果样本数据集合中“频次最高的样本值”只有一个,则称此样本值为单一众数,简称为众数。当样本数据集合中,有多个“频次最高的样本值”时,则这些样本值就都是该数据集合的众数。此时的众数,称为“复众数”。•广义上说,众数的概念适用于所有测度级别的样本数据,但对于初步表达样本数据集合的“中心”位置而言,序次级以上的数据集合的众数,更有效一些。3.3样本数据的位置特征:对数据中心的描述•定义2:对于刻度级的样本数据集合,在对数据的等区间分组的直方图中,最高的矩形所示的数据区间,称为该数据集合的众数区间,简称为众数。众数区间也有单一众数与复众数之分。3.3样本数据的位置特征:对数据中心的描述•3.3.2样本的中位数•将一组数据按大小顺序排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数。3.3样本数据的位置特征:对数据中心的描述3.3样本数据的位置特征:对数据中心的描述•注意•当样本容量为奇数时,样本中位数适用于顺序级以上的样本数据集合。•当样本容量为偶数时,样本中位数仅适用于刻度级以上的样本数据集合。3.3样本数据的位置特征:对数据中心的描述•3.3.3样本均值•仅适用于刻度级别的数据(比率级数据和间距级数据)3.4样本数据的离散特征•3.4.1对样本数据离散特征的点状描述:极值、四分点与百分位点•1、极大值与极小值•将样本数据从大到小进行排列,位于序列第一的数据是极小值,位于序列最后一个的数据为极大值。3.4样本数据的离散特征•2、下四分点和上四分点•通过四分位数基本能看出整个样本数据的分布情况,左偏,右偏,对称?•下四分点把排序后的样本数据集合分成了左右两部分,使左边部分包含25%的样本总个数,右边部分包含75%的样本总个数。•上四分点把排序后的样本数据集合分成了左右两部分,使左边部分包含75%的样本总个数,右边部分包含25%的样本总个数。•上、下四分点在一定意义上反映了样本数据的离散情况。3.4样本数据的离散特征3.4样本数据的离散特征3.4样本数据的离散特征3.4样本数据的离散特征•3、上下百分位点•下十分点把排序后的样本数据集合分成了左右两部分,使左边部分包含10%的样本总个数,右边部分包含90%的样本总个数。•上十分点把排序后的样本数据集合分成了左右两部分,使左边部分包含90%的样本总个数,右边部分包含10%的样本总个数。3.4样本数据的离散特征•3.4.2对样本数据离散特征的区间描述:极差、四分位距与离差3.4样本数据的离散特征3.4样本数据的离散特征•3.4.3离散状况的统计描述1:样本方差3.4样本数据的离散特征•3.4.3离散状况的统计描述2:变异系数•标准差包括了度量单位的影响,只有剔除度量单位的影响后,标准差之间的比较才有意义。3.5样本数据特征的综合表达:箱形图•3.5.1箱形图的基本构造•箱形图由一个矩形和向外延伸的细线组成,箱形图的结构示意图。•适用于刻度级数据3.5样本数据特征的综合表达:箱形图•3.5.2修正的箱形图•修正的箱形图结构示意图本节课重点提示•茎叶图与直方图的适用范围及做法。•样本的众数、中位数和均值。•对数据离散特征的描述•箱型图的做法。课堂作业•简答:•什么是数据集合的众数?•什么是单一众数?什么是复合众数?
本文标题:2012-3-27+28应用统计学与SPSS统计软件的运用
链接地址:https://www.777doc.com/doc-3025193 .html