您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 企业财务 > 多媒体课件-统计学-数据的整理图表.
第三章统计整理本章重点与难点1.统计整理的工作内容与程序;2.统计分组的概念、作用,统计分组方法;3.分配数列的概念、构成要素与种类;4.变量数列的编制方法与编制技术;5.统计图表的编制技术及其应用。◆其中,变量数列的编制方法是本章学习中的难点。一、统计整理的概念统计整理——就是按照统计研究的目的和要求,对所搜集的原始资料进行分组、汇总,使资料条理化、系统化的工作过程。对已整理过的初级资料进行再整理,也属于统计整理。统计整理是统计调查的继续,是统计分析的前提和基础,在整个统计工作中,发挥着承上启下的作用。第一节统计整理概述二、统计整理的工作内容1、数据的预处理—对调查得来的材料进行审核;2、数据分组——按照综合表的要求进行分组;——分组是统计整理的关键;3、数据汇总——对各单位的标志值或指标进行汇总或做必要的加工计算;4、编表——将汇总整理的结果编制成统计表;5、存档——做好统计资料的系统积累工作。三、统计整理的工作程序1.制订统计整理方案2.审核调查资料3.对调查资料进行分组、汇总和计算4.整理后的统计数据的再审核5.将整理结果编制成统计表或绘制成统计图第二节统计分组统计分组是根据统计研究的目的,结合研究对象的特点,将统计总体按照一定的标志区分为若干组成部分的统计方法。一、统计分组的概念总体的差异性是统计分组的客观依据;统计分组的目的在于把同质总体中的差异性揭示出来。二、统计分组的作用(1)划分现象的类型——类型分组例表2-4(P43)(2)揭示现象内部结构——结构分组例表2-5(P43)(3)分析现象之间的依存关系——分析分组例表2-6(43)揭露社会经济现象的类型,反映各类型的特点。⑴类型分组类型2000年2001年2002年2003年农业13873.614462.814931.514870.1林业936.5938.81033.51239.9牧业7393.17963.18454.69538.8渔业2712.62815.02971.13137.6合计24915.826179.627390.829691.8例单位:亿元说明社会经济现象的内部结构。⑵结构分组年份2000200120022003第一产业16.415.815.314.6第二产业50.250.150.452.5第三产业33.434.134.333.1合计100.0100.0100.0100.0例我国国内生产总值构成(%)研究经济现象之间的依存关系。⑶分析分组耕作深度分组(cm)地块数平均收获率(斤/亩)10-12740012-141046014-161654016-1818-20125620680例某乡某种农作物的耕作深度与收获率的关系三、统计分组的原则1.组内同质、组间异质原则2.穷尽原则3.互斥原则四、统计分组的种类(1)按分组标志的多少分:对社会经济现象需要从各方面进行观察和分析研究,需要采用一系列相互联系、相互补充的标志对现象进行多种分组,这些分组结合起来构成一个体系,叫做分组体系。简单分组——按一个标志对总体进行分组复合分组——按两个或两个以上标志对同一总体进行分组四、统计分组的种类(2)按分组标志的性质分:品质分组——按品质标志进行的分组。变量分组——按数量标志进行的分组五、统计分组的方法1.品质(标志)分组方法按品质标志分组,即选择反映事物属性差异的品质标志作为分组标志进行分组。2.变量(数量标志)分组的方法变量分组,即选择反映事物数量差异的数量标志进行分组,确定各组在数量上的差别,并通过数量上的变化来区分各组的不同类型和性质差异。包括:单项式分组组距式分组对于组距式分组来说,根据各组组距是否相等,又分为:等距分组——各组组距都相同的变量分组;例表3-13.异距分组——各组组距有差异的变量分组;例3-14.●组距式分组的假定条件——变量在各组内的分布是均匀变化的。●组距式分组的原则——不重复、不遗漏在重叠式分组中一般有“上限不在内”的原则。变量分组的相关概念:组限组距两端的数值。分为上限和下限。组距某一组的上限和下限的距离,分等距和异距。全距分组数列中最大值的上限与最小值的下限之差。组中值组的上限和下限的中间值。按组限的完备程度不同,分:开口式分组:最低组与最高组不封口。例:成绩60分以下,90分以上。闭口式分组:例40-60分,90-100分。组距=上限-下限第三节分配数列一、分配数列的概念和种类统计总体按照某一标志分组以后,用以反映总体各单位在各组的分配情况的统计数列,称分配数列,又可称次数分配,或次数分布。1.概念例月工资分组(元)工人数(人)占总数比重(%)2000以下21039.62000-250018735.32500以上13325.1合计530100.0组别(变量)次数(频数)频率(比率)2.种类一、分配数列的概念和种类以分组标志特征不同分为:品质数列变量数列例某班学生的性别构成情况按性别分组绝对数人数比重(%)男3075女1025合计40100组别次数频率⑴品质数列⑵变量数列单项变量数列(单项数列)——按每个变量值分别列组编制数列,适用于不连续变量或变量能以整数表示,其变动范围不大时。组距变量数列(组距数列)——按组距分组编制数列。适用于连续变量或变量可用小数表示,其变动范围较大时。单项数列见例如下:某厂第二季度工人平均日产量工人平均日产量(件)工人人数(人)210315430540620合计115从另一角度看,变量数列分为:连续变量数列——可有小数,采取组距式。非连续变量数列——整数,采取单项式或组距式(例:一个地区的企业按职工人数分组)。1、整理数据资料,确定全距对于一个杂乱无章的原始资料,把标志值按大小顺序排列后所得的最大值与最小值之差就是全距。2.确定变量数列的形式确定变量数列的形式,也就是确定变量数列是编制单项式数列还是组距式数列。二、变量数列的编制方法3.确定组数和组距•在编制等距数列的情况下,组数、组距和全距存在下列关系:全距组数=组距原则:(1)要尽可能反映出总体单位的分布情况及集中趋势;(2)要尽可能区分出组与组之间性质上的差异。考试成绩(分)人数(人)56-60260-10038合计40例若将考试成绩仅分为不及格与及格两组,则可编成如下组距数列:某班学生统计学考试成绩表若把上表改变为如下统计表,则基本上能准确反映总体的分布特征。某班学生统计学考试成绩表考试成绩(分)人数(人)比重(%)50-6025.060-70717.570-801127.580-901230.090-100820.0合计40100.04.确定组限和组中值⑴关于组限问题当组距组数确定后,只需划分各组数量界限,便可编制组距数列。一般来讲,组限应是决定事物性质的数量界限,具体划分时应注意以下几点:第一,组限确定应当有利于表现各变量值实际分布的规律性。第二,最小组下限要略低于最小变量值,最大组上限要略高于最大变量值。第三,如果变量值相对集中,无特大或特小极端值时,则采用闭口式;反之,如果变量值相对比较分散时,则采用开口式。例已知组距为5,组数为7,最大值39,最小值5,怎样分组?按分法(c)较合适(a)(b)(c)1-53-85-105-108-1310-1510-1513-1815-2015-2018-2320-2520-2523-2825-3025-3028-3330-3530-3533-3835-40上组限不在内适用于越大越好的变量,如产值。适用于越小越好的变量,如成本。下组限不在内对连续变量,组数也要连续。在登记次数时,习惯上遵守:对不连续变量,组与组间是间断的。⑵关于组中值问题闭口式分组的组中值求法:22下限上限下限或组的下限组的上限组中值⑵关于组中值问题开口式分组的组中值求法:1212缺下限的开口组的组中值上限邻组组距缺上限的开口组的组中值下限邻组组距三、累计频数与累计频率向上累计次数(上限)——即较小制累计。每一组的累计次数表示小于该组上限(变量)值的次数共有多少。向下累计次数(下限)——即较大制累计。每一组的累计次数表示大于该组下限(变量)值的次数共有多少。例考分次数向上累计次数(上限)向下累计次数(下限)人数(人)比率(%)人数(人)比率(%)人数(人)比率(%)50-6025.025.040100.060-70717.5922.53895.070-801127.52050.03177.580-901230.03280.02050.090-100820.040100.0820.0合计40100.0----某班统计学考试成绩次数分配四、次数分布的特征1.次数分布的表示方法⑴表示法——即用统计表来表示次数分布。⑵图示法即用统计图来表示次数分布直方图折线图曲线图直方图(或次数分配曲线图)仍以上例考试成绩数据,画成如下直方图:04812考分次数0102030比率(%)405060708090100110若组距不等的话,先计算频数密度,然后据此画直方图:按工人年龄分组(岁)组距人数(人)标准组距人数(人)频数密度=频数/组距15-20517173.420-25528285.625-30540408.030-355707014.035-45106532.56.545-50510102.0合计-230--直方图例010203040506070年龄人数02468101214频数密度10152025303540455055折线图在直方图的基础上连接各条形顶边的中点成折线图。如下图红笔围成的,即为次数分配曲线图:04812考分次数0102030比率(%)405060708090100110折线图还可用来表示累计次数分布(仍以上例数据):累计次数分布折线图0102030405060708090100考分人数0255075100比率(%)曲线图是组数趋向于无限多时折线图的极限描绘,是一种理论曲线。向下累计向上累计2.次数分布的主要类型一般次数分布呈正态分布曲线,或称正态曲线钟型分布YY右偏型(上偏型)左偏型(下偏型)XX很多是偏态分布曲线,或称偏态曲线还有其他形态J型分配曲线U型分配曲线双峰曲线第四节统计表一统计表的结构和内容例分组总产值(万元)职工人数(人)劳动生产率(元/人)P123大型中型小型合计2005年某月某公司各企业劳动生产率统计表单位____横栏标题主词宾词总标题纵栏标题数据资料(指标数值)从形式上看:统计表由总标题、横行标题、纵栏标题、指标数值构成。从内容上看:统计表由主词和宾词两部分构成。主词说明总体或总体的分组。宾词用哪些指标数值来说明总体或总体的分组。二统计表的特点开口式上下有基线编号:主词一般按A、B、C…,宾词按1、2、3…有计量单位表中不允许有空格:若不需要此资料则用“-”;暂缺某资料则用“……”三统计表的分类简单表总体未分组分组表总体按一个标志进行分组复合表总体按二个或二个以上标志进行复合分组某年某公司所属两企业自行车合格品数量表厂别合格品数量(辆)甲厂5000乙厂7000合计12000例某年某地区工业增加值和职工人数项目增加值(万元)职工人数(人)内资企业大型975013800中型860045000小型420010050外商投资经营企业大型73007500中型520010400小型44004500例四统计表的编制原则1.总标题须简明扼要表达出全表的内容;2.各标题要确切反映表的内容,且表格安排合理;3.指标数值要位数对齐,合计或总计一般放在表的尾部;4.对指标内容作必要说明时,可加注在表的下方;5.表的上下边线(基线)用粗实线或双线,表的两边是开口式;6.纵栏较多时编栏号,指标数值栏要注明计量单位和资料表示的时间。总原则:合理、科学、实用、简练、美观。EndofChapter2
本文标题:多媒体课件-统计学-数据的整理图表.
链接地址:https://www.777doc.com/doc-2503973 .html