您好,欢迎访问三七文档
当前位置:首页 > 行业资料 > 交通运输 > 02第二章 统计调查与整理2
1.意义:第三节统计分组一、统计整理的意义和内容2.内容(P41)绘制图表审核资料分组、分类加工汇总资料积累统计调查统计整理统计分析承前启后二、统计分组的意义和作用(一)统计分组:将统计总体按照某一标志,划分为若干组成部分。例:居民按居住地区可以分为城市和农村;选择分组标志划分各组界限关键:(二)统计分组的作用划分现象类型(P43表2-4)揭示现象内部结构(P43表2-5)分析现象之间的依存关系(P44表2-6)三、分组标志的选择(一)分组标志选择的要求:1、要符合统计研究的目的2、选择最能反映事物本质特征的标志进行分组3、要考虑现象发展的具体历史、经济条件(二)分组标志分类1、品质分组:2、数量分组:思考:下列分组属于那种分组?教师按职称分组;学生按专业分组;职工按工资分组;居民按每月消费额分组。四、简单分组、复合分组和分组体系1.简单分组:每次只按一个标志分组2.复合分组:按两个或以上标志层叠式的分组3.分组体系:采用一系列相互联系、相互补充的标志对现象进行多种分组。复合分组企业职工女职工男职工管理人员技术工人管理人员技术工人简单分组企业职工分组表分组标志组别性别男女岗位技术职工管理人员学历大专以上高中中专、初中以下第四节分配数列一、分配数列的概念和种类1、分配数列:总体中各个单位在各组间的分布,称为次数分配或分配数列。2、频数:分布在各组的总体单位数,也称次数;频率:各组次数与总次数之比3、构成:各组名称(变量值)+各组单位数(次数)变量数列品质数列异距数列等距数列组距数列单值数列•4、分类:分配数列性别人数(人)比重(%)男性女性6004006040合计1000100某公司职工按性别分组表各组名称次数(频数)比率(频率)品质数列示例品质数列示例某公司职工按性别分组表品质数列示例月工资(元)人数(人)所占(%)1000以下1000-15001500-20002000-25002500-30003000以上80150230340150508152334155合计1000100变量数列示例各组名称次数(频数)比率(频率)某公司职工按月工资分组表(一)相关概念1.组距和组数组距(i)=上限-下限全距(R)=最大值-最小值组数:K二、组距数列的编制2.等距分组和异距分组等距数列:各组组距都相等的组距数列组距=全距/组数=R/K异距数列:各组组距不相等的组距数列•组中值的确定•闭口组•组中值=(上限+下限)/2•开口组(XX以上,XX以下)2邻组组距=下限+缺上限的开口组组中值2邻组组距=上限-缺下限的开口组组中值3、组限和组中值组限:组距两端的数值组中值:各组变量范围的中间数值收入(元)组中值(元)1000以下(1)1000-1500(2)1500-2000(3)2000以上(4)组中值的计算1000-(1500-1000)/2=1000-500/2=750(1500+1000)/2=12502000+(2000-1500)/2=2000+500/2=2250(2000+1500)/2=1750假设某车间30个工人的某日生产产品数量(个)如下:10699851218494106105110119101959087105106109118961289197105111111107103101107106根据上面的资料编制工人日产量的变量分配数列。(二)变量分配数列编制的案例第一步,将原始资料排序。即将上述未经整理的日产量的原始数据按从小到大的顺序排列,得到以下数列:84858790919495969799101101103105105105106106106106107107109110111111118119121128第二步,观察数列,可看到30个工人的日产量是有波动的,波动幅度在84到128之间(R=44),确定组距i=10,则组数k=R/i=4.4,k=5.注:1.组距最好为5、10、100或其整数倍;2.组数可根据经验值确定,一般情况下可分5~7组。第四步,绘制次数分布曲线图(直方图、折线图)第三步,划分各组组限,将数据整理成组距数列。注(1)最小组的下限略低于最小变量值,最大组的上限略高于最大变量值;(2)组限最好为5、10、100或其整数倍。(3)连续型变量:相邻组的组限必须重合。某车间工人日产量次数分配表工人日产量(个)工人人数(人)比率(%)90以下31090-100723100-1101343110-120517120以上27合计301008090100110130日产量(个)工人人数(人)81241200某车间工人日产量次数分配曲线图编制小结:1、排序计算全距R;2、结合数据分布情况确定组距i及组数k;3、确定各组组限4、利用Excel数据分析功能完成图表制作工具——数据分析——直方图三、累计次数分布•(一)向上累计:以下累计、较小制累计•(二)向下累计:以上累计、较大制累计四、次数分布的主要类型•(一)钟形分布:“两头小,中间大”•(二)U形分布:“两头大,中间小”•(三)J形分布:次数随变量值的增大而增多(减小)A对称分布B右偏分布C左偏分布U型分布正J型分布反J型分布第五节统计表•一、统计表的作用实例初步核算,2011年东莞市生产总值(GDP)4735.39亿元,比上年增长8.0%。分产业看,第一产业增加值17.71亿元,下降0.4%;第二产业增加值2377.40亿元,增长6.8%;第三产业增加值2340.28亿元,增长9.3%。三大产业比例为0.4:50.2:49.4。东莞市2011年国内生产总值汇总表资料来源:东莞市统计局:2011年东莞市国民经济和社会发展统计公报产业类别绝对数(亿元)增长率(%)比重(%)(甲)(1)(2)(3)第一产业第二产业第三产业17.712377.402340.28-0.46.89.30.450.249.4合计4735.398.0100.0指标数值表脚总标题纵栏标题横行标题•(二)统计表的构成东莞市2011年国内生产总值汇总表资料来源:东莞市统计局:2011年东莞市国民经济和社会发展统计公报产业类别绝对数(亿元)增长率(%)比重(%)(甲)(1)(2)(3)第一产业第二产业第三产业17.712377.402340.28-0.46.89.30.450.249.4合计4735.398.0100.01.标题能准确、简明扼要地反映统计资料的内容。2.纵横栏的排列内容要对应3.统计表格布局合理、大小适当、比例恰当、醒目美观。4.写清计量单位。5.外线粗,内线细,左右不可封口。6.栏目较多可以编号。•三、编制统计表应注意的问题
本文标题:02第二章 统计调查与整理2
链接地址:https://www.777doc.com/doc-4000099 .html