您好,欢迎访问三七文档
第三章统计资料的整理•第一节统计整理的意义和步骤•第二节统计分组及编制分配数列•第三节统计表•第四节统计图第三章统计资料的整理一.统计整理:指对调查所得原始材料进行科学分组与汇总和对以往的材料进行再加工。统计整理的意义:使搜集到的数据系统化、条理化,便于推断总体只有统计整理正确,才能对社会经济现象的数量描述真实准确第一节统计整理的意义和步骤二、统计整理的步骤1.设计和编制统计整理方案2.对调查资料进行审核(完整性、及时性、完整性)3.对调查资料进行分组、汇总、计算4.对汇总后的调查资料再审核(复计审核、表表审核、表实审核、对照审核)5.编制统计表,绘制统计图第一节统计整理的意义和步骤第二节统计分组及编制分配数列一、统计分组的概念与作用(一)统计分组:根据统计研究的目的和研究对象的特点,将统计总体按照一定的标志区分为若干个组成部分的一种统计方法。---“分组”的双重含义:对总体而言是“分”,将总体分为性质相异的若干部分;对个体而言是“合”,将在某些方面性质相同的个体组合起来。---对同一总体研究的角度不同,可以选择不同的标识进行分组。(二)统计分组的作用:1.经过统计分组整理后,可以发现零星分散统计资料的特点与规律。2.可以划分现象的类型(主要作用)3.可以分析总体内部结构和总体结构特征4.可以揭示现象之间的依存关系第二节统计分组及编制分配数列第二节统计分组及编制分配数列统计分组的关键:1、选择分组标志(核心);2、划分各组界限(一)选择分租标志:分组标志:将统计区分为各个性质不同的组的标准或依据。选择分租标志所遵循的原则:1.根据统计研究的目的与任务选择分组标志2.要从众多标志中,选择最能反映被研究现象本质特征的标志作为分组标志。3.根据现象所处的历史条件或经济条件来选择标志其他原则:穷尽性和互斥性第二节统计分组及编制分配数列(二)划分各族界限的方法:按品质标志分组:选择反映事物属性差异的品质标识为分组标志,分为若干性质不同的组成部分。按数量标志分组:选择反映事物数量差异的品质标识为分组标志,分为若干数量标志值不同的组成部分。根据变量取值范围不同,分组形式可以分为单项式分组(变动范围小、变量个数少的离散变量)和组距式分组(连续变量、取值范围大的离散变量)。第二节统计分组及编制分配数列三、统计分组体系统计分组体系:根据分析的要求,通过对同一总体进行不同分组,形成一系列相互联系、相互补充的体系。1.简单分组和平行分组体系简单分组:总体只按照一个标志分组平行分组体系:对同一个总体选择两个或两个以上的标志分别进行简单分组(彼此独立,不分主次,互不影响)第二节统计分组及编制分配数列2.复合分组和复合分组体系复合分组:对同一总体选择两个或两个以上分组标志层叠起来进行分组复合分组体系:复合分组所形成的分组体系(主次有序)eg.平行分组体系(1)按性别分组:男:女:(2)按居住地分组:城镇人口:乡村人口:复合分组体系城镇人口:男:女:乡村人口:男:女:注:复合分组的组数等于个简单分组组数的连乘积,此处为2×2=4组第二节统计分组及编制分配数列四、分配数列(统计分组的产物、统计整理的结果)(一)分配数列(分布数列或次数分配):在统计分组的基础上,将总体的所有单位按组归类整理,并按一定顺序排列而形成的总体中各个单位在各组间的分布。(二)分配数列的种类及编制:1.品质分配数列2.数量分配数列:单项式分配数列和祖居士分配数列第二节统计分组及编制分配数列单项式分配数列:将每一变量值列为一组而形成的数列。亦即按单项式分组所编制的变量数列。(界限明确,数列稳定)由小到大排列→确定组数和各组变量值→汇总各变量值出现次数,编制单项式数列组距式分配数列:以标志值变动的一定范围作为一组的分组,即组距式分组所形成的变量数列。(难度大)由小到大排列,确定全距→确定组数和组距→确定组限→汇总各组的次数及比重,编制组距式数列为最小变量值为最大变量值,为组数,为全距,为组距,式中minmaxminmax,,XXKRiXXRKRi为标志值项数)(NNnlg322.31全距:全部变量值的最大值和最小值的距离组距:各组上限(最大值)和下限(最小值)之间的距离组数:某个变量数列划分为多少组数量分组的标准:I.事物本身的属性特征II.组数、组距确定的斯特杰斯经验公式等距数列:各组组距都相等第二节统计分组及编制分配数列异距数列:各组组距都不完全相等的数列适用范围:社会经济现象数量变动不均衡,很难用等距办法实现区分事物不同性质的情况分组依据:---按等比组距或者等差组距(0~10kg,10~30kg,30~60kg,60~100kg;0~2m,2~6m,6~14m,14~30m)---按事物性质变化的数量界限第二节统计分组及编制分配数列•组限:圈定一一组标志值变动范围的两个数,即每组两端的标志值(上限和下限)•下开口组:只有上限无下限,一般为最小组•上开口组:只有下限无上限,一般为最大组•确定组限的要求:---组限应是决定事物之间不同性质的数量界限---组限应能正确反映总体内各个单位的实际分布特点第二节统计分组及编制分配数列•组限的形式:–重合式:指相邻两组中,前一组的上限和后一组的下限数值重合。一般用于连续型变量。组距=上限-下限–不重合式:指前一组的上限与后一组的下限,两值紧密相连而不相重复。一般用于离散型变量。组距=下组下限-本组下限,或=本组上限-前组上限第二节统计分组及编制分配数列组中值:各组标志值波动范围的中点值,也就是每组上限和下限之间的中点数值组中值(重合式组限)=(上限+下限)÷2•=下限+邻组组距/2•=上限-邻组组距/2组中值(不重合式组限)=(本组上/下限+下一组上/下限)÷2第二节统计分组及编制分配数列频数:分配数列中分布在各组中的个体单位数比率(频率):各组次数(各组单位数)占总次数(总体单位数)的比重各组次数之和等于总次数,各组频率值和等于1或100%分配数列的基本要素:各组的名称和各组的次数或频率其他要素:累计次数及其频率分布第二节统计分组及编制分配数列---广义的统计表:统计工作各个阶段以纵横交叉的线条所绘制成的用来表现统计资料的表格。---狭义的统计表:专门用以表现经过整理的系统化的统计资料的表格(条理清晰,简明易懂,节约篇幅,便于计算,易于检查)一、统计表的构成1.统计表的基本形式:总标题、横行标题、纵栏标题和指标数值附注说明:资料来源、指标计算方法、填报单位、填表人、填表日期2.统计表的内容:主词和宾词第三节统计表---广义的统计表:统计工作各个阶段以纵横交叉的线条所绘制成的用来表现统计资料的表格。---狭义的统计表:专门用以表现经过整理的系统化的统计资料的表格(条理清晰,简明易懂,节约篇幅,便于计算,易于检查)一、统计表的构成1.统计表的基本形式:总标题、横行标题、纵栏标题和指标数值附注说明:资料来源、指标计算方法、填报单位、填表人、填表日期2.统计表的内容:主词和宾词第三节统计表二、统计表的分类1.简单表:对统计总体未作任何分组,仅按单位名称或时间顺序排列而成的统计表2.分组表:对统计总体按一个标识进行分组而形成的统计表3.复合表:对统计总体按两个或两个以上标识进行层叠分组而形成的三、宾词的设计宾词指标的简单设计宾词指标的复合设计第三节统计表四、编制统计表的要求(科学、实用、简练、美观)(1)标题表述应简明确切,写明所属时间空间范围(2)内容简明扼要且具有系统性(整体性、层次性、逻辑性)(3)主词及宾词格兰德排列,应有一个合理的顺序(先分组后总计)(4)复合分组的格式(5)纵览较多应编栏号(6)“三线表”:上下两端以粗线或双线绘制,两端开口,长宽比例适当(7)文字书写工整、字迹清晰;数字填写整齐,数位对准。(8)数字资料记明数量单位(9)对于特殊说明的统计资料,应在统计表下方加注说明第三节统计表第四节统计图020406080100120一月二月三月四月条形图圆形图一月二月三月四月05010015020002468101214曲线图P71三、计算题1.有20名工人,其看管机器台数如下:54243435434343264425试根据上述资料按看管机器台数编制变量数列,,并计算出各组频率解题思路A、排序22233333444444445556B、确定组数--单项式数列有多少个变量值就有多少组,本例取“5”C、汇总变量值出现的次数2:出现3次3:出现5次4:出现8次5:出现3次6:出现1次D、编制变量数列看管机器台数(台)人数(人)频率(%)2315352548405315615合计20100P71三、计算题2.某企业某工种工人每日生产定额为100件,6月12日50名工人生产某种产品的产量如下:838812311011815812114611710810511010713712015912513612714211810387115141117123126138151101868211311411912613593142108101105125116132138131127125要求:(1)试根据以上资料按工人日产量编制一等距数列(2)计算组距、组中值(3)计算累计次数、累计频率,绘制日产量分布图,指出资料的分布特征,并对工人生产定额完成情况作简要分析解题思路A、排序828386878893101101103105105107108108110110113114115116117117118118119120121123123125125125126126127127131132135136137138138141142142146151158159B、确定组数---全距=159-82=77,本例取组数为4组比较合理,C、确定组距---组距=全距/组数=77÷4=19.25,为方便计算本例取“20”解题思路D、确定组限–离散型变量——上下限都可以用准确的数值表示–考虑要反映总体质的区别,本例取第一组下限为80,分为80~100,100~120,120~140,140~160四组E、计算各组频数、累计次数、累计频率F、绘制日产量分布图,简要分析日产量分配数列日产量(件)人数(人)频率(%)向上累计次数(人)频率(%)80~100612612100~12019382550120~14018364386140~16071450100合计50100向下累计组中值(件)人数(人)次数(人)频率(%)5010090644881108255013029714150750日产量分布图未完成定额的工人为6人,占12%。超额完成任务的工人有44人,占88%。该企业工人生产定额完成情况较好。P71三、计算题3..某厂有两个车间,甲车间有职工150人,其中男性为100人,女性为50人。男职工中高级职称职工为10人,中级职称职工为45人,其余为初级职称及以下。女性职工中高级职称职工为4人,中级职称职工为17人,其余为初级及以下。乙车间共有职工200人,其中男性为145人,女性为55人。男职工中高级职称职工为19人,中级职称职工为56人,其余为初级职称及以下。女性职工中高级职称职工为10人,中级职称职工为15人,其余为初级及以下。要求:根据上述资料编制复合分组表解题思路分组标志:车间、性别、职称单位:人车间合计男小计高级中级初级及以下甲150100104545乙200145195670合计35024529101115女小计高级中级初级及以下504172955101530105143259P71三、计算题4.试根据表3-24的资料,以部门、经济类型、职工人数(分三组)为分组标志编制如下统计表:(1)简单平行分组体系表(2)复合分组表解题思路(1)简单平行分组体系表指标企业数(个)合计50按部门分工业15商业9交通6按经济类型分国有14集体10个体6按职工人数分300人以下7300~500人17500人以上6解题思路(1)复合分组表部门工业企业(个)商业企业(个)交通企业(个)国有300人以下210300~500人232500人以上211集体300人以下
本文标题:第34章统计学原理
链接地址:https://www.777doc.com/doc-2110939 .html