您好,欢迎访问三七文档
统计整理•第一节统计整理概述•第二节统计分组•第三节统计分布•第四节统计表•自我测试题三本章教学目标•了解统计整理的概念;•掌握统计整理的内容和步骤;•理解统计分组的含义、作用及原则;•掌握统计分组的方法;•掌握统计分布的编制与表示方法;•掌握统计表的概念、分类与编制规则。本章导入•如何清晰表示这些数字呢?•经过统计调查收集数据以后,接下来的工作就是对这些数据资料进行加工处理,使其能够清晰而准确地满足统计分析的需要。•例如,下面是某班30名学生的年龄(单位:岁)。•222121201921222321192020192221•212120192322202222231919202122•上述数据是我们通过对某班学生进行普查得到的原始资料,这些数据零散而且杂乱无章,无法揭示研究对象的分布特征和规律性。如何表示这些数字才会使其清晰呢?•为了概括以上的数据,统计学会经常使用一些图表,通过图表对这些数据进行归类整理。如何整理这些数据,如何编制图表来显示这些数据的分布特征就是本章所要讲述的内容。第一节统计整理概述•一、统计数据整理的含义•二、统计整理的内容和步骤本节教学目标•了解统计整理的概念;•掌握统计整理的内容和步骤;一、统计数据整理的含义统计整理是指根据统计研究目的,对统计调查所搜集到的各种原始资料进行科学的加工,使之条理化、系统化的工作过程。设计和编制统计整理方案对统计资料进行审核和审查对统计资料进行科学的分组和汇总编制统计表与绘制统计图二、统计整理的内容和步骤1.设计和编制统计整理方案•统计整理方法是指导整个工作的基本文件,在方案中应明确规定各种统计分组及统计指标的设置。整理方案与调查方案应该紧密衔接。整理方案中的指标体系与调查项目要基本保持一致。整理方案是否科学对于统计整理乃至统计分析的质量都是至关重要的。2.对调查资料进行审核和审查•在汇总资料之前,必须对搜集的数据进行审查,可以分为对原始数据资料的审核和对第二手数据资料的审查。(1)对原始数据资料的审核。•对原始数据资料进行审核,主要检查数据的完整性和准确性。完整性审核,即检查被调查的单位有没有遗漏,应调查的项目或指标是否填写完整,是否按照规定的份数、时间呈报。准确性审核,即检查原始数据是否真实、可靠,计算是否有错误等。准确性审核具体的方法如下。•第一,逻辑审查。它是利用逻辑理论来检查数据之间或指标之间有无矛盾。例如,人口普查时,16周岁以下的少年儿童,不应有婚姻状况。如果出现已婚,显然在逻辑上是不可能的,要进一步进行查实、更正。•第二,比较审查。它是对指标之间进行数据比较来审查。例如,在对某高校学生进行调查时,不应出现班级数比学生数还大的情况;在对企业的情况进行调查时,不能出现企业固定资产原值小于企业固定资产净值的情况等。凡是诸如此类的问题,必须进行核实,及时修改。•第三,设疑审查。它是根据指标之间存在一定的量值范围与比例关系,设置疑问框,审查数据有无疑问。一般来说,疑问框的设计必须由对数据资料情况十分熟悉的人负责,不是随意设置的。例如,规定现价工业总产值与销售收入的比值在0.7~1.5之间,那么,小于0.7或大于1.5的比值均为“疑问”值。(2)对次级资料的审查。•次级资料就是通过间接渠道获得的数据资料。对其的检查主要从以下两个方面着手。•第一,甄别现有资料。对现有的资料进行分类,明确哪些是目前可用的,哪些是目前不可用的;哪些资料是需要进行加工,那些资料是不需要进行加工的;哪些资料存在虚假信息;哪些资料包括的范围不够全面,等等。•第二,评价现有资料。在甄别的基础上,对现有资料进行评价分析。确定现有资料需要进行怎样的加工处理就可以满足我们的要求。3.科学的统计分组与汇总•统计分组是统计整理的一个重要环节,采用一定的组织形式与适当的方法,根据调查资料的性质与特点,对原始数据资料进行科学的分组,然后对分组的资料进行必要的汇总和计算,使其能够反映出统计总体的特征。4.编制统计表与绘制统计图•将统计整理和汇总的结果用统计表和统计图的形式反映出来,清晰地、简明扼要地表达统计总体的特征,同时还可以积累资料,以备分析之用。第二节统计分组•一、统计分组的概念•二、统计分组的作用•三、统计分组的原则•四、统计分组的方法•五、统计分组体系本节教学目标•理解统计分组的含义、作用及原则;•掌握统计分组的方法;统计分组是指根据客观现象的特点和统计研究的目的要求,按照一定的标志把总体划分为若干不同性质的组或类型。一、统计分组的概念我国城镇居民家庭人均消费支出构成表按商品分类分组比重(%)食品类衣着类家庭设备用品类文化娱乐用品类交通通讯类医疗保健类居住类杂项商品类40.64.77.511.610.84.714.45.7合计100我国三大产业从业人员构成表产业1995年人员比重(%)1996年人员比重(%)1997年人员比重(%)1998年人员比重(%)1999年人员比重(%)第一产业第二产业第三产业52.223.024.850.523.526.049.923.726.449.823.526.750.123.026.9某地商店按销售额分组的流通费用水平统计表按销售额分组(万元)商店数(个)各组商品流通费用率(%)200以下200-400400-800800-10001000以上2570130754011.210.49.906.705.90二、统计分组的作用●区分社会经济现象的不同类型●反映现象总体的内部结构●分析现象之间的相互依存关系⑴区分社会经济现象的不同类型按商品类别分组零售额(元)构成(%)食品类3055.1740.6衣着类353.234.7家庭设备用品及服务类564.567.5文化娱乐用品类873.0611.6交通通讯类811.8810.8医疗保健类356.274.7居住类1082.8214.4杂项商品类420.825.7合计7517.81100.00⑵反映现象总体的内部结构年份农副产品农副产品加工品工矿产品合计195057.533.29.3100196042.342.326.7100197037.737.725.6100198029.529.551.8100198526.926.955.6100199029.229.257.8100199526.226.266.5100199925.125.169.7100资料来源:《中国对外经济贸易年鉴(1988)》第357页(一)按分组标志的多少划分简单分组三、统计分组的类型某校学生按性别男生女生平行分组体系性别年龄(岁)民族男女18—2021—2324—26汉族少数民族750680400810220140327某校学生男生女生复合分组汉族少数民族汉族少数民族按性别按民族按民族复合分组体系性别男生女生民族汉族少数民族汉族少数民族年龄(岁)182021232426182021232426182021232426182021232426人数(人)10451112049228928396372(二)按分组标志的性质划分品质分组(属性分组)人口按性别男女数量分组(变量分组)人口按年龄6岁以下7—17岁18—59岁60岁以上四、统计分组的原则完整性(穷尽)原则互斥原则五、统计分组的方法1按品质标志分组2按数量标志分组要符合统计研究的目的和要求要选择最本质或最主要的标志作为分组依据要考虑到客观现象所处的具体历史条件分组标志的选择第三节统计分布•一、统计分布的概念•二、统计分布的编制过程•三、组距式变量数列编制的基本概念•四、统计分布的表示方法本节教学目标•掌握统计分布的编制与表示方法;一、统计分布的概念•在统计分组的基础上,将总体的所有单位按组进行归并排列,形成总体中各个单位在各组间的分布,称为统计分布,也称为次数分布。•统计分布的实质是把总体的全部单位按某标志所分的组进行分配所形成的数列,因此又称为分配数列。•统计分布包括两个要素:总体按某标志所分的组和各组的单位数(简称次数),即分配数列有两个组成要求:一个是分组;另一个是次数。分配数列的基本形式(见图3-3)在分配数列中,次数有两种表示方法:频数(次数)和频率。分布在各个组的总体单位数叫作频数,频数的大小决定着该组标志值在总体标志值中的地位大小。将各组频数与总频数进行对比叫作比重或频率。分配数列的种类(一)按分组标志的性质不同:品质分配数列,变量分配数列。(二)品质分配数列:简称品质数列,按品质标志分组形成的分配数列。(三)变量分配数列:简称变量数列,按数量标志分组形成的分配数列。品质数列变量数列分配数列组距数列单项数列等距数列异距数列分配数列某校学生性别构成性别人数(人)比重(%)男女25053032.167.9合计780100.0某村农户按子女数分组品质数列单变量数列子女数户数比率%0123109060405453020合计200100组别次数频率组别次数频率【例】分配数列累计次数•向上累计次数,是将各组次数由最小组向最大组累计,各项累计数表明各组上限以下的总次数。•向下累计次率,是将各组次数由最大组向最小组累计,各项累计数表明各组下限以上的总次数。某班学生统计学考分次数分布表成绩(分)频数(人)频率(%)向上累计向下累计频数(人)频率(%)频数(人)频率(%)60以下60-7070-8080-9090-10027121185.017.530.027.520.0292132405.022.552.580.0100.0403831198100.095.077.547.520.0合计40100.0————结果表明:该班80分以下有21人,占52.5%;80分以上有19人,占47.5%。二、统计分布的编制过程•【例3.2】某工厂有100名工人,某一天每个工人生产的零件件数如下(单位:件)。•420420420420450450480480480480•540540540540540540540540540540•540540540540540540540540580580•520520520520530500500500500500•510510520520520500510510500500•530530530540620620620620720720•720720630630630630620620620620•650650650650650650650650650650•580580580580580580580580580580•580580580580580650650620630630•第一,若将上述资料编制成单项式变量数列,步骤如下。•(1)将所有变量按照由小到大或由大到小的顺序排列。•(2)分别汇总出每一个变量值所对应的工人数。结果见表3-9。•第二,若将上述资料编制成组距式变量数列,步骤如下。•(1)按工人完成的零件个数分组。•(2)汇总出每组包含的工人数。•(3)将每一组按照从小到大的顺序加以排列。•结果见表3-10。•若将上述资料编制成累积分布数列,可将表3-10中各组工人数逐一由低向高累积(称为向上累积或高位制累积)或由高向低累积(称为向下累积或低位制累积)。结果见表3-11。由【例3.2】我们可以大概总结出统计分布(亦即分配数列)的编制过程。•1.将原始资料按其数值大小重新排列•只有把统计得到的原始资料按其数值大小重新排列顺序,才能较为清楚地看出变量分布的集中趋势和特点,为确定全距、组距和组数做准备。•2.确定全距•全距是变量值中最大值和最小值之差。确定全距主要是确定变量值的变动范围和变动幅度。如果是变动幅度不大的离散变量,即可编制单项式变量数列,如果是变动幅度较大的离散变量或者是连续变量,就可以考虑编制组距式变量数列。•3.确定组距和组数•前面已经介绍过组距数列有等距数列和异距数列之分,这应该视研究目的和研究对象的特点而定。组距的大小和组数的多少是互为条件和互相制约的。当全距一定时,组距大,组数就少;组距小,组数就多。在实际应用中,组距应是整数,最好选5或10的整数倍。在等距分组条件下,存在以下关系:组数=全距/组距•4.确定组限•组限要根据变量
本文标题:统计整理
链接地址:https://www.777doc.com/doc-3142905 .html