您好,欢迎访问三七文档
第三章统计整理第一节统计整理的基本问题统计整理的意义统计整理是统计工作的第二阶段。它是根据统计研究的任务,对统计调查所搜集到的大量原始资料进行加工汇总,使其系统化、条理化、科学化,以得出反映事物总体综合特征的资料的工作过程。整理的内容整理要依据事先拟定的整理纲要要求的项目确定。整理纲要的内容包括一整套空白的综合表和编制说明。综合表的基本内容包括两部分:一部分是分组,一部分是相应的统计指标。总产值增加值销售成本管理费用利润总额利税总额国企225107381.518074.72122.3493.62573.5集体3794808.22754.2201.69100.37244.46股份2626630.21999.9191.56169.37322.61外商3298.4585.72404.3196.23221.39397.25港澳台1942.6430.81445.590.55106.22188.05其他102.8464.894.2215.9-2.96-1.55全国大中型工业企业主要经济指标(1996)(万元)第二节统计分组一、统计分组的意义统计分组就是根据统计研究的需要,将统计总体按照一定的标志区分为若干个组成部分的一种统计方法。保持各组内统计资料的一致性与组和组之间资料的差异性。统计分组的作用统计分组基本作用有以下三方面:(一)划分现象的类型(二)揭示现象内部结构(三)分析现象之间的依存关系三、分组标志的选择分组标志是统计分组的依据。正确选择分组标志,须考虑以下三点:(一)根据研究问题的目的来选择。(二)要选择最能反映被研究对象本质特征的标志作为分组标志。(三)要结合现象所处的具体历史条件或经济条件来选择。分组标志也有品质标志与数量标志两种。品质标志一般不能用数量表示,它表明事物的质量属性,有的比较简单,有的则比较复杂。数量标志一般是用数量表示的,按数量标志进行分组,可有两种情况:不同标志值较少,可作成单项式分组;数值较多,变动范围较大,则应作组距式分组。品质标志分组——反映事物属性差异-单项式数量分组——运用于变量变动幅度小、项目少的分组。如:看管机器台数分组(0,1,2,3,4,…)-组距式分组——运用于变量变动幅度大、项目多的分组。如:按月工资(元)分组(600~650,650~700,700~750,…)数量标志分组——反映事物数量差异单项式分组:工人看管设备数(台)工人人数(人)120240315415按计划完成程度分组(%)企业数(个)比重(%)90以下47.4190-100814.29100-1103257.14110以上1221.43合计56100.00某地区工业企业总产值计划完成情况四、简单分组、复合分组和分组体系简单分组又称单一分组,即只按一个标志进行分组。特点是:只能反映现象在某一标志特征方面的差异情况,而不能反映现象在其他标志方面的差异。复合分组是按两个或两个以上标志进行层叠分组。特点是:第一,对总体选择两个或两个以上标志进行层叠分组,可以从几个不同角度了解总体内部的差别和关系,因而比简单分组能更全面、更深入地研究问题;第二,复合分组的组数随着分组标志的增加而成倍地增加。第三节分配数列(次数分布)月工资分组(元)工人数(人)占总数比重(%)1000以下21039.61000-150018735.31500以上13325.1合计530100.0组别(变量)次数(频数)频率(比率)一、分配数列的概念和种类在统计分组的基础上,将总体的所有单位按组归类整理,并按一定顺序排列,形成总体中各个单位在各组间的分布,称为次数分配和分配数列。分布在各组的个体单位数叫次数,又称频数;各组次数与总次数之比叫比率,又称频率。按品质标志分组成为品质数列。按数量标志分组形成为变量数列。单项式分组:工人看管设备数(台)工人人数(人)120240315415组距式分组:月收入(元)家庭数(户)频率%80~100100~120120~140140~160160~180180~200200~220220~24057101386329.2612.9618.5224.0714.8711.115.563.70合计54100.00二组距数列的编制组限组距两端的数值。分为上限和下限。组距某一组的上限和下限的距离,分等距和异距。全距分组数列中最大值的上限与最小值的下限之差。组数全距等距数列的组距R组中值组的上限和下限的中间值。因数列两端组限形式不同分:开口式组距:最低组与最高组不封口。例:成绩60分以下,90分以上。闭口式组距:例40-60分,90-100分。组距=上限-下限(一)确定组距和组数组距某一组的上限和下限的距离,分等距和异距。组距=上限-下限全距分组数列中最大值的上限与最小值的下限之差。组数全距等距数列的组距R斯特奇斯公式(组距公式):数据的个数—lg21.31nnRd斯特奇斯公式(组距公式):例若将考试成绩仅分为不及格与及格两组,则可编成如下组距数列:某班学生统计学考试成绩表考试成绩(分)人数(人)56-60260-10038合计40若把上表改变为如下统计表,则基本上能准确反映总体的分布特征。某班学生统计学考试成绩表(表2-10)考试成绩(分)人数(人)比重(%)50-6025.060-70717.570-801127.580-901230.090-100820.0合计40100.01.等距数列各组组距均相等。如:10—2020—3030—40以上各组组距均为10。这种分组适用于均匀分布的总体。2.异距数列各组组距不一定相等。如:10—2020—5050—6060—70以上分组中,其中第二组与其它各组的组距不同。这种分组适用于资料分布离差较大或者是为了满足特殊的研究目的的需要。(二)等距分组和异距分组1.组限组限就是每一组两端的数值。10—2020—3030—40下限上限确定组限的方法有两种:按连续变量分组和按离散变量分组。职工人数(人)99以下100—199200—299300—399固定资产额(万元)50—6060—7070—8080—90间断式确定组限适用于离散变量重叠式确定组限适用于连续变量上组限不在内(三)组限和组中值2.组中值每组上限与下限之间的中点数值,是各组的假定平均数。组中值=(上限值+下限值)÷2开口组组中值的计算:缺下限:组中值=本组上限—相邻组组距/2缺上限:组中值=本组下限+相邻组组距/2例如产值(万元)50以下50—6060—7070以上第一组组中值:50-(10÷2)=45最后一组组中值:70+(10÷2)=75合理确定组中值例如:第一组:50人以下第二组:50—200人按公式(不合理)组中值2525020050252/500)(组中值应定下限为0例:分配数列的编制1、品质分配数列的编制:只需将品质标志的表现一一排列出来,然后汇总出每一种标志表现出现的次数即可。如下例:100250合计4032208100805020国有企业股份制企业合资企业独资企业比重(%)企业数经济类型2、变量分配数列的编制:其基本步骤为:第一步:将原始资料按数值大小依次排列。第二步:确定变量的类型和分组方法(单项式分组或组距分组)。第三步:确定组数和组距。当组数确定后,组距可计算得到:组距=全距÷组数全距=最大变量值-最小变量值第四步:确定组限。注意:第一组的下限要小于或等于最小变量值,最后一组的上限要大于最大变量值。)第五步:汇总出各组的单位数,计算频率,并编制统计表。注意不同方法确定的组限在汇总单位数时的区别间断式确定组限:汇总各组单位数时,按照“上下限均包括在本组内”的原则汇总。职工人数(人)499以下500—599600—699700—799重叠式确定组限:汇总各组单位数时,按照“上组限不在内”的原则汇总。产值(万元)50—6060—7070—8080—90单位数(个)单位数(个)因为有了“上组限不在内”的原则,实际工作中,对于离散型变量也经常采用重叠式确定组限的方法。三累计次数分布1.次数分布的表示方法⑴表示法——即用统计表来表示次数分布。例考分次数向上累计(上限)向下累计(下限)人数(人)比率(%)人数(人)比率(%)人数(人)比率(%)50-6025.025.040100.060-70717.5922.53895.070-801127.52050.03177.580-901230.03280.02050.090-100820.040100.0820.0合计40100.0----某班统计学考试成绩次数分配向上累计:以下累计次数(上限)——即较小制累计。每一组的累计次数表示小于该组上限(变量)值的次数共有多少。向下累计:以上累计次数(下限)——即较大制累计。每一组的累计次数表示大于该组下限(变量)值的次数共有多少。(一)钟型分布(1)对称分布yxo钟型分布:特征是“两头小,中间大”,即靠近中间的变量值分布的次数多,靠近两端的变量值分布的次数少,其形状宛如一口古钟。次数分布的主要类型(2)偏态分布yxo右偏分布yxo左偏分布(二)U型分布yxoU型分布:特征是靠近中间的变量值分布的次数少,靠近两端的变量值分布的次数多,其形状宛如英文字母U。(三)J型分布yxoJ正型分布yxoJ反型分布J型分布:特征是次数随着变量值的增大而增多或随变量值的增大而减少,其形状宛如英文大写字母J。次数分布的主要类型1、钟型分布(1)对称的钟型分布0204060801009101112131415人数(人)日产量(件)(2)左偏分布020406080100491011121314人数(人)日产量(件)(3)右偏分布02040608010010111213141519人数(人)日产量(件)2、U型分布01020304050婴幼儿青少年中年人老年人死亡率(%)3、J型分布(1)020406080100120需求量价格返回J型分布(2)020406080100供应量价格第四节统计表一、统计表的作用(1)能使大量的统计资料系统化、条理化、因而能更清晰地表述统计资料的内容。(2)利用统计表便于比较各项目(指标)之间的关系,而且也便于计算(如有些计算表比用公式更简易、明了);(3)采用统计表格表述统计资料比用叙述的方法表述统计资料显得紧凑、简明、醒目,使人一目了然;(4)利用统计表易于检查数字的完整性(是否有遗漏)和正确性。二、统计表的结构从内容上看,统计表由主词和宾词两部分组成。主词是统计表所要说明的总体及其分组;宾词是用来说明总体的统计指标。从构成要素看,统计表包括以下三个部分。(1)总标题。就是统计表的总称,简要说明全表的内容,一般都写在表的上端中央。(2)分标题(又叫做标目)。就是指总体名称或分类名称及说明总体的各种项目。分横行标题(横标目)写在表的左方,纵栏标题(纵标目)写在表的上方。(3)纵、横栏组成的本身及表中的数字。例分组总产值(万元)职工人数(人)劳动生产率(元/人)P123大型中型小型合计2003年某月某公司各企业劳动生产率统计表单位____横行标题主词宾词总标题纵栏标题数据资料(指标数值)三、统计表的种类简单表总体未分组分组表总体按一个标志进行分组复合表总体按二个或二个以上标志进行复合分组简单表表2-15某年某公司所属两企业自行车合格品数量表厂别合格品数量(辆)甲厂5000乙厂7000合计12000例复合表表2-16某年某地区工业增加值和职工人数项目增加值(万元)职工人数(人)内资企业大型975013800中型860045000小型420010050外商投资经营企业大型73007500中型520010400小型44004500例四、编制统计表应注意的问题(1)统计表的标题(包括总标题和分标题)应十分简明地概括所要反映的内容。(2)表中主词各行和宾词各栏,一般应按先局部后整体的原则排列,即先列各个项目,后列总体。(3)表中必须注明数字资料的计量单位。(4)表中数字上下位置对齐。(5)统计表的表式,一般是开口式,即表的左右两端不画纵线,表的上下通常用粗线封口。(6)必要时,统计表应加以注解,连同数字的资料来源等一
本文标题:经济统计学第3章
链接地址:https://www.777doc.com/doc-1164327 .html