您好,欢迎访问三七文档
当前位置:首页 > 医学/心理学 > 基础医学 > 统计学基础知识与统计实务第3章
第三章统计整理统计学基础知识与统计实务一、统计整理的概念和任务对原始资料进行科学的分类和汇总,或对已经加工的综合资料进行再加工,为统计分析准备系统化、条理化的综合资料的工作过程。统计整理是统计工作过程的中心环节第一节统计整理的内容和方法(二)对原始资料进行审查例:统计上海市工业企业的工业总产值(三)对原始资料进行分组,编制分配数列(四)编制统计表,画统计图时间地点(主管部门、地域)范围计算口径计算方法符号二、统计整理的步骤(一)设计和编制统计整理方案(五)对统计资料进行系统积累一、统计分组的概念根据统计的需要,按一定的标志将总体划分为若干个组,使组与组之间有明显的差别,同组的单位具有相对的同质性。一定的标志——分组标志。总体“分”统计分组的含义单位“合”第二节统计分组二、统计分组的作用(一)凸显社会经济现象的规律(二)划分社会经济现象的类型(四)分析现象与现象之间的依存关系(三)反映社会经济现象的内部结构三、统计分组的原则科学性原则——选择能反映事物本质的分组标志。完整性原则——每个单位都有组可归。互斥性原则——每个单位只能归属一个组。四、统计分组的方法统计分组的关键是选择分组标志和划分各组界限。(一)选择分组标志1.选择能满足统计研究目的的标志产品产量研究企业规模固定资产数职工人数3.选择符合一定具体条件的标志2.选择能够反映现象本质的标志(二)划分各组界限1.按品质标志分组特点:①概念明确,直接反映现象质的不同;②有时分组界限不够明确。2.按数量标志分组特点:①用数量变化反映现象质的不同,界限明确;②有时很难明显地反映现象质的不同。五、统计分组体系根据统计分组的要求,对同一总体进行多种不同分组而形成,相互联系相互补充以加深对社会经济现象认识的体系。(一)简单分组和平行分组体系总体按一个标志分组称为简单分组,对同一总体选择两个或两个以上标志分别进行简单分组形成平行分组体系。按学科分:文科大学生理科工科按专科或本科分:专科生大学生本科生按性别分:男生大学生女生特点:(1)各次分组之间无直接关系;(2)不论几次分组,每组只固定一个差异。(二)复合分组和复合分组体系对同一总体选择两个或两个以上标志重叠起来进行分组称为复合分组,复合分组的结果形成复合分组体系。男生专科女生文科男生本科女生男生专科女生大学生理科男生本科女生男生专科女生工科男生本科女生特点:(1)分组有先后次序,一级一级重叠起来。(2)每级分组固定一个差异,几级分组固定几个差异。一级二级三级一、统计分布的概念1.统计分布的概念统计分布——将按某一标志进行分组后的总体,再按一定的顺序进行排列,反映总体各单位在各组中的分布。分配数列——统计分布形成的数列。第三节统计分布统计分布的要素:总体按某标志所分的组各组的单位数(次数)按完成件数分组工人数比重(件)(人)(%)500以下500~550550~600600~650650~700700以上2084343024810421715124合计200100变量次数(频数)比率(频率)二、统计分布的编制过程品质数列——总体按品质标志分组的分配数列变量数列——总体按数量标志分组的分配数列1.变量数列的要素变量值次数(或)比率2.单项数列和组距数列(1)单项数列每一个变量值代表一组,顺序排列而形成的数列。例:某工厂有100名工人,分为10个组,规定每人每天生产零件500件为完成定额,现有某一天每个工人的实际生产情况如下(单位:件):一组:420420420420450450480480480480二组:540540540540540540540540540540三组:540540540540540540540540580580四组:520520520520530500500500500500五组:5l0510520520520500510510500500六组:530530530540620620620620720720七组:720720630630630630620620620620八组:650650650650650650650650650650九组:580580580580580580580580580580十组:580580580580580650650620630630某工厂工人完成生产定额情况变量数列(单项数列)按完成生产定额分组(件)工人数(人)4204504805005105205305405806206306507204248474191796124合计100(2)组距数列按组距分组而编制的变量数列某工厂工人完成生产定额情况变量数列(组距式)按完成件数分组(件)工人数(人)500以下500~550550~600600~650650~700700以上1042l7l5124合计100累积分配数列:按完成件数分组工人数比重累计频数累计频率(件)(人)(%)高位制低位制高位制低位制500以下500~550550~600600~650650~700700以上20843430248104217151242010413816819220020018096623281052698496100100904831164合计200100――――三、组距数列编制的基本概念(一)组距与组数的划分注意:不同质的数量必须划分开来组距与组数的关系:组数↑组距↓(二)等距数列和异距数列等距数列——各组组距相等的数列异距数列——各组组距不完全相等的数列当变量值变动较均匀,编制等距数列可用下列公式:Rik全距()组距()=组数()(三)组限与组中值组限——各组的上限或下限原则:每个单位都能根据它的变量值分在各个组内,并且只能分在一个组内。①连续变量——相邻两组组限重叠,“上限不在内”棉田按亩产量分组(千克)块数(块)100以下100~150150~200200以上10322416合计8299149199②离散变量——组限不重叠(或与连续变量相同)企业按职工人数分组(人)企业数(个)499以下500~9991000~19992000以上10322416合计82企业按职工人数分组(人)企业数(个)500以下500~10001000~20002000以上10322416合计82组中值——代表组内各单位变量值的一般水平组上限+组下限组中值=2组上限-组下限组中值=组下限+2组上限-组下限组中值=组上限-2开口组适用于:变量值变化比较大,次数比较少的情况。假设开口组的组距与邻组组距相等。首组开口的“虚拟”组下限=首组上限-邻组组距组中值=上限-邻组组距/2末组开口的“虚拟”组上限=末组下限+邻组组距组中值=下限+邻组组距/2(四)频数与频率次数(频数)——分配在各组中的单位数。比率(频率)——各组单位数占总单位数的比重。频率的特点:各组的频率均大于0,各组的频率之和等于1。四、统计分布的表示方法(一)列表法(二)图示法直方图折线图曲线图饼图一、统计表的概念用纵横交叉的线条绘制的表现统计资料的一种表格广义——统计工作中各阶段所用到的一切表格狭义——通过统计整理所得的反映综合资料的表格第四节统计表用统计表反映资料的优点:使统计资料条理化使统计资料简明易懂便于比较和计算,并能检查数字的准确性二、统计表的构成和内容(一)统计表的构成总标题——说明统计表的名称横行标题——横标目,说明每一行的名称纵栏标题——纵标目,说明每一列的名称指标数值(二)统计表的内容主词——反映统计表要说明的总体宾词——反映总体的统计指标(一)按作用不同分调查表——主词未分组汇总表或整理表——主词简单分组分析表——主词复合分组三、统计表的种类(二)按主词的分组情况分简单表——主词未分组分组表——主词简单分组复合表——主词复合分组四、统计表的编制规则
本文标题:统计学基础知识与统计实务第3章
链接地址:https://www.777doc.com/doc-6498987 .html