您好,欢迎访问三七文档
统计整理统计调查客观现象数量表现统计总体数量特征统计研究的程序统计研究目的统计设计推断分析描述分析《统计学》第三章统计资料的整理《统计学》第三章统计资料的整理《统计学》第三章统计资料的整理第三章统计资料的整理★§3.1统计整理的意义和步骤§3.2统计分组§3.3分配数列§3.4统计表和统计图《统计学》第三章统计资料的整理《统计学》第三章统计资料的整理§3.1统计整理的意义和步骤一、统计整理的意义二、统计整理的步骤统计整理就是根据统计研究的目的,对所搜集到的资料进行科学的加工,使之系统化、条理化的工作过程。是统计调查的继续,统计分析的前提和基础地位统计数据的处理:统计资料的分组、汇总及制表统计数据的管理:数据的传输、贮存、更新及输出内容《统计学》第三章统计资料的整理设计和制定统计整理方案对原始资料进行审核对经过审核的资料进行分组制作统计表或统计图统计整理的步骤《统计学》第三章统计资料的整理统计资料的保存,系统积累《统计学》第三章统计资料的整理《统计学》第三章统计资料的整理§3.2统计分组一、统计分组的概念二、统计分组的作用三、统计分组的方法四、统计分组的体系根据统计研究的需要,将统计总体按照一定的标志分为若干个组成部分的一种统计方法。统计分组统计分组的作用:总体经过分组,能够突出组与组之间的差异而抽象掉组内各单位之间的差异,使数据变得条理化,便于进一步分析研究。《统计学》第三章统计资料的整理区分现象的不同类型研究总体的内部结构分析现象的依存关系《统计学》第三章统计资料的整理《统计学》第三章统计资料的整理(一)分组标志选择的原则1.要选择能够反映事物本质或主要特征的标志2.应根据研究的目的与任务选择分组标志3.根据现象所处的历史条件的变化选择分组标志《统计学》第三章统计资料的整理《统计学》第三章统计资料的整理(二)统计分组的方法1.按品质标志分组就是用来反映事物的属性、性质的标志作为分组标志,就可以将总体单位划分为若干性质不同的组成部分。2.按数量标志分组就是用反映事物数量差异的标志作为分组标志,将总体单位划分为若干个组。《统计学》第三章统计资料的整理《统计学》第三章统计资料的整理选择分组标志确定分组体系总体单位归类科学性:组间差异大,组内差异小。完备性和互斥性:每个单位均能且只能归到某个组中。统计分组的方法第三章统计资料的整理《统计学》第三章统计资料的整理《统计学》第三章统计资料的整理对大学生月生活费支出情况进行分组研究:按家庭收入水平分组;按城乡分组;按性别分组;按年龄分组。?对父母亲下岗情况进行分组研究:单亲下岗;双亲下岗;双亲在岗。不符合科学性不符合完备性和互斥性城乡区别离退休是否健在?第三章统计资料的整理统计分组体系分组体系是根据统计任务与分组的要求,对同一总体进行多种不同分组而形成的体系。各分组标志并列使用各分组标志交叉结合使用平行分组体系复合分组体系第三章统计资料的整理平行分组体系对教师的分类按性别分类男性女性按职称分类按年龄分类高级中级初级青年中年共计7组2+3+2《统计学》第三章统计资料的整理复合分组体系按性别分类按职称分类按年龄分类男女高级中级初级青年中年共计12组2×3×2《统计学》第三章统计资料的整理对教师的分类《统计学》第三章统计资料的整理《统计学》第三章统计资料的整理§3.3分配数列一、分配数列的概念与种类二、变量数列的编制三、次数分布的主要类型变量数列品质数列在统计分组的基础上,总体中的所有单位按其所属的组别归类整理,并且按照一定的顺序排列,形成总体单位书在各组分布的一系列数字分配数列分类分组标志的具体表现各组的次数或比率构成要素异距数列等距数列组距数列单项数列《统计学》第三章统计资料的整理《统计学》第三章统计资料的整理《统计学》第三章统计资料的整理获金牌项目金牌数占总数比例跳水5枚0.1786举重5枚0.1786乒乓球4枚0.1429羽毛球4枚0.1429体操3枚0.1071射击3枚0.1071柔道2枚0.0714田径1枚0.0357跆拳道1枚0.0357中国体育代表团在悉尼奥运会上获金牌的项目《统计学》第三章统计数据的整理与显示品质数列单项数列指每个组值只用一个具体的变量值表现的数列同时具备变量数列的编制变量是离散变量变量的不同取值个数较少编制条件:【例】己知某车间有24名工人,他们的日产量(件)分别是:20,23,20,24,23,21,22,25,26,20,21,21,22,22,23,22,22,24,25,21,22,21,24,23.要求根据以上资料编制变量数列。《统计学》第三章统计资料的整理日产量(件)X工人数(人)f比率20212223242526356432112.5%20.8%25%16.7%12.5%8%4.2%合计24100%编制结果如下:《统计学》第三章统计资料的整理(各组变量值)(次数)(频率)《统计学》第三章统计资料的整理《统计学》第三章统计资料的整理练一练•某车间有30个工人看管机器数量的资料如下:•542434344543426•442534532436354•据以上资料编制变量分配数列。《统计学》第三章统计资料的整理《统计学》第三章统计资料的整理看管机器台数(台)工人人数(人)频率(%)2410.333720.33412405510.67626.67合计30100说明:对离散变量,如果变量值的变动幅度小,就可以一个变量值对应一组,用单项式分组。组距数列指每个组的变量值用一个区间来表现的变量数列变量数列的编制变量是连续变量;或:总体单位数较多变量不同取值个数也较多的离散变量。编制条件:变量值变动区间的长度相等变量值变动区间的长度不完全相等等距数列异距数列《统计学》第三章统计资料的整理相关概念指每组两端表示各组界限的变量值,各组的最小值为下限,最大值为上限组限每组变量值变动区间的长度,为上下限之差组距每组变量取值范围的中点数值组中值《统计学》第三章统计资料的整理2下限上限组中值=某地区100个百货商店月销售额与流通费用情况销售额(万元)商店数(个)每百元商品销售额中支付的流通费(元)50以下50~100100~200200~300300以上102030251514.211.410.19.28.5上组限U下组限L如:组距d=U-L=100-50=50(万元)如:组中值x=(U+L)/2=(100+200)/2=150(万元)《统计学》第三章统计数据的整理《统计学》第三章统计资料的整理《统计学》第三章统计资料的整理某地区100个百货商店月销售额与流通费用情况《统计学》第三章统计数据的整理与显示销售额(万元)每百元商品销售额中支付的流通费(元)2135363945454647…32936038718.316.917.215.614.714.213.612.9…8.27.17.6按销售额分组(万元)商店数(个)每百元商品销售额中支付的流通费(元)50以下50~100100~200200~300300以上102030251514.211.410.19.28.5《统计学》第三章统计资料的整理《统计学》第三章统计资料的整理开口式组距数列组中值的计算:首组假定下限=首组上限-相邻组组距末组假定上限=末组下限+相邻组组距先计算开口组的假定上、下限:因此有:22相邻组组距上限首组首组假定下限首组上限22相邻组组距下限末组末组假定上限末组下限首组组中值末组组中值编制等距数列适用于总体单位的标志值变动比较均匀的情况实例己知某地区某年50个商店商品销售额的资料如下(单位:百万元):7.412.629.02.012.47.014.817.515.018.218.715.512.826.017.38.314.712.03.56.825.019.36.44.011.98.513.214.517.115.613.44.59.520.015.76.011.423.014.216.721.016.013.610.013.95.05.810.516.322.0要求编制组距数列。《统计学》第三章统计资料的整理编制步骤:⒈求全距百万元)(27229minmaxXXR⒉确定组距及组数确定组距的原则:要能区分各组的性质差异要能反映总体资料的分布特征为方便计算,尽可能为5或10的整数倍R≤组距(d)×组数(m)编制等距数列《统计学》第三章统计资料的整理计算组数(组数不宜过多,也不宜太少)上例中,取d=5,则有组)(615271dRm编制等距数列1dRmdRm(当的结果为整数时)dR(当的结果为小数时)dR《统计学》第三章统计资料的整理⒊确定组限对于离散变量,相邻组组限可以间断,也可重叠;对于连续变量,相邻组组限必须重叠;符合“上组限不计入”原则;首末两组可使用“××以下”及“××以上”的开口组。组限的表示方法编制等距数列《统计学》第三章统计资料的整理《统计学》第三章统计资料的整理《统计学》第三章统计资料的整理确定组限应注意的问题1.最小组的下限应低于最小变量值,最大组的上限应高于最大变量值2.组限的确定应有利于表现出总体分布的特点,应反映出事物质的变化3.为了方便计算组限应尽可能取整数,最好是5或10的整数倍4.由于变量有连续型变量和离散型变量两种,其组限的确定方法是不同的《统计学》第三章统计资料的整理《统计学》第三章统计资料的整理销售额(百万元)商店数频率(﹪)累计次数累计频率(﹪)5以下5~1010~1515~2020~2525以上410161343820322686合计50100fff《统计学》第三章统计资料的整理频率各组单位数占总体单位总数的比重累计次数(频率)从变量值低的组开始,将各组次数(频率)逐次向变量值高的组累计,说明某一组上限以下各组的累计次数(频率)。向上累计向下累计从变量值高的组开始,将各组次数(频率)逐次向变量值低的组累计,说明某一组下限以上各组的累计次数(频率)。《统计学》第三章统计资料的整理《统计学》第三章统计资料的整理《统计学》第三章统计资料的整理销售额(百万元)商店数频率(﹪)累计次数累计频率(﹪)向上累计向上累计5以下5~1010~1515~2020~2525以上41016134382032268641430434750828608694100合计50100——fff《统计学》第三章统计资料的整理《统计学》第三章统计资料的整理《统计学》第三章统计资料的整理销售额(百万元)商店数频率(﹪)累计次数累计频率(﹪)向上累计向下累计向上累计向下累计5以下5~1010~1515~2020~2525以上410161343820322686414304347505046362073828608694100100927240146合计50100————fff《统计学》第三章统计资料的整理《统计学》第三章统计资料的整理《统计学》第三章统计资料的整理练一练•某班40名学生统计学考试成绩分别为:•68898884868775737268•75829758815479769576•71609065767276858992•64578381787772617081•学校规定:60分以下为不及格,60─70分为及格,70─80分为中,80─90分为良,90─100分为优。要求:(1)将该班学生分为不及格、及格、中、良、优五组,编制一张次数分配表。•(2)指出分组标志及类型;分组方法的类型;分析本班学生考试情况。《统计学》第三章统计资料的整理《统计学》第三章统计资料的整理成绩学生人数(人)频率(%)60分以下37.560-7061570-801537.580-90123090-100410合计40100分组标志为成绩,其类型为数量标志;分组方法为:变量分组中的组距式分组,而且是开口式分组;本班学生的考试成绩的分布呈两头小,中间大的正态分布的形态。《统计学》第三章统计资料的整理《统计学》第三章统计资料的整理次数分布的主要类型钟形分布(人体的体重)U形分布(人口死亡率)J形分布(成年人数量按年
本文标题:统计学课件三
链接地址:https://www.777doc.com/doc-3492773 .html