您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > 三种抽样方法的概念和一般步骤
本节授课核心:三种抽样方法的概念和一般步骤一:情景引入1.要考察某公司生产的500袋装牛奶的质量是否达标,现从中抽取60袋进行检验,则总体是?总体个数N是?样本是?样本个数n?500袋牛奶,500,60袋牛奶,602.如何判断一锅汤的味道的好坏?A全部喝完B舀上面油多的一勺汤品尝C舀下面味道重的一勺汤品尝D搅拌均匀后再随机舀一勺汤品尝D思考:要获取一个有代表性的好的样本,关键是。使总体内的各个个体被抽到的机会都相等二、新课:(一)简单随机抽样1.思考:例1.要在我们班选出五个人去参加劳动,怎样选才是最公平的呢?2.简单随机数法的概念:P583.简单随机抽样必须具备下列特点:(1)总体个数N是限的。有(2)样本个数n总体的个数N。不大于(3)放回的抽样。不(4)每个个体被抽到的机会.相等4.简单随机抽样的方法有和抽签法和随机数法5.既学即练:(1)下列抽样的方式是否属于简单随机抽样?为什么?A.从无限多个个体中抽取50个个体作为样本.B.箱子里共有100个零件,从中选出10个零件进行质量检验,在抽样操作中,从中任意取出一个零件进行质量检验后,再把它放回箱子.错(2)为了了解全校240名学生的身高情况,从中抽取40名学生进行测量,下列说法正确的是A.总体是240B、个体是每一个学生C、样本是40名学生D、样本容量是40D(3)从3名男生、2名女生中随机抽取2人,检查数学成绩,则抽到的均为女生的可能性是。1/10(二)系统抽样1.思考:例2.我校为了了解高一年级学生对教师教学的意见,打算从高一年级的500名学生中抽取50名进行调查.你怎样进行操作呢?P602.系统抽样概念:P603.进行系统抽样的步骤:,,和P60编号,分段,确定起始个体的编号L,抽取样本,通常是将起始编号L加上间隔k得到第2个个体编号L+K,再加上K得到第3个个体编号L+2K,这样继续下去,直到获取整个样本。4.既学即练:(1)下列抽样中不是系统抽样的是()A、从标有1~15号的15号的15个小球中任选3个作为样本,按从小号到大号排序,随机确定起点i,以后为i+5,i+10(超过15则从1再数起)号入样B工厂生产的产品,用传关带将产品送入包装车间前,检验人员从传送带上每隔五分钟抽一件产品检验C、搞某一市场调查,规定在商场门口随机抽一个人进行询问,直到调查到事先规定的调查人数为止D、电影院调查观众的某一指标,通知每排(每排人数相等)座位号为14的观众留下来座谈C不是系统抽样,因为事先不知道总体,抽样方法不能保证每个个体按事先规定的概率入样。(三)分层抽样1.思考:例3.假设某地区有高中生2400人,初中生10900人,小学生11000人,此地教育部门为了了解本地区中小学的近视情况及其形成原因,要从本地区的小学生中抽取1%的学生进行调查,你认为应当怎样抽取样本?高中生24人,初中生109人,小学生110人2.分层抽样定义:P633.分层抽样的步骤:,,和.(1)分层:按某种特征将总体分成若干部分。(2)按比例确定每层抽取个体的个数。(3)各层分别按简单随机抽样的方法抽取。(4)综合每层抽样,组成样本。4.分层抽样应遵循以下要求:(1)分层遵循不重复、不遗漏的原则。(2)在各层中进行简单随机抽样,每层样本数量与每层个体数量的比与这层个体数量与总体容量的比相等。5.既学即练:(1)分层抽样又称类型抽样,即将相似的个体归入一类(层),然后每层抽取若干个体构成样本,所以分层抽样为保证每个个体等可能入样,必须进行()A、每层等可能抽样B、每层不等可能抽样C、所有层按同一抽样比等可能抽样C(2)如果采用分层抽样,从个体数为N的总体中抽取一个容量为n样本,那么每个个体被抽到的可能性为()A.N1B.n1C.NnD.NnC(3)某高中共有900人,其中高一年级300人,高二年级200人,高三年级400人,现采用分层抽样抽取容量为45的样本,那么高一、高二、高三各年级抽取的人数分别为()A.15,5,25B.15,15,15C.10,5,30D.15,10,20D(4)某中学高一年级有学生600人,高二年级有学生450人,高三年级有学生750人,每个学生被抽到的可能性均为0.2,若该校取一个容量为n的样本,则n=。360(四)简单随机抽样、系统抽样、分层抽样的比较类别共同点各自特点联系适用范围简单随机抽样(1)抽样过程中每个个体被抽到的可能性相等(2)每次抽出个体后不再将它放回,即不放回抽样从总体中逐个抽取总体个数较少将总体均分成几部分,按预先制定的规则在各部分抽取在起始部分采样时采用简随机抽样总体个数较多系统抽样将总体分成几层,分层进行抽取分层抽样时采用简单随机抽样或系统抽样总体由差异明显的几部分组成分层抽样五.体验探究:1、某单位有老年人28人,中年人54人,青年人81人,为了调查他们的身体情况,需从他们中抽取一个容量为36的样本,则适合的抽取方法是()A.简单随机抽样B.系统抽样C.分层抽样D.先从老人中剔除1人,然后再分层抽样D2、某校有500名学生,其中O型血的有200人,A型血的人有125人,B型血的有125人,AB型血的有50人,为了研究血型与色弱的关系,要从中抽取一个20人的样本,按分层抽样,O型血应抽取的人数为8人,A型血应抽取的人数为人,B型血应抽取的人数为人,AB型血应抽取的人数为2人。8,5,5,23.从编号为1~50的50枚最新研制的某种型号的导弹中随机抽取5枚来进行发射实验,若采用每部分选取的号码间隔一样的系统抽样方法,则所选取5枚导弹的编号可能是()A.5,10,15,20,25B、3,13,23,33,43C.1,2,3,4,5D、2,4,6,16,32B4、一个地区共有5个乡镇,人口3万人,其中人口比例为3:2:5:2:3,从3万人中抽取一个300人的样本,分析某种疾病的发病率,已知这种疾病与不同的地理位置及水土有关,问应采取什么样的方法?并写出具体过程。60,40,100,40,60二、新课:(一)频率分布直方图的作法:1.探究:P67①确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费.如果希望大部分居民的日常生活不受影响,那么标准a定为多少比较合理呢?为了较为合理地确定出这个标准,需要做哪些工作?②给出100位居民的月均用水量表,讨论:如何分析数据?2.频率分布表和频率分布图,是从各个小组数据在样本容量中的角度,来表示数据分布的规律。所占比例大小〈一〉频率分布的概念:频率分布是指一个样本数据在各个小范围内所占。比例大小一般用频率分布直方图反映样本的频率分布。其一般步骤为:,,,和(1)求极差(2)决定组距与组数(3)将数据分组(4)列频率分布表(5)画频率分布直方图3.动手作图以课本P68制定居民用水标准问题为例,经过以上几个步骤画出频率分布直方图。4.既学即练:(1)频率分布直方图2.2-1纵坐标表示?(2)直方图是用表示在各个区间内取值的频率,小长方形面积的和为.面积,1(3)频率分布直方图2.2-1表示每月用水量在1吨到3吨之间的居民所占比例是0.76(4)如果当地政府希望使88%以上的居民每月的用水量不超出标准,根据频率分布表2-2和频率分布直方图2.2-1,那么制定月用水量标准是吨?3(二)频率分布折线图、总体密度曲线1.定义频率分布折线图:2.定义总体密度曲线:3.既学即练:(1)下表给出了某校500名12岁男孩中用随机抽样得出的120人的身高(单位cm)区间界限[122,126)[126,130)[130,134)[134,138)[138,142)[142,146)人数5810223320区间界限[146,150)[150,154)[154,158)人数1165(ⅰ)列出样本频率分布表﹔(ⅱ)画出频率分布直方图;(ⅲ)估计身高小于134cm的人数占总人数的百分比.解:(1)样本频率分布表如下:(2)其频率分布直方图如下:(3)由样本频率分布表可知身高小于134cm的男孩分组频数频率[122,126)50.04[126,130)80.07[130,134)100.08[134,138)220.18[138,142)330.28[142,146)200.17[146,150)110.09[150,154)60.05[154,158)50.04合计1201122126130134138142146150158154身高(cm)o0.010.020.030.040.050.060.07频率/组距出现的频率为0.04+0.07+0.08=0.19,所以我们估计身高小于134cm的人数占总人数的19%.(2)为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数次测试,将所得数据整理后,画出频率分布直方图(如图),图中从左到右各小长方形面积之比为2:4:17:15:9:3,第二小组频数为12.(ⅰ)第二小组的频率是多少?样本容量是多少?(ⅱ)若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少?(ⅲ)在这次测试中,学生跳绳次数的中位数落在哪个小组内?请说明理由。分析:在频率分布直方图中,各小长方形的面积等于相应各组的频率,小长方形的高与频数成正比,各组90100110120130140150次数o0.0040.0080.0120.0160.0200.0240.028频率/组距0.0320.036频数之和等于样本容量,频率之和等于1。解:(1)由于频率分布直方图以面积的形式反映了数据落在各小组内的频率大小因此第二小组的频率为:40.0824171593又因为频率=第二小组频数样本容量所以121500.08第二小组频数样本容量第二小组频率(2)由图可估计该学校高一学生的达标率约为171593100%88%24171593(3)由已知可得各小组的频数依次为6,12,51,45,27,9,所以前三组的频数之和为69,前四组的频数之和为114,所以跳绳次数的中位数落在第四小组内。〈三〉茎叶图1.茎叶图的概念:当数据是两位有效数字时,用中间的数字表示,即第一个有效数字,两边的数字表示,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,因此通常把这样的图叫做茎叶图。十位数、个位数2.茎叶图的特征:(1)用茎叶图表示数据有两个优点:一是从统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记录与表示。(2)茎叶图只便于表示两位有效数字的数据,而且茎叶图只方便记录两组的数据,两个以上的数据虽然能够记录,但是没有表示两个记录那么直观,清晰。3.既学即练:试将下列两组数据制作出茎叶图,并计算两组数据的平均数和方差.甲得分:13,51,23,8,26,38,16,33,14,25,39,乙得分:49,24,12,31,60,31,44,36,15,37,24《同步》(一)、众数、中位数、平均数1.已知数据:10,11,12,12,13,13,13,14,15,根据初中所学的知识,中位数是______、众数是______、平均数是______13,13,12.62.在样本数据的频率分布直方图中______是众数。最高的矩形的中点3.在频率分布直方图中,矩形的大小正好表示对应组的频率的大小,即中位数左边和右边的直方图的______相等。小矩形的面积,面积相等4.估计平均数:频率分布直方图中每个小矩形的______乘以小矩形_______________之和面积,底边中点的横坐标5.众数、中位数、平均数都是对数据中心位置的描述,可以作为总体相应特征的估计.样本众数易计算,但只能表达样本数据中的很少一部分信息,不一定唯一;中位数仅利用了数据中排在中间数据的信息,与数据的排列位置有关;平均数受样本中的每一个数据的影响,绝对值越大的数据,对平均数的影响也越大.三者相比,平均数代表了数据更多的信息,描述了数据的平均水平,是一组数据的“重心”.(二)、标准差、方差1.标准差考察样
本文标题:三种抽样方法的概念和一般步骤
链接地址:https://www.777doc.com/doc-417677 .html