您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > 高中数学2.1随机抽样
统计数理统计感性认识数理统计►数理统计是研究如何有效地收集,整理,分析受随机影响的数据,并对所考虑的问题作出推断或预测,直至为采取决策和行动提供依据和建议的一门学科。它是一门应用性很强的学科,凡是有大量数据出现的地方,都要用到数理统计。现在,数理统计的内容已异常丰富,成为数学中最活跃的学科之一。教科书选择了数理统计中最基本问题来介绍这门学科的思想与方法。►数理统计所要解决的问题是(1)如何从总体中抽取样本(2)对样本的整理,计算,分析和综合,然后才能对总体作统计推断。随机抽样相关概念与原则相关概念►总体:所要考察对象的全体►个体:总体中的每一个考察对象;►样本:从总体中抽取的一部分个体,叫总体的一个样本;►样本容量:样本中个体的数目;►抽样:从总体中抽取一部分个体作为样本的过程叫抽样.如何才能收集到高质量的样本数据?设计抽样方法的原则►生活常识:判断一锅汤的味道如何,只需品尝一勺即可,前提是什么?►“搅拌均匀”的总体►一个好的抽样调查胜过一次蹩脚的普查►抽样的关键在于使抽取的样本与总体的特征一致,以利于进一步利用样本估计总体。►达到这样目的的有效途径就是抽样的随机化。侯选人《LiteraryDigest》预测%选举结果%罗斯福4362兰顿5738一个著名的案例——抽样中的泰坦尼克事件►1936年美国正从经济大恐慌中复苏,全国仍有9百万人失业.当年的美国总统大选,由民主党员罗斯福与共和党员兰登进行角逐.《文学文摘》(LiteraryDigest)杂志对结果进行了调查预测.他们根据当时的电话号码簿及该杂志订户俱乐部会员名单,邮寄1千万份问卷调查表,回收约240万份.工作人员获得了大量的样本,对此进行了精确的计算,根据数据的整理分析结果,他们断言:在总统选举中,兰登将以370∶161的优势,即以57%比43%,领先14个百分点击败罗斯福.与之相反,一个名叫乔治•盖洛普的人,对《文学文摘》调查结果的可信度提出质疑.他也组织了抽样调查,进行民意测验.他的预测与《文学文摘》截然相反,认为罗斯福必胜无疑.结果,罗斯福以62%比38%压倒性地大胜兰登.这一结果使《文学文摘》销声匿迹,而盖洛普则名声大噪.简单随机抽样►概念:一般地,设一个总体的个体数为N,如果通过逐个不放回地抽取的方法从中抽取n(n≤N)个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样。►要点:它要求被抽取样本的总体的个体数有限它是从总体中逐个进行抽取它是一种不放回抽样它是一种等概率抽样用从个体数为N的总体中抽取一个容量为n的样本,那么每个个体被抽取的概率等于Nn简单随机抽样常用的方法►1、抽签法(抓阄法)先将总体中的所有个体(共N个)编号(号码可以从1到N),并把号码写在形状、大小相同的号签上(号签可以用小球、卡片、纸条等制作),然后将这些号签放在同一个箱子里,进行均匀搅拌。抽签时,每次从中抽出1个号签,连续抽取n次,就得到一个容量为n的样本。对个体编号时,也可以利用已有的编号。例如学生的学号,座位号等。练习►1.高二(21)班有53名同学,现要从中抽取8名去参加一个座谈会,请写出用抽签法抽选的过程►2.假设一个总体有5个元素,分别记为a,b,c,d,e,采用抽签法抽取一个容量为2的样本,样本共有多少个?►为了考察某公司生产底800克袋装牛奶的质量是否达标,现从800袋牛奶中抽取60件产品进行检查.当总体的个数较多时,将总体“搅拌均匀”比较困难,抽签法产生的样本代表性差的可能性很大。简单随机抽样常用的方法►2、随机数表法随机数表是统计工作者用计算机生成的随机数,保证表中的每个位置上的数字是等可能出现的用随机数表进行抽样的步骤:将总体中个体编号;选定开始的数字;获取样本号码用随机数表抽取样本,可以任选一个数作为开始,读数的方向可以向左,也可以向右、向上、向下等等。因此并不是唯一的由于随机数表是等概率的,因此利用随机数表抽取样本保证了被抽取个体的概率是相等的►例:为了考察某公司生产底00克袋装牛奶的质量是否达标,现从800袋牛奶中抽取60件产品进行检查.S1,将800袋牛奶编号,可以编为000,001,……,799;S2,在随机数表中任意选一个数,例如第8行第7列的数7;S3,从选定的数7开始向右读,得到一个三位数,如果这个三位数在000~799范围内,则取出,否则去掉;继续向右读,得下一个三位数;依次下去,直到样本的60个号码全部取出.►将总体中的个体编号时从000开始,用意何在?►当随机地选定开始读数的数后,读数的方向只能向右吗?练习►将全班同学按学号编号,制作相应的卡片号签,放入同一个箱子里均匀搅拌,从中抽出15个号签,就相应的15名学生对看足球比赛的喜爱程度(很喜爱、喜爱、一般、不喜爱、很不喜爱)进行调查。上述问题中抽取样本的方法用随机数表法来进行!►规则1:从107页表中第3行第11列的两位数开始,依次向下读数,到头后再转向它左面的两位数号码,并向上读数,以此下去,直到取足样本。►规则2:从107页表中第12行第10列的两位数开始,依次向左读数,到头后再转向它下面的两位数号码,并向右读数,以此下去,直到取足样本。系统抽样(等距抽样)问题情景:一个礼堂有30排座位,每排有40个座位。一次报告会礼堂坐满了听众。会后为听取意见,需要抽取30名听众进行座谈,除了用简单随机抽样获得样本外,你能否设计其他的抽取样本的方法?留下每排座位号为20的30名听众进行座谈。这种抽取样本的方法与简单随机抽样有什么区别?你能说出操作步骤吗?由于每排的座位有40个,各排每个号码被抽取的概率都是,因而第1排被抽取前,其他各排中各号码被抽取概率也是,也就是说被抽取的概率是,每排的抽样也是简单随机抽样,因此这种抽样的方法是系统抽样。401401401一个礼堂有30排座位,每排有40个座位。一次报告会礼堂坐满了听众。会后为听取意见留下了座位号为20的30名听众进行座谈。系统抽样►当总体的个数较多时,采用简单随机抽样太麻烦,这时将总体分成均衡的部分,然后按照预先定出的规则,从每一部分中抽取1个个体,得到所需要的样本,这种抽样称为系统抽样。(1)采取随机方式将总体中的个体编号。(2)将整个的编号均衡地分段,确定分段间隔k。是整数时,;不是整数时,从N中剔除一些个体,使得其为整数为止。nNnNknN(3)第一段用简单随机抽样确定起始号码l。(4)按照规则抽取样本:l;l+k;l+2k;……l+nk(等距)系统抽样时,将总体中的个体均分后的每一段进行抽样时,采用简单随机抽样;系统抽样每次抽样时,总体中各个个体被抽取的概率也是相等的;如总体的个体数不能被样本容量整除时,可以先用简单随机抽样从总体中剔除几个个体,然后再按系统抽样进行。需要说明的是整个抽样过程中每个个体被抽到的概率仍然相等。系统抽样的步骤以下抽样方法的区别中,说法错误的是___►(A)4个人打牌时,将洗好的牌(52张)随机确定一张牌为起始牌,然后按次序发牌,每人13张,这种抽样方法属于随机抽样►(B)从标号为1~15的15个球中,任选3个做为样本,按从小到大排序,随机选取起点号i0,以后选取i0+5,i0+10(超过15则从1数起),这种抽样方法属于系统抽样►(C)工厂生产某种产品,用传送带送入包装车间,检验人员每隔五分钟从传送带上抽一产品进行检验,这种抽样方法属于系统抽样►(D)电影院为调查观众某项指标,通知每排的座位号为8号的观众留下来,这种抽样方法属于系统抽样A应用举例►某地区有3000名学生参加学科竞赛,现要从中抽取一个样本对他们的成绩进行分析,每个学生被抽到的概率均为1/15,试确定样本容量,并说出抽样步骤。►设某校共有118名教师,为了支援西部的教育事业,要从中随机抽出16名教师组成暑期西部讲师团。请用系统抽样方法选出讲师团成员。►有人说,可以借用居民身份证号码(18位)来进行央视春晚的收视率调查:在1~999中抽出一个随机数,比如632,那么身份证后三位是632的观众就是要调查的对象。你觉得这样所获得的样本有代表性吗?系统抽样的优缺点►优点:(1)简单易操作(2)当对总体结构有一定了解时,充分利用已有的信息对总体中的个体进行排队后再抽样,可提高抽样效率(3)当总体中的个体存在一种自然编号时,采用系统抽样比较方便►缺点:(4)当在不了解样本总体的情况下(如性别差异,经济基础,个人喜好,天气因素等等),所抽出的样本可能会有一定的偏差。如何改进?分层抽样问题情景:一个单位的职工有500人,其中不到35岁的有125人,35~49岁的有280人,50岁以上的有95人。为了了解该单位职工年龄与身体状况的有关指标,从中抽取100名职工作为样本,应该怎样抽取?分层抽样►当已知总体由差异明显的几部分组成时,为了使样本充分地反映总体的情况,常将总体分成几部分,然后按照各部分所占的比例进行抽样,这种抽样叫做分层抽样。其中所分成的各部分叫做层。►注意:分层抽样适用于总体由差异明显的几部分组成的情况,每一部分称为层,在每一层中实行简单随机抽样。分层抽样中分多少层,要视具体情况而定。总的原则是:层内样本的差异要小,而层与层之间的差异尽可能地大,否则将失去分层的意义。解:抽取人数与职工总数的比是100:500=1:5,则各年龄段(层)的职工人数依次是125:280:95=25:56:19,然后分别在各年龄段(层)运用简单随机抽样方法抽取。答:在分层抽样时,不到35岁、35~49岁、50岁以上的三个年龄段分别抽取25人、56人和19人。分层抽样举例►一个单位的职工有500人,其中不到35岁的有125人,35~49岁的有280人,50岁以上的有95人。为了了解该单位职工年龄与身体状况的有关指标,从中抽取100名职工作为样本,应该怎样抽取?分层抽样的步骤►1.总体与样本容量确定抽取的比例。►2.由分层情况,确定各层抽取的样本数。►3.各层的抽取数之和应等于样本容量。►4.对于不能取整的数,求其近似值。NnkiiNknnninnNkniii,问题:每个个体在整个抽样过程中被抽取的概率是否相等?每部分抽取的个体数样本容量该部分的个体总数总体中的个体数练习►1.某科研单位有科研人员160人,其中具有高级以上职称的24人,中级职称48人,其余均为初级以下职称,现要抽取一个容量为20的样本,试确定抽样方法,并写出抽样过程.►2.某市3个区共有高中学生20000人,且3个区的高中学生人数之比为2:3:5,现在要用分层抽样的方法从所有学生中抽取一个容量为200的样本,这3个区应该分别抽取多少人?►3.如果采用分层抽样,从个体数为N的总体中,抽取一个容量为n的样本,那么每个个体被抽到的概率等于()nND.nC.NB.NnA.11►4.下列属于分层抽样特点的是()A.从总体中逐个抽取B.将总体分成几层,分层进行抽取C.将总体分成几部分,按事先确定的规则在各部分抽取D.将总体随意分成几部分,然后进行随机抽取►5.某校高中生共有900人,其中高一年级300人,高二年级200人,高三年级400人,现采用分层抽样抽取容量为45的样本,那么高一,高二,高三各年级抽取人数分别为()A15,5,25B15,15,15C10,5,30D15,10,20B►6.某公司在A,B,C,D四个地区分别有150个,120个,180个,150个销售点,公司为了调查产品销售情况,需从这600个销售点中抽取容量为100的样本,记这项调查为①;在C地区有20个特大型销售点,现从中抽取7个调查它的销售收入和销后服务情况,记这项调查为②;则完成①,②这两项调查应采取的抽样方法依次为()A,分层抽样法,系统抽样法;B,分层抽样法,简单随机抽样法;C,系统抽样法,分层抽样法;D,简单随机抽样法,分层抽样法;A►7.在100个零件中,有一级品20个,二级品30个,其余为三级品,从中抽取20个作为样本.(1)采用随机抽样法,将零件编号为00,01,…99.抽签取出20个;(2)采用系统抽样法,将所有零件分成20组,每组5个,然
本文标题:高中数学2.1随机抽样
链接地址:https://www.777doc.com/doc-6266807 .html