您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > 12.3 抽样方法、总体分布的估计
§12.3抽样方法、总体分布的估计基础知识自主学习要点梳理1.抽样方法(1)简单随机抽样①定义:设一个总体含有N个个体,从中抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都,就把这种抽样方法叫做简单随机抽样.②最常用的简单随机抽样的方法:和.逐个不放回地相等抽签法随机数表法(2)系统抽样的步骤假设要从容量为N的总体中抽取容量为n的样本.①先将总体的N个个体.②确定,对编号进行,当Nn是整数时,取k=Nn.③在第1段用确定第一个个体编号l(l≤k).④按照一定的规则抽取样本,通常是将l加上间隔k得到第2个个体编号,再加k得到第3个个体编号,依次进行下去,直到获取整个样本.编号分段间隔k分段简单随机抽样(l+k)(l+2k)(3)分层抽样①定义:在抽样时,将总体分成的层,然后按照,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法叫做分层抽样.②分层抽样的应用范围当总体是由组成时,往往选用分层抽样.互不交叉一定的比例差异明显的几个部分2.总体分布的估计(1)总体分布总体分布是指总体取值的分布规律,这种分布往往是不易知道的,所以要用的频率分布去估计总体分布.一般地,样本容量越,估计就越精确.(2)频率分布①频率:样本中所有数据(或数据组)的和的比,就是该组数据(或数据组)的频率.概率样本大频数样本容量②样本频率分布:所有数据(或数据组)的的分布变化规律叫做样本频率分布.③样本频率分布的表示样本频率分布可以用样本频率分布表、样本频率分布图或样本频率分布图来表示.(3)在频率分布直方图中各小长方形的之和等于1.频率条形直方面积3.总体密度曲线如果样本容量无限,分组的组距无限,那么频率分布直方图就会无限接近于一条光滑曲线——总体密度曲线.总体密度曲线反映了总体分布,即反映了总体在各个范围内取值的.增加减小百分比基础自测1.在简单随机抽样中,某一个个体被抽到的可能性()A.与第几次抽样有关,第一次抽到的可能性最大B.与第几次抽样有关,第一次抽到的可能性最小C.与第几次抽样无关,每一次抽到的可能性相等D.与第几次抽样无关,与抽取几个样本有关解析在简单随机抽样中,每个个体被抽到的概率是相等的,与第几次抽样无关.C2.要完成下列两项调查:①从某社区125户高收入家庭、280户中等收入家庭、95户低收入家庭中选出100户调查社会购买力的某项指标;②从某中学的15名艺术特长生中选出3人调查学习负担情况.宜采用的抽样方法依次为()A.①随机抽样法,②系统抽样法B.①分层抽样法,②随机抽样法C.①系统抽样法,②分层抽样法D.①②都用分层抽样法解析①中总体由差异明显的几部分构成,宜采用分层抽样法,②中总体中的个体数较少,宜采用简单随机抽样法.B3.(2009·陕西文,5)某单位共有老、中、青职工430人,其中有青年职工160人,中年职工人数是老年职工人数的2倍.为了解职工身体状况,现采用分层抽样方法进行调查,在抽取的样本中有青年职工32人,则该样本中的老年职工人数为()A.9B.18C.27D.36解析设老年职工为x人,则430-3x=160,x=90,设抽取的样本为m,则160430m=32,m=86,则抽取样本中老年职工人数为90430×86=18(人).B4.一个容量为32的样本,已知某组样本的频率为0.375,则该组样本的频数为()A.4B.8C.12D.16解析频率=频数容量.∴频数=频率×容量=0.375×32=12.C5.某雷达测速区规定:凡车速大于或等于70km/h的汽车视为“超速”,并将受到处罚,如图是某路段的一个检测点对200辆汽车的车速进行检测所得结果的频率分布直方图,则从图中可以看出被处罚的汽车大约有()A.30辆B.40辆C.60辆D.80辆解析由图可知,车速大于或等于70km/h的汽车的频率为0.02×10=0.2,则将被处罚的汽车大约有200×0.2=40(辆)答案B题型分类深度剖析题型一抽样方法【例1】某政府机关有在编人员100人,其中副处级以上干部10人,一般干部70人,工人20人.上级机关为了了解政府机构改革意见,要从中抽取一个容量为20的样本,试确定用何种方法抽取,请具体实施抽取.思维启迪(1)机构改革关系到各种人不同的利益;(2)不同层次的人员情况有明显差异,故采用分层抽样.解用分层抽样方法抽取.具体实施抽取如下:(1)∵20∶100=1∶5,∴105=2,705=14,205=4,∴从副处级以上干部中抽取2人,从一般干部中抽取14人,从工人中抽取4人.(2)因副处级以上干部与工人的人数较少,他们分别按1~10编号与1~20编号,然后采用抽签法分别抽取2人和4人;对一般干部70人采用00,01,02,…,69编号,然后用随机数表法抽取14人.(3)将2人,4人,14人的编号汇合在一起就取得了容量为20的样本.探究提高分层抽样的操作步骤及特点(1)操作步骤①将总体按一定标准进行分层;②计算各层的个体数与总体数的比,按各层个体数占总体数的比确定各层应抽取的样本容量;③在每一层进行抽样(可用简单随机抽样或系统抽样).(2)特点①适用于总体由差异明显的几部分组成的情况;②更充分地反映了总体的情况;③等可能抽样,每个个体被抽到的可能性都是nN.知能迁移1(2009·天津理,11)某学院的A,B,C三个专业共有1200名学生,为了调查这些学生勤工俭学的情况,拟采用分层抽样的方法抽取一个容量为120的样本,已知该学院的A专业有380名学生,B专业有420名学生,则在该学院的C专业应抽取________名学生.解析C专业有学生1200-380-420=400(名),则C专业应抽取的学生数为4001200×120=40(名).40题型二频率分布直方图在总体估计中的应用【例2】为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图,图中从左到右各小长方形面积之比为2∶4∶17∶15∶9∶3,第二小组频数为12.(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少?思想启迪解(1)由已知可设每组的频率为2x,4x,17x,15x,9x,3x.则2x+4x+17x+15x+9x+3x=1解得x=0.02.则第二小组的频率为0.02×4=0.08,样本容量为12÷0.08=150.(2)次数在110次以上(含110次)的频率和为17×0.02+15×0.02+9×0.02+3×0.02=0.34+0.3+0.18+0.06=0.88.则高一学生的达标率约为0.88×100%=88%.探究提高用频率分布直方图解决相关问题时,应正确理解图表中各个量的意义,识图掌握信息是解决该类问题的关键.频率分布直方图有以下几个要点:(1)纵轴表示频率/组距.(2)频率分布直方图中各长方形高的比也就是其频率之比.(3)直方图中每一个矩形的面积是样本数据落在这个区间上的频率,所有的小矩形的面积之和等于1,即频率之和为1.知能迁移2有一容量为100的样本,数据的分组及各组的频数如下:[12.5,15.5),6;[15.5,18.5),16;[18.5,21.5),18;[21.5,24.5),22;[24.5,27.5),20;[27.5,30.5),10;[30.5,33.5),8.(1)列出样本的频率分布表;(2)画出频率分布直方图;(3)估计数据小于30.5的概率.解(1)样本的频率分布如下:分组频数频率12.5~15.560.0615.5~18.5160.1618.5~21.5180.1821.5~24.5220.2224.5~27.5200.2027.5~30.5100.1030.5~33.580.08合计1001.00(2)频率分布直方图如下图所示:(3)数据大于等于30.5的频率是0.08,所以小于30.5的频率是0.92,所以数据小于30.5的概率约为0.92.题型三频率分布条形图在实际生活中的应用【例3】(12分)某电脑生产公司为评估其生产的电脑硬盘的寿命,对其最近20年生产的硬盘抽取了50件进行检验,它们的寿命(年数)如下:(注:计算年数的时候按四舍五入取整,如寿命为7.4年按7年计算)786865910785656787910985787986779658696810787869871069(1)列出频率分布表;(2)画出频率分布条形图;(3)估计硬盘的寿命在7~9年的概率.思维启迪本题中样本的个体取不同数值较少,可直接列表画图,画图时只要横轴的单位长度取得一致,纵轴的单位长度取得一致即可,不要求两者单位长度相同.解题示范解(1)频率分布表如下:年数频数频率550.106100.207110.228120.24980.161040.08[4分](2)以寿命(年数)为横轴,频率为纵轴,画频率分布条形图.如下图:[9分](3)由题意,硬盘寿命为7年的频率为0.22,寿命为8年的频率为0.24,寿命为9年的频率为0.16,则估计硬盘的寿命在7~9年的概率为0.22+0.24+0.16=0.62.[12分]探究提高条形图也是一种重要的统计工具,它可以很直观地表示各个事件的分布情况,条形图中的y轴根据统计的需要可以表示频率,也可以表示次数、人数等统计数据.知能迁移3某射手对100个靶各射击5次,记下命中数,射击结果如下表:命中数012345频数3182931145(1)列出频率分布表;(2)画出频率分布条形图;(3)求命中不少于3次的概率.解(1)频率分布表如下:命中数012345合计频数3182931145100频率0.030.180.290.310.140.051(2)以命中数为横轴,频率为纵轴,画频率分布条形图.如图(3)由题意知,命中不少于3次的概率为0.31+0.14+0.05=0.5.思想方法感悟提高方法与技巧1.简单随机抽样是系统抽样和分层抽样的基础,是一种等概率的抽样,由定义应抓住以下特点:(1)它要求总体个数较少;(2)它是从总体中逐个抽取的;(3)它是一种不放回抽样.2.系统抽样又称等距抽样,号码序列一确定,样本即确定了,但要求总体中不能含有一定的周期性,否则其样本的代表性是不可靠的,甚至会导致明显的偏向.3.抽样方法经常交叉使用,比如系统抽样中的第一均衡部分,可采用简单随机抽样,分层抽样中,若每层中个体数量仍很大时,则可辅之以系统抽样.4.用样本频率分布来估计总体分布的重点是:频率分布表和频率分布直方图的绘制及用样本频率分布估计总体分布,难点是频率分布表和频率分布直方图的理解及应用.在计数和计算时一定要准确,在绘制小矩形时,宽窄要一致.通过频率分布表和频率分布直方图可以对总体作出估计.失误与防范1.分析总体特征、选择合理的抽样方法.2.不要把直方图错以为条形图,两者的区别在于条形图是离散随机变量,纵坐标刻度为频数或频率,直方图是连续随机变量,纵坐标刻度为频率/组距,这是密度.连续随机变量在某一点上是没有频率的.定时检测一、选择题1.现要完成下列3项抽样调查:①从10盒酸奶中抽取3盒进行食品卫生检查.②科技报告厅有32排,每排有40个座位,有一次报告会恰好坐满了听众,报告会结束后,为了听取意见,需要请32名听众进行座谈.③东方中学共有160名教职工,其中一般教师120名,行政人员16名,后勤人员24名.为了了解教职工对学校在校务公开方面的意见,拟抽取一个容量为20的样本.较为合理的抽样方法是()A.①简单随机抽样,②系统抽样,③分层抽样B.①简单随机抽样,②分层抽样,③系统抽样C.①系统抽样,②简单随机抽样,③分层抽样D.①分层抽样,②系统抽样,③简单随机抽样解析①总体较少,宜用简单随机抽样;②已分段,宜用系统抽样;③各层间差距较大,宜用分层抽样,故选A.答案A2.(2008·广东理,3)某校共有学生2000名,各年级男、女生人数如下表.已知在全校学生中随机抽取1名,抽到二年级女生的概率是0.19.现用分层抽样的方法在全校抽取64名学生,
本文标题:12.3 抽样方法、总体分布的估计
链接地址:https://www.777doc.com/doc-3953166 .html