您好,欢迎访问三七文档
118 5年高考3年模拟B版(教师用书)§11.2 随机抽样、用样本估计总体对应学生用书起始页码P228考点一随机抽样类别共同点各自特点联系适用范围简单随机抽样系统抽样分层抽样(1)抽样过程中每个个体被抽到的可能性相等;(2)每次抽出个体后不再将它放回,即不放回抽样从总体中逐个抽取,是一种等可能抽样总体个体数较少先将总体均分成几部分,再按预先设定的规则在各部分中进行抽取,是一种等距抽样在起始部分抽样时,采用简单随机抽样总体个体数较多,且个体之间无明显差异将总体分成互不交叉的层,分层进行抽取,是一种等比例抽样各层抽样时,采用简单随机抽样或系统抽样总体由差异明显的几部分组成考点二用样本估计总体高频考点 1.频率分布表与频率分布直方图的绘制步骤如下:(1)求极差,即求一组数据中最大值与最小值的差;(2)决定组距与组数;(3)将数据分组;(4)列频率分布表,落在各小组内的数据的个数叫做频数,每小组的频数与样本容量的比值叫做这一小组的频率,计算各小组的频率,列出频率分布表;(5)画频率分布直方图,依据频率分布表画出频率分布直方图,其中纵坐标(小长方形的高)表示频率与组距的比值,其相应组距上的频率等于该组上的小长方形的面积,即每个小长方形的面积=组距×频率组距=频率.各个小长方形面积的总和等于1. 2.频率分布折线图和总体密度曲线(1)频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.(2)总体密度曲线:随着样本容量的增加,作频率分布直方图时所分的组数增加,组距减小,相应的频率分布折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.3.茎叶图茎叶图是统计中用来表示数据的一种图,茎叶图便于记录和表示数据的所有信息,但对数据的分析是粗略的.4.众数、中位数、平均数数字特征样本数据频率分布直方图众数出现次数最多的数据取最高的小矩形底边中点的横坐标中位数将数据按大小依次排列,处在最中间位置的一个数据(或最中间两个数据的平均数)把频率分布直方图划分为左右两个面积相等的部分,分界线与x轴交点的横坐标平均数样本数据的算术平均数每个小矩形的面积乘小矩形底边中点的横坐标之和 5.方差和标准差方差和标准差反映了数据波动程度的大小.(1)方差:s2=1n[(x1-x)2+(x2-x)2+…+(xn-x)2];(2)标准差:s=1n[(x1-x)2+(x2-x)2+…+(xn-x)2].注意 方差和标准差描述了一组数据与平均数的离散程度,反映了一组数据相对于平均数的波动情况,标准差和方差越大,说明这组数据的波动性越大.对应学生用书起始页码P228一、抽样方法的选择 1.系统抽样的最基本特征是“等距性”.一般地,每组内所抽取的号码依据第一组抽取的号码和组距确定.每组抽取的号码依次构成一个以第一组抽取的号码m为首项、组距d为公差的等差数列{an},第k组抽取的号码为ak=m+(k-1)d.2.分层抽样的关键是根据样本特征的差异进行分层,实质是等比例抽样,抽样比=样本容量个体总量=各层所抽取的个体数各层个体数量.(1)(2019河南部分省示范性高中1月份联考,7)某学校为落实学生掌握社会主义核心价值观的情况,用系统抽样的方法从全校2400名学生中抽取30人进行调查.现将2400名学生随机地从1~2400编号,按编号顺序平均分成30组(1~80号,81~160号,……,2321~2400号),若第3组与第4组抽出的号码之和为432,则第6组抽到的号码是( )A.416B.432C.448D.464(2)(2018安徽安庆一中、山西太原五中等五省六校(K12联盟)期末联考,3)某中学有高中生960人,初中生480人,为了了解学生的身体状况,采用分层抽样的方法,从该校学生中抽取容量为n的样本,其中高中生有24人,那么n等于( )A.12B.18C.24D.36解析 (1)设第n组抽到的号码是an,则{an}构成以80为公差的等差数列,所以a3=a1+80×2=160+a1,a4=a1+80×3=240+a1,则有a3+第十一章 概率与统计119 a4=2a1+80×5=432,解得a1=16,所以a6=16+80×5=416.故选A.(2)根据分层抽样方法知n960+480=24960,解得n=36.答案 (1)A (2)D 1-1 (2018福建福州3月质量检测,2)为了解某地区的“微信健步走”活动情况,拟从该地区的人群中抽取部分人员进行调查,事先已了解到该地区老、中、青三个年龄段人员的“微信健步走”活动情况有较大差异,而男女“微信健步走”活动情况差异不大.在下面的抽样方法中,最合理的抽样方法是( )A.简单随机抽样B.按性别分层抽样C.按年龄段分层抽样D.系统抽样1-1答案 C解析 根据题意及分层抽样的特征知选C. 1-2 总体由编号为01,02,…,19,20的20个个体组成.利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为( )7816657208026314070243699728019832049234493582003623486969387481A.08B.07C.02D.011-2答案 D解析 由题意知选取的5个个体的编号为08,02,14,07,01.故选D.二、频率分布直方图的应用 1.绘制频率分布直方图时需注意:(1)频率分布直方图中的纵轴表示频率组距,而不是频率;(2)频率分布直方图中各小长方形的高之比就是相应各组的频率之比;(3)频率分布直方图中各个小长方形的面积是相应各组的频率,所有的小长方形的面积之和等于1,即频率之和为1.2.由频率分布直方图进行相关计算时,需掌握下列关系式:(1)频率组距×组距=频率;(2)频数样本容量=频率,此关系式的变形为频数频率=样本容量,样本容量×频率=频数.(2019广东广州天河综合测试(一),19)某学校高三年级学生某次身体素质体能测试的原始成绩采用百分制,已知所有这些学生的原始成绩均分布在[50,100]内,发布成绩使用等级制,各等级划分标准见下表.百分制85分及以上70分到84分60分到69分60分以下等级ABCD 规定:A,B,C三个等级为合格,D等级为不合格.为了解该校高三年级学生身体素质情况,从中抽取了n名学生的原始成绩作为样本进行统计.按照[50,60),[60,70),[70,80),[80,90),[90,100]分组作出的频率分布直方图如图1所示,样本中分数在80分及以上的所有数据的茎叶图如图2所示.(1)求n和频率分布直方图中的x,y的值,并估计该校高三年级学生成绩是合格的概率;(2)根据频率分布直方图,求成绩的中位数(精确到0.1);(3)在选取的样本中,从A,D两个等级的学生中随机抽取2名学生进行调研,求至少有一名学生是A等级的概率.解析 (1)由题意知,样本容量n=60.012×10=50,x=250×10=0.004,y=1-0.04-0.1-0.12-0.5610=0.018.因为成绩是合格的人数为(1-0.1)×50=45,所以抽取的50人中成绩是合格等级的概率P=910,即估计该校高三年级学生成绩是合格的概率为910.(2)根据频率分布直方图,知成绩的中位数为70+0.220.56×10≈73.9(分).(3)由茎叶图知,A等级的学生有3人,由频率分布直方图知D等级的学生有0.1×50=5人,记A等级的学生为a、b、c,D等级的学生为d、e、f、g、h,从这8人中随机抽取2人,基本事件是:ab、ac、ad、ae、af、ag、ah、bc、bd、be、bf、bg、bh、cd、ce、cf、cg、ch、de、df、dg、dh、ef、eg、eh、fg、fh、gh,共28个;至少有一名学生是A等级的基本事件是:ab、ac、ad、ae、af、ag、ah、bc、bd、be、bf、bg、bh、cd、ce、cf、cg、ch,共18个,故所求的概率P=1828=914. 2-1 (2018安徽马鞍山第一次教学质量检测,13)已知样本容量为200,在样本的频率分布直方图中,共有n个小矩形,若中间一个小矩形的面积等于其余(n-1)个小矩形面积和的13,则该组的频数为 .2-1答案 50解析 设除中间一个小矩形外的(n-1)个小矩形面积的和为p,则中间一个小矩形面积为13p,p+13p=1,p=34,则中间一个小矩形的面积等于13p=14,200×14=50,即该组的频数为50. 2-2 我国是世界上严重缺水的国家,某市为了制订合理的节水方案,对居民用水情况进行了调查.通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成了如图所示的频率分布直方图.120 5年高考3年模拟B版(教师用书)(1)求直方图中a的值;(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,说明理由;(3)估计居民月均用水量的中位数.2-2解析 (1)由频率分布直方图,可知:月均用水量在[0,0.5)的频率为0.08×0.5=0.04.同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5]等组的频率分别为0.08,0.21,0.25,0.06,0.04,0.02.由1-(0.04+0.08+0.21+0.25+0.06+0.04+0.02)=0.5×a+0.5×a,解得a=0.30.(2)由(1),100位居民月均用水量不低于3吨的频率为0.06+0.04+0.02=0.12,由以上样本的频率分布,可以估计30万居民中月均用水量不低于3吨的人数为300000×0.12=36000.(3)设中位数为x吨.因为前5组的频率之和为0.04+0.08+0.15+0.21+0.25=0.73>0.5,而前4组的频率之和为0.04+0.08+0.15+0.21=0.48<0.5,所以2≤x<2.5.由0.50×(x-2)=0.5-0.48,解得x=2.04.故可估计居民月均用水量的中位数为2.04吨.三、样本的数字特征及其应用 1.平均数、中位数、众数与方差、标准差都是重要的数字特征,利用它们可对总体进行一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数可描述总体的集中趋势,方差和标准差可描述波动大小.2.有关平均数、方差的一些结论:(1)若数据x1,x2,…,xn的平均数为x,那么mx1+a,mx2+a,mx3+a,…,mxn+a的平均数是mx+a.(2)设数据x1,x2,…,xn的方差为s2,则①s2=1n[(x1-x)2+(x2-x)2+…+(xn-x)2];②数据x1+a,x2+a,…,xn+a的方差也为s2;③数据ax1,ax2,…,axn的方差为a2s2.(2018河南新乡一模,19)为了了解甲、乙两个工厂生产的轮胎的宽度是否达标,从两厂各随机选取了10个轮胎,将每个轮胎的宽度(单位:mm)记录下来并绘制出如下的折线图:(1)分别计算甲、乙两厂提供的10个轮胎宽度的平均值;(2)若轮胎的宽度在[194,196]内,则称这个轮胎是标准轮胎.试比较甲、乙两厂分别提供的10个轮胎中所有标准轮胎宽度的方差的大小,根据两厂的标准轮胎宽度的平均水平及其波动情况,判断这两个工厂哪个的轮胎相对更好.解析 (1)甲厂10个轮胎宽度的平均值:x甲=110×(195+1
本文标题:(课标专用)2020届高考数学一轮复习 第十一章 概率与统计 11.2 随机抽样、用样本估计总体教师
链接地址:https://www.777doc.com/doc-8453826 .html