您好,欢迎访问三七文档
第九章统计、统计案例第2节用样本估计总体◆考纲·了然于胸◆1.了解分布的意义与作用,能根据频率分布表画频率分布直方图、频率折线图、茎叶图,体会它们各自的特点.2.理解样本数据标准差的意义和作用,会计算数据标准差.3.能从样本数据中提取基本的数字特征(如平均数、标准差),并做出合理的解释.4.会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想.5.会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题.[要点梳理]1.作频率分布直方图的步骤[质疑探究1]频率分布直方图中纵轴表示什么含义?小长方形的面积表示什么?各小长方形面积之和等于多少?提示:频率组距,频率,1.2.频率分布折线图和总体密度曲线(1)频率分布折线图:把频率分布直方图中各个长方形上边的______用线段连接起来,就得到频率分布折线图.(2)设想如果样本容量__________________,分组的组距________________,则频率分布直方图实际上越来越接近于____________,它可以用一条光滑曲线________来描绘,这条光滑曲线就叫做总体密度曲线.不断增大不断缩小总体的分布y=f(x)中点3.茎叶图定义是统计中用来表示数据的一种图,茎是指中间的一列数,叶就是从茎的旁边生长出来的数画法对于样本数据较少,且分布较为集中的一组数据:若数据是两位整数,则将十位数字作茎,个位数字作叶;若数据是三位整数,则将百位、十位数字作茎,个位数字作叶.样本数据为小数时做类似处理.对于样本数据较少,且分布较为集中的两组数据,关键是找到两组数据共有的茎优缺点用茎叶图表示数据的优点是:(1)所有的信息都可以从茎叶图中得到;(2)便于记录和读取,能够展示数据的分布情况.缺点是:当样本数据较多或数据位数较多时,茎叶图就显得不太方便4.样本的数字特征数字特征定义特点众数在一组数据中出现次数最多的数据体现了样本数据的最大集中点,不受极端值的影响,而且不唯一中位数将一组数据按大小顺序依次排列,处在最中间位置的一个数据(或最中间两个数据的平均数)中位数不受极端值的影响,仅利用了排在中间数据的信息平均数样本数据的算术平均数如果有n个数x1,x2,…,xn,那么x-=1n(x1+x2+…+xn)叫做这n个数的平均数.在频率分布直方图中,平均数的估计值等于每个小矩形的面积乘以小矩形底边中点的横坐标之和标准差标准差是样本数据到平均数的一种平均距离,即s=1n[x1-x-2+x2-x-2+…+xn-x-2].反映了各个样本数据聚集于样本平均数周围的程度.标准差越小,表明各个样本数据在样本平均数周围越集中;标准差越大,表明各个样本数据在样本平均数的两边越分散方差标准差的平方,即s2=1n[(x1-x-)2+(x2-x)2+…+(xn-x-)2]同标准差一样用来衡量样本数据的离散程度,但是平方后夸大了偏差程度[质疑探究2]怎样利用频率分布直方图求众数、中位数与平均数?提示:在频率分布直方图中:(1)最高的小长方形底边中点的横坐标即是众数;(2)中位数左边和右边的小长方形的面积和是相等的;(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.[质疑探究3]平均数、标准差与方差反映了数据的哪些特征?提示:平均数反映了数据取值的平均水平,标准差、方差反映了数据对平均数的波动情况,即标准差、方差越大,数据的离散程度越大,越不稳定;反之离散程度越小,越稳定.[小题查验]1.给出下列命题,正确的是()①一组数据的平均数一定大于这组数据中的每个数据②平均数、众数与中位数都可以描述数据的集中趋势③一组数据的方差越大,说明这组数据的波动越大④频率分布直方图中,小矩形的面积越大,表示样本数据落在该区间内的频率越高⑤茎叶图中的数据要按从小到大的顺序写,相同的数据可以只记一次.A.①③④B.②③④C.③④D.②③④⑤[解析]①错误.平均数一定不大于这组数据中的最大值;②正确.平均数表示一组数据的平均水平,众数表示一组数据中出现次数最多的数,中位数等分样本数据所占频率,都可以从不同的角度描述数据的集中趋势.③正确.由方差的意义知结论正确.④正确.由频率分布直方图的意义知结论正确.⑤错误,茎叶图要求不能丢失数据.故选B.[答案]B2.某雷达测速区规定:凡车速大于或等于70km/h的汽车视为“超速”,并将受到处罚,如图是某路段的一个检测点对200辆汽车的车速进行检测所得结果的频率分布直方图,则从图中可以看出被处罚的汽车大约有()A.30辆B.40辆C.60辆D.80辆[解析]由题图可知,车速大于或等于70km/h的汽车的频率为0.02×10=0.2,则将被处罚的汽车大约有200×0.2=40(辆).故选B.[答案]B3.(2016·广州模拟)对某商店一个月内每天的顾客人数进行了统计,得到样本的茎叶图(如图所示),则该样本的中位数、众数、极差分别是()A.46,45,56B.46,45,53C.47,45,56D.45,47,53[解析]茎叶图中共有30个数据,所以中位数是第15个和第16个数字的平均数,即12(45+47)=46,排除C,D;再计算极差,最小数据是12,最大数据是68,所以68-12=56,故选A.[答案]A4.一个容量为20的样本,数据的分组及各组的频数如下:[10,20),2;[20,30),3;[30,40),x;[40,50),5;[50,60),4;[60,70),2;则x=________;根据样本的频率分布估计,数据落在[10,50)的概率约为________.[解析]x=20-(2+3+5+4+2)=4,P=2+3+4+520=0.7或P=1-4+220=710=0.7.[答案]40.75.如图所示是某学校一名篮球运动员在五场比赛中所得分数的茎叶图,则该运动员在这五场比赛中得分的方差为________.(注:方差s2=1n[(x1-x)2+(x2-x)2+…+(xn-x)2],其中x为x1,x2,…,xn的平均数)[解析]依题意知,运动员在5次比赛中的分数依次为8,9,10,13,15,其平均数为8+9+10+13+155=11.由方差公式得s2=15[(8-11)2+(9-11)2+(10-11)2+(13-11)2+(15-11)2]=15(9+4+1+4+16)=6.8.[答案]6.8考点一频率分布直方图的绘制及应用(基础型考点——自主练透)[方法链接](1)绘制频率分布直方图时需注意:①制作好频率分布表后可以利用各组的频率之和是否为1来检验该表是否正确;②频率分布直方图的纵坐标是频率组距,而不是频率.(2)由频率分布直方图进行相关计算时,需掌握下列关系式:频率组距×组距=频率.[题组集训]1.(2016·黄冈月考)从某小学随机抽取100名同学,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图).若要从身高在[120,130),[130,140),[140,150]三组内的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在[140,150]内的学生中选取的人数应为()A.2B.3C.4D.5[解析]选B依题意可得10×(0.005+0.01+0.02+a+0.035)=1,则a=0.03.所以身高在[120,130),[130,140),[140,150]三组内的学生比例为3∶2∶1.所以从身高在[140,150]内的学生中选取的人数应为3.2.(2016·河南三市调研)在检验某产品直径尺寸的过程中,将某尺寸分成若干组,[a,b)是其中的一组,抽查出的个体数在该组上的频率为m,该组在频率分布直方图上的高为h,则|a-b|等于()A.mhB.hmC.mhD.与h,m无关[解析]选A根据概率分布直方图的概念可知,|a-b|×h=m,由此可知|a-b|=mh.3.某地政府调查了工薪阶层1000人的月工资收入,并根据调查结果画出如图所示的频率分布直方图,为了了解工薪阶层对月工资收入的满意程度,要用分层抽样的方法从调查的1000人中抽出100人做电话询访,则(30,35](百元)月工资收入段应抽出________人.[解析]月工资收入落在(30,35](百元)内的频率为1-(0.02+0.04+0.05+0.05+0.01)×5=1-0.85=0.15,则0.15÷5=0.03,所以各组的频率比为0.02∶0.04∶0.05∶0.05∶0.03∶0.01=2∶4∶5∶5∶3∶1,所以(30,35](百元)月工资收入段应抽出320×100=15(人).[答案]154.(2016·烟台四校联考)据悉山东省高考要将体育成绩作为参考,为此,济南市为了了解今年高中毕业生的体能状况,从本市某校高中毕业班中抽取一个班进行铅球测试,成绩在8.0m(精确到0.1m)以上的为合格.把所得数据进行整理后,分成6组,并画出频率分布直方图的一部分如图所示.已知从左到右前5个小组对应矩形的高分别为0.04,0.10,0.14,0.28,0.30,且第6小组的频数是7.(1)求这次铅球测试成绩合格的人数;(2)若由直方图来估计这组数据的中位数,指出该中位数在第几组内,并说明理由.[解](1)由题易知,第6小组的频率为1-(0.04+0.10+0.14+0.28+0.30)×1=0.14,∴此次测试的总人数为70.14=50.∴这次铅球测试成绩合格的人数为(0.28×1+0.30×1+0.14×1)×50=36.(2)直方图中中位数两侧的矩形面积和相等,即频率和相等,前三组的频率和为0.28,前四组的频率和为0.56,∴中位数位于第4组内.考点二茎叶图的应用(重点型考点——师生共研)【例1】某学校随机抽取20个班,调查各班中有网上购物经历的人数,所得数据的茎叶图如图所示,以组距为5将数据分组成[0,5),[5,10),…,[30,35),[35,40]时,所作的频率分布直方图是()[解析]由分组可知C,D一定不对;由茎叶图可知[0,5)有1人,[5,10)有1人,∴第一、二小组频率相同,频率分布直方图中矩形的高应相等,可排除B.[答案]A【例2】(2016·九江模拟)甲、乙两人在淘宝网各开一家网店,直销同一厂家的同一种产品,厂家为考察两人的销售业绩,随机选了10天,统计两店销售量,得到如图所示的茎叶图,由图知()A.甲网店的极差大于乙网店的极差B.甲网店的中位数是46C.乙网店的众数是42D.甲网店的销售业绩好[解析]甲网店极差为58-6=52,乙网店极差为58-5=53,A错;甲网店中位数为44,B错;乙网店的众数为13,C错;甲网店平均数110(6+11+12+32+43+47+45+51+58+51)=35.6,乙网店平均数为110(5+7+13+13+13+22+34+42+42+58)=24.9,所以甲网店的业绩好.故选D.[答案]D【名师说“法”】在使用茎叶图时,一定要观察所有的样本数据,弄清楚这个图中数字的特点,不要漏掉了数据,也不要混淆茎叶图中茎与叶的含义.跟踪训练1.某苗圃基地为了解基地内甲、乙两块地种植的同一种树苗的长势情况,从两块地各随机抽取了10株树苗,用茎叶图表示上述两组数据,对两块地抽取树苗的高度的平均数x甲、x乙和中位数y甲、y乙进行比较,下面结论正确的是()A.x甲>x乙,y甲>y乙B.x甲<x乙,y甲<y乙C.x甲<x乙,y甲>y乙D.x甲>x乙,y甲<y乙[解析]从茎叶图看出乙地树苗高度的平均数大于甲地树苗高度的平均数,乙地树苗高度的中位数是35.5,甲地树苗高度的中位数是27.[答案]B2.(2013·山东高考)将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91,现场作的9个分数的茎叶图后来有一个数据模糊,无法辨认,在图中以x表示,则7个剩余分数的方差为()A.1169B.367C.36D.677[解析]这组数据为87,87,94,90,91,90,90+x,99,91,最高分为99,最低分为87,剩余
本文标题:用样本估计总体-
链接地址:https://www.777doc.com/doc-7479262 .html