您好,欢迎访问三七文档
第九篇统计与统计案例返回导航第2节用样本估计总体返回导航最新考纲1.了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特点.2.理解样本数据标准差的意义和作用,会计算数据标准差.3.能从样本数据中提取基本的数字特征(如平均数、标准差),并给出合理的解释.4.会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想.5.会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题.返回导航【教材导读】1.频率分布直方图提供了样本数据的哪些信息?提示:各组数据的频率.2.茎叶图提供了样本数据的哪些信息?提示:全部的原始数据.返回导航1.作频率分布直方图的步骤返回导航2.频率分布折线图和总体密度曲线(1)频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得频率分布折线图.(2)总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,即总体密度曲线.返回导航3.茎叶图定义是统计中用来表示数据的一种图,茎是指中间的一列数,叶就是从茎的旁边生长出来的数返回导航画法对于样本数据较少,且分布较为集中的一组数据:若数据是两位整数,则将十位数字作茎,个位数字作叶;若数据是三位整数,则将百位、十位数字作茎,个位数字作叶.样本数据为小数时做类似处理.对于样本数据较少,且分布较为集中的两组数据,关键是找到两组数据共有的茎返回导航优缺点用茎叶图表示数据的优点是:(1)所有的信息都可以从茎叶图中得到;(2)便于记录和读取,能够展示数据的分布情况.缺点是:当样本数据较多或数据位数较多时,茎叶图就显得不太方便返回导航4.样本的数字特征数字特征定义特点众数在一组数据中出现次数最多的数据体现了样本数据的最大集中点,不受极端值的影响,而且可能不唯一中位数将一组数据按大小顺序依次排列,处在最中间位置的一个数据(或最中间两个数据的平均数)中位数不受极端值的影响,仅利用了排在中间数据的信息返回导航平均数样本数据的算术平均数如果有n个数x1,x2,…,xn,那么x=1n(x1+x2+…+xn)叫做这n个数的平均数.在频率分布直方图中,平均数的估计值等于每个小矩形的面积乘以小矩形底边中点的横坐标之和返回导航标准差标准差是样本数据到平均数的一种平均距离,即s=反映了各个样本数据聚集于样本平均数周围的程度.标准差越小,表明各个样本数据在样本平均数周围越集中;标准差越大,表明各个样本数据在样本平均数的两边越分散方差标准差的平方,即s2=1n[(x1-x)2+(x2-x)2+…+(xn-x)2]同标准差一样用来衡量样本数据的离散程度,但是平方后夸大了偏差程度返回导航【重要结论】1.频率分布直方图中各个小矩形的面积之和为1,纵轴上的数据是各组的频率除以组距的结果.2.在频率分布直方图中,各组的中点值乘以各组的频率之和即为样本数组平均值的估计值.3.在频率分布直方图中,垂直于横轴的直线如果把各个小矩形的面积等分,则其对应的数据即为中位数的估计值.返回导航1.样本中共有五个个体,其值分别为0,1,2,3,m.若该样本的平均值为1,则其方差为()(A)105(B)305(C)2(D)2D解析:依题意得m=5×1-(0+1+2+3)=-1,样本方差s2=15(12+02+12+22+22)=2.即所求的样本方差为2.返回导航2.(2017全国卷Ⅲ)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.返回导航根据该折线图,下列结论错误的是()(A)月接待游客量逐月增加(B)年接待游客量逐年增加(C)各年的月接待游客量高峰期大致在7,8月(D)各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳A解析:根据折线图可知,2014年8月到9月、2014年10月到11月等月接待游客量都是减少,所以A错误.返回导航3.某赛季,甲、乙两名篮球运动员都参加了11场比赛,他们每场比赛得分的情况用如图所示的茎叶图表示,则甲、乙两名运动员的中位数分别为()(A)19、13(B)13、19(C)20、18(D)18、20返回导航A解析:由茎叶图可知,甲的中位数为19,乙的中位数为13.故选A.返回导航4.有一个容量为66的样本,数据的分组及各组的频数如下:[11.5,15.5)2[15.5,19.5)4[19.5,23.5)9[23.5,27.5)18[27.5,31.5)11[31.5,35.5)12[35.5,39.5)7[39.5,43.5)3根据样本的频率分布估计,数据落在[31.5,43.5]的概率约是()(A)16(B)13(C)12(D)23返回导航B解析:由条件可知,落在[31.5,43.5)的数据有12+7+3=22(个),故所求概率约为2266=13.故选B.返回导航5.农场种植的甲乙两种水稻,在面积相等的两块稻田中连续6年的年平均产量如下(单位:500g)品种第1年第2年第3年第4年第5年第6年甲900920900850910920乙890960950850860890则甲乙两种水稻平均产量的标准差分别是__________.返回导航解析:平均值都是900,甲的标准差约等于23.8,乙的标准差约等于41.6.答案:23.8,41.6返回导航考点一频率分布直方图为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图,图中从左到右各小长方形面积之比为2∶4∶17∶15∶9∶3,第二小组频数为12.返回导航返回导航(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少?(3)在这次测试中,学生跳绳次数的中位数落在哪个小组内?请说明理由.返回导航解:(1)由已知可设每组的频率为2x,4x,17x,15x,9x,3x.则2x+4x+17x+15x+9x+3x=1解得x=0.02.则第二小组的频率为0.02×4=0.08.样本容量为12÷0.08=150.返回导航(2)次数在110次以上(含110次)的频率和为17×0.02+15×0.02+9×0.02+3×0.02=0.34+0.3+0.18+0.06=0.88.则高一学生的达标率约为0.88×100%=88%.(3)在这次测试中,学生跳绳次数的中位数落在第四组,因为中位数为平分频率直方图的面积且垂直于横轴的直线与横轴交点的横坐标.返回导航【反思归纳】(1)纵轴上的数据是频率除以组距;(2)各组的频率之和等于1;(3)各组的频率等于各组的频数除以样本容量.返回导航【即时训练】(2018龙岩4月)党的十八大以来,脱贫攻坚取得显著成绩.2013年至2016年4年间,累计脱贫5564万人,2017年各地根据实际进行创新,精准、高效地完成了脱贫任务.某地区对当地3000户家庭的2017年所的年收入情况调查统计,年收入的频率分布直方图如图所示,数据(单位:千元)的分组依次为[20,40),[40,60),[60,80),[80,100),则年收入不超过6万的家庭大约为()返回导航(A)900户(B)600户(C)300户(D)150户返回导航A解析:由频率分布直方图可得成绩不超过60分的学生的概率为:(0.005+0.01)×20=0.3,所以成绩不超过60分的学生人数大约为:3000×0.3=900,故选A.返回导航考点二茎叶图(1)(2018毛坦厂中学4月)某商场对一个月内每天的顾客人数进行统计得到如图所示的样本茎叶图,则该样本的中位数和众数分别是()(A)46,45(B)45,46(C)46,47(D)47,45返回导航(2)某车间将10名技工平均分成甲、乙两组加工某种零件,在单位时间内每个技工加工的合格零件数的统计数据的茎叶图如图所示,已知两组技工在单位时间内加工的合格零件的平均数都为10.返回导航①求出m,n的值;②求出甲、乙两组技工在单位时间内加工的合格零件的方差s2甲和s2乙,并由此分析两组技工的加工水平;③质检部门从该车间甲、乙两组技工中各随机抽取一名,对其加工的零件进行检测,若两人加工的合格零件个数之和大于17,则称该车间“质量合格”,求该车间“质量合格”的概率.返回导航解析:(1)由茎叶图可知,出现次数最多的是数45,将所有数从小到大排列后,中间两数为45,47,故中位数为46,故选A.(2)①根据题意可知:x甲=15(7+8+10+12+10+m)=10,x乙=15(9+n+10+11+12)=10,∴m=3,n=8.返回导航②s2甲=15[(7-10)2+(8-10)2+(10-10)2+(12-10)2+(13-10)2]=5.2,s2乙=15[(8-10)2+(9-10)2+(10-10)2+(11-10)2+(12-10)2]=2,∵x甲=x乙,s2甲>s2乙,∴甲、乙两组的整体水平相当,乙组更稳定一些.返回导航③质检部门从该车间甲、乙两组技工中各随机抽取一名,对其加工的零件进行检测,设两人加工的合格零件数分别为a,b,则所有(a,b)有(7,8),(7,9),(7,10),(7,11),(7,12),(8,8),(8,9),(8,10),(8,11),(8,12),(10,8),(10,9),(10,10),(10,11),(10,12),(12,8),(12,9),(12,10),(12,11),(12,12),(13,8),(13,9),(13,10),(13,11),(13,12),共计25个,而a+b≤17的基本事件有(7,8),(7,9),(7,10),(8,8),(8,9),共计5个,故满足a+b>17的基本事件共有25-5=20(个),故该车间“质量合格”的概率为2025=45.返回导航【反思归纳】(1)茎叶图保留了全部的样本数据;(2)从茎叶图上可以发现样本数据的分散与集中程度,从而对样本数据的平均值和方差作出定性判断.返回导航【即时训练】某良种培育基地正在培育一小麦新品种A,将其与原有的一个优良品种B进行对照试验,两种小麦各种植了25亩,所得亩产数据(单位:千克)如下:品种A:357,359,367,368,375,388,392,399,400,405,412,414,415,421,423,423,427,430,430,434,443,445,445,451,454返回导航品种B:363,371,374,383,385,386,391,392,394,394,395,397,397,400,401,401,403,406,407,410,412,415,416,422,430(1)作出数据的茎叶图;(2)用茎叶图处理现有的数据,有什么优点?(3)通过观察茎叶图,对品种A与B的亩产量及其稳定性进行比较,写出统计结论.返回导航解析:(1)画出茎叶图如图所示.返回导航(2)由于每个品种的数据都只有25个,样本容量不大,画茎叶图很方便;此时茎叶图不仅清晰明了地展示了数据的分布情况,便于比较,没有任何信息损失,而且可以随时记录新的数据.(3)通过观察茎叶图可以看出:①品种A的亩产平均数(或均值)比品种B高;②品种A的亩产标准差(或方差)比品种B大,故品种A的亩产稳定性较差.返回导航考点三用样本估计总体随机抽取某中学甲、乙两班各10名同学,测量他们的身高(单位:cm),获得身高数据的茎叶图,如图所示.返回导航(1)根据茎叶图判断哪个班的平均身高较高;(2)计算甲班的样本方差;(3)现从乙班这10名同学中随机抽取2名身高不低于173cm的同学,求身高为176cm的同学被抽中的概率.返回导航解析:(1)由茎叶图可知:甲班同学身高集中在162~179cm,而乙班同学身高集中在170~179cm,因此乙班的平均身高高于甲班.(2)x甲=158+162+163+168+168+170+171+179+179+18210=
本文标题:2020版高考数学一轮复习 第九篇 统计与统计案例 第2节 用样本估计总体课件 文 新人教A版
链接地址:https://www.777doc.com/doc-8235787 .html