您好,欢迎访问三七文档
第二章统计2.2用样本估计总体2.2.1用样本的频率分布估计总体分布学习目标核心素养1.会用频率分布表,画频率分布直方图表示样本数据.(难点)2.能通过频率分布表和频率分布直方图对数据做出总体统计.(重点)3.理解茎叶图的概念,会画茎叶图.(重点)1.通过频率分布直方图和茎叶图的学习,培养数据分析素养.2.借助图表中的数据运算,提升数学运算素养.自主预习探新知1.频率分布直方图的画法2.频率分布折线图和总体密度曲线(1)频率分布折线图:连接频率分布直方图中各小长方形,就得到了频率分布折线图.(2)总体密度曲线:随着样本容量的增加,作图时所分的也在增加,组距减小,相应的频率分布折线图就会越来越接近于一条,统计中称之为总体密度曲线,它反映了总体在各个范围内取值的百分比.光滑曲线上端的中点组数3.茎叶图(1)茎叶图的制作方法(以两位数据为例):将所有两位数的十位数字作为,个位数字作为,茎相同者共用一个茎,茎按从的顺序从上向下列出.小到大茎叶(2)茎叶图的优缺点在样本数据时,用茎叶图表示数据的效果较好.它不但可以保留所有信息,而且可以随时,这对数据的记录和表示都能带来方便.但是当样本数据时,茎叶图就显得不太方便,因为每一个数据都要在图中占据一个空间,如果数据很多,枝叶就会很长.较少记录较多思考:通过抽样获取的原始数据有何缺点?[提示]因为通过抽样获得的原始数据多而且杂乱,无法直接从中理解它们的含义,并提取信息,也不便于我们用它来传递信息.1.下列关于茎叶图的叙述正确的是()A.将数组的数按位数进行比较,将数大小基本不变或变化不大的位作为一个主杆(茎),将变化大的位的数作为分枝(叶),列在主杆的后面B.茎叶图只可以分析单组数据,不能对两组数据进行比较C.茎叶图更不能表示三位数以上的数据D.画图时茎要按照从小到大的顺序从下向上列出,共茎的叶可随意同行列出A[由茎叶图的概念可得.]2.一个容量为80的样本中,数据的最大值为152,最小值为60,组距为10,应将样本数据分为()A.10组B.9组C.8组D.7组A[由题意知,152-6010=9.2,故应分成10组.]3.200辆汽车通过某一段公路时的时速的频率分布直方图如图所示,时速在[50,60)内的汽车有()A.30辆B.40辆C.60辆D.80辆C[由直方图知,时速在[50,60)内的频率为0.03×10=0.3,故此段内汽车有200×0.3=60辆.]4.如图是一个班的语文成绩的茎叶图(单位:分),则优秀率(90分以上)是________,最低分是________.4%51[由茎叶图知,样本容量为25,90分以上有1人,故优秀率为125×100%=4%,最低分为51分.]合作探究释疑难频率分布直方图的绘制[探究问题]1.要做频率分布表,需要对原始数据做哪些工作?[提示]分组、频数累计、计算频数和频率.2.画频率分布直方图时,如何决定组数与组距?[提示]若极差组距为整数,则极差组距=组数.若极差组距不为整数,则极差组距+1=组数.注意:[x]表示不大于x的最大整数.3.同一组数据,如果组距不同,得到的频率分布直方图也会不同吗?[提示]不同.对于同一组数据分析时,要选好组距和组数,不同的组距与组数对结果有一定的影响.【例1】某中学从高一年级随机抽取50名学生进行智力测验,其得分如下(单位:分):4864528671486441867971688284686462688157905274735678476655645688694073976856675970527944556962583258根据上面的数据,回答下列问题:(1)这次测验成绩的最高分和最低分分别是多少?(2)将区间[30,100]平均分成7个小区间,试列出这50名学生智力测验成绩的频率分布表,进而画出频率分布直方图;(3)分析频率分布直方图,你能得出什么结论?思路点拨:按画频率分布直方图的步骤进行绘制.[解](1)这次测验成绩的最低分是32分,最高分是97分.(2)根据题意,列出样本的频率分布表如下:分组频数频率[30,40)10.02[40,50)60.12[50,60)120.24[60,70)140.28[70,80)90.18[80,90)60.12[90,100]20.04合计501.00频率分布直方图如图所示.(3)从频率分布直方图可以看出,这50名学生的智力测验成绩大体上呈两头小、中间大,左右基本对称,说明这50名学生中智力特别好或特别差的占极少数,而智力一般的占多数,这是一种最常见的分布.1.(变条件)美国历届总统中,就任时年纪最小的是罗斯福,他于1901年就任,当时年仅42岁;就任时年纪最大的是里根,他于1981年就任,当时69岁.下面按时间顺序(从1789年的华盛顿到2009年的奥巴马,共44任)给出了历届美国总统就任时的年龄:57,61,57,57,58,57,61,54,68,51,49,64,50,48,65,52,56,46,54,49,51,47,55,55,54,42,51,56,55,51,54,51,60,62,43,55,56,61,52,69,64,46,54,48将数据进行适当的分组,并画出相应的频率分布直方图.[解]以4为组距,列表如下:频率分布直方图如下:2.(变结论)本例条件不变,若把所给数据去掉一个最高分和一个最低分后分成5组,试画出这48名学生智力测验成绩的频率分布直方图.[解]列出频率分布表如下:频率分布直方图如下:绘制频率分布直方图应注意的问题1组数与样本容量有关,一般地,样本容量越大,所分组数越多.当样本容量不超过100时,按数据的多少,常分成5~12组.2在确定分组区间的端点,即分点时,应对分点进行适当调整,使分点比数据多一位小数,并确保每个数据均能落在一个区间内,而不是处于区间的端点.3一般地,频率分布直方图中两坐标轴上的单位长度是不一致的,纵轴是频率/组距,而不是频率.频率分布直方图的应用【例2】为增强市民节能环保意识,我市面向全市征召义务宣传志愿者,现从符合条件的500名志愿者中随机抽取100名志愿者,他们的年龄情况如下表所示:分组(单位:岁)频数频率[20,25)50.05[25,30)①0.20[30,35)35②[35,40)300.30[40,45]100.10合计1001.00(1)频率分布表中的①②位置应填什么数据?(2)补全如图所示的频率分布直方图,再根据频率分布直方图估计这500名志愿者中年龄在[30,35)岁的人数.[解](1)设年龄在[25,30)岁的频数为x,年龄在[30,35)岁的频率为y.法一:根据题意可得x100=0.20,35100=y,解得x=20,y=0.35,故①处应填20,②处应填0.35.法二:由题意得5+x+35+30+10=100,0.05+0.20+y+0.30+0.10=1,解得x=20,y=0.35,故①处填20,②处填0.35.(2)由频率分布表知年龄在[25,30)岁的频率是0.20,组距是5.所以频率组距=0.205=0.04.补全频率分布直方图如图所示.根据频率分布直方图估计这500名志愿者中年龄在[30,35)岁的人数为500×0.35=175.频率分布直方图的性质1因为小矩形的面积=组距×频率组距=频率,所以各小矩形的面积表示相应各组的频率.这样,频率分布直方图就以面积的形式反映了数据落在各个小组内的频率大小.2在频率分布直方图中,各小矩形的面积之和等于1.3频数相应的频率=样本容量.[跟进训练]1.从某小区抽取100户居民进行月用电量调查,发现其用电量都在50至350度之间,频率分布直方图如图所示.(1)求直方图中x的值;(2)在这些用户中,求用电量落在区间[100,250)内的户数.[解](1)由频率分布直方图知[200,250)小组的频率为1-(0.0024+0.0036+0.0060+0.0024+0.0012)×50=0.22,于是x=0.2250=0.0044.(2)∵数据落在[100,250)内的频率为(0.0036+0.0060+0.0044)×50=0.7,∴所求户数为0.7×100=70.茎叶图的绘制及应用【例3】某中学高二(2)班甲、乙两名学生自进入高中以来,每次数学考试成绩情况如下:甲:95,81,75,91,86,89,71,65,76,88,94,110,107.乙:83,86,93,99,88,103,98,114,98,79,78,106,101.画出两人数学成绩的茎叶图,并根据茎叶图对两人的成绩进行比较.思路点拨:题中可以用十位数字为茎,个位数字为叶作茎叶图.然后由茎叶图的特点分析两人的成绩.[解]甲、乙两人数学成绩的茎叶图如图所示:从这个茎叶图上可以看出,乙同学的得分情况是大致对称的,中位数是98;甲同学的得分情况,也大致对称,中位数是88.乙同学的成绩比较稳定,总体情况比甲同学好.绘制茎叶图的注意点1绘制茎叶图时需注意“叶”的位置的数字位数只有一位,而“茎”的位置的数字位数一般不需要统一.2茎叶图可用于确定数据的中位数,判断数据大致集中在哪个茎,是否关于该茎对称,是否分布均匀等.[跟进训练]2.从甲、乙两个班中各随机选出15名同学进行随堂测验,成绩的茎叶图如图所示,则甲、乙两组的最高成绩分别是________,________,从图中看,________班的平均成绩较高.9692乙[由茎叶图知,甲班最高分是96分,乙班的最高分是92.甲班的成绩集中在60~80间,乙班的成绩集中在70~90间,故乙班的平均成绩较高.]课堂小结提素养1.总体分布指的是总体取值的频率分布规律,由于总体分布不易知道,因此我们往往用样本的频率分布去估计总体的分布.2.总体的分布分两种情况:当总体中的个体取值很少时,用茎叶图估计总体的分布;当总体中的个体取值较多时,将样本数据恰当分组,用各组的频率分布描述总体的分布,方法是用频率分布表或频率分布直方图.1.判断下列结论的正误(正确的打“√”,错误的打“×”)(1)用样本的频率分布可以估计总体分布.()(2)频率分布直方图的纵轴表示频率.()(3)只有两位的数据能用茎叶图表示.()[答案](1)√(2)×(3)×2.观察新生儿的体重,其频率分布直方图如图所示,则新生儿体重在[2700,3000)内的频率为()A.0.1B.0.2C.0.3D.0.4C[由图可得,新生儿体重在[2700,3000)内的频率为0.001×300=0.3.]3.如图所示的茎叶图表示的是一台自动售货机的销售情况,则茎叶图中9表示的销售额为()A.9B.49C.29D.1349C[观察茎叶图,分清楚茎和叶即可.分开茎、叶的竖线左侧仅有一列,表示茎,右侧有多列,表示叶,所以9表示的销售额为29.]4.某班50名同学参加数学测验,成绩的分组及各组的频数如下:[40,50),2;[50,60),3;[60,70),10;[70,80),15;[80,90),12;[90,100],8.(1)列出样本的频率分布表;(2)画出频率分布直方图.[解](1)频率分布表如下:分组频数频率[40,50)20.04[50,60)30.06[60,70)100.2[70,80)150.3[80,90)120.24[90,100]80.16(2)频率分布直方图如下:Thankyouforwatching!
本文标题:2020-2021学年高中数学 第2章 统计 2.2 用样本估计总体 2.2.1 用样本的频率分布估
链接地址:https://www.777doc.com/doc-8238875 .html