您好,欢迎访问三七文档
最新课程标准:用样本估计总体①结合实例,能用样本估计总体的集中趋势参数(平均数、中位数、众数),理解集中趋势参数的统计含义.②结合实例,能用样本估计总体的离散程度参数(标准差、方差、极差),理解离散程度参数的统计含义.③结合实例,能用样本估计总体的取值规律.知识点数据的直观表示1.柱形图:能够反映样本的频率分布规律的直方图.2.频率分布折线图:将频率分布直方图中各相邻的矩形的________的中点顺次连接起来,就得到频率分布折线图.3.扇形图可以形象地表示出各部分数据在全部数据中所占的比例情况.4.茎叶图的画法步骤第一步:将每个数据分为茎(高位)和叶(低位)两部分;第二步:将最小茎与最大茎之间的数按大小次序排成一列;第三步:将各个数据的叶依次写在其茎的两侧.上底边5.频数(率)分布直方图绘制频率分布直方图的步骤状元随笔表示频率分布的几种方法的优点与不足优点不足频率分布表表示数量较确切分析数据分布的总体态势不方便频率分布直方图表示数据分布情况非常直观原有的具体数据信息被抹掉了频率分布折线图能反映数据的变化趋势不能显示原有数据信息[基础自测]1.关于频率分布直方图中的有关数据,下列说法正确的是()A.直方图的高表示该组上的个体在样本中出现的频率与组距的比值B.直方图的高表示该组上的个体在样本中出现的频率C.直方图的高表示取某数的频率D.直方图的高表示该组上的个体数与组距的比值解析:直方图的高表示频率与组距的比值,直方图的面积为频率.答案:A2.一个容量为n的样本,分成若干组,已知某组的频数和频率分别为40,0.125,则n的值为()A.640B.320C.240D.160解析:依题意得40n=0.125,∴n=400.125=320.答案:B3.甲、乙两个班各随机选出15名同学进行测验,所得成绩的茎叶图如图.从图中看,________班的平均成绩较高.解析:结合茎叶图中成绩的情况可知,乙班平均成绩较高.答案:乙题型一频率分布直方图、频率分布折线图的绘制[经典例题]例1美国历届总统中,就任时年龄最小的是罗斯福,他于1901年就任,当时年仅42岁;就任时年龄最大的是特朗普,他于2016年就任,当时70岁.下面按时间顺序(从1789年的华盛顿到2016年的特朗普,共45任)给出了历届美国总统就任时的年龄:57,61,57,57,58,57,61,54,68,51,49,64,50,48,65,52,56,46,54,49,51,47,55,55,54,42,51,56,55,51,54,51,60,62,43,55,56,61,52,69,64,46,54,47,70.(1)将数据进行适当的分组,并画出相应的频率分布直方图和频率分布折线图;(2)用自己的语言描述一下历届美国总统就任时年龄的分布情况.【解析】(1)以4为组距,列频率分布表如下:分组频数频率[42,46)20.0444[46,50)70.1555[50,54)80.1778[54,58)160.3556[58,62)50.1111[62,66)40.0889[66,70]30.0667合计451.0000画出相应的频率分布直方图和频率分布折线图,如图所示.(2)从频率分布表中可以看出,将近60%的美国总统就任时的年龄在50岁至60岁之间,45岁及45岁以下和65岁以上就任的总统所占的比例相对较小.状元随笔找出此组数据的最大值和最小值―→确定分组的组距和组数―→列出频率分布表―→由频率分布表绘制频率分布直方图、折线图―→根据图形特点作分析方法归纳绘制频率分布直方图应注意的问题(1)在绘制出频率分布表后,画频率分布直方图的关键就是确定小矩形的高.一般地,频率分布直方图中两坐标轴上的单位长度是不一致的,合理的定高方法是“以一个恰当的单位长度”(没有统一规定),然后以各组的“频率组距”所占的比例来定高.如我们预先设定以“”为1单位长度,代表“0.1”,则若一个组的频率组距为0.2,则该小矩形的高就是“”(占两个单位长度),依此类推.(2)数据要合理分组,组距要选取恰当,一般尽量取整,数据为30~100个时,应分成5~12组,在频率分布直方图中,各个小长方形的面积等于各组的频率,小长方形的高与频数成正比,各组频数之和等于样本容量,频率之和为1.跟踪训练1有一个容量为200的样本,数据的分组以及各组的频数如下:[-20,-15),7;[-15,-10),11;[-10,-5),15;[-5,0),40;[0,5),49;[5,10),41;[10,15),20;[15,20),17.(1)列出样本的频率分布表;(2)画出频率分布直方图和频率分布折线图;(3)求样本数据不足0的频率.解析:(1)频率分布表如下:分组频数频率[-20,-15)70.035[-15,-10)110.055[-10,-5)150.075[-5,0)400.2[0,5)490.245[5,10)410.205[10,15)200.1[15,20]170.085合计2001.00(2)频率分布直方图和频率分布折线图如图所示:(3)样本数据不足0的频率为:0.035+0.055+0.075+0.2=0.365.①求极差.②组距及组数.③分组.④列表.⑤画直方图.题型二频率分布直方图的应用[经典例题]例2已知某市2015年全年空气质量等级如表1所示.表1空气质量等级(空气质量指数(AQI))频数频率优(AQI≤50)8322.8%良(50AQI≤100)12133.2%轻度污染(100AQI≤150)6818.6%中度污染(150AQI≤200)4913.4%重度污染(200AQI≤300)308.2%严重污染(AQI300)143.8%合计365100%2016年5月和6月的空气质量指数如下:5月2408056539212645875660191625558565389901251241038189443453798162116886月63921101221021168116315876331026553385552769912712080108333573829014695选择合适的统计图描述数据,并回答下列问题:(1)分析该市2016年6月的空气质量情况.(2)比较该市2016年5月和6月的空气质量,哪个月的空气质量较好?(3)比较该市2016年6月与该市2015年全年的空气质量,2016年6月的空气质量是否好于2015年?【解析】(1)根据该市2016年6月的空气质量指数和空气质量等级分级标准,可以画出该市这个月的不同空气质量等级的频数与频率分布表(表2).表2空气质量等级优良轻度污染中度污染重度污染严重污染合计天数415920030比例13.33%50%30%6.67%00100%从表中可以看出,“优”“良”的天数达19天,占了整月的63.33%,没有出现“重度污染”和“严重污染”.我们可以用条形图和扇形图对数据作出直观的描述,如图1和图2.从条形图中可以看出,在前三个等级的占绝大多数,空气质量等级为“良”的天数最多,后三个等级的天数很少.从扇形图中可以看出,空气质量为“良”的天数占了总天数的一半,大约有三分之二为“优”“良”,大多数是“良”和“轻度污染”.因此,整体上6月的空气质量不错.我们还可以用折线图展示空气质量指数随时间的变化情况,如图3.容易发现,6月的空气质量指数在100附近波动.(2)根据该市2016年5月的空气质量指数和空气质量分级标准,可以画出该市这个月的不同空气质量等级的频数和频率分布表(表3).表3空气质量等级优良轻度污染中度污染重度污染严重污染合计天数321511031频率10%68%16%3%3%0100%为了便于比较,我们选用复合条形图,将两组数据同时反映到一个条形图上.通过条形图中柱的高低,可以更直观地进行两个月的空气质量的比较(下图).由表3和图4可以发现,5月空气质量为“优”和“良”的总天数比6月多.所以,从整体上看,5月的空气质量略好于6月,但5月有重度污染,而6月没有.(3)把2016年6月和2015年全年的空气质量进行比较,由于一个月和一年的天数差别很大,所以直接通过频数比较没有意义,应该转化成频率分布进行比较.可以通过二者的空气质量指数的频率分布直方图或空气质量等级的频率分布条形图进行比较(图5).通过图5可以看出,虽然2016年6月的空气质量为“优”的频率略低于2015年,但“良”的频率明显高于2015年,而且2016年6月中度以上的污染天气频率明显小于2015年.所以从整体上看,2016年6月的空气质量要好于2015年全年的空气质量.方法归纳频率分布直方图的意义(1)频率分布直方图以面积的形式反映了数据落在各组内频率大小.(2)在频率分布直方图中,各小矩形的面积之和等于1.(3)频数/相应的频率=样本容量.跟踪训练2[2019·北京模拟]从某小学随机抽取100名同学,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图所示),由图中数据可知a=________.若要从身高在[120,130),[130,140),[140,150]三组内的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在[140,150]内的学生中选取的人数应为________.解析:因为频率分布直方图中各小长方形的面积之和为1,所以10×(0.005+0.035+a+0.020+0.010)=1,解得a=0.030.由图可知身高在[120,150]内的学生人数为100×10×(0.030+0.020+0.010)=60,其中身高在[140,150]内的学生人数为10,所以从身高在[140,150]内的学生中选取的人数为1860×10=3.答案:0.0303状元随笔各小长方形的面积表示数据落在相应区间的频率和为1→建立关于a的方程→求解即可依据样本容量和频率求出三组的频数和,即抽样的总体个数→求出抽样比→所求人数即得题型三茎叶图[教材P81例1]例3为了快速了解某学校学生体重(单位:kg)的大致情况,随机抽取了10名学生称重,得到的数据整理成茎叶图如图所示.估计这个学校学生体重的平均数和方差.【解析】将样本中的每一个数都减去50,可得-5,-1,-3,-1,-4,-4,1,8,9,10,这组数的平均数为-5-1-3-1-4-4+1+8+9+1010=1,方差为62+22+42+22+52+52+02+72+82+9210=30.4.因此可估计这个学校学生体重平均数为51,方差为30.4.教材反思茎叶图中的三个关注点(1)“叶”的位置只有一个数字,而“茎”的位置的数字位数一般不需要统一.(2)重复出现的数据要重复记录,不能遗漏.(3)给定两组数的茎叶图,估计数字特征,茎上的数字由小到大排列,一般“重心”下移者平均数较大,数据集中者方差较小.跟踪训练3[2019·贵州遵义航天高中模拟]某学生在一门功课的22次考试中,所得分数茎叶图如图所示,则此学生该门功课考试分数的极差与中位数之和为()A.117B.118C.118.5D.119.5解析:22次考试中,所得分数最高的为98,最低的为56,所以极差为98-56=42,将分数从小到大排列,中间两数为76,76,所以中位数为76,所以此学生该门功课考试分数的极差与中位数之和为42+76=118.答案:B
本文标题:2019-2020学年新教材高中数学 第五章 统计与概率 5.1.3 数据的直观表示 5.1.4 用
链接地址:https://www.777doc.com/doc-8263606 .html