您好,欢迎访问三七文档
第9讲用样本估计总体1.了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特点.2.理解样本数据标准差的意义和作用,会计算数据标准差.3.能从样本数据中提取基本的数字特征(如平均数、标准差),并作出合理的解释.4.会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想.5.会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题.1.用样本估计总体通常我们对总体作出的估计一般分成两种,一种是用样本的频率分布估计总体的分布,另一种是用样本的数字特征估计总体的数字特征.2.统计图(1)频率分布直方图.①求极差:极差是一组数据的最大值与最小值的差.②决定组距和组数:当样本容量不超过100时,常分成5~12组.组距=.极差组数③将数据分组:通常对组内数值所在区间取左闭右开区间,最后一组取闭区间.也可以将样本数据多取一位小数分组.④列频率分布表:登记频数,计算频率,列出频率分布表.将样本数据分成若干个小组,每个小组内的样本个数称作频数,频数与样本容量的比值叫做这一小组的频率.频率反映各个数据在每组所占比例的大小.⑤绘制频率分布直方图:把横轴分成若干段,每一段对应一个组距,然后以线段为底作一小长方形,它的高等于该组的频率组距,这样得到一系列的长方形,每个长方形的面积恰好是该组上的频率.这些矩形就构成了频率分布直方图,各个长方形的面积总和等于______.1(2)频率分布折线图和总体密度曲线.①频率分布折线图:连接频率分布直方图中各长方形上端的中点,就得频率分布折线图.②总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率分布折线图就会越来越接近于一条光滑的曲线,统计中称之为总体密度曲线.(3)茎叶图.当样本数据较少时,用茎叶图表示数据的效果较好,它不但可以保留所有信息,而且可以随时记录,给数据的记录和表示都带来方便.3.用样本的数字特征估计总体的数字特征(1)众数、中位数、平均数.①众数:在一组数据中,出现次数最多的数据叫做这组数据的众数.②中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.③平均数:样本数据的算术平均数,即x-=1n(x1+x2+…+xn).在频率分布直方图中,中位数左边和右边的直方图的面积应该相等.(2)样本方差、标准差.①标准差s=1n[x1-x-2+x2-x-2+…+xn-x-2]平均数②标准差是反映总体波动大小的特征数,样本方差是标准差的平方.通常用样本方差估计总体方差,当样本容量接近总体容量时,样本方差接近总体方差.(其中xn是样本数据的第n项,n是样本容量,x-是__________).1.在广雅中学“十佳学生”评选的演讲比赛中,如图9-9-1是七位评委为某学生打出的分数的茎叶图,去掉一个最高分和)C一个最低分后,所剩数据的众数和中位数分别为(图9-9-1A.85,85B.84,86,C.84,85D.85,862.(2012年广东惠州第一次调研)从某小学随机抽取100名同学,将他们的身高(单位:cm)数据绘制成频率分布直方图(如)图9-9-2).由图中数据可知身高在[120,130]内的学生人数为(图9-9-2A.20B.25C.30D.35C3.甲、乙、丙、丁四人参加奥运会射击项目选拔赛,四人的平均成绩和方差如下表所示:从这四个人中选择一人参加奥运会射击项目比赛,最佳人人员甲乙丙丁-平均环数x8.68.98.98.23.53.52.15.6选是()CA.甲C.丙B.乙D.丁方差s24.(2013年四川成都二模)在某大型企业的招聘会上,前来应聘的本科生、硕士研究生和博士研究生共2000人,各类毕业生人数统计图如图9-9-3,则博士研究生的人数为__________.图9-9-3240考点1频率分布直方图的绘制及其应用例1:(2013年四川)某学校随机抽取20个班,调查各班中有网上购物经历的人数,所得数据的茎叶图如图9-9-4.以组距为5将数据分组成[0,5),[5,10),…,[30,35),[35,40]时,所作的频率分布直方图是()图9-9-4ACBD分组频数频率频率组距[0,5)10.050.01[5,10)10.050.01[10,15)40.200.04[15,20)20.100.02[20,25)40.200.04[25,30)30.150.03[30,35)30.150.03[35,40)20.100.02合计201.000.20解析:根据题意,列频率分布表得:故选A.【规律方法】用频率分布直方图解决相关问题时,应正确理解图表中各个量的意义,识图掌握信息是解决该类问题的关键.频率分布直方图有以下几个要点:①纵轴表示频率组距;②频率分布直方图中各长方形高的比也就是其频率之比;③直方图中每一个矩形的面积是样本数据落在这个区间上的频率,所有的小矩形的面积之和等于1,即频率之和为1.答案:A【互动探究】1.(2014年江苏)某种树木的底部周长的取值范围是[80,130],它的频率分布直方图如图9-9-5,则在抽测的60株树木中,有________株树木的底部周长小于100cm.图9-9-5解析:由题意知,在抽测的60株树木中,底部周长小于100cm的株数为(0.015+0.025)×10×60=24(株).答案:24考点2茎叶图的应用例2:(2014年新课标Ⅱ)某市为了考核甲、乙两部门的工作情况,随机访问了50位市民,根据这50位市民对这两部门的评分(评分越高表明市民的评价越高),绘制茎叶图(如图9-9-6).图9-9-6(1)分别估计该市的市民对甲、乙两部门评分的中位数;(2)分别估计该市的市民对甲、乙两部门的评分高于90分的概率;(3)根据茎叶图分析该市的市民对甲、乙两部门的评价.的是66,68,故样本中位数为66+682=67,所以该市的市民对乙部门评分的中位数的估计值是67.解:(1)由所给茎叶图知,50位市民对甲部门的评分由小到大排序,排在第25,26位的是75,75,故样本中位数为75,所以该市的市民对甲部门评分的中位数的估计值是75.50位市民对乙部门的评分由小到大排序,排在第25,26位=0.1,=0.16.(2)由所给茎叶图知,50位市民对甲、乙部门的评分高于90分的比率分别为550850故该市的市民对甲、乙部门的评分高于90分的概率的估计值分别为0.1,0.16.(3)由所给茎叶图知,市民对甲部门的评分的中位数高于对乙部门的评分的中位数,而且由茎叶图可以大致看出对甲部门的评分的标准差要小于对乙部门的评分的标准差,说明该市市民对甲部门的评价较高、评价较为一致,对乙部门的评价较低、评价差别较大.(注:考生利用其他统计量进行分析,结论合理的同样给分)【互动探究】2.(2013年重庆)茎叶图(如图9-9-7)记录了甲、乙两组各5名学生在一次英语听力测试中的成绩(单位:分).图9-9-7已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x,y的值分别为()CA.2,5B.5,5C.5,8D.8,8解析:甲组数据按照从小到大的顺序排,最中间那个数为15,则x=5,乙组平均数为16.8,则乙组数据的总和为16.8×5=84,则y=84-9-15-18-24-10=8.年龄/岁工人数/人191283293305314323401合计20考点3用样本的数字特征估计总体的数字特征例3:(2014年广东)某车间20名工人年龄数据如下表:(1)求这20名工人年龄的众数与极差;(2)以十位数为茎,个位数为叶,作出这20名工人年龄的茎叶图;(3)求这20名工人年龄的方差.解:(1)这20名工人年龄的众数为30,极差为40-19=21.(2)茎叶图(如图9-9-8)如下:图9-9-8(3)这20名工人年龄的平均数为19+28×3+29×3+30×5+31×4+32×3+4020=30,这20名工人年龄的方差为-112+-22×3+-12×3+02×5+12×4+22×3+10220=121+12+3+4+12+10020=25220=12.6.【规律方法】1众数体现了样本数据的最大集中点,但无法客观的反映总体特征.2中位数是样本数据所占频率的等分线.3标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据越分散;标准差、方差越小,数据越集中.【互动探究】3.(2014年陕西)某公司10位员工的月工资(单位:元)为x1,x2,…,x10,其均值和方差分别为x-和s2,若从下个月起每位员工的月工资增加100元,则这10位员工下个月工资的均值和方差分别为A.x-,s2+1002B.x-+100,s2+1002C.x-,s2D.x-+100,s2()解析:由题意,得x1+x2+…+x10=10×x-=10x-;(x1-x-)2+(x2-x-)2+…+(x10-x-)2=10×s2=10s2.若从下个月起每位员工的月工资增加100元,则这10位员工下个月工资的均值和方差分别为:均值y-=x1+100+x2+100+…+x10+10010=x1+x2+…+x10+10×10010=10x-+10×10010=x-+100.答案:D方差=[x1+100-x-+100]2+[x2+100-x-+100]2+…+[x100+100-x-+100]210=x1-x-2+x2-x-2+…+x10-x210=10s210=s2.●难点突破●⊙统计图与概率的结合在高考中常以频率分布直方图或茎叶图的形式出现,考查统计与概率的知识,这也是近几年高考的热点.例题:(2014年重庆)20名学生某次数学考试成绩(单位:分)的频数分布直方图(如图9-9-9)如下:(1)求频率分布直方图中a的值;(2)分别求出成绩落在[50,60)与[60,70)中的学生人数;(3)从成绩在[50,70)的学生中任选2人,求此2人的成绩都在[60,70)中的概率.解:(1)频率分布直方图的组距为10,(2a+3a+6a+7a+2a)×10=1,a=1200=0.005.图9-9-9(2)成绩落在[50,60)的学生人数为2×0.005×10×20=2,成绩落在[60,70)的学生人数为3×0.005×10×20=3.(3)记成绩落在[50,60)的学生为A1,A2,成绩落在[60,70)的学生为B1,B2,B3,从成绩在[50,70)的学生中任选2人,共有基本事件10个,即{A1,A2},{A1,B1},{A1,B2},{A1,B3},{A2,B1},{A2,B2},{A2,B3},{B1,B2},{B1,B3},{B2,B3},此2人的成绩都在[60,70)中的基本事件有{B1,B2},{B1,B3},{B2,B3},共3个,故所求概率为p=310.
本文标题:2016年《南方新课堂·高考总复习》数学(理科)-第九章-第9讲-用样本估计总体
链接地址:https://www.777doc.com/doc-7536666 .html