您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > 高考数学总复习 第十章第2课时 用样本估计总体课件
第2课时用样本估计总体教材回扣夯实双基基础梳理1.作频率分布直方图的步骤(1)求极差(即一组数据中最大值与最小值的差).(2)决定组距和组数.(3)将数据分组.(4)列频率分布表.(5)画频率分布直方图思考探究频率分布直方图中纵轴的含义是频率吗?提示:不是.表示的是频率/组距.2.频率分布折线图和总体密度曲线(1)频率分布折线图:连接频率分布直方图中各小长方形上端的_______,就得到频率分布折线图.(2)总体密度曲线:随着__________的增加,作图时____________增加,______减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线中点样本容量所分的组数组距3.茎叶图统计中还有一种被用来表示数据的图叫做茎叶图.茎是指中间的一列数,叶是指从茎的旁边生长出来的数.4.标准差和方差(1)标准差是样本数据到平均数的一种________________.(2)标准差与方差的计算公式平均距离s=1n[x1-x2+x2-x2+…+xn-x2].s2=1n[(x1-x)2+(x2-x)2+…+(xn-x)2].(xn是样本数据,n是样本容量,x是样本平均数)5.利用频率分布直方图估计样本的数字特征(1)中位数:在频率分布直方图中,中位数左边和右边的直方图的面积____________,由此可以估计中位数的值.(2)平均数:平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的______________.应该相等横坐标之和(3)众数:在频率分布直方图中,众数是最高的矩形的中点的_________.横坐标课前热身1.(2011·高考四川卷)有一个容量为66的样本,数据的分组及各组的频数如下:[11.5,15.5)2[15.5,19.5)4[19.5,23.5)9[23.5,27.5)18[27.5,31.5)11[31.5,35.5)12[35.5,39.5)7[39.5,43.5)3根据样本的频率分布估计,数据落在[31.5,43.5)的概率约是()A.16B.13C.12D.23解析:选B.由条件可知,落在[31.5,43.5)的数据有12+7+3=22(个),故所求概率约为2266=13.2.有一个容量为200的样本,其频率分布直方图如图所示.根据样本的频率分布直方图估计,样本数据落在区间[10,12)内的频数为()A.18B.36C.54D.72解析:选B.由0.02+0.05+0.15+0.19=0.41,∴落在区间[2,10)内的频率为0.41×2=0.82.∴落在区间[10,12)内的频率为1-0.82=0.18.∴样本数据落在区间[10,12)内的频数为0.18×200=36.3.(2011·高考江苏卷)某老师从星期一到星期五收到的信件数分别为10,6,8,5,6,则该组数据的方差s2=________.解析:x=10+6+8+5+65=7,∴s2=15[(10-7)2+(6-7)2+(8-7)2+(5-7)2+(6-7)2]=165=3.2.答案:3.2考点探究讲练互动考点突破频率分布直方图在总体估计中的应用例1(2010·高考安徽卷)某市2010年4月1日—4月30日对空气污染指数的监测数据如下(主要污染物为可吸入颗粒物):61,76,70,56,81,91,92,91,75,81,88,67,101,103,95,91,77,86,81,83,82,82,64,79,86,85,75,71,49,45.(1)完成频率分布表;(2)作出频率分布直方图;(3)根据国家标准,污染指数在0~50之间时,空气质量为优;在51~100之间时,为良;在101~150之间时,为轻微污染;在151~200之间时,为轻度污染.请你依据所给数据和上述标准,对该市的空气质量给出一个简短评价.【解】(1)频率分布表:分组频数频率[41,51)2230[51,61)1130[61,71)4430[71,81)6630[81,91)101030[91,101)5530[101,111)2230(2)频率分布直方图如图所示:(3)答对下述两条中的一条即可:①该市一个月中空气污染指数有2天处于优的水平,占当月天数的115;有26天处于良的水平,占当月天数的1315;处于优或良的天数为28,占当月天数的1415.说明该市空气质量基本良好.②轻微污染有2天,占当月天数的115;污染指数在80以上的接近轻微污染的天数15,加上处于轻微污染的天数17,占当月天数的1730,超过50%,说明该市空气质量有待进一步改善.【题后感悟】(1)解决频率分布直方图问题,应注意某一组的频率=某一组的频数样本容量=某一组对应小长方形的面积这一关系的灵活运用.(2)利用样本的频率分布,可近似地估计总体的分布,利用样本在某一范围内的频率,可近似地估计总体在这一范围内的概率.备选例题从全校参加科技知识竞赛的学生试卷中,抽取一个样本,考察竞赛的成绩分布.将样本分成5组,绘成频率分布直方图(如图),图中从左到右各小组的小长方形的高的比是1∶3∶6∶4∶2,最后边一组的频数是6.例请结合频率分布直方图提供的信息,解答下列问题:(1)样本的容量是多少?(2)列出频率分布表;(3)成绩落在哪个范围内的人数最多?并求出该小组的频数、频率;(4)估计这次竞赛中,成绩不低于60分的学生占总人数的百分比.【解】(1)由于各组的组距相等,所以各组的频率与各小长方形的高成正比且各组频率的和等于1,那么各组的频率分别为116,316,616,416,216.设该样本容量为n,则6n=216,所以样本容量为n=48.(2)由以上得频率分布表如下:成绩频数频率[50.5,60.5)3116[60.5,70.5)9316[70.5,80.5)18616[80.5,90.5)12416[90.5,100.5]6216合计481(3)成绩落在[70.5,80.5)之间的人数最多,该组的频数和频率分别是18和38.(4)不低于60分的学生占总人数的百分比约为(1-116)×100%=93.75%.变式训练1.样本容量为200的频率分布直方图如图所示.根据样本的频率分布直方图估计,样本数据落在[6,10)内的频数为________,数据落在[2,10)内的概率约为________.解析:样本数据落在[6,10)内的频率为0.08×4=0.32.则频数为0.32×200=64.数据落在[2,10)内的频率为(0.02+0.08)×4=0.4.故样本数据落在[2,10)内的概率约为0.4.答案:640.4茎叶图的应用如图所示的茎叶图表示的甲、乙两人在5次综合测评中的成绩,其中一个数字被污损,则甲的平均成绩超过乙的平例2均成绩的概率为()A.25B.710C.45D.910【解析】记其中被污损的数字为x.依题意得甲的五次综合测评的平均成绩是15(80×2+90×3+8+9+2+1+0)=90,乙的五次综合测评的平均成绩是15(80×3+90×2+3+3+7+x+9)=15(442+x).令9015(442+x),由此解得x8,即x的可能取值是0~7,因此甲的平均成绩超过乙的平均成绩的概率为810=45,选C.【答案】C【题后感悟】(1)茎叶图的优点是保留了原始数据,便于记录及表示,能反映数据在各段上的分布情况.(2)茎叶图不能直接反映总体的分布情况,这就需要通过茎叶图给出的数据求出数据的数字特征,进一步估计总体情况.备选例题某良种培育基地正在培育一种小麦新品种A,将其与原有的一个优良品种B进行对照试验,两种小麦各种植了25亩,所得亩产数据(单位:千克)如下:例品种A:357,359,367,368,375,388,392,399,400,405,412,414,415,421,423,423,427,430,430,434,443,445,445,451,454品种B:363,371,374,383,385,386,391,392,394,394,395,397,397,400,401,401,403,406,407,410,412,415,416,422,430(1)完成所附的茎叶图;(2)用茎叶图处理现有的数据有什么优点?(3)通过观察茎叶图,对品种A与B的亩产量及其稳定性进行比较,写出统计结论.【解】(1)(2)由于每个品种的数据都只有25个,样本不大,画茎叶图很方便,此时茎叶图不仅清晰明了地展示了数据的分布情况,便于比较,没有任何信息损失,而且还可以随时记录新的数据.(3)通过观察茎叶图可以看出:①品种A的亩产平均数(或均值)比品种B高;②品种A的亩产标准差(或方差)比品种B大,故品种A的亩产稳定性较差.变式训练2.(2010·高考福建卷)若某校高一年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数和平均数分别是()A.91.5和91.5B.91.5和92C.91和91.5D.92和92解析:选A.中位数为12(91+92)=91.5;平均数为18(87+89+90+91+92+93+94+96)=91.5.甲、乙二人参加某体育项目训练,近期的五次测试成绩得分情况如图.用样本的数字特征估计总体的数字特征例3(1)分别求出两人得分的平均数与方差;(2)根据图和上面算得的结果,对两人的训练成绩作出评价.【解】(1)由图象可得甲、乙两人五次测试的成绩分别为甲:10分,13分,12分,14分,16分,乙:13分,14分,12分,12分,14分,x甲=10+13+12+14+165=13,x乙=13+14+12+12+145=13,s2甲=15[(10-13)2+(13-13)2+(12-13)2+(14-13)2+(16-13)2]=4,s2乙=15[(13-13)2+(14-13)2+(12-13)2+(12-13)2+(14-13)2]=0.8.(2)由s2甲s2乙可知乙的成绩较稳定.从折线图看,甲的成绩基本呈上升状态,而乙的成绩上下波动,可知甲的成绩在不断提高,而乙的成绩则无明显提高.【题后感悟】平均数反映了数据取值的平均水平,标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的分散程度越大,越不稳定;标准差、方差越小,数据的分散程度越小,越稳定.备选例题为了选拔一名同学参加全市中学生射击竞赛,某校对甲、乙两名同学的射击水平进行了测试,两人在相同的条件下各射靶10次,统计结果如下:例甲成绩(环数)7868659乙成绩(环数)9578768甲成绩(环数)1074甲=7S=3乙成绩(环数)677乙=7S=?xx2甲2乙(1)求方差s;(2)比较甲、乙两位同学的射击水平,谁的成绩稳定一些?你认为学校派谁参加竞赛更合适?2乙【解】(1)s2乙=110×[(9-7)2+(5-7)2+(7-7)2+(8-7)2+(7-7)2+(6-7)2+(8-7)2+(6-7)2+(7-7)2+(7-7)2]=110×(4+4+0+1+0+1+1+1+0+0)=110×12=1.2.(2)∵s2甲s2乙,∴乙同学的射击水平(成绩)更稳定一些,学校派乙同学参加竞赛更合适.方法技巧1.众数、中位数与平均数的异同:(1)众数、中位数及平均数都是描述一组数据集中趋势的量,平均数是最重要的量.(2)由于平均数与每一个样本数据有关,所以,任何一个样本数据的改变都会引起平均数的改变.这是中位数、众数都不具有的性质.方法感悟(3)众数考查各数据出现的频率,大小只与这组数据中的部分数据有关,当一组数据中有不少数据多次重复出现时,其众数往往更能反映问题.(4)中位数仅与数据的排列位置有关,某些数据的变动对中位数没有影响.中位数可能出现在所给数据中,也可能不在所给数据中.当一组数据中的个别数据变动较大时,可用中位数描述其集中趋势.(5)在实际问题中求得的平均数、众数和中位数应带上单位.2.茎叶图、频率分布表和频率分布直方图都是用来描述样本数据的分布情况的.茎叶图由所有样本数据构成,没有损失任何样本信息,可以随时记录;而频率分布表和频率分
本文标题:高考数学总复习 第十章第2课时 用样本估计总体课件
链接地址:https://www.777doc.com/doc-3156778 .html