您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > 三维设计2014届高考数学理总复习课件第十课:第二课---用样本估计总体
[知识能否忆起]一、作频率分布直方图的步骤1.求极差(即一组数据中与的差).2.确定与.3.将数据.4.列.5.画.最大值最小值组距组数分组频率分布表频率分布直方图二、频率分布折线图和总体密度曲线1.频率分布折线图:连接频率分布直方图中各小长方形上端的,就得频率分布折线图.2.总体密度曲线:随着的增加,作图时增加,减小,相应的频率折线图会越来越接近于,即总体密度曲线.中点样本容量所分的组数组距一条光滑曲线三、样本的数字特征数字特征定义众数一组数据中,出现次数的数据叫做这组数据的众数.中位数将一组数据按大小依次排列,把处在_______位置的一个数据(或最中间两个数据的)叫做这组数据的中位数.,在频率分布直方图中,中位数左边和右边的直方图的面积.最多最中间平均数相等数字特征定义平均数样本数据的算术平均数.即=.方差S2=其中s为标准差x1n(x1+x2+…+xn)1n[(x1-x)2+(x2-x)2+…+(xn-x)2].四、茎叶图茎叶图的优点是可以保留原始数据,而且可以随时记录,方便记录与表示.[小题能否全取]1.(教材习题改编)在如图所示的茎叶图表示的数据中,众数和中位数分别是()A.23与26B.31与26C.24与30D.26与30答案:B解析:观察茎叶图可知,这组数据的众数是31,中位数是26.2.(教材习题改编)把样本容量为20的数据分组,分组区间与频数如下:[10,20),2;[20,30),3;[30,40),4;[40,50),5;[50,60),4;[60,70],2,则在区间[10,50)上的数据的频率是()A.0.05B.0.25C.0.5D.0.7解析:由题知,在区间[10,50)上的数据的频数是2+3+4+5=14,故其频率为1420=0.7.答案:D3.(2012·长春模拟)从某小学随机抽取100名同学,将他们的身高(单位:厘米)数据绘制成频率分布直方图由图中数据可知身高在[120,130]内的学生人数为()A.20B.25C.30D.35答案:C解析:由题意知a×10+0.35+0.2+0.1+0.05=1,则a=0.03,故学生人数为0.3×100=30.4.(教材习题改编)甲、乙两人比赛射击,两人所得的平均环数相同,其中甲所得环数的方差为5,乙所得环数如下:5、6、9、10、5,那么这两人中成绩较稳定的是________.解析:x=7,s2乙=4.4,则s2甲>s2乙,故乙的成绩较稳定.答案:乙5.(2012·山西大同)将容量为n的样本中的数据分为6组,绘制频率分布直方图,若第一组至第六组的数据的频率之比为2∶3∶4∶6∶4∶1,且前三组数据的频数之和为27,则n=________.解析:依题意得,前三组的频率总和为2+3+42+3+4+6+4+1=920,因此有27n=920,即n=60.答案:601.在频率分布直方图中,中位数左边和右边的直方图的面积相等,由此可以估计中位数的值,而平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和,众数是最高的矩形的中点的横坐标.2.注意区分直方图与条形图,条形图中的纵坐标刻度为频数或频率,直方图中的纵坐标刻度为频率/组距.3.方差与原始数据的单位不同,且平方后可能夸大了偏差的程度,虽然方差与标准差在刻画样本数据的分散程度上是一样的,但在解决实际问题时,一般多采用标准差.[例1](2012·广东高考)某校100名学生期中考试语文成绩的频率分布直方图如图所示,其中成绩分组区间是:[50,60),[60,70),[70,80),[80,90),[90,100].用样本的频率分布估计总体分布(1)求图中a的值;(2)根据频率分布直方图,估计这100名学生语文成绩的平均分;(3)若这100名学生语文成绩某些分数段的人数(x)与数学成绩相应分数段的人数(y)之比如下表所示,求数学成绩在[50,90)之外的人数.分数段[50,60)[60,70)[70,80)[80,90)x∶y1∶12∶13∶44∶5[自主解答](1)由频率分布直方图知(2a+0.02+0.03+0.04)×10=1,解得a=0.005.(2)由频率分布直方图知这100名学生语文成绩的平均分为55×0.005×10+65×0.04×10+75×0.03×10+85×0.02×10+95×0.005×10=73(分).(3)由频率分布直方图知语文成绩在[50,60),[60,70),[70,80),[80,90)各分数段的人数依次为0.005×10×100=5,0.04×10×100=40,0.03×10×100=30,0.02×10×100=20.由题中给出的比例关系知数学成绩在上述各分数段的人数依次为5,40×12=20,30×43=40,20×54=25.故数学成绩在[50,90)之外的人数为100-(5+20+40+25)=10.在本例条件下估计样本数据的众数.解:众数应为最高矩形的中点对应的横坐标,故约为65.解决频率分布直方图问题时要抓住(1)直方图中各小长方形的面积之和为1.(3)直方图中每组样本的频数为频率×总体数.(2)直方图中纵轴表示频率组距,故每组样本的频率为组距×频率组距,即矩形的面积.1.(2012·深圳调研)某中学组织了“迎新杯”知识竞赛,从参加考试的学生中抽出若干名学生,并将其成绩绘制成频率分布直方图(如图),其中成绩的范围是[50,100],样本数据分组为[50,60),[60,70),[70,80),[80,90),[90,100],已知样本中成绩小于70分的个数是36,则样本中成绩在[60,90)内的学生人数为________.解析:依题意得,样本中成绩小于70分的频率是(0.010+0.020)×10=0.3;样本中成绩在[60,90)内的频率是(0.020+0.030+0.025)×10=0.75,因此样本中成绩在[60,90)内的学生人数为36×0.750.3=90.答案:90茎叶图的应用[例2](2012·陕西高考)从甲、乙两个城市分别随机抽取16台自动售货机,对其销售额进行统计,统计数据用茎叶图表示(如图所示).设甲、乙两组数据的平均数分别为x甲、x乙,中位数分别为m甲、m乙,则()A.x甲x乙,m甲m乙B.x甲x乙,m甲m乙C.x甲x乙,m甲m乙D.x甲x乙,m甲m乙[自主解答]x甲=116(41+43+30+30+38+22+25+27+10+10+14+18+18+5+6+8)=34516,x乙=116(42+43+48+31+32+34+34+38+20+22+23+23+27+10+12+18)=45716.∴x甲<x乙.又∵m甲=20,m乙=29,∴m甲<m乙.[答案]B由茎叶图可以清晰地看到数据的分布情况,这一点同频率分布直方图类似.它优于频率分布直方图的第一点是从茎叶图中能看到原始数据,没有任何信息损失;第二点是茎叶图便于记录和表示.其缺点是当样本容量较大时,作图较繁.2.(2012·淮北模考)如图所示的茎叶图记录了一组数据,关于这组数据,其中说法正确的序号是________.①众数是9;②平均数是10;③中位数是9或10;④标准差是3.4.解析:由茎叶图知,该组数据为7,8,9,9,9,10,11,12,12,13,∴众数为9,①正确;中位数是9+102=9.5,③错;平均数是x=110(7+8+9+9+9+10+11+12+12+13)=10,②正确;方差是s2=110[(7-10)2+(8-10)2+(9-10)2+(9-10)2+(9-10)2+(10-10)2+(11-10)2+(12-10)2+(12-10)2+(13-10)2]=3.4,标准差s=3.4,④错.答案:①②样本的数字特征[例3](1)(2012·江西高考)样本(x1,x2,…,xn)的平均数为x-,样本(y1,y2,…,ym)的平均数为y-(x-≠y-).若样本(x1,x2,…,xn,y1,y2,…,ym)的平均数z-=αx-+(1-α)y-,其中0α12,则n,m的大小关系为()A.nmB.nmC.n=mD.不能确定(2)(2012·山东高考)在某次测量中得到的A样本数据如下:82,84,84,86,86,86,88,88,88,88.若B样本数据恰好是A样本数据每个都加2后所得数据,则A,B两样本的下列数字特征对应相同的是()A.众数B.平均数C.中位数D.标准差[自主解答](1)x=x1+x2+…+xnn,y=y1+y2+…+ymm,z=x1+x2+…+xn+y1+y2+…+ymm+n,则z=nx+mym+n=nm+nx+mm+ny.由题意知0<nm+n<12,∴n<m.(2)对样本中每个数据都加上一个非零常数时不改变样本的方差和标准差,众数、中位数、平均数都发生改变.[答案](1)A(2)D(1)众数体现了样本数据的最大集中点,但无法客观地反映总体特征.(2)中位数是样本数据居中的数.(3)标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据越分散,标准差、方差越小,数据越集中.3.(2012·淄博一检)一农场在同一块稻田中种植一种水稻,其连续8年的产量(单位:kg)如下:450,430,460,440,450,440,470,460,则该组数据的方差为()A.120B.80C.15D.150解析:根据题意知,该组数据的平均数为450+430+460+440+450+440+470+4608=450,所以该组数据的方差为18×(02+202+102+102+02+102+202+102)=150.答案:D[典例](2012·山东高考)如图是根据部分城市某年6月份的平均气温(单位:℃)数据得到的样本频率分布直方图,其中平均气温的范围是[20.5,26.5],样本数据的分组为[20.5,21.5),[21.5,22.5),[22.5,23.5),[23.5,24.5),[24.5,25.5),[25.5,26.5].已知样本中平均气温低于22.5℃的城市个数为11,则样本中平均气温不低于25.5℃的城市个数为________.[尝试解题]最左边两个矩形面积之和为0.10×1+0.12×1=0.22,总城市数为11÷0.22=50,最右边矩形面积为0.18×1=0.18,50×0.18=9.[答案]91.忽视频率分布直方图中纵轴的含义为频率/组距,误认为是每组相应的频率值,导致失误.2.不清楚直方图中各组的面积之和为1,导致某组的频率不会求.3.不理解由直方图求样本平均值的方法误用每组的频率乘以每组的端点值,而导致失误.4.由直方图确定众数时应为最高矩形中点对应的横坐标值,中位数应为左右两侧的频率均等各为12.针对训练对某种电子元件的使用寿命进行跟踪调查,所得样本的频率分布直方图如图所示,由图可知,这一批电子元件中使用寿命在100~300h的电子元件的数量与使用寿命在300~600h的电子元件的数量的比是()A.12B.13C.14D.16解析:寿命在100~300h的电子元件的频率为12000+32000×100=420=15;寿命在300~600h的电子元件的频率为1400+1250+32000×100=45.则它们的电子元件数量之比为15∶45=14.答案:C1.(2012·陕西高考)对某商店一个月内每天的顾客人数进行了统计,得到样本的茎叶图(如图所示),则该样本的中位数、众数、极差分别是()A.46,45,56B.46,45,53C.47,45,56D.45,47,53教师备选题(给有能力的学生加餐)解析:从茎叶图中可以看出样本数据的中位数为中间两个数的平均数,即45+472=46,众数为45,极差为68-12=56.答案:A2.(2012·济南调研)如图是2012年在某大学自主招生面试环节中,七位评委为某考生打出的分数的茎叶统计图,去掉一个最高分和一个最低分后,所剩数据的平均数和方差分别为()A.84,4.84B.84,1.6C.85,1
本文标题:三维设计2014届高考数学理总复习课件第十课:第二课---用样本估计总体
链接地址:https://www.777doc.com/doc-5438548 .html