您好,欢迎访问三七文档
第一章统计§5用样本估计总体5.1估计总体的分布5.2估计总体的数字特征自主学习梳理知识课前基础梳理|学习目标|1.会作频率分布直方图、频率折线图,会用样本的频率分布估计总体的分布.2.会用样本的数字特征估计总体的数字特征.1.用样本估计总体的两种情况(1)用样本的__________估计总体的分布.(2)用样本的__________估计总体的数字特征.2.频率分布直方图在频率分布直方图中,纵轴表示____________,数据落在各小组内的频率用______来表示,各小长方形的面积的总和等于___.频率分布数字特征频率/组距面积1练一练:(1)有一个容量为200的样本,其频率分布直方图如图所示,根据样本的频率分布直方图估计,样本数据落在区间[10,12]内的频数为()A.18B.36C.54D.72解析:在[10,12]内的频率为1-(0.19+0.15+0.05+0.02)×2=0.18,∴频数为200×0.18=36,∴选B.答案:B3.频率折线图在频率分布直方图中,按照分组原则,再在左边和右边各加一个区间,从所加的左边区间的______开始,用线段依次连接各个矩形的__________,直至右边所加区间的______,就可以得到一条折线,我们称之为频率折线图.随着样本量的增大,所划分的区间数也可以随之______,而每个区间的长度则会相应随之______,相应的频率折线图就会越接近于一条光滑曲线.中点顶端中点中点增多减小练一练:(2)下列说法不正确的是()A.频率分布直方图中每个小矩形的高就是该组的频率B.频率分布直方图中各个小矩形的面积之和等于1C.频率分布直方图中各个小矩形的宽一样大D.频率分布折线图是依次连接频率分布直方图的每个小矩形上端中点得到的解析:频率分布直方图中每个小矩形的高为频率组距,所以A错误,B、C、D均正确.答案:A1.作频率分布直方图的一般步骤是什么?(1)求极差.(2)决定组距与组数.一般样本容量越大,所分组数越多;组距的选择力求“取整”;当样本容量不超过120时,按照数据的多少,通常分成5~12组.(3)将数据分组.(4)列频率分布表,各小组的频率=小组频数样本容量.(5)画频率分布直方图.2.用样本估计总体时,可能产生什么问题?用样本估计总体时,如果抽样的方法比较合理,那么样本可以反映总体的信息,但从样本得到的信息会有偏差,其原因在于样本的随机性.这种偏差是不可避免的.典例精析规律总结课堂互动探究已知一个样本:30,29,26,24,25,27,26,22,24,25,26,28,25,21,23,25,27,29,25,28.(1)列出样本的频率分布表;(2)画出频率分布直方图和频率分布折线图;(3)根据频率分布直方图,估计总体出现在23~28内的频率是多少?【解】(1)计算极差:30-21=9;决定组距和组数:取组距为2.∵92=4.5,∴共分5组;决定分点,使分点比数据多一位小数,并把第1小组的分点减少0.5,即分成如下5组:20.5~22.5,22.5~24.5,24.5~26.5,26.5~28.5,28.5~30.5.列出频率分布表如下:分组个数累计频数频率频率/组距20.5~22.520.10.0522.5~24.530.150.07524.5~26.580.40.226.5~28.540.20.128.5~30.530.150.075合计20201.00(2)作出频率分布直方图如下:取各小长方形上的中点并用线段连接就构成了频率折线图,如上图.(3)由频率分布表和频率分布直方图观察得:样本值出现在23~28之间的频率为0.15+0.4+0.2=0.75,所以可以估计总体中出现在23~28之间的数的频率约为0.75.【规律总结】画频率分布直方图要注意以下几个问题:(1)频率分布直方图的横轴表示数据,纵轴表示频率与组距的比值;(2)同样一组数据,分组时组距要相等,每个矩形的高和频率成正比.对某电子元件的寿命进行追踪调查,结果如下:寿命/h个数100~20020200~30030300~40080400~50040500~60030(1)列出频率分布表;(2)作出频率分布直方图;(3)作出频率折线图.解:(1)频率分布表如下:分组频数频率100~200200.10200~300300.15300~400800.40400~500400.20500~600300.15合计2001.00(2)由上表得频率分布直方图如图①.(3)在上面的频率分布直方图中左右各加一个区间0~100,600~700,然后分别取0~100及600~700的中点以及各个矩形的顶端中点,再用线段依次连接起来,得到如图②所示的频率折线图.(2017·北京卷)某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20,30),[30,40),…,[80,90],并整理得到如下频率分布直方图:(1)从总体的400名学生中随机抽取一人,估计其分数小于70的概率;(2)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数;(3)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男生和女生人数的比例.【解】(1)根据频率分布直方图可知,样本中分数不小于70的频率为(0.02+0.04)×10=0.6,所以样本数据中分数小于70的频率为1-0.6=0.4.所以,从总体的400名学生中随机抽取一人,估计其分数小于70的概率为0.4.(2)根据题意,样本中分数不小于50的频率为(0.01+0.02+0.04+0.02)×10=0.9,分数在区间[40,50)内的人数为100-100×0.9-5=5.所以总体中分数在区间[40,50)内的人数估计为400×5100=20.(3)由题意可知,样本中分数不小于70的学生人数为(0.02+0.04)×10×100=60,所以样本中分数不小于70的男生人数为60×12=30.所以样本中的男生人数为30×2=60,女生人数为100-60=40,男生和女生人数的比例为60∶40=3∶2.所以根据分层抽样原理,总体中男生和女生人数的比例估计为3∶2.【规律总结】频率分布直方图中,小长方形的面积=组距×频率组距=频率;各小长方形的面积之和等于1;频数/相应的频率=样本容量.在学校开展的综合实践活动中,某班进行了小制作评比,作品上交时间为5月1日至31日,评委会把同学们上交作品的件数按5天一组统计,绘制了频率分布直方图(如图所示),已知从左到右矩形的高之比为2∶3∶4∶6∶4∶1,第三组的频数为12.(1)本次活动中一共有多少件作品参评?(2)上交作品数量最多的一组有多少件?解:在频率分布直方图中各小矩形的面积=组距×频率组距=频率,即各小矩形的面积等于相应各组的频率,且它们的面积之和等于1.(1)依题意知第三组的频率为42+3+4+6+4+1=15,又因为第三组的频数为12,所以本次活动的参评作品数为12÷15=60(件).(2)根据频率分布直方图,可以看出第四组上交的作品数量最多,共有60×62+3+4+6+4+1=18(件).为迎接5月31日世界无烟日的到来,小华对10名戒烟成功者戒烟前和戒烟5个星期后的体重作了认真统计,并记录如下表所示:(单位:kg)人员ABCDEFGHIJ戒烟前67806952526055556460戒烟后70816855576254526758(1)求这10人在戒烟前和戒烟后的体重的平均数;(2)求这10人在戒烟前和戒烟后的体重的方差;(3)通过上述数据,你能得到什么结论?【解】(1)将数据按从小到大的顺序重新排列;戒烟前:52,52,55,55,60,60,64,67,69,80;戒烟后:52,54,55,57,58,62,67,68,70,81.求得x戒烟前=61.4kg,x戒烟后=62.4kg.(2)s2戒烟前=70.44,s2戒烟后=73.84.(3)从戒烟前后两组数据的统计量知:从平均数看戒烟后这10人的平均体重增加了1kg;从方差看,戒烟后数据的波动比戒烟前数据波动大,说明戒烟对不同的人所发生的变化程度是不同的,通过对这两组数据的统计分析,得出结论:吸烟有害健康,戒烟对身体健康是有益的.【规律总结】平均数与方差是两个重要的数字特征,用样本平均数可估计总体数据取值情况;用方差来研究数据与平均数的偏离程度.甲、乙两人参加某体育项目训练,近期的五次测试成绩得分情况如图.(1)分别求出两人得分的平均数与方差;(2)根据图和上面算得的结果,对两人的训练成绩作出评价.解:(1)由图像可得甲、乙两人五次测试成绩分别为:(单位:分)甲:10,13,12,14,16;乙:13,14,12,12,14.x甲=10+13+12+14+165=13,x乙=13+14+12+12+145=13,s2甲=15[(10-13)2+(13-13)2+(12-13)2+(14-13)2+(16-13)2]=4,s2乙=15[(13-13)2+(14-13)2+(12-13)2+(12-13)2+(14-13)2]=0.8.(2)由s2甲>s2乙,可知乙的成绩较稳定.从折线图看,甲的成绩基本呈上升状态,而乙的成绩上下波动,可知甲的成绩在不断提高,而乙的成绩则无明显提高.若40个数据的平方和是56,平均数是22,则这组数据的方差是________.【错解】设这40个数据为xi(i=1,2,…,40),平均数为x.则s2=140[(x1-x)2+(x2-x)2+…+(x40-x)2]=140(x21+x22+…+x240+40x2)=14056+40×12=1.9.【错因分析】对稍复杂计算不能明确计算顺序,导致计算出现错误.【正解】设这40个数据为xi(i=1,2,…,40),平均数为x.则s2=140[(x1-x)2+(x2-x)2+…+(x40-x)2]=140[(x21-2x1x+x2)+(x22-2x2x+x2)+…+(x240-2x40x+x2)]=140[(x21+x22+…+x240)-2x(x1+x2+…+x40)+40x2]=140[56-2x·40x+40x2]=140(56-40x2)=14056-40×12=0.9.【答案】0.9即学即练稳操胜券基础知识达标知识点一样本的数字特征1.期中考试后,班长算出了全班40个人数学成绩的平均分为M,如果把M当成一个同学的分数,与原来的40个分数一起,算出这41个分数的平均数为N,那么M∶N为()A.4041B.1C.4140D.2解析:40人的数学成绩总和为40M,∴N=40M+M41=M,∴MN=1,故选B.答案:B2.甲、乙、丙、丁四人参加奥运会射击项目选拔赛,四人的平均成绩和方差如下表所示:甲乙丙丁平均数x8.58.88.88方差s23.53.52.18.7则参加奥运会的最佳人选应为()A.甲B.乙C.丙D.丁解析:丙的平均成绩较高且较稳定.答案:C知识点二频率分布直方图3.将容量为n的样本中的数据分为6组,绘制频率分布直方图,若第一组至第六组的数据的频率之比为2∶3∶4∶6∶4∶1,且前三组数据的频数之和为27,则n=________.解析:由题意得2+3+42+3+4+6+4+1·n=27,即920=27n,∴n=60.答案:604.在样本的频率分布直方图中,共有9个小长方形,已知中间一个长方形的面积等于其他8个小长方形面积之和的13,又知样本容量是100,则中间一组的频数是________.解析:由统计知识知道,9个小长方形的面积之和为1,每个小长方形的面积分别对应于每组的频率.设中间一个小长方形的面积为S,则S=13(1-S),解得S=0.25,即中间一组的频率为0.25,而频率=频数样本容量,所以中间一组的频数是100×0.25=25.答案:25知识点三频率分布直方图的应用5.中小学生的视力状况受到全社会的广泛关注,某市有关部
本文标题:2019-2020学年高中数学 第一章 统计 5 用样本估计总体 5.1 估计总体的分布 5.2 估
链接地址:https://www.777doc.com/doc-8285744 .html