您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > 2.2.2用样本的数字特征估计总体
用样本的数字特征估计总体的数字特征【复习引入】1、频率分布直方图2、频率分布折线图3、总体密度曲线4、茎叶图我们学习了用图、表来组织数据,以及通过图、表提供的的信息,用样本的频率分布估计总体的分布.为了更好的把握总体的规律,还需要通过样本的数据对总体的数字特征进行研究。探究1:某学校高一甲班和高一乙班各有49名学生,两班在一次数学测试中的成绩统计如下:班级平均分众数中位数标准差甲班79708719.8乙班7970795.2【探究新知】(1)请你对下面的一段话给予简要分析:甲班的小刚对妈妈说:“昨天的数学测验,全班平均分79分,得70分的人最多,我得了85分,在班里算是上游了!”(2)请你根据表中的数据,对这两个班的数学测验情况进行简要分析,并提出建议.解:(1)甲班49名学生数学成绩的中位数是87,则85分排在全班第25名之后,从位次上看应该属于中游.但也不能以位次来判断学习的好坏,小刚得了85分,说明他对这段的学习内容掌握较好,从掌握学习的内容上讲,也可以说属于上游;(2)甲班成绩的中位数是87分,说明高于87分的人数占一半以上,而平均分为79分,标准差又很大,说明低分也多,两极分化严重,建议加强对学习困难的学生的帮助.乙班的中位数和平均数都是79分,标准差又小,说明学生之间差别较小,学习很差的学生少,但学生优异的也少,建议采取措施提高优秀率.班级平均分众数中位数标准差甲班79708719.8乙班7970795.2名称定义特征众数一组数据中出现次数最多的数(1)反映了数据的集中趋势;(2)只能表达样本数据很少的一部分信息,无法客观反映总体特征中位数一组数据按大小依次排列,中间位置的一个数(或中间两个数的平均数)(1)反映了数据的集中趋势;(2)不受少数极端值的影响,但对极端值不敏感平均数一组数据的和与这组数据的个数的商(1)反映了数据的平均水平;(2)反映出更多的关于样本数据全体的信息;(3)受少端值的影响较大,任何一个数据的改变都会引起平均数的改变1、众数、中位数、平均数练习:从甲、乙、丙三个厂家生产的同一件产品中抽取8件产品,对其寿命进行跟踪调查结果如下(单位:年):甲:3,4,5,6,8,8,8,10;乙:4,6,6,7,9,9,12,13;丙:3,4,6,8,9,10,12,12;三个厂家在广告中都称该产品的使用寿命是8年,请根据结果判断厂家在广告中分别运用了平均数、众数、中位数中哪一种集中趋势的特征数:甲:________,乙:_________,丙:_________。平均数中位数众数月均用水量/t频率组距0.50.40.30.20.10.511.522.533.544.5O探究2:下图是城市居民月均用水量样本数据的频率分布直方图,如何从频率分布直方图中估计众数、中位数、平均数?月均用水量/t频率组距0.50.40.30.20.10.511.522.533.544.5O取最高矩形中点的横坐标2.25作为众数.(1)你认为众数应在哪个小矩形内?由此估计总体的众数是什么?(2)直方图中,从左至右各个小矩形的面积分别是:0.04,0.08,0.15,0.22,0.25,0.14,0.06,0.04,0.02.中位数左右两侧的直方图的面积有什么关系?由此估计总体的中位数是什么?0.5-0.04-0.08-0.15-0.22=0.01,0.01÷0.5=0.02,中位数是2.02.月均用水量/t频率组距0.50.40.30.20.10.511.522.533.544.5O(3)平均数是频率分布直方图的“重心”,由此估计总体平均数为多少?月均用水量/t频率组距0.50.40.30.20.10.511.522.533.544.5O平均数的估值=频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和0.25×0.04+0.75×0.08+1.25×0.15+1.75×0.22+2.25×0.25+2.75×0.14+3.25×0.06+3.75×0.04+4.25×0.02=2.02(t).(4)从居民月均用水量样本数据可知,该样本的众数是2.3,中位数是2.0,平均数是1.973,这与我们从样本频率分布直方图得出的结论有偏差,你能解释一下原因吗?这是因为样本数据的频率分布直方图,只是直观地表明分布的形状,损失了一些样本数据,得到的是一个估计值,且所得估计值与数据分组有关.因此,在只有样本频率分布直方图的情况下,我们可以按上述方法估计众数、中位数和平均数,并由此估计总体特征.2、用频率分布直方图估计众数、中位数、平均数【探究新知】(1)众数:最高的矩形的底边的中点的横坐标.(2)中位数:左右两侧直方图的面积相等.(3)平均数:每个小矩形的面积乘以小矩形底边中点的横坐标之和.注:利用直方图求众数、中位数、平均数均为估计值,与实际数据可能不一致.练习:某中学举行电脑知识竞赛,现将高一参赛学生的成绩进行整理后分成五组绘制成如图所示的频率分布直方图,已知图中从左到右的第一、二、三、四、五小组的频率分别是0.30、0.40、0.15、0.10、0.05.求高一参赛学生的成绩的众数、中位数、平均成绩.众数为65,中位数为65,平均成绩约为67.探究3:在一次射击选拔赛中,甲、乙两名运动员各射击10次,每次命中的环数如下:甲:78795491074乙:9578768677如果你是教练,你如何对这次射击作出评价?【探究新知】77xx乙甲,两人射击的平均成绩是一样的,那么两个人的水平就没有什么差异吗?作出两人成绩的频率分布条形图,可以看出还是有差异的环数频率0.40.30.20.145678910O(甲)环数频率0.40.30.20.145678910O(乙)甲的成绩比较分散,极差较大,乙的成绩相对集中,比较稳定.甲的环数极差=10-4=6,乙的环数极差=9-5=4.它们在一定程度上表明了样本数据的分散程度,与平均数一起,可以给我们许多关于样本数据的信息.显然,极差对极端值非常敏感,注意到这一点,我们可以得到一种“去掉一个最高分,去掉一个最低分”的统计策略.因此,我们还需要从另外的角度来考察这两组数据.例如:在作统计图表时提到过的极差.考察样本数据的分散程度的大小,最常用的统计量是标准差.标准差是样本数据到平均数的一种平均距离,一般用S表示.12.nxxxxxxSn由于上式含有绝对值,运算不太方便,因此,通常改用如下公式来计算标准差.所谓“平均距离”,其含义可作如下理解:3、标准差与方差【探究新知】假设样本数据x1,x2,…,xn的平均数为,则标准差的计算公式是:x222121[()()()nsxxxxxxn(1)标准差:(2)方差2222121[()()()nsxxxxxxn用来描述样本数据的离散程度.特别的,一个容量为2的样本:x1,x2(x1x2),则,122xxx212xxs标准差的取值范围是标准差越大离散程度越大,数据较分散;标准差越小离散程度越小,数据较集中在平均数周围;[0,)①若x1,x2,x3,…,xn的平均数是x-,那么mx1+a,mx2+a,…,mxn+a的平均数是mx-+a.②数据x1,x2,…,xn与数据x1+a,x2+a,…,xn+a的方差相等.③若x1,x2,…,xn的方差为s2,那么ax1,ax2,…,axn的方差为a2s2.S=0,标准差为0的样本数据都相等.练习:(1)校园歌手大赛中,七位裁判为一选手打出的分数如下:90899095939493去掉一个最高分和一个最低分,所剩数据的平均值和方差分别为()A.92,2B.92,2.8C.93,2D.93,2.8B(3)若样本1+X1,1+X2,1+X3,…,1+Xn的平均数是10,方差为2,则对于样本2+X1,2+X2,……2+Xn,下列结论正确的是()A.平均数为10,方差为2B.平均数为11,方差为3C.平均数为11,方差为2D.平均数为12,方差为4C(2)某学生在一次考试中,语文、数学、英语三门学科的平均成绩是80分,物理、化学两门学科的平均成绩为85分,则该学生这五门学科的平均成绩是_____分.82(4)若X1,X2,X3,…,X20,这20个数据的平均数为X,方差为0.20,则X1,X2,X3,…,X20,X这21个数据的方差约为_________.4/21(5)数据x1,x2,…,x8平均数为6,标准差为2,则数据2x1-6,2x2-6,…,2x8-6的平均数为_____,方差为_____.616例1:画出下列四组样本数据的条形图,说明它们的异同点.(1)5,5,5,5,5,5,5,5,5;(2)4,4,4,5,5,5,6,6,6;(3)3,3,4,4,5,6,6,7,7;(4)2,2,2,2,5,8,8,8,8;【典例剖析】【典例剖析】例2、某赛季甲、乙两名篮球运动员各13场比赛得分情况用茎叶图表示如下:甲乙988177996102256799532030237104根据上图,对这两名运动员的成绩进行比较,下列四个结论中,不正确...的是()A.甲运动员得分的极差大于乙运动员得分的极差B.甲运动员得分的的中位数大于乙运动员得分的的中位数C.甲运动员的得分平均值大于乙运动员的得分平均值D.甲运动员的成绩比乙运动员的成绩稳定【知识归纳】1、众数、中位数、平均数2、用频率分布直方图估计众数、中位数、平均数(1)众数:最高的矩形的底边的中点的横坐标.(2)中位数:左右两侧直方图的面积相等.(3)平均数:每个小矩形的面积乘以小矩形底边中点的横坐标之和.3、标准差、方差
本文标题:2.2.2用样本的数字特征估计总体
链接地址:https://www.777doc.com/doc-4447952 .html