您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > 用样本的数字特征估计总体的数字特征课件
众数、中位数、平均数中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.众数:在一组数据中,出现次数最多的数据叫做这组数据的众数.平均数:一组数据的算术平均数,即)(1321nxxxxnx知识回顾1.(2015·江苏卷)已知一组数据4,6,5,8,7,6,那么这组数据的平均数为.2.在某次考试中,10名同学得分如下:84,77,84,83,68,78,70,85,79,95.则这一组数据的众数和中位数分别为()A.84,68B.84,78C.84,81D.78,816C练习:68,70,77,78,79,83,84,84,85,95.知识探究(一):众数在城市居民月均用水量样本数据的频率分布直方图中,你认为众数应在哪个小矩形内?由此估计总体的众数是什么?频率分布直方图1月均用水量/t频率/组距00.10.20.30.40.50.60.511.522.533.544.5取最高矩形下端中点的横坐标2.25作为众数.知识探究(二):中位数在频率分布直方图中,每个小矩形的面积表示什么?中位数左右两侧的直方图的面积应有什么关系?在城市居民月均用水量样本数据的频率分布直方图中,从左至右各个小矩形的面积分别是0.04,0.08,0.15,0.22,0.25,0.14,0.06,0.04,0.02.由此估计总体的中位数是什么?频率分布直方图2月均用水量/t频率/组距00.10.20.30.40.50.60.511.522.533.544.5x5.0)2(01.0x0.040.080.150.220.250.140.060.040.02B某地居民的月收入调查所得数据画的样本的频率分布直方图如下,居民的月收入中位数大约是()A.2000B.2400C.2500D.2600根据统计学中数学期望原理,将频率分布直方图中每个小矩形的面积与小矩形底边中点的横坐标之积相加,就是样本数据的估值平均数.由此估计总体的平均数是什么?知识探究(三):平均数月均用水量/t频率/组距00.10.20.30.40.50.60.511.522.533.544.50.040.080.150.220.250.140.060.040.020.25×0.040.75×0.081.25×0.151.75×0.222.25×0.252.75×0.143.25×0.063.75×0.044.25×0.02++++++++=2.02平均数是2.02.从居民月均用水量样本数据可知,该样本的众数是2.3,中位数是2.0,平均数是1.973,这与我们从样本频率分布直方图得出的结论有偏差,你能解释一下原因吗?频率分布直方图损失了把原始的一些样本数据给遗失了,得到的是一个估计值,且所得估值与数据分组有关.探究:众数、中位数、平均数与频率分布直方图的关系众数在样本数据的频率分布直方图中,就是最高矩形的中点的横坐标。在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此可以估计中位数的值。平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和。结论:某校100名学生期中考试语文成绩的频率分布直方图如图所示,其中成绩分组区间是:[50,60),[60,70),[70,80),[80,90),[90,100].①求图中α的值.②根据频率分布直方图,估计这100名学生语文成绩的众数、中位数(保留小数点后两位).③根据频率分布直方图,估计这100名学生语文成绩的平均分.应用①由频率分布直方图知(0.04+0.03+0.02+2α)×10=1,∴α=0.005.②65,71.67③55×0.05+65×0.4+75×0.3+85×0.2+95×0.05=73.所以平均分为73.三种数字特征的优缺点1、众数体现了样本数据的最大集中点,但它对其它数据信息的忽视使得无法客观地反映总体特征.如上例中众数是2.25t,它告诉我们,月均用水量为2.25t的居民数比月均用水量为其它数值的居民数多,但它并没有告诉我们多多少.2、中位数是样本数据所占频率的等分线,它不受少数几个极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺点。如上例中假设有某一用户月均用水量为10t,那么它所占频率为0.01,几乎不影响中位数,但显然这一极端值是不能忽视的。三种数字特征的优缺点3、由于平均数与每一个样本的数据有关,所以任何一个样本数据的改变都会引起平均数的改变,这是众数、中位数都不具有的性质。也正因如此,与众数、中位数比较起来,平均数可以反映出更多的关于样本数据全体的信息,但平均数受数据中的极端值的影响较大,使平均数在估计时可靠性降低。三种数字特征的优缺点例某工厂人员及工资构成如下:人员经理管理人员高级技工工人学徒合计日工资2200250220200100人数16510123合计22001500110020001006900(1)指出这个问题中日工资的众数、中位数、平均数(2)这个问题中,工资的平均数能客观地反映该厂的工资水平吗?为什么?数学应用分析:众数为200,中位数为220,平均数为300。因平均数为300,由表格中所列出的数据可见,只有经理在平均数以上,其余的人都在平均数以下,故用平均数不能客观真实地反映该工厂的工资水平。张华同学是高二(1)班数学成绩优秀的学生.上学期,在平时的5次测验中,他前4次的分数是98,97,99,96,而最后一次因感冒参加考试仅得了75分.这样他5次测试的平均分是93分,班主任用93分来评定他上学期的成绩是否合理?数学应用分析:班主任用93分来评定张华同学的成绩是不合理的.在上面5个数据中,后4个数据的大小比较接近(按从小到大排列为:75,96,97,98,99),第一个数据与它们的差异较大.这时,如果用排在正中的数据97来描述张华的数学成绩,就具有一定的代表性,可以不受个别极端数据(很小或很大)的影响.本例中选用的统计量不恰当,因而不能较好地说明问题.小结:能利用频率分布直方图估计总体的众数、中位数、平均数;能用样本的众数、中位数、平均数估计总体的众数、中位数、平均数,并结合实际,对问题作出合理判断,制定解决问题的有效方法。aa某公司为了了解本公司职员的早餐费用情况,抽样调查了100位职员的早餐日平均费用(单位:元),得到如图所示的频率分布直方图,图中标注的数字模糊不清。(1)试根据频率分布直方图求的值,并估计该公司职员早餐日平均费用的众数;(2)已知该公司有1000名职员,试估计该公司有多少职员早餐日平均费用不少于8元?a作业:今年西南一地区遭遇严重干旱,某乡计划向上级申请支援,为上报需水量,乡长事先抽样调查了100户村民的月均用水量,得到这100户村民月均用水量的频率分布表如下表:(月均用水量的单位:吨)作业:用水量分组频数频率[0.5,2.5)12[2.5,4.5)[4.5,6.5)40[6.5,8.5)0.18[8.5,10.5]6合计1001(1)请完成该频率分布表,并画出相对应的频率分布直方图和频率分布折线图.(2)估计样本的中位数是多少?(3)已知上级将按每户月均用水量向该乡调水,若该乡共有1200户,请估计上级支援该乡的月调水量是多少吨?频率分布直方图3月均用水量/t频率/组距00.10.20.30.40.50.60.511.522.533.544.5【思路点拨】(1)由频率计算公式和各频率之和为1求解.(2)根据中位数前频率之和为0.5求解.(3)先求出样本中的月用水量平均值,再估计上级支援该乡的月调水量.【规范解答】(1)频率分布表与相应的频率分布直方图和频率分布折线图如下:用水量分组频数频率[0.5,2.5)120.12[2.5,4.5)240.24[4.5,6.5)400.40[6.5,8.5)180.18[8.5,10.5]60.06合计1001(2)设中位数为x,因为月用水量在[0.5,4.5)内的频率是(0.06+0.12)×2=0.36,月用水量在[0.5,6.5)内的频率是(0.06+0.12+0.20)×2=0.76,所以x∈[4.5,6.5),则(x-4.5)×0.2=0.5-0.36,解得x=5.2.故中位数是5.2.(3)该乡每户月均用水量估计为(1.5×0.12+3.5×0.24+5.5×0.40+7.5×0.18+9.5×0.06)=5.14.又5.14×1200=6168(吨).答:上级支援该乡的月调水量是6168吨.
本文标题:用样本的数字特征估计总体的数字特征课件
链接地址:https://www.777doc.com/doc-5752493 .html