您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > 用样本的数字特征估计总体的数字特征(优秀课件))
12.2.2用样本的数字特征估计总体的数字特征1.众数、中位数、平均数2.标准差2众数、中位数、平均数3一、众数、中位数、平均数的概念中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.众数:在一组数据中,出现次数最多的数据叫做这组数据的众数.众数、中位数、平均数都是描述一组数据的集中趋势的特征数,只是描述的角度不同,其中以平均数的应用最为广泛.121()nxxxn平均数:一组数据的算术平均数,即x=4频率组距0.10.20.30.40.5O0.511.522.533.544.5月平均用水量(t)例如,在上一节调查的100位居民的月均用水量的问题中,从这些样本数据的频率分布直方图可以看出,月均用水量的众数是2.25t.如图所示:一、众数、中位数、平均数与频率分布直方图的关系1、众数在样本数据的频率分布直方图中,就是最高矩形的中点的横坐标。52、在样本中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数,因此,在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此可以估计中位数的值。下图中虚线代表居民月均用水量的中位数的估计值,此数据值为2.02t.频率组距0.10.20.30.40.5O0.511.522.533.544.5月平均用水量(t)6说明:2.02这个中位数的估计值,与样本的中位数值2.0不一样,这是因为样本数据的频率分布直方图,只是直观地表明分布的形状,但是从直方图本身得不出原始的数据内容,所以由频率分布直方图得到的中位数估计值往往与样本的实际中位数值不一致.7下图显示了居民月均用水量的平均数:x=1.973频率组距0.10.20.30.40.5O0.511.522.533.544.5月平均用水量(t)3、平均数是频率分布直方图的“重心”.是直方图的平衡点.n个样本数据的平均数由公式:给出121()nxxxxn8众数、中位数、平均数的简单应用1某工厂人员及工资构成如下:人员经理管理人员高级技工工人学徒周工资2200250220200100人数165101(1)指出这个问题中周工资的众数、中位数、平均数(2)这个问题中,工资的平均数能客观地反映该厂的工资水平吗?为什么?解:众数为200,中位数为220,平均数为300。因平均数为300,由表格中所列出的数据可见,只有经理在平均数以上,其余的人都在平均数以下,故用平均数不能客观真实地反映该工厂的工资水平。92.右面是某校学生日睡眠时间的抽样频率分布表(单位:h),试估计该校学生的日平均睡眠时间。睡眠时间人数频率[6,6.5)50.05[6.5,7)170.17[7,7.5)330.33[7.5,8)370.37[8,8.5)60.06[8.5,9]20.02100110解1:总睡眠时间约为6.25×5+6.75×17+7.25×33+7.75×37+8.25×6+8.75×2=739(h)故平均睡眠时间约为7.39h解2:求各组中值与对应频率之积的和,6.25×0.05+6.75×0.17+7.25×0.33+7.75×37+8.25×0.06+8.75×0.02=7.39(h)估计该校学生的日平均睡眠时间约为7.39h113.若M个数的平均数是x,N个数的平均数是y,则这M+N个数的平均数是.MxNyMN,12,,,nyyy12,,,nxxx1122,,,nnxyxxy和的样本平均数分别是x和y,那么一组数的平均数是4.如果两组数.12众数、中位数、平均数并不能非常准确反应样本数据特征。13标准差14(1)方差:设在一组数据,x1,x2,…,xn中,各数据与它们的平均数x的差的平方分别是22212(),(),,()nxxxxxx2222121[()()()]nsxxxxxxn来衡量这组数据的波动大小,并把它叫做这组数据的方差,一组数据方差越大,则这组数据波动越大。那么我们用它们的平均数,即15(2)标准差:我们把数据的方差的算术平方根叫做这组数据的标准差,它也是一个用来衡量一组数据的波动大小的重要的量。222121[()()()]nsxxxxxxn16标准差和频率直方图的关系从标准差的定义可知,如果样本各数据都相等,则标准差得0,这表明数据没有波动幅度,数据没有离散性;若个体的值与平均数的差的绝对值较大,则标准差也较大,表明数据的波动幅度也很大,数据的离散程度很高,因此标准差描述了数据对平均数的离散程度。用来判断数据波动性和稳定性的大小。想一想:标准差得大小由什么决定?17AB样本数据3333311355平均数33标准差01.79频率分布直方图数据没有离散度数据离散程度很高1.00.80.60.40.212345123451.00.80.60.40.218例一.甲、乙两种水稻试验品种连续5年的平均单位面积产量如下(单位:t/hm2),试根据这组数据估计哪一种水稻品种的产量比较稳定。品种第1年第2年第3年第4年第5年甲9.89.910.11010.2乙9.410.310.89.79.8解:甲品种的样本平均数为10,样本方差为[(9.8-10)2+(9.9-10)2+(10.1-10)2+(10-10)2+(10.2-10)2]÷5=0.02.19乙品种的样本平均数也为10,样本方差为[(9.4-10)2+(10.3-10)2+(10.8-10)2+(9.7-10)2+(9.8-10)2]÷5=0.24.因为0.240.02,所以,由这组数据可以认为甲种水稻的产量比较稳定。20S3算出(i=1,2,…,n);2()ixxS4算出(i=1,2,…,n)这n个数的平均数,即为样本方差s2;2()ixxS5算出方差的算术平方根,即为样本标准差s。计算标准差的算法:S1算出样本数据的平均数x;S2算出每个样本数据与样本平均数的差(i=1,2,……,n);ixx21的平均数为,12,,,naxaxaxax(2)新数据方差为.22as,方差仍为.12,,,nxbxbxbxb2s(1)新数据的平均数为,方差为.12,,,naxbaxbaxbaxb22as的平均数为(3)新数据12,,,nxxxx2s如果数据的平均数为,方差为,则方差的运算性质:221.有甲、乙两种水稻,测得每种水稻各10株的分蘖数后,计算出样本方差分别为=11,=3.4,由此可以估计()(A)甲种水稻比乙种水稻分蘖整齐(B)乙种水稻比甲种水稻分蘖整齐(C)甲、乙种水稻分蘖整齐程度相同(D)甲、乙两种水稻分蘖整齐程度不能比较B2甲S2乙S233.数据5,7,7,8,10,11的标准差是()(A)8(B)4(C)2(D)1C240D.0xxC.xxxx.B0A.x0x,x,x.6.______3X5231.5.D.C.B.A.4n21n21n21总体方差一定是)(,则表示的方差为,若样本是,则这个样本的标准差数是,若它的平均,,,,已知一个样本以上都不对标准差方差极差)(范围大小的指标是一组数据变化在数据统计中,能反映A2B257.如果一组数中每个数减去同一个非零常数,则这一组数的().A.平均数不变,方差不变B.平均数改变,方差改变C.平均数不变,方差改变D.平均数改变,方差不变D
本文标题:用样本的数字特征估计总体的数字特征(优秀课件))
链接地址:https://www.777doc.com/doc-7138872 .html