您好,欢迎访问三七文档
当前位置:首页 > 行业资料 > 酒店餐饮 > 2.2.1样本频率估计总体分布
用样本的频率分布估计总体分布(一)〈一〉频率分布的概念:频率分布是指一个样本数据在各个小范围内所占比例的大小。一般用频率分布直方图反映样本的频率分布〈二〉画频率分布直方图其一般步骤为(1)计算一组数据中最大值与最小值的差,即求极差(2)决定组距与组数(3)将数据分组(4)列频率分布表(5)画频率分布直方图下表给出100位居民的月均用水量表分析数据的一种基本方法是用图将它们画出来,或者用紧凑的表格改变数据的排列方式,作图可以达到两个目的,一是从数据中提取信息,二是利用图形传递信息。表格则是通过改变数据的构成形式,为我们提供解释数据的新方式讨论:如何分析数据?根据这些数据你能得出用水量其他信息吗?为此我们要对这些数据进行整理与分析第一步:求极差:(数据组中最大值与最小值的差距)最大值=4.3最小值=0.2所以极差=4.3-0.2=4.1第二步:决定组距与组数:(强调取整)当样本容量不超过100时,按照数据的多少,常分成5~12组.为方便组距的选择应力求”取整”.本题如果组距为0.5(t).则4.18.20.5极差组数=组距第三步:将数据分组:(给出组的界限)所以将数据分成9组较合适.[0,0.5),[0.5,1),[1,1.5),……[4,4.5)共9组.第四步:列频率分布表.分组频数频率频率/组距[0-0.5)4[0.5-1)8[1-1.5)15[1.5-2)22[2-2.5)25[2.5-3)15[3-3.5)5[3.5-4)4[4-4.5)2合计100组距=0.50.040.080.080.160.30.150.440.220.250.512.000.020.040.040.080.10.30.150.0500.10.20.30.40.50.60.511.522.533.544.5第五步:画出频率分布直方图.频率/组距月均用水量/t(组距=0.5)0.080.160.30.440.50.30.10.080.04小长方形的面积=?小长方形的面积总和=?月均用水量最多的在哪个区间?请大家阅读第68页,直方图有哪些优点和缺点?连接频率分布直方图中各小长方形上端的中点,得到频率分布折线图。随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线。例1从高三学生中抽取50名学生参加数学竞赛,成绩的分组及各组的频率如下(单位:分):[40,50),2;[50,60),3;[60,70),10;[70,80),15;[80,90),12;[90,100],8.(1)列出样本的频率分布表;(2)画出频率分布直方图;(3)估计成绩在[60,90)分的学生比例.【思路点拨】组距为10,直方图的高度依次为0.004,0.006,0.02,0.03,0.024和0.016.【解】(1)频率分布表如下成绩分组频数频率[40,50)20.04[50,60)30.06[60,70)100.2[70,80)150.3[80,90)120.24[90,100]80.16合计501.00(2)频率分布直方图如图所示.(3)成绩在[60,90)的学生比例即学生成绩在[60,90)的频率,0.2+0.3+0.24=74%.【思维总结】利用样本在某一范围内的频率,近似地估计总体在这一范围内的频率.一般地,频率分布表除最下边的区间是闭区间外,其他区间均为左闭右开区间.茎叶图是一种既能保留原始数据又能展示数据分布情况的表与图的结合.茎叶图例2某中学高二(2)班甲、乙两名同学自上高中以来每场数学考试成绩情况如下:甲的得分:95,81,75,91,86,89,71,65,76,88,94,110,107;乙的得分:83,86,93,99,88,103,98,114,98,79,101.画出两人数学成绩的茎叶图,并根据茎叶图对两人的成绩进行比较,说明甲、乙两人谁发挥比较稳定.【思路点拨】用中间的数字表示两位同学得分的十位数和百位数,两边的数字分别表示两人每场数学考试成绩的个位数.作茎叶图先确定中间数取数据的哪几位,填写数据时边读边填.比较时从数据分布的对称性、中位数、稳定性等方面来比较.【解】甲、乙两人数学成绩的茎叶图如图所示:从这个茎叶图上可以看出,乙同学的得分情况是大致对称的,中位数是98;甲同学的得分情况除一个特殊得分外,也大致对称,中位数是88.因此乙同学发挥比较稳定,总体得分情况比甲同学好.【思维总结】绘制茎叶图的关键是分清茎和叶.一般地说,如果数据是整数(至少为两位数)的,除个位数字以外的其它数字为“茎”,个位数字为“叶”;如果是小数的,通常把整数部分作为“茎”,小数部分作为“叶”.解题时要根据数据特点合理选择茎和叶.变式训练(2010年高考福建卷)若某校高一年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数和平均数分别是()A.91.5和91.5B.91.5和92C.91和91.5D.92和92
本文标题:2.2.1样本频率估计总体分布
链接地址:https://www.777doc.com/doc-4095769 .html