您好,欢迎访问三七文档
当前位置:首页 > 行业资料 > 酒店餐饮 > 频率分布直方图与茎叶图..
用样本的频率分布估计总体分布衡阳县六中高一年级刘碧华用样本的频率分布估计总体分布一频率分布图和频率分布直方图二频率分布折线图和总体密度曲线三莖叶图理论迁移1某地区为了了解知识分子的年龄结构,随机抽样50名,其年龄分别如下:42,38,29,36,41,43,54,43,34,44,40,59,39,42,44,50,37,44,45,29,48,45,53,48,37,28,46,50,37,44,42,39,51,52,62,47,59,46,45,67,53,49,65,47,54,63,57,43,46,58.(1)列出样本频率分布表;(2)画出频率分布直方图;(3)估计年龄在32~52岁的知识分子所占的比例约是多少.(1)极差为67-28=39,取组距为5,分为8组.样本频率分布表:分组频数频率[27,32)30.06[32,37)30.06[37,42)90.18[42,47)160.32[47,52)70.14[52,57)50.10[57,62)40.08[62,67]30.06合计501.00(2)样本频率分布直方图:年龄0.060.050.040.030.020.01273237424752576267频率组距O(3)因为0.06+0.18+0.32+0.14=0.7,故年龄在32~52岁的知识分子约占70%.某校共有5000名学生,该校学生每月课外读物方面的支出总体上在20—60元之间其频率分布直方图如右图所示,为具体了解同学们购买课外读物的具体情况,按支出的情况进行分层抽样,抽出一个容量为100的样本进行分析,其中支出在)60,50[元频率组距20304050600.010.0360.024元的同学应抽取人。30理论迁移2例1.关于频率分布直方图中小长方形的高说法,正确的是()A.表示该组上的个体在样本中出现的频率B.表示某数的频率C.表示该组上的个体数与组距的比值D.表示该组上的个体在样本中出现的频率与组距的比值课堂测试:D2.根据《中华人民共和国道路交通安全法》规定:血液酒精浓度在80mg/100ml(含80)以上时,属醉酒驾车,处十五日以下拘留和暂扣三个月以上六个月以下驾驶证,并处500元以上2000元以下罚款.据《法制晚报》报道,2009年8月15日至8月28日,全国查处酒后驾车和醉酒驾车共500人,如图1是对这500人酒后驾车血液中酒精含量进行检测所得结果的频率分布直方图,则属于醉酒驾车的人数约为()A.25B.50C.75D.100答案:C3.统计某校1000名学生的数学水平测试成绩,得到样本频率分布直方图如图所示,若满分为100分,规定不低于60分为及格,则及格率是()A.20%B.25%C.60%D.80%D下表给出100位居民的月均用水量表为此我们要对这些数据进行整理与分析第一步:求极差:(数据组中最大值与最小值的差距)最大值=4.3最小值=0.2所以极差=4.3-0.2=4.1第二步:决定组距与组数:(强调取整)当样本容量不超过100时,按照数据的多少,常分成5~12组.为方便组距的选择应力求”取整”.本题如果组距为0.5(t).则4.18.20.5极差组数=组距第三步:将数据分组:(给出组的界限)所以将数据分成9组较合适.[0,0.5),[0.5,1),[1,1.5),……[4,4.5)共9组.第四步:列频率分布表.(包括分组、频数、频率、频率/组距)分组频数频率频率/组距[0-0.5)4[0.5-1)8[1-1.5)15[1.5-2)22[2-2.5)25[2.5-3)15[3-3.5)5[3.5-4)4[4-4.5)2合计100组距=0.50.040.080.080.160.30.150.440.220.250.512.000.020.040.040.080.10.30.150.0500.10.20.30.40.50.60.511.522.533.544.5第五步:画出频率分布直方图.频率/组距月均用水量/t(组距=0.5)0.080.160.30.440.50.30.10.080.04小长方形的面积=?小长方形的面积总和=?月均用水量最多的在哪个区间?请大家阅读第67页,直方图有哪些优点和缺点?频率分布直方图的特征:从频率分布直方图可以清楚的看出数据分布的总体趋势。从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了。思考:从频率分布直方图中,你能得到任意区间(a,b)的频率?有什么困难?00.10.20.30.40.50.60.511.522.533.544.5一、频率分布折线图与概率密度曲线频率/组距月均用水量/t(取组距中点,并连线)0.080.160.30.440.50.30.10.080.04频率分布直方图如下:月均用水量/t频率组距0.100.200.300.400.500.511.522.533.544.5连接频率分布直方图中各小长方形上端的中点,得到频率分布折线图思考:上例的样本容量为100,如果增至1000,其频率分布直方图的情况会有什么变化(组距和组数)?假如增至10000呢?在样本频率分布直方图中,当样本容量增加,作图时所分的组数增加,组距减少,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.它能够精确地反映了总体在各个范围内取值的百分比,它能给我们提供更加精细的信息.总体密度曲线:月均用水量/t频率组距0ab总体密度曲线频率组距月均用水量/tab(图中阴影部分的面积,表示总体在某个区间(a,b)内取值的百分比)。当样本容量无限增大,分组的组距无限缩小,那么频率分布折线图就会无限接近一条光滑曲线——总体密度曲线.总体密度曲线月均用水量/t频率组距0ab1.对于任何一个总体,它的密度曲线是不是一定存在?它的密度曲线是否可以被非常准确地画出来?思考2.图中阴影部分的面积表示什么?1、总体密度曲线反映了总体在各个范围内取值的百分比,精确地反映了总体的分布规律。是研究总体分布的工具.总体密度曲线的特征:2、样本容量越大,频率分布直方图就会无限接近总体密度曲线,就越精确地反映了总体的分布规律,即越精确地反映了总体在各个范围内取值百分比。3、不能由样本的频率分布折线图得到准确的总体密度曲线。1.实际上,尽管有些总体密度曲线是客观存在的,但一般很难想函数图象那样准确地画出来,我们只能用样本的频率分布对它进行估计,一般来说,样本容量越大,这种估计就越精确二、茎叶图当数据是两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,因此通常把这样的图叫做茎叶图例:甲乙两人比赛得分记录如下:甲:13,51,23,8,26,38,16,33,14,28,39乙:49,24,12,31,50,31,44,36,15,37,25,36,39用茎叶图表示两人成绩,说明哪一个成绩好.甲乙0123452,55,41,6,1,6,7,94,9084,6,33,6,83,8,91叶茎叶合作探究:茎叶图(一种被用来表示数据的图)甲乙804631253682543893161679449150主要从对称性,中位数(体现成绩好坏),稳定性(即集中程度)来分析分析:甲得分除51分外大致对称,乙基本上也对称。甲的中位数为26,乙的中位数为36,所以乙较甲成绩要好,另,乙的叶较甲的更集中,所以乙较甲发挥更稳定。画茎叶图要注意什么:1.将每个数据分为茎(高位)和叶(低位)两部分,在此例中,茎为十位上的数字,叶为个位上的数字;2.将最小茎和最大茎之间的数按大小次序排成一列,写在左(右)侧;3.将各个数据的叶按大小次序写在其茎右(左)侧.茎叶08134523683389451两个优点:一是:没有原始数据信息的损失;二是:茎叶图中的数据可以随时记录,随时添加,方便记录与表示。茎叶图的特征:三个局限:一是:只便于表示两位有效数字的数据;二是:茎叶图只方便记录两组的数据;三是:数据量不能太大阅读70页最后一段,说出茎叶图的优缺点?频数茎叶2107,811112,7,6,3,6,8,6,7,2,2,013126,8,4,2,7,8,6,1,0,4,3,2,04134,2,3,0下表一组数据是某车间30名工人加工零件的个数,设计一个茎叶图表示这组数据,并说明这一车间的生产情况.134112117126128124122116113107116132127128126121120118108110133130124116117123122120112112练习1:练习2:某次运动会甲乙两名射击运动员的成绩(环数)如下:甲:9.4,8.7,7.5,8.4,10.1,10.5,10.7,7.2,7.8,10.8乙:9.1,8.7,7.1,9.8,9.7,8.5,10.1,9.2,10.1,9.1(1)用茎叶图表示甲乙的成绩(2)根据茎叶图分析甲乙的成绩甲乙7891015711278118527448751(2)解:如图:茎为成绩的整环数,叶为小数点后的数字(2)乙成绩大致对称,甲成绩的中位数为9.05,乙成绩的中位数为9.15,所以乙成绩较甲好,乙成绩较集中于峰值,甲成绩分散所以乙发挥的稳定性好,甲波动大。小结:1.不易知一个总体的分布情况时,往往从总体中抽取一个样本,用样本的频率分布去估计总体的频率分布,样本容量越大,估计就越精确.2.目前有:频率分布表、直方图、茎叶图.3.当总体中的个体取值很少时,用茎叶图估计总体的分布;当总体中的个体取值较多时,将样本数据恰当分组,用各组的频率分布描述总体的分布,方法是用频率分布表或频率分布直方图。
本文标题:频率分布直方图与茎叶图..
链接地址:https://www.777doc.com/doc-1809837 .html