您好,欢迎访问三七文档
当前位置:首页 > 行业资料 > 酒店餐饮 > 2.2.1用样本的频率分布估计总体分布
2020/1/23统计的基本思想方法:用样本估计总体,即通常不直接去研究总体,而是通过从总体中抽取一个样本,根据样本的情况去估计总体的相应情况.统计的核心问题:如何根据样本的情况对总体的情况作出一种推断.这里包括两类问题:一类是如何从总体中抽取样本?另一类是如何根据对样本的整理、计算、分析,对总体的情况作出推断.2020/1/23用样本的有关情况去估计总体的相应情况,这种估计大体分为两类,一类是用样本频率分布估计总体分布,一类是用样本的某种数字特征(例如平均数、方差等)去估计总体的相应数字特征。整体介绍:2020/1/23频率分布的概念:频率分布是指一个样本数据在各个小范围内所占比例的大小。一般用频率分布直方图反映样本的频率分布。频数:将一批数据按要求分为若干个组,各组内数据的个数,叫做该组的频数。频率:每组数据的个数除以全体数据个数的商叫做该组的频率。我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了节约生活用水,计划在本市试行居民生活用水一、探究定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费.那么①标准a定为多少比较合理呢?②为了较合理地确定这个标准,你认为需要做哪些工作?2000年全国主要城市中缺水情况排在前10位的城市2020/1/23思考:由上表,大家可以得到什么信息?通过抽样,我们获得了100位居民某年的月平均用水量(单位:t),如下表:1.求极差(即一组数据中最大值与最小值的差)2.决定组距与组数:组数=4.3-0.2=4.14.10.5=8.2组距极差=3.将数据分组[0,0.5),[0.5,1),…,[4,4.5]二、画频率分布直方图的步骤当数据在100个以内时,常分5-12组.第几组频率=第几组频数样本容量4.列频率分布表100位居民月均用水量的频率分布表月均用水量/t频率组距0.100.200.300.400.500.511.522.533.544.5小长方形的面积=?5.画频率分布直方图其相应组上的频率等于该组上长方形的面积.=频率长方形的面积组距频率组距把横轴分成若干段,每一段对应一个组的组距,以此线段为底作矩形,高等于该组的频率/组距,这样得到一系列矩形,每一个矩形的面积恰好是该组上的频率,这些矩形构成了频率分布直方图.作频率分布直方图的方法为:归纳:月均用水量/t频率组距0.100.200.300.400.500.511.522.533.544.51、小长方形的面积总和=?三、频率分布直方图再认识月均用水量/t频率组距0.100.200.300.400.500.511.522.533.544.52、月均用水量最多的在那个区间?月均用水量/t频率组距0.100.200.300.400.500.511.522.533.544.53、请大家阅读第68页,直方图有那些优点和缺点?优点:从频率分布直方图可以清楚的看出数据分布的总体趋势.缺点:从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了.频率分布直方图的特征:如果当地政府希望使85%以上的居民每月的用水量不超出标准,根据频率分布表和频率分布直方图,你能对制定月用水量标准提出建议吗?拓展思考:[12.5,15.5)3[15.5,18.5)8[18.5,21.5)9[21.5,24.5)11[24.5,27.5)10[27.5,30.5)5[30.5,33.5)4(1)列出样本的频率分布表;(2)画出频率分布直方图;(3)根据频率分布直方图估计,数据落在[15.5,24.5)的百分比是多少?例1.有一个容量为50的样本数据的分组的频数如下:解:(1)组距为3,列频率分布表分组频数频率频率/组距[12.5,15.5)3[15.5,18.5)8[18.5,21.5)9[21.5,24.5)11[24.5,27.5)10[27.5,30.5)5[30.5,33.5)40.060.160.180.220.200.100.080.0200.0530.0600.0730.0670.0330.027(2)画频率分布直方图:频率组距0.0100.0200.0300.0400.05012.515.50.0600.0702020/1/231.一个容量为32的样本,已知某组样本的频率为0.125,那么该组样本的频数为()A.2B.4C.6D.82.在用样本频率估计总体分布的过程中,下列说法正确的是()A.总体容量越大,估计越精确B.总体容量越小,估计越精确C.样本容量越大,估计越精确D.样本容量越小,估计越精确BC课堂训练3、已知样本10,8,6,10,8,13,11,10,12,7,8,9,12,9,11,12,9,10,11,11,那么频率为0.2范围的是()A.5.5~7.5B.7.5~9.5C.9.5~11.5D.11.5~13.5分组频数频率5.5~7.520.17.5~9.560.39.5~11.580.411.5~13.540.2合计201.0D2020/1/234、一个容量为20的样本数据.分组后.各组与频数如下:(0,20]2;(20,30]3,(30,40]4;(40,50]5;(50,60]4;(60,70]2。则样本在(0,50]上的频率为:,7/10(2012,江西)2020/1/23240027003000330036003900X体重y0.0015、观察新生婴儿的体重,其频率分布直方图如图所示,则新生婴儿体重(2700,3000)的频率为:;0.32020/1/236.为了了解某地区高三学生的身体发育情况,抽查了该地区100名年龄为17.5岁-18岁的男生体重(kg),得到频率分布直方图如下:C0.030.050.07体重(kg)频率/组距54.558.562.566.570.574.5根据上图可得这100名学生中体重在[56.5,64.5]的学生人数是()A.20B.30C.40D.502020/1/237.一个容量为100的样本,数据的分组和各组的相关信息如下表,试完成表中每一行的两个空格.分组频数频率频率累计[12,15)6[15,18)0.08[18,21)0.30[21,24)21[24,27)0.69[27,30)16[30,33)0.10[33,36]1.00合计1001.002020/1/232020/1/23在城市居民月均用水量样本数据的频率分布直方图中,,依次连接各小长方形上端的中点,就得到一条折线,这条折线称为频率分布折线图.你认为频率分布折线图能大致反映样本数据的频率分布吗?频率组距0.50.40.30.20.10.511.522.533.544.5O月均用水量/t2020/1/23当总体中的个体数很多时(如抽样调查全国城市居民月均用水量),随着样本容量的增加,作图时所分的组数增多,组距减少,你能想象出相应的频率分布折线图会发生什么变化吗?频率组距0.50.40.30.20.10.511.522.533.544.5O月均用水量/t2020/1/23频率组距月均用水量/tab(图中阴影部分的面积,表示总体在某个区间(a,b)内取值的百分比)。当样本容量无限增大,组距无限缩小,那么频率分布直方图就会无限接近于一条光滑曲线——总体密度曲线。2020/1/23用样本分布直方图去估计相应的总体分布时,一般样本容量越大,频率分布直方图就会无限接近总体密度曲线,就越精确地反映了总体的分布规律,即越精确地反映了总体在各个范围内取值百分比。反映了总体在各个范围内取值的百分比,精确地反映了总体的分布规律。是研究总体分布的工具.总体密度曲线2020/1/23频率分布表、频率分布直方图和折线图的主要作用是表示样本数据的分布情况,此外,我们还可以用茎叶图来表示样本数据的分布情况.2020/1/23一般地,画出一组样本数据的茎叶图的步骤如何?第一步,将每个数据分为“茎”(高位)和“叶”(低位)两部分;第二步,将最小的茎和最大的茎之间的数按大小次序排成一列,写在左(右)侧;第三步,将各个数据的叶按大小次序写在茎右(左)侧.2020/1/23对于样本数据:3.1,2.5,2.0,0.8,1.5,1.0,4.3,2.7,3.1,3.5,用茎叶图如何表示?012348050571153茎叶2020/1/23【问题】某赛季甲、乙两名篮球运动员每场比赛的得分情况如下:甲运动员得分:13,51,23,8,26,38,16,33,14,28,39;乙运动员得分:49,24,12,31,50,31,44,36,15,37,25,36,39.2020/1/23【问题】某赛季甲、乙两名篮球运动员每场比赛的得分情况如下:甲运动员得分:13,51,23,8,26,38,16,33,14,28,39;乙运动员得分:49,24,12,31,50,31,44,36,15,37,25,36,39.甲乙8463368389101234525541616794902020/1/23甲运动员得分:13,51,23,8,26,38,16,33,14,28,39;乙运动员得分:49,24,12,31,50,31,44,36,15,37,25,36,39.甲乙846336838910123452554161679490你能理解这个图是如何记录这些数据的吗?你能算出甲、乙运动员得分的众数,中位数,平均数吗?你能通过该图说明哪个运动员的发挥更稳定吗?2020/1/23你认为茎叶图有哪些优点?(1)保留了原始数据,没有损失样本信息;(2)数据可以随时记录、添加或修改.对任意一组样本数据,是否都适合用茎叶图表示?为什么?不适合样本容量很大.思考:2020/1/231.用样本的频率分布估计总体分布,当总体中的个体数取值很少时,可用茎叶图估计总体分布;当总体中的个体数取值较多时,可将样本数据适当分组,用频率分布表或频率分布直方图估计总体分布.2.总体密度曲线可看成是函数的图象,对一些特殊的密度曲线,其函数解析式是可求的.3.茎叶图中数据的茎和叶的划分,可根据样本数据的特点灵活决定.课堂小结1.求极差(即一组数据中最大值与最小值的差)知道这组数据的变动范围4.3-0.2=4.12.决定组距与组数(将数据分组)3.将数据分组(8.2取整,分为9组)画频率分布直方图的步骤4.列出频率分布表.5.画出频率分布直方图组距:指每个小组的两个端点的距离,组数:将数据分组,当数据在100个以内时,按数据多少常分5-12组.4.18.20.5极差组数=组距2020/1/234、比较:图形优点缺点频率分布直方图1)易表示大量数据2)直观地表明分布地情况丢失一些信息茎叶图1)无信息损失2)随时记录方便记录和表示只能处理样本容量较小数据
本文标题:2.2.1用样本的频率分布估计总体分布
链接地址:https://www.777doc.com/doc-3255617 .html