您好,欢迎访问三七文档
当前位置:首页 > 行业资料 > 酒店餐饮 > 频率分布表和频率分布直方图1
2.2.1用样本的频率分布估计总体分布一、复习回顾1.我们已经学习了哪些抽样的方法?简单随机抽样系统抽样分层抽样随机抽样是收集数据的方法,如何通过样本数据所包含的信息,估计总体的基本特征,即用样本估计总体,是我们需要进一步学习的内容.用样本估计总体一般有两种方法:1.用样本的频率分布估计总体的分布2.是用样本的数字特征(如平均数、标准差等)估计总体特征。二、样本估计总体的方法•我国是世界上严重缺水的国家之一。2000年全国主要城市中缺水情况排在前10位的城市如何节约用水?例:某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超过a的部分按议价收费。①如果希望大部分居民的日常生活不受影响,那么标准a定为多少比较合理呢?②为了较合理地确定这个标准,你认为需要做哪些工作?思考:由上表,大家可以得到什么信息?通过抽样,我们获得了100位居民某年的月平均用水量(单位:t),如下表:三、样本分析一般通过表、图、计算来分析数据,帮助我们找出样本数据中的规律,使数据所包含的信息转化成直观的容易理解的形式。频数分布表和频数分布图可以使我们能够清楚的知道数据分布在各个小组的个数。频率分布表和频率分布直方图则是从各个小组数据在样本容量中所占比例的大小的角度,来表示数据分布的规律,它可以使我们看到整个样本数据的频率分布情况。通过抽样,我们获得了100位居民某年的月平均用水量(单位:t),如下表:知识探究(一):频率分布表1.求极差(即一组数据中最大值与最小值的差)2.决定组距与组数组数=4.3-0.2=4.14.10.5=8.2组距极差=3.将数据分组[0,0.5),[0.5,1),…,[4,4.5]组数:将数据分组,当数据在100个以内时,按数据多少常分5-12组。组距:指每个小组的两个端点的距离,4.列频率分布表100位居民月平均用水量的频率分布表频率=频数÷样本容量频数=样本数据落在各小组内的个数一、求极差,即数据中最大值与最小值的差二、决定组距与组数:组距=极差/组数三、分组,通常对组内数值所在区间,取左闭右开区间,最后一组取闭区间四、登记频数,计算频率,列出频率分布表画一组数据的频率分布直方图,可以按以下的步骤进行:五、画出频率分布直方图(纵轴表示频率/组距)思考1:为了直观反映样本数据在各组中的分布情况,我们将上述频率分布表中的有关信息用下面的图形表示:频率分布直方图中各小长方形的宽度和高度在数量上有何特点?月均用水量/t频率组距0.50.40.30.20.10.511.522.533.544.5O知识探究(二):频率分布直方图宽度:组距高度:频率组距频率/组距月平均用水量/t0.500.400.300.200.1000.511.522.533.544.5画频率分布直方图小长方形的面积=组距频率=组距×频率注意:①这里的纵坐标不是频率,而是频率/组距;②某个区间上的频率用这个区间矩形的面积表示;直方图0.080.160.300.440.500.280.120.080.04思考2:频率分布直方图中各小长方形的面积表示什么?各小长方形的面积之和为多少?月均用水量/t频率组距0.50.40.30.20.10.511.522.533.544.5O各小长方形的面积=对应频率各小长方形的面积之和=11.某校共有5000名学生,该校学生每月课外读物方面的支出总体上在20—60元之间其频率分布直方图如右图所示,为具体了解同学们购买课外读物的具体情况,按支出的情况进行分层抽样,抽出一个容量为100的样本进行分析,其中支出在)60,50[元频率组距20304050600.010.0360.024元的同学应抽取人。30理论迁移思考3:频率分布直方图非常直观地表明了样本数据的分布情况,使我们能够看到频率分布表中看不太清楚的数据模式,但原始数据不能在图中表示出来.你能根据上述频率分布直方图指出居民月均用水量的一些数据特点吗?月均用水量/t频率组距0.50.40.30.20.10.511.522.533.544.5O(1)居民月均用水量的分布是“山峰”状的,而且是“单峰”的;月均用水量/t频率组距0.50.40.30.20.10.511.522.533.544.5O(2)大部分居民的月均用水量集中在一个中间值附近,只有少数居民的月均用水量很多或很少;(3)居民月均用水量的分布有一定的对称性等.理论迁移2某地区为了了解知识分子的年龄结构,随机抽样50名,其年龄分别如下:42,38,29,36,41,43,54,43,34,44,40,59,39,42,44,50,37,44,45,29,48,45,53,48,37,28,46,50,37,44,42,39,51,52,62,47,59,46,45,67,53,49,65,47,54,63,57,43,46,58.(1)列出样本频率分布表;(2)画出频率分布直方图;(3)估计年龄在32~52岁的知识分子所占的比例约是多少.(1)极差为67-28=39,取组距为5,分为8组.分组频数频率[27,32)30.06[32,37)30.06[37,42)90.18[42,47)160.32[47,52)70.14[52,57)50.10[57,62)40.08[62,67]30.06合计501.00样本频率分布表:(2)样本频率分布直方图:年龄0.060.050.040.030.020.01273237424752576267频率组距O(3)因为0.06+0.18+0.32+0.14=0.7,故年龄在32~52岁的知识分子约占70%.小结:频率分布直方图步骤1.求极差2.决定组距与组数3.将数据分组4.列频率分布表5.画频率分布直方图频率分布直方图以面积的形式反映了数据落在各个小组的频率的大小.必修3实验例1.关于频率分布直方图中小长方形的高说法,正确的是()A.表示该组上的个体在样本中出现的频率B.表示某数的频率C.表示该组上的个体数与组距的比值D.表示该组上的个体在样本中出现的频率与组距的比值应用举例:D2.根据《中华人民共和国道路交通安全法》规定:血液酒精浓度在80mg/100ml(含80)以上时,属醉酒驾车,处十五日以下拘留和暂扣三个月以上六个月以下驾驶证,并处500元以上2000元以下罚款.据《法制晚报》报道,2009年8月15日至8月28日,全国查处酒后驾车和醉酒驾车共500人,如图1是对这500人酒后驾车血液中酒精含量进行检测所得结果的频率分布直方图,则属于醉酒驾车的人数约为()A.25B.50C.75D.100答案:C3.学校为了调查学生在课外读物方面的支出况,抽出了一个容量为n的样本,其频率分布直方图如右图所示,其中支出在元的同学有30人,则n的值为[50,60)元频率组距20304050600.010.0360.0241004.统计某校1000名学生的数学水平测试成绩,得到样本频率分布直方图如图所示,若满分为100分,规定不低于60分为及格,则及格率是()A.20%B.25%C.60%D.80%D例5:从高二学生中抽取50名同学参加数学竞赛,成绩的分组及各组的频数如下(单位:分)[40,50),2;[50,60),3;[60,70),10;[70,80),15;[80,90),12;[90,100),8;(1)列出样本的频率分布表;(2)画出频率分布直方图;(3)估计成绩在[60,90)分的学生比例。COMPANYLOGO、课时训练P732、探究咱班学生的身高分布情况COMPANYLOGO
本文标题:频率分布表和频率分布直方图1
链接地址:https://www.777doc.com/doc-3173226 .html