您好,欢迎访问三七文档
当前位置:首页 > 行业资料 > 酒店餐饮 > 用样本频率分布估计总体分布
2.2.1用样本的频率分布估计总体分布我们用简单随机抽样、系统抽样、分层抽样的方法收集样本数据后,就可以通过样本研究总体。用样本估计总体的两种情况:①用样本的频率分布估计总体分布②用样本的数字特征(平均数、标准差等)估计总体的数字特征复习回顾频数:不分组时,数据中某个数据出现的次数分组时,一个组内的数据的个数频率:样本容量频数频率极差:最大数-最小数分组频数频率频率/组距频率分布表:知识探究(一):频率分布表某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费.问题1:如果希望大部分居民的日常生活不受影响,那么标准a定为多少比较合理?问题2:为了较为合理的确定标准a,需要做哪些工作?通过抽样调查,获得100位居民2007年的月均用水量如下表(单位:t):3.12.52.02.01.51.01.61.81.91.63.42.62.22.21.51.20.20.40.30.43.22.72.32.11.61.23.71.50.53.83.32.82.32.21.71.33.61.70.64.13.22.92.42.31.81.43.51.90.84.33.02.92.42.41.91.31.41.80.72.02.52.82.32.31.81.31.31.60.92.32.62.72.42.11.71.41.21.50.52.42.52.62.32.11.61.01.01.70.82.42.82.52.22.01.51.01.21.80.62.2问题3:这些数字告诉了我们什么信息?我们可以看出,样本数据中的最大值4.3和最小值,其他数据在0.2~4.3之间分析数据的基本方法:用图画出来用表格重新排列1、借助于图:频率分布直方图、频率分布折线图、茎叶图两个目的①从数据中提取信息②利用图形传递信息2、借助于表格:频率分布表两个目的①改变数据的排列方式②提供解释数据的新方式第二步:确定组距,组数组距=每个小组两个端点的差.组数=极差÷组距(取整数)探究一频率分布表(4.1÷0.5=8.2将8.2取整,组数=9,组距=0.5思考1:上述100个数据的最小值和最大值分别是多少?第一步:求极差思考2:分成多少组合适?若将上述100个数据按组距为0.5进行分组,则这些数据共分为多少组?极差:4.3-0.2=4.15~12组第四步:列频率分布表思考3:各组数据的取值范围如何设定?第三步:确定端点,将数据分组各组均为左闭右开区间,最后一个闭区间思考4:如何统计各组中的频数、频率?[0,0.5),[0.5,1),[1,1.5),…,[4,4.5].探究一频率分布表分组频数频率[0,0.5)40.04[0.5,1)80.08[1,1.5)150.15[1.5,2)220.22[2,2.5)250.25[2.5,3)140.14[3,3.5)60.06[3.5,4)40.04[4,4.5]20.02合计1001.00第四步:列频率分布表分组频数频率频率/组距[0,0.5)40.04[0.5,1)80.08[1,1.5)150.15[1.5,2)220.22[2,2.5)250.25[2.5,3)140.14[3,3.5)60.06[3.5,4)40.04[4,4.5]20.02合计1001.00分组频数频率频率/组距[0,0.5)40.040.08[0.5,1)80.080.16[1,1.5)150.150.30[1.5,2)220.220.44[2,2.5)250.250.50[2.5,3)140.140.28[3,3.5)60.060.12[3.5,4)40.040.08[4,4.5]20.020.04合计1001.00探究(二):画频率分布直方图月均用水量/t频率组距0.50.40.30.20.10.511.522.533.544.5O第一步:画直角坐标系:x轴为数据单位,y轴为频率/组距第二步:在x轴上均匀标出各组分点,在y轴上标出单位长度第三步:以组距为宽,各组的频率/组距为高,分别画出各组对应的长方形问题1:频率分布直方图中各小长方形的宽度和高度在数量上有何特点?月均用水量/t频率组距0.50.40.30.20.10.511.522.533.544.5O宽度:组距高度:频率组距2频率分布直方图的意义问题2:频率分布直方图中各小长方形的面积表示什么?各小长方形的面积之和为多少?各小长方形的面积=各小组的频率各小长方形的面积之和=1月均用水量/t频率组距0.50.40.30.20.10.511.522.533.544.5O宽度:组距高度:频率组距3分析:频率分布直方图非常直观地表明了样本数据的分布情况,使我们能够看到频率分布表中看不太清楚的数据模式,但原始数据不能在图中表示出来.你能根据上述频率分布直方图指出居民月均用水量的一些数据特点吗?月均用水量/t频率组距0.50.40.30.20.10.511.522.533.544.5O(1)居民月均用水量的分布是“山峰”状的,而且是“单峰”的;(2)大部分居民的月均用水量集中在一个中间值附近,只有少数居民的月均用水量很多或很少;(3)居民月均用水量的分布有一定的对称性等.月均用水量/t频率组距0.50.40.30.20.10.511.522.533.544.5O思考:对一组给定的样本数据,频率分布直方图的外观形状与哪些因素有关?在居民月均用水量样本中,你能以1为组距画频率分布直方图吗?与分组数(或组距)及坐标系的单位长度有关.月均用水量/t频率组距0.40.30.20.112345O1、求极差(即一组数据中最大值与最小值的差)知道这组数据的变动范围4.3-0.2=4.12、决定组距与组数(注意取整)3、将数据分组(给出每组的分点)画频率分布直方图的步骤4、列出频率分布表.(包含分组、频数、频率,增加频率/组距一栏)5、画出频率分布直方图。(横坐标为样本数据尺寸,纵坐标为频率/组距.)组距:指每个小组的两个端点的距离组数:当数据在100个以内时,按数据多少常分5-12组。4.18.20.5极差组数=组距小结理论迁移例1某地区为了了解知识分子的年龄结构,随机抽样50名,其年龄分别如下:42,38,29,36,41,43,54,43,34,44,40,59,39,42,44,50,37,44,45,29,48,45,53,48,37,28,46,50,37,44,42,39,51,52,62,47,59,46,45,67,53,49,65,47,54,63,57,43,46,58.(1)列出样本频率分布表;(2)画出频率分布直方图;(3)估计年龄在32~52岁的知识分子所占的比例约是多少.(1)极差为67-28=39,取组距为5,分为8组.分组频数频率频率/组距[27,32)30.060.012[32,37)30.060.012[37,42)90.180.036[42,47)160.320.064[47,52)70.140.028[52,57)50.100.020[57,62)40.080.016[62,67)30.060.012合计501.000.200样本频率分布表:(2)样本频率分布直方图:年龄0.060.050.040.030.020.01273237424752576267频率组距O(3)因为0.06+0.18+0.32+0.14=0.7,故年龄在32~52岁的知识分子约占70%.90100110120130140150次数o0.0040.0080.0120.0160.0200.0240.028频率/组距0.0320.036例2:为了了解高二学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图),图中从左到右各小长方形面积之比为2:4:17:15:9:3,第二小组频数为12.(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,试估计该学校全体高二学生的达标率是多少?1.有一个容量为50的样本数据的分组及各组的频数如下:[12.5,15.5)3[24.5,27.5)10[15.5,18.5)8[27.5,30.5)5[18.5,21.5)9[30.5,33.5)4[21.5,24.5)11⑴列出样本的频率分布表和画出频率分布直方图;⑵根据样本的频率分布估计,小于30.5的数据约占多少?课堂练习解:组距为3分组频数频率频率/组距[12.5,15.5)3[15.5,18.5)8[18.5,21.5)9[21.5,24.5)11[24.5,27.5)10[27.5,30.5)5[30.5,33.5)40.060.160.180.220.200.100.080.0200.0530.0600.0730.0670.0330.027课堂练习频率分布直方图如下:频率组距0.0100.0200.0300.0400.05012.515.50.0600.070课堂练习课堂练习2.一个社会调查机构就某地居民的月收入调查了10000人,并根据所得数据画了样本的频率分布直方图(如下图)。为了分析居民的收入与年龄、学历、职业等方面的关系,要从这10000人中再用分层抽样方法抽出100人作进一步调查,则在[2500,3000](元)月收入段应抽出_______人.0.00010.00020.00030.00040.00051000150020002500300035004000月收入(元)频率/组距25课堂练习3.某班50名学生在一次百米测试中,成绩全部介于13秒与19秒之间,将测试结果按如下方式分成六组:第一组,成绩大于等于13秒且小于14秒;第二组,成绩大于等于14秒且小于15秒;……第六组,成绩大于等于18秒且小于等于19秒.右图是按上述分组方法得到的频率分布直方图.设成绩小于17秒的学生人数占全班总人数的百分比为x,成绩大于等于15秒且小于17秒的学生人数为y,则从频率分布直方图中可分析出x和y分别为()A.0.9,35B.0.9,45C.0.1,35D.0.1,45O13141516171819秒频率/组距0.360.340.180.060.040.02A课堂练习4.为了了解某地区高三学生的身体发育情况,抽查了该地区100名年龄为17.5岁-18岁的男生体重(kg),得到频率分布直方图如下:根据上图可得这100名学生中体重在[56.5,64.5]的学生人数是()A.20B.30C.40D.500.030.050.07体重(kg)频率/组距54.558.562.566.570.574.5C课堂练习身高/cm人数/人14515516517518550150250350450550195输入A1,A2,…,Ana=0i=41ii输出siAss是否开始结束5.下面左图是某县参加2007年高考的学生身高条形统计图,从左到右的各条形表示的学生人数依次记为A1、A2、…、A10(如A2表示身高(单位:cm)(150,155)内的学生人数).右图是统计左图中身高在一定范围内学生人数的一个算法流程图.现要统计身高在160~180cm(含160cm,不含180cm)的学生人数,那么在流程图中的判断框内应填写的条件是()A.i9B.i8C.i7D.i6B1、求极差(即一组数据中最大值与最小值的差)知道这组数据的变动范围4.3-0.2=4.12、决定组距与组数(注意取整)3、将数据分组(给出每组的分点)画频率分布直方图的步骤4、列出频率分布表.(包含分组、频数、频率,增加频率/组距一栏)5、画出频率分布直方图。(横坐标为样本数据尺寸,纵坐标为频率/组距.)组距:指每个小组的两个端点的距离组数:当数据在100个以内时,按数据多少常分5-12组。4.18.20.5极差组数=组距小结第二节(1)居民月均用水量的分布是“山峰”状的,而且是“单峰”的;(2)大部分居民的月均用水量集中在一个中间值附近,只有少数居民的月均用水量很多或很少;
本文标题:用样本频率分布估计总体分布
链接地址:https://www.777doc.com/doc-3590874 .html