您好,欢迎访问三七文档
当前位置:首页 > 行业资料 > 酒店餐饮 > 2.2.1用样本的频率分布估计总体分布资料
2.2.1用样本的频率分布估计总体分布我国是世界上严重缺水的国家之一,城市缺水问题较为突出。2000年全国主要城市中缺水情况排在前10位的城市某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超过a的部分按议价收费。①如果希望大部分居民的日常生活不受影响,那么标准a定为多少比较合理呢?②为了较合理地确定这个标准,你认为需要做哪些工作?思考:由上表,大家可以得到什么信息?通过抽样,我们获得了100位居民某年的月平均用水量(单位:t),如下表:1.求极差(即一组数据中最大值与最小值的差)2.决定组距与组数组数=4.3-0.2=4.14.10.5=8.2组距极差=3.将数据分组[0,0.5),[0.5,1),…,[4,4.5]组数:将数据分组,当数据在100个以内时,按数据多少常分5-12组。组距:指每个小组的两个端点的距离,4.列频率分布表100位居民月平均用水量的频率分布表注意:这里出来了条形图中条形的宽度。频率不仅与条形的高度有关,而且与它的宽度有关。为了使选择不同宽度的总体分布相同,我们用另一种图形表示,即直方图——用面积表示概率。频率/组距月平均用水量/t0.500.400.300.200.1000.511.522.533.544.55.画频率分布直方图小长方形的面积组距频率=组距×频率=注意:①这里的纵坐标不是频率,而是频率/组距;②某个区间上的频率用这个区间的面积表示;直方图思考:所有小长方形的面积之和等于?一、求极差,即数据中最大值与最小值的差二、决定组距与组数:组距=极差/组数三、分组,通常对组内数值所在区间,取左闭右开区间,最后一组取闭区间四、登记频数,计算频率,列出频率分布表画一组数据的频率分布直方图,可以按以下的步骤进行:五、画出频率分布直方图(纵轴表示频率/组距)频率/组距月平均用水量/t0.500.400.300.200.1000.511.522.533.544.5如果当地政府希望85%以上的居民每月的用水量不超出标准,根据频率分布表和频率分布直方图,你能对制定月用水量提出建议吗?你认为3吨这个标准一定能够保证85%以上的居民用水量不超过标准吗?例1.一个容量为100的样本,数据的分组和各组的相关信息如下表,试完成表中每一行的两个空格.分组频数频率频率累计[12,15)6[15,18)0.08[18,21)0.30[21,24)21[24,27)0.69[27,30)16[30,33)0.10[33,36]1.00合计1001.00应用举例:•作业:P812(画频率分布直方图);•下节课再对所画的图形做出分析。知识回顾频率分布直方图应用步骤1.求极差2.决定组距与组数3.将数据分组4.列频率分布表5.画频率分布直方图频率/组距月平均用水量/t0.500.400.300.200.1000.511.522.533.544.5频率分布折线图连接频率直方图中各小长方形上端中点的折线,叫频率分布折线图频率组距产品尺寸(mm)当样本容量无限增大,分组的组距无限缩小,那么频率分布折线图就会无限接近一条光滑曲线总体在区间内取值的频率),(baS——总体密度曲线.ab例2、对某电子元件进行寿命追踪调查,情况如下:寿命个数100~200200~300300~400400~500500~6002030804030(1)列出频率分布表;(2)画出频率分布直方图;(3)估计电子元件寿命在100h~400h以内的频率;(4)估计电子元件寿命在400h以上的频率;应用举例:(1)列出频率分布表;100~200200~300300~400400~500500~600寿命合计频率频数累积频率20308040302000.100.150.400.200.1510.100.250.650.851100200300400500600)寿命(h频率/组距0.65.0:400~10065.0:400~1003的概率为元件寿命在,所以我们估计电子为的电子元件出现的频率出,寿命在)由频率分布表可以看(hhh..:h...:h3504003501502004004以上的概率为估计电子元件寿命在,故我们元件出现的频率为以上的电子命在由频率分布表可知,寿)(.探究:同样一组数据,如果组距不同,横轴、纵轴的单位不同,得到的图的形状也会不同。不同的形状给人以不同的印象,这种印象有时会影响我们对总体的判断。分别以1和0.1为组距重新作图,然后谈谈你对图的印象。新课讲授初中我们学过用平均数、众数和中位数反映总体的水平,用方差考察稳定程度。我们还有一种简易的方法,就是将这些数据有条理的列出来,从中观察数据的分布情况,这种方法就是茎叶图。制作茎叶图的方法将所有两位数的十位数字作为“茎”,个位数字作为“叶”,茎相同者共用一个茎,茎按从小到大的顺序从上向下列出,共茎的叶一般按从大到小(或从小到大)的顺序同行列出。123452545116679049茎:十位数字叶:表示个位数字例1:某篮球运动员在某赛季各场比赛的得分情况如下:12,15,24,25,31,31,36,36,37,39,44,49,50茎叶图:注:1、重复出现的数据要重复记录,不能遗漏;特别是“叶”部分;2、所有的信息都可以从这个茎叶图中得到;3、茎叶图便于记录和表示;4、不足的是其分析只是粗略的,对差异不大的两组数据不易分析;表示三位数以上的数据时不够方便;例2:甲、乙两篮球运动员上赛季每场比赛的得分如下,试比较这两位运动员的得分水平:甲12,15,24,25,31,31,36,36,37,39,44,49,50乙8,13,14,16,23,26,28,33,38,39,51,33,29甲乙08251346052368911667938913494051注:中间的数字表示得分的十位数字。旁边的数字分别表示两个人得分的个位数。为了了解各自受欢迎的程度,甲、乙两个网站分别随机选取了14天,记录下上午8:00-10:00间各自的点击量:甲:73,24,58,72,64,38,66,70,20,41,55,67,8,25;乙:12,37,21,5,54,42,61,45,19,6,19,36,42,14.你能用茎叶图表示上面的数据吗?你认为甲、乙两个网站哪个更受欢迎?例3:海南卷文科16题、5分练习.从甲、乙两品种的棉花中各抽测了25根棉花的纤维长度(单位:mm),结果如下:甲品种:271273280285285287292294295301303303307308310314319323325325328331334337352乙品种:284292295304306307312313315315316318318320322322324327329331333336337343356由以上数据设计了如下茎叶图根据以上茎叶图,对甲、乙两品种棉花的纤维长度作比较,写出两个统计结论:①;②.31277550284542292587331304679403123556888553320224797413313673432356甲乙练习:非典期间某医院的发热门诊部对一天接待的16名病人的体温进行了测量,得到以下数据,请作出当天病人体温数据的茎叶图。37.53839.238.539.537.839.1238.1737.639.238.139.537.838.538.739.332.有两个班级,每班各自按学号随机选出10名学生,测验铅球成绩,以考察体育达标程度,测验成绩如下:单位(米)甲9.127.888.426.945.207.227.968.066.694.92乙8.808.457.347.066.718.389.808.686.835.86两个班相比较,哪个班整体实力强一些?3.从全年级的两个班调研考试成绩中每班任意抽取20名的数学成绩如下(总分150分)甲班:12011813513414014610811098981421261181129510314892121132乙班:1381241479610811712513711910813212197104114135127124135107试用茎叶图分析,哪个班成绩比较稳定。小结图形优点缺点频率分布1)易表示大量数据丢失一些直方图2)直观地表明分布地情况信息1)无信息损失只能处理样本茎叶图2)随时记录方便记录和表示容量较小数据
本文标题:2.2.1用样本的频率分布估计总体分布资料
链接地址:https://www.777doc.com/doc-4095777 .html