您好,欢迎访问三七文档
当前位置:首页 > 高等教育 > 大学课件 > 2212用样本的频率分布估计总体分布二
重庆市万州高级中学曾国荣wzzxzgr@163.com§2.2.1-2用样本的频率分布估计总体分布(二)§2.2.1-2用样本的频率分布估计总体分布(二)2021/11/1重庆市万州高级中学曾国荣wzzxzgr@163.com2频率分布表的制作1、计算数据中最大值与最小值的差,即极差。据此,决定组数和组距。2、分组:通常对组内数据所在区间取左闭右开区间,最后一组取闭区间,且使分点比数据多一位小数。3、登记频数,计算频率,列出频率分布表极差组距组数§2.2.1-2用样本的频率分布估计总体分布(二)2021/11/1重庆市万州高级中学曾国荣wzzxzgr@163.com31.某电子元件厂生产一批同型号的电子元件,今从中随机地抽取40个测得其电阻值如下:10194103941039011399107100991009810199929710210394991039810798102110969510610210110510897102879397101试作出频率分布表:最小值=87,最大值=113,可取区间[86.5,113.5]并分成个小区间,每个小区间的长度为§2.2.1-2用样本的频率分布估计总体分布(二)2021/11/1重庆市万州高级中学曾国荣wzzxzgr@163.com41、求极差(即一组数据中最大值与最小值的差)知道这组数据的变动范围4.3-0.2=4.12、决定组距与组数(将数据分组)3、将数据分组(8.2取整,分为9组)画频率分布直方图的步骤4、列出频率分布表.5、画出频率分布直方图。组距:指每个小组的两个端点的距离,组距组数:将数据分组,当数据在100个以内时,按数据多少常分5-12组。4.18.20.5极差组数=组距§2.2.1-2用样本的频率分布估计总体分布(二)2021/11/1重庆市万州高级中学曾国荣wzzxzgr@163.com5表2-2100位居民月均用水量的频率分布表分组频数累计频数频率[0,0.5)40.04[0.5,1)80.08[1,1.5)150.15[1.5,2)220.22[2,2.5)250.25[2.5,3)140.14[3,3.5)60.06[3.5,4)40.04[4,4.5)20.02合计1001.00§2.2.1-2用样本的频率分布估计总体分布(二)2021/11/1重庆市万州高级中学曾国荣wzzxzgr@163.com6频率分布直方图如下:月均用水量/t频率组距0.100.200.300.400.500.511.522.533.544.5小长方形的面积=?§2.2.1-2用样本的频率分布估计总体分布(二)2021/11/1重庆市万州高级中学曾国荣wzzxzgr@163.com7月均用水量/t频率组距0.100.200.300.400.500.511.522.533.544.5频率分布直方图如下:小长方形的面积总和=?注:小长方形的面积=组距×频率/组距=频率各长方形的面积总和等于1。§2.2.1-2用样本的频率分布估计总体分布(二)2021/11/1重庆市万州高级中学曾国荣wzzxzgr@163.com8频率分布直方图如下:月均用水量/t频率组距0.100.200.300.400.500.511.522.533.544.5月均用水量最多的在那个区间?§2.2.1-2用样本的频率分布估计总体分布(二)2021/11/1重庆市万州高级中学曾国荣wzzxzgr@163.com9频率分布直方图如下:月均用水量/t频率组距0.100.200.300.400.500.511.522.533.544.5请大家阅读第68页,直方图有那些优点和缺点?重庆市万州高级中学曾国荣wzzxzgr@163.com探究:同样一组数据,如果组距不同,横轴、纵轴的单位不同,得到的图的形状也会不同。不同的形状给人以不同的印象,这种印象有时会影响我们对总体的判断。分别以1和0.1为组距重新作图,然后谈谈你对图的印象。§2.2.1-2用样本的频率分布估计总体分布(二)2021/11/1重庆市万州高级中学曾国荣wzzxzgr@163.com11练习1.有一个容量为50的样本数据的分组的频数如下:[12.5,15.5)3[15.5,18.5)8[18.5,21.5)9[21.5,24.5)11[24.5,27.5)10[27.5,30.5)5[30.5,33.5)4(1)列出样本的频率分布表;(2)画出频率分布直方图;(3)根据频率分布直方图估计,数据落在[15.5,24.5)的百分比是多少?§2.2.1-2用样本的频率分布估计总体分布(二)2021/11/1重庆市万州高级中学曾国荣wzzxzgr@163.com12解:组距为3分组频数频率频率/组距[12.5,15.5)3[15.5,18.5)8[18.5,21.5)9[21.5,24.5)11[24.5,27.5)10[27.5,30.5)5[30.5,33.5)40.060.160.180.220.200.100.080.0200.0530.0600.0730.0670.0330.027§2.2.1-2用样本的频率分布估计总体分布(二)2021/11/1重庆市万州高级中学曾国荣wzzxzgr@163.com13频率分布直方图如下:频率组距0.0100.0200.0300.0400.05012.515.50.0600.070§2.2.1-2用样本的频率分布估计总体分布(二)2021/11/1重庆市万州高级中学曾国荣wzzxzgr@163.com14频率分布直方图如下:月均用水量/t频率组距0.100.200.300.400.500.511.522.533.544.5100位居民的月均用水量的频率分布折线图思考:如果当地政府希望使85%以上的居民每月的用水量不超出标准,根据频率分布表和频率分布直方图,你能对制定月用水量标准提出建议吗?§2.2.1-2用样本的频率分布估计总体分布(二)2021/11/1重庆市万州高级中学曾国荣wzzxzgr@163.com15频率分布直方图如下:月均用水量/t频率组距0.100.200.300.400.500.511.522.533.544.5连接频率分布直方图中各小长方形上端的中点,得到频率分布折线图100位居民的月均用水量的频率分布折线图§2.2.1-2用样本的频率分布估计总体分布(二)2021/11/1重庆市万州高级中学曾国荣wzzxzgr@163.com16利用样本频率分布对总体分布进行相应估计(3)当样本容量无限增大,组距无限缩小,那么频率分布直方图就会无限接近于一条光滑曲线——总体密度曲线。(2)样本容量越大,这种估计越精确。(1)上例的样本容量为100,如果增至1000,其频率分布直方图的情况会有什么变化?假如增至10000呢?§2.2.1-2用样本的频率分布估计总体分布(二)2021/11/1重庆市万州高级中学曾国荣wzzxzgr@163.com17用样本分布直方图去估计相应的总体分布时,一般样本容量越大,频率分布直方图就会无限接近总体密度曲线,就越精确地反映了总体的分布规律,即越精确地反映了总体在各个范围内取值百分比。总体密度曲线反映了总体在各个范围内取值的百分比,精确地反映了总体的分布规律。是研究总体分布的工具.总体密度曲线§2.2.1-2用样本的频率分布估计总体分布(二)2021/11/1重庆市万州高级中学曾国荣wzzxzgr@163.com18总体密度曲线频率组距月均用水量/tab(图中阴影部分的面积,表示总体在某个区间(a,b)内取值的百分比)。※总体密度曲线能够很好的反映总体在各个范围内的百分比,能够提供更准确的信息。尽管有些总体密度曲线是客观存在的,但是很难象函数图象那样准确的地画出来。?思考一下图中阴影部分的面积表示什么?总体在区间内取值的概率),(ba§2.2.1-2用样本的频率分布估计总体分布(二)2021/11/1重庆市万州高级中学曾国荣wzzxzgr@163.com19频率分布表分组个数累计频数频率频率/组距频率分布直方图样本频率分布中,当样本容量无限增大,组距无限缩小样本频率分布直方图接近于一条光滑曲线——总体密度曲线,反映了总体分布。§2.2.1-2用样本的频率分布估计总体分布(二)2021/11/1重庆市万州高级中学曾国荣wzzxzgr@163.com20引入:某篮球运动员在某赛季各场比赛的得分情况如下:12,15,24,25,31,31,36,37,39,44,49,50.问题1:如何分析该运动员的整体水平及发挥的稳定程度?问题2:初中统计部分曾学过用什么来反映总体的水平?用什么来考察稳定程度?§2.2.1-2用样本的频率分布估计总体分布(二)2021/11/1重庆市万州高级中学曾国荣wzzxzgr@163.com21.,,,,,,,,,,,,:50494439373636313125241512下各场比赛的得分情况如某篮球运动员在某赛季?定程度发挥的稳体水平及如何分析该运动员的整.)(.,,.,displayleafandstem该运动员得分的这种方法就是画出况从中观察得分的分布情来地列出是将这些数据有条理就有一种简易方法我们还用方差考察稳定程度映总体的集中水平反数和中位数均数、众初中统计部分曾学过平茎叶图§2.2.1-2用样本的频率分布估计总体分布(二)2021/11/1重庆市万州高级中学曾国荣wzzxzgr@163.com22123452545116679049茎:十位数字叶:表示个位数字例:某篮球运动员在某赛季各场比赛的得分情况如下:12,15,24,25,31,31,36,36,37,39,44,49,50茎叶图:§2.2.1-2用样本的频率分布估计总体分布(二)2021/11/1重庆市万州高级中学曾国荣wzzxzgr@163.com23..)(,,,,:如下图茎叶图就得到该运动员得分的这样的顺序同行列出或从小到大般按从大到小共茎的叶一上向下列出茎按从小到大的顺序从茎相同者共用一个茎叶个位数字作为茎为字作将所有两位数的十位数制作茎叶图的方法.,,,,,,,,,,,,::50494439373636313125241512情况如下赛的得分比场各季赛某在员运动某篮球上述问题049116679452554321个位数表示叶:十位数表示茎:分界线§2.2.1-2用样本的频率分布估计总体分布(二)2021/11/1重庆市万州高级中学曾国荣wzzxzgr@163.com24049116679452554321个位数表示叶:十位数表示茎:分界线.,,,,,,.,,依次类推分一个分一个分两个分第三行说明有两个分分和明得分为第二行说同理分分和员的得分为这一行说明该运动这表示个位数字和的右侧字数表示十位左侧的线界行分一图中第3937363125241512521.,,,,发挥比较稳定说明其集中程度高且分布较对称之间到众数都在位数、该运动员平均得分及中出从这张图可以直观地看4020§2.2.1-2用样本的频率分布估计总体分布(二)2021/11/1重庆市万州高级中学曾国荣wzzxzgr@163.com25用茎叶图表示数据有两个突出的优点:一是所有的信息都可以从这个茎叶图上得到;二是茎叶图便于记录和表示.用茎叶图表示数据有一个突出的缺点:茎叶图的缺点是其分析只是粗略的,对差异不大的两组数据不易分析;表示三位数以上的数据时不够方便.§2.2.1-2用样本的频率分布估计总体分布(二)2021/11/1重庆市万州高级中学曾国荣wzzxzgr@163.com26例某赛季甲、乙两名篮球运动员每场比赛得分的原始记录如下:(1)甲运动员得分:13,51,23,8,26,38,16,33,14,28,39(2)乙运动员得分:49,24,12,31,50,31,44,36,15,37,25,36,39.,,,如图叶分左、右两侧间共用可将茎放在中为便于对比分析画出两人得分的茎叶图解甲乙012345255416167949084633683891§2.2.1-2用样本的频率分布估计总体分
本文标题:2212用样本的频率分布估计总体分布二
链接地址:https://www.777doc.com/doc-8684936 .html