您好,欢迎访问三七文档
当前位置:首页 > 行业资料 > 酒店餐饮 > 用样本的频率分布估计总体分布-ppt.
2.2总体分布的估计统计的基本思想方法:用样本估计总体,即通常不直接去研究总体,而是通过从总体中抽取一个样本,根据样本的情况去估计总体的相应情况.统计的核心问题:如何根据样本的情况对总体的情况作出一种推断.这里包括两类问题:一类是如何从总体中抽取样本?另一类是如何根据对样本的整理、计算、分析,对总体的情况作出推断.问题某班40名同学在一次测验中的成绩如下:736977668478487873859881529673658579100638857997179836778757471897674506292877764现在我想弄清这些同学的成绩分布情况,该怎么办?各分点比所给数据多取一位小数的原因是:为了使数据不落在分点上,从而明确它们究竟属于哪一组。分数段人数与全班人数的比40.5~50.520.0550.5~60.520.0560.5~70.570.17570.5~80.5160.4080.5~90.580.2090.5~100.550.125分数段人数与全班人数的比40.5~50.5250.5~60.5260.5~70.5770.5~80.51680.5~90.5890.5~100.55分数段人数与全班人数的比40.5~50.550.5~60.560.5~70.570.5~80.580.5~90.590.5~100.5分数段人数与全班人数的比频率00.10.20.30.440.550.560.570.580.590.5100.5成绩(分)频率00.10.20.30.440.550.560.570.580.590.5100.5成绩(分)频率00.10.20.30.440.550.560.570.580.590.5100.5成绩(分)频率00.10.20.30.440.550.560.570.580.590.5100.5成绩(分)频率00.10.20.30.440.550.560.570.580.590.5100.5成绩(分)频率00.10.20.30.440.550.560.570.580.590.5100.5成绩(分)频率00.10.20.30.440.550.560.570.580.590.5100.5成绩(分)学生分数分布表(频率分布表)学生分数分布统计图(频率分布直方图)用样本估计总体•用样本估计总体(两种):一种是:用样本的频率分布估计总体的分布。另一种是:用样本的数字特征(平均数标准差等)估计总体的数字特征。用样本的频率分布估计总体分布一频率分布图和频率分布直方图二频率分布折线图和总体密度曲线三茎叶图(stem-and-leafdisplay)探究:我国是世界上严重缺水的国家之一,城市缺水问题较为突出。某市政府为了节约用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的按平价收费,超过a的按议价收费。如果希望大部分居民的日常生活不受影响,那么标准a定为多少比较合理?你认为,为了较为合理地确定出这个标准,需要做什么工作?根据这些数据你能得出用水量其他信息吗?表2-1100位居民的月均用水量(单位:t)3.12.52.02.01.51.01.61.81.91.63.42.62.22.21.51.20.20.40.30.43.22.72.32.11.61.23.71.50.53.83.32.82.32.21.71.33.61.70.64.13.22.92.42.31.81.43.51.90.84.33.02.92.42.41.91.31.41.80.72.02.52.82.32.31.81.31.31.60.92.32.62.72.42.11.71.41.21.50.52.42.52.62.32.11.61.01.01.70.82.42.82.52.22.01.51.01.21.80.62.2表2-2100位居民月均用水量的频率分布表分组频数累计频数频率[0,0.5)40.04[0.5,1)80.08[1,1.5)150.15[1.5,2)220.22[2,2.5)250.25[2.5,3)140.14[3,3.5)60.06[3.5,4)40.04[4,4.5)20.02合计1001.0000.511.522.533.544.50.500.400.300.200.10频率/组距月均用水量/t注:小长方形的面积=组距×频率/组距=频率各长方形的面积总和等于1。1、求极差(即一组数据中最大值与最小值的差)知道这组数据的变动范围4.3-0.2=4.12、决定组距与组数(将数据分组)3、将数据分组(8.2取整,分为9组)画频率分布直方图的步骤4、列出频率分布表.(学生填写频率/组距一栏)5、画出频率分布直方图。组距:指每个小组的两个端点的距离,组距组数:将数据分组,当数据在100个以内时,按数据多少常分5-12组。4.18.20.5极差组数=组距例.从规定尺寸为25.40mm的一堆产品中任取100件,测得尺寸如下:25.3925.3625.3425.4225.4525.3825.3925.4225.4725.3525.4125.4325.4425.4825.4525.4325.4625.4025.5125.4525.4025.3925.4125.3625.3825.3125.5625.4325.4025.3825.3725.4425.3325.4625.4025.4925.3425.4225.5025.3725.3525.3225.4525.4025.2725.4325.5425.3925.4525.4325.4025.4325.4425.4125.5325.3725.3825.2425.4425.4025.3625.4225.3925.4625.3825.3525.3125.3425.4025.3625.4125.3225.3825.4225.4025.3325.3725.4125.4925.3525.4725.3425.3025.3925.4625.2925.4025.3725.3325.4025.3525.4125.3725.3725.4725.3925.4225.4725.3825.39样本的频率分布表示形式有:频率分布表和频率分布直方图一、计算最大值与最小值的差(也称极差),从而知道这组数据的变动范围。二、决定组距与组数(将数据分组)组距:指每个小组的两个端点的距离,组距=极差/组数列出频率分布表、画频率分布直方图的方法极差为:25.56–25.24=0.32三.决定分点可以令分点比数据多1位小数,并且把第1小组的起点稍微减少一点组数:将数据分组,当数据在100个以内时,按数据多少分成5-12组分组个数累计频数频率累计频率[25.235,25.265)一10.010.01[25.265,25.295)T20.020.03[25.295,25.325)正50.050.08[25.325,25.355)正正T120.120.20[25.355,25.385)正正正下180.180.38[25.385,25.415)正正正正正250.250.67[25.415,25.445)正正正一160.160.79[25.445,25.475)正正下130.130.92[25.475,25.505)TT40.040.96[25.505,25.535)T20.020.98[25.535,25.565)T20.021.00合计1001.00四.列出频率分布表00.050.10.150.20.250.31频率/组距产品尺寸(mm)五.画频率分布直方图注意:直方图的纵轴表示频率与组距的比值,=频率长方形的面积组距频率组距8.3频率分布直方图如下:月均用水量/t频率组距0.100.200.300.400.500.511.522.533.544.5小长方形的面积=?频率分布直方图如下:月均用水量/t频率组距0.100.200.300.400.500.511.522.533.544.5小长方形的面积总和=?频率分布直方图如下:月均用水量/t频率组距0.100.200.300.400.500.511.522.533.544.5月均用水量最多的在那个区间?频率分布直方图如下:月均用水量/t频率组距0.100.200.300.400.500.511.522.533.544.5请大家阅读第68页,直方图有那些优点和缺点?练习1.有一个容量为50的样本数据的分组的频数如下:[12.5,15.5)3[15.5,18.5)8[18.5,21.5)9[21.5,24.5)11[24.5,27.5)10[27.5,30.5)5[30.5,33.5)4(1)列出样本的频率分布表;(2)画出频率分布直方图;(3)根据频率分布直方图估计,数据落在[15.5,24.5)的百分比是多少?某校对初二年级60名15岁女学生的身高做了测量,结果如下(单位:cm):142154159175159156149162166158159156166160164155157146147161158158153158154158163154153153162162151154165164152151146151158160165158163163162161154165162162159157159149164149159153列出频率分布表,绘出频率分布直方图。例题已知一组数据如下:2521232527292528302926242527262224252628填写下面的频率分布表,绘出频率分布直方图。组别频数累计频数频率20.5~22.522.5~24.524.5~26.526.5~28.528.5~30.5合计练习一红星养猪场400头猪的质量频率分布直方图如图,其中数据不在分点上。按图回答:1)质量在组里的猪最多,有头。2)质量在60.5kg以上的猪有头。3)这400头猪的总质量约kg,平均质量约是kg。频率00.10.20.30.445.550.555.560.565.570.575.5质量(kg)400×0.4=16055.5~60.5400×(0.2+0.08+0.02)=120组组平均值每组头数每组总质量45.5~50.54840192050.5~55.55380424055.5~60.558160928060.5~65.56380504065.5~70.56832217670.5~75.5738584总质量232402324023240÷400=58.1练习二如果用n表示样本容量,分别用it,if表示频率分布表中第i组的频数和频率,你能用公式表示出样本容量、频数和频率之间的关系吗?各组的频数和等于几?各组的频率和呢?ntfii)1(ntttn...)2(211...)3(21nfff想一想频率分布直方图如下:月均用水量/t频率组距0.100.200.300.400.500.511.522.533.544.5连接频率分布直方图中各小长方形上端的中点,得到频率分布折线图0.511.522.533.544.50.20频率/组距0月均用水量/t0.500.400.300.10图2.2-2100位居民的月均用水量的频率分布折线图利用样本频率分布对总体分布进行相应估计(3)当样本容量无限增大,组距无限缩小,那么频率分布直方图就会无限接近于一条光滑曲线——总体密度曲线。(2)样本容量越大,这种估计越精确。(1)上例的样本容量为100,如果增至1000,其频率分布直方图的情况会有什么变化?假如增至10000呢?月均用水量/t频率组距0ab※总体密度曲线能够很好的反映总体在各个范围内的百分比,能构提供更准确的信息。尽管有些总体密度曲线是客观存在的,但是很难象函数图象那样准确的地画出来。?思考一下图中阴影部分的面积表示什么?用样本分布直方图去估计相应的总体分布时,一般样本容量越大,频率分布直方图就会无限接近总体密度曲线,就越精确地反映了总体的分布规律,即越精确地反映了总体在各个范围内取值百分比。总体密度曲线反映了总体
本文标题:用样本的频率分布估计总体分布-ppt.
链接地址:https://www.777doc.com/doc-4432111 .html