您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > 新人教版A(2019)-第九章-统计-9.2.2-总体百分位数的估计
9.2用样本估计总体9.2.2总体百分位数的估计讲课人:邢启强2(1)绘制步骤:①求,即一组数据中的最大值与最小值的差.②决定与.组距与组数的确定没有固定的标准,一般数据的个数越多,所分组数越.当样本容量不超过100时,常分成5~12组.为方便起见,一般取组距,并且组距应力求“”.③将数据.④列表.计算各小组的频率,第i组的频率是.⑤画频率分布直方图.其中横轴表示分组,纵轴表示.实际上就是频率分布直方图中各小长方形的高度,它反映了各组样本观测数据的程度画频率分布直方图的一般步骤为:复习引入极差组距组数多等长取整分组频率分布第i组频数样本容量频率组距疏密频率组距讲课人:邢启强3复习引入(2)意义:各个小长方形的面积表示相应各组的,频率分布直方图以的形式反映数据落在各个小组的频率的大小,各小长方形的面积的总和等于.(3)总体取值规律的估计:我们可以用样本观测数据的估计总体的取值规律.(4)频率分布直方图的特征:当频率分布直方图的组数少、组距大时,容易从中看出数据整体的分布特点,但由于无法看出每组内的数据分布情况,损失了较多的;当频率分布直方图的组数多、组距小时,保留了较多的原始数据信息,但由于小长方形较多,有时图形会变得非常,不容易从中看出总体数据的分布特点.频率面积1频率分布原始数据信息不规则讲课人:邢启强4复习引入频率分布直方图的性质(1)因为小矩形的面积=组距×=频率,所以各小矩形的面积表示相应各组的频率.这样,频率分布直方图就以面积的形式反映了数据落在各个小组内的频率大小.(2)在频率分布直方图中,各小矩形的面积之和等于1.(3)=样本容量.(4)在频率分布直方图中,各矩形的面积之比等于频率之比,各矩形的高度之比也等于频率之比.频率组距频数相应的频率讲课人:邢启强53.除了频率分布的直方图还有没有类似的统计数据处理方法?学习新知统计图表主要应用(表示数据上的特点)扇形图直观描述各类数据占总数的比例条形图和直方图直观描述不同类别或分组数据的频数和频率折线图描述数据随时间的变化趋势在初中学习过条形图、扇形图、折线图、频数分布直方图等.不同的统计图在表示数据上有不同的特点,不同的统计图适用的数据类型也不同.例如,条形图适用于描述离散型的数据,直方图适用描述连续型数据等.在解决问题的过程中,要根据实际问题的特点,选择恰当的统计图对数据进行可视化描述,以使我们能通过图形直观地发现样本数据的分布情况,进而估计总体的分布规律讲课人:邢启强6典型例题例1已知某市2015年全年空气质量等级如表所示.空气质量等级(空气质量指数(AQI))频数频率优(AQI≤50)8322.8%良(50AQI≤100)12133.2%轻度污染(100AQI≤150)6818.6%中度污染(150AQI≤200)4913.4%重度污染(200AQI≤300)30308.2%严重污染(AQI300)14143.8%合计365100%2016年5月和6月的空气质量指数如下:5月24080565392126458756601916255585653899012512410381894434537981621166月63921101221021168116315876331026553385552769912712080108333573829014695选择合适的统计图描述数据,并回答下列问题:(1)分析该市2016年6月的空气质量情况.(2)比较该市2016年5月和6月的空气质量,哪个月的空气质量较好?(3)比较该市2016年6月与该市2015年全年的空气质量,2016年6月的空气质量是否好于去年?讲课人:邢启强7解:(1)根据该市2016年6月的空气质量指数和空气质量等级分级标准,可以画出该市这个月的不同空气质量等级的频数与频率分布表频数与频率分布表可以直接得到各类数据的频数和频率.从表中可以看出,“优”“良”的天数达19天,占了整月的63.33%,没有出现“重度污染”和“严重污染”我们还可以用折线图展示空气质量指数随时间的变化情况,如图.容易发现,6月的空气质量指数在100附近波动.讲课人:邢启强8从条形图中可以看出,在前三个等级的占绝大多数,空气质量等级为“良”的天数最多,后三个等级的天数很少从扇形图中可以看出,空气质量为“良”的天数占了总天数的一半,大约有三分之二为“优”“良”,大多数是“良”和“轻度污染”因此,整体上6月的空气质量不错.用条形图和扇形图对数据作出直观的描述讲课人:邢启强96月(2)根据该市2016年5月的空气质量指数和空气质量分级标准,可以画出该市这个月的不同空气质量等级的频数和频率分布表5月为了便于比较,我们选用复合条形图,将两组数据同时反映到一个条形图上.通过条形图中柱的高低,可以更直观地进行两个月的空气质量的比较从整体上看,5月的空气质量略好于6月,但5月有重度污染,而6月没有讲课人:邢启强10(3)把2016年6月和2015年全年的空气质量进行比较,由于一个月和一年的天数差别很大,所以直接通过频数比较没有意义,应该转化成频率分布进行比较.可以通过二者的空气质量指数的频率分布直方图或空气质量等级的频率分布条形图进行比较通过图可以看出,虽然2016年6月的空气质量为“优”的频率略低于2015年,但“良”的频率明显高于2015年,而且2016年6月中度以上的污染天气频率明显小于2015年,所以从整体上看,2016年6月的空气质量要好于2015年全年的空气质量.能得出“2016年的空气质量比为2015年明显改善了”的结论吗?为什么?讲课人:邢启强11[例2]家庭过期药品属于“国家危险废物”,处理不当将污染环境,危害健康.某市药监部门为了解市民家庭处理过期药品的方式,决定对全市家庭作一次简单随机抽样调査.(1)下列选取样本的方法最合理的一种是________.(只需填上正确答案的序号)①在市中心某个居民区以家庭为单位随机抽取;②在全市医务工作者中以家庭为单位随机抽取;③在全市常住人口中以家庭为单位随机抽取.典型例题③讲课人:邢启强12(2)本次抽样调査发现,接受调査的家庭都有过期药品,现将有关数据呈现如图:①m=________,n=________;②补全条形统计图;③根据调査数据,你认为该市市民家庭处理过期药品最常见的方式是什么?④家庭过期药品的正确处理方式是送回收点,若该市有180万户家庭,请估计大约有多少户家庭处理过期药品的方式是送回收站.典型例题206讲课人:邢启强13[解析](2)①抽样调査的家庭总户数为:80÷8%=1000(户),m%=2001000×100%=20%,m=20,n%=601000×100%=6%,n=6.②C类户数为:1000-(80+510+200+60+50)=100,条形统计图补充如下:③根据调査数据,即可知道该市市民家庭处理过期药品最常见的方式是B类.④180×10%=18(万户).若该市有180万户家庭,估计大约有18万户家庭处理过期药品的方式是送回收站.讲课人:邢启强14例3某中学初中部共有120名教师,高中部共有150名教师,其性别比例如图所示,则该校女教师的人数为()A.128B.144C.174D.167解析:初中部女教师有120×70%=84(人),高中部女教师有150×(1-60%)=150×40%=60(人),则女教师共有84+60=144(人).分析根据女教师的百分比,分别计算初中部和高中部女教师的人数即可.B对于折线图、扇形图、条形图一定要注意每种图示的作用和含义,其次要看清所标记数据和单位,最后要抓住各种图示中所体现的信息“密码”.典型例题讲课人:邢启强15调查机构对某高科技行业进行调查统计,得到该行业从业者学历分布扇形图、从事该行业岗位分布条形图,如图所示.给出下列三种说法:①该高科技行业从业人员中学历为博士的占一半以上;②该高科技行业中从事技术岗位的人数超过总人数的30%;③该高科技行业中从事运营岗位的人员主要是本科生.其中正确的个数为()A.0个B.1个C.2个D.3个典型例题C讲课人:邢启强16典型例题如图是根据某市3月1日至3月10日的最低气温(单位:℃)的情况绘制的折线统计图,试根据折线统计图反映的信息,绘制该市3月1日到10日最低气温(单位:℃)的扇形统计图和条形统计图.讲课人:邢启强17日期12345678910最低气温(℃)-3-20-1120-122解:该城市3月1日至10日的最低气温(单位:℃)情况如下表:其中最低气温为-3℃的有1天,占10%,最低气温为-2℃的有1天,占10%,最低气温为-1℃的有2天,占20%,最低气温为0℃的有2天,占20%,最低气温为1℃的有1天,占10%,最低气温为2℃的有3天,占30%.扇形统计图条形统计图讲课人:邢启强189.2.2总体百分位数的估计前面我们用频率分布表、频率分布直方图描述了居民用户月均用水量的样本数据,通过对图表的观察与分析,得出了一些样本数据的频率分布规律,并由此推测了该市全体居民用户月均用水量的分布情况,得出了“大部分居民用户的月均用水量集中在一个较低值区域”等推断,接下来的问题是,如何利用这些信息,为政府决策服务呢?下面我们对此进行讨论.问题:如果该市政府希望使80%的居民用户生活用水费支出不受影响,根据9.2.1节中100户居民用户的月均用水量数据,你能给市政府提出确定居民用户月均用水量标准的建议吗?讲课人:邢启强19学习新知根据市政府的要求确定居民用户月均用水量标准,就是要寻找一个数a,使全市居民用户月均用水量中不超过a的占80%,大于a的占20%.把得到的100个样本数据按从小到大排序,得到第80个和81个数据分别为13.6和13.8.可以发现,区间(13.6,13.8)内的任意一个数,都能把样本数据分成符合要求的两部分.一般地,我们取这两个数的平均数()13.6+13.8)/2=13.7,并称此数为这组数据的第80百分位数(percentile),或80%分位数.你认为14t这个标准一定能够保证80%的居民用水不超标吗?如果不一定,那么哪些环节可能会导致结论的差别?根据样本数据的第80百分位数,我们可以估计总体数据的第80百分位数为13.7左右.由于样本的取值规律与总体的取值规律之间会存在偏差,而在决策问题中,只要临界值近似为第80百分位数即可,因此为了实际中操作的方便,可以建议市政府把月均用水量标准定为14t,或者把年用水量标准定为168t.讲课人:邢启强20定义:一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.学习新知可以通过下面的步骤计算一组n个数据的第p百分位数:第1步,按从小到大排列原始数据.第2步,计算i=n×p%.第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第项与第(i+1)项数据的平均数.讲课人:邢启强21学习新知中位数,相当于是第50百分位数.常用的分位数还有第25百分位数,第75百分位数.这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数.其中第25百分位数也称为第一四分位数或下四分位数等,第75百分位数也称为第三四分位数或上四分位数等,第1百分位数第5百分位数,第95百分位数和第99百分位数在统计中也经常被使用.概念拓展讲课人:邢启强22典型例题163.0164.0161.0157.0162.0165.0158.0155.0164.0162.5154.0154.0164.0149.0159.0161.0170.0171.0155.0148.0172.0162.5158.0155.5157.0163.0172.0例2根据下面女生的身高的样本数据,估计树人中学高一年级女生的第25,50,75百分位数.解:把27名女生的样本数据按从小到大排序,可得148.0149.0154.0154.0155.0155.0155.5157.0157.0158.0158.0159.0161.0161.01
本文标题:新人教版A(2019)-第九章-统计-9.2.2-总体百分位数的估计
链接地址:https://www.777doc.com/doc-7407318 .html