您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > 随机抽样、用样本估计总体、正态分布
1.会用简单随机抽样方法从总体中抽取样本,了解分层抽样和系统抽样方法.2.了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特点.3.理解样本数据标准差的意义和作用,会计算数据标准差,并能做出合理的解释.4.会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想.会用统计思想解决一些简单的实际问题.5.通过实际问题,借助直观(如实际问题的直方图),认识正态分布曲线的特点及曲线所表示的意义.121._______.231nxnxxxx平均数:一组数据的平均数,记为设有个数据,,,,则平均数为①中位数:一组数据按照从小到大或从大到小的顺序进行排列时,处于中间位置的数.当这组数据的个数为奇数时,中位数为中间一个数;当这组数据的个数为偶数时,中位数为中间.数据的基本数字特征的两个数的平均数.众数:一组数据中出现次数最多的数.2245s______________________.6.ss极差:一组数据中最大数与最小数的差.方差:一组数据中所有数与平均数的差的平方和的平均数,记为,即②标准差:方差的算术平方根,记作12()()()()()()23基本统计图表:象形、条形、折线、直方图、茎叶图.频率分布直方图的画图步骤:ⅰ求极差;ⅱ决定组距与组数;ⅲ将数据分.组;频率ⅳ列频率分布表;ⅴ画频率分布直方图以为纵坐标.组距频率分布折线图:连接频率分布直方图中各小长方形上端的中点所主要统计图表得的折线.45()总体密度曲线:随着样本容量的增加,作频率分布折线图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,则称这条光滑曲线为总体密度曲线.茎叶图:中间的数字表示数据的十位十位和百位数字,旁边的数字分别表示两组数据中各个数据的个位数字.1Nn(nN)____________________.()__________3Nnn简单随机抽样:从含有个个体的总体中逐个不放回地抽取个个体作为样本,如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做③有两种常用方法:ⅰ④:就是把总体中的个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中取出一个号签,连续抽取次,就得到一个容量.抽样方法为的样本.()________________2()()()1()()3____________________________.Nkllkⅱ⑤:利用随机数表、随机数骰子或计算机产生的随机数进行抽样.系统抽样:按下列步骤进行抽样:ⅰ先将总体的个个体编号;ⅱ确定分段间隔,对编号进行分段;ⅲ在第段用简单随机抽样确定第一个个体编号;ⅳ按照一定的规则抽取样本.分层抽样:即⑥21__________________________________.()()d_________4___.baxNabPabxx,,如果随机变量的概率密度为⑦其中、分别表示总体的平均数与标准差,称服从参数为、的正态分布,记作~,,函数图象称为正态密度曲线,简称正态曲线.一般的,如果对于任何实数,随机变量满足,则称.正态分布的分布为⑧2____________0,10,13()()()NNxxxx标准正态分布在正态分布中,当⑨,⑩时,正态总体称为标准正态总体,正态分布,称为标准正态分布,记作~.正态曲线的性质ⅰ曲线在轴的上方,与轴不相交;ⅱ曲线关于直线对称;ⅲ曲线在时位于最高点;()x()xxⅳ当时,曲线上升;当时,曲线下降,并且当曲线向左、右两边无限延伸时,以轴为渐近线向它无限靠近;ⅴ当一定时,曲线的形状由确定,越大,曲线越“矮胖”,表示总体的分布越分散;越小,曲线越“瘦高”,表示总体的分布越集中.22224().5()()0.6826(22)0.9544(33)0.9974.6()______________________3NEDXNPXPXPXNX若~,,则,若~,,则,,通常认为服从正态分布,的随机变量只取⑪,并简称之为原则.222221212()2.......1(())201(33)nnxxxxxxxxxxnnex①;②;③简单随机抽样;④抽签法;⑤随机数表法;⑥在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽出一定数量的个体,将各层取出的个体合在一起作为样本;⑦,;⑧正态分布;⑨;⑩;⑪,【要点指南】之间的值1.一支田径队有男运动员48人,女运动员36人,若用分层抽样的方法从该队的全体运动员中抽取一个容量为21的样本,则抽取男运动员的人数为()A.10人B.12人C.24人D.30人【解析】抽取男运动员的人数为2148+36×48=12人,故选B.2.为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(十分制)如图所示,假设得分值的中位数为me,众数为mo,平均值为x-,则()A.me=mo=x-B.me=mo<x-C.me<mo<x-D.mo<me<x-【解析】由图可知30名学生的得分情况依次为2人得3分,3人得4分,10人得5分,6人得6分,3人得7分,2人得8分,2人得9分,2人得10分,则中位数为第15,16个数为5和6的平均数,即me=5.5,5出现次数最多,故mo=5,x-=2×3+3×4+10×5+6×6+3×7+2×8+2×9+2×1030≈5.97,于是momex-,故选D.3.有一个容量为200的样本,其频率分布直方图如图所示,根据样本的频率分布直方图估计,样本数据落在区间[10,12)内的频数为()A.18B.36C.54D.72【解析】由图可知样本数据在[10,12)内的频率为0.18,则样本数据在区间[10,12)内的频数为36,故选B.4.某老师从星期一到星期五收到的信件数分别为10,6,8,5,6,则该组数据的方差s2=3.2.【解析】因为x-=15(10+6+8+5+6)=7,所以s2=15[(10-7)2+(6-7)2+(8-7)2+(5-7)2+(6-7)2]=3.2.5.已知随机变量X服从正态分布N(2,σ2),且P(X4)=0.8,则P(0X2)=0.3.【解析】因为μ=2,所以P(X4)=1-P(X≥4)=0.8,所以P(X≥4)=P(X≤2)=0.2,所以P(0X2)=12P(0X4)=12(1-2×0.2)=0.3.一用样本估计总体【例1】在某次测验中,有6位同学的平均成绩为75分.用xn表示编号为n(n=1,2,…,6)的同学所得成绩,且前5位同学的成绩如下:(1)求第6位同学的成绩x6,以及这6位同学成绩的标准差s;(2)从前5位同学中,随机地选2位同学,求恰有1位同学成绩在区间(68,75)中的概率.【解析】(1)因为这6位同学的平均成绩为75分,所以16(70+76+72+70+72+x6)=75,所以x6=90,即第6位同学的数学成绩为90分,这6位同学成绩的方差为s2=16×[(70-75)2+(76-75)2+(72-75)2+(70-75)2+(72-75)2+(90-75)2]=49,所以标准差s=7.(2)从前5位同学中随机选取2位同学,共有C25=10种结果,恰有一位同学的成绩在(68,75)中有(70,76),(76,72),(76,70),(76,72)共4种结果,故所求概率为P=410=0.4.【点评】用样本估计总体即用样本的平均值、方差、标准差估计总体的平均值、方差和标准差.设矩形的长为a,宽为b,其比满足b∶a=5-12≈0.618,这种矩形给人以美感,称为黄金矩形.黄金矩形常应用于工艺品设计中.下面是某工艺品厂随机抽取两个批次的初加工矩形宽度与长度的比值样本:甲批次:0.5980.6250.6280.5950.639乙批次:0.6180.6130.5920.6220.620素材1根据上述两个样本来估计两个批次的总体平均数,与标准值0.618比较,正确结论是()A.甲批次的总体平均数与标准值更接近B.乙批次的总体平均数与标准值更接近C.两个批次总体平均数与标准值接近程度相同D.两个批次总体平均数与标准值接近程度不能确定【解析】甲批次的平均数为0.617,乙批次的平均数为0.613.所以,可以估计甲批次的总体平均数与标准值更接近,故选A.【点评】样本估计总体即以样本的平均数、方差估计总体的平均数、方差.二茎叶图及应用【例2】(2011·深圳第一次调研)第26届世界大学生夏季运动会将于2011年8月12日到23日在深圳举行,为了搞好接待工作,组委会在某学院招募了12名男志愿者和18名女志愿者.将这30名志愿者的身高编成如下所示的茎叶图(单位:cm):若身高在175cm以上(包括175cm)定义为“高个子”,身高在175cm以下(不包括175cm)定义为“非高个子”,且只有“女高个子”才担任“礼仪小姐”.(1)如果用分层抽样的方法从“高个子”和“非高个子”中抽取5人,再从这5人中选2人,那么至少有一人是“高个子”的概率是多少?(2)若从所有“高个子”中选3名志愿者,用ξ表示所选志愿者中能担任“礼仪小姐”的人数,试写出ξ的分布列,并求ξ的数学期望.【解析】(1)根据茎叶图,有“高个子”12人,“非高个子”18人,用分层抽样的方法,每个人被抽中的概率是530=16,所以选中的“高个子”有12×16=2人,“非高个子”有18×16=3人.用事件A表示“至少有一名‘高个子’被选中”,则它的对立事件A-表示“没有一名‘高个子’被选中”,则P(A)=1-C23C25=1-310=710.因此,至少有一人是“高个子”的概率是710.(2)依题意,ξ的可能取值为0,1,2,3,则P(ξ=0)=C38C312=1455,P(ξ=1)=C14C28C312=2855,P(ξ=2)=C24C18C312=1255,P(ξ=3)=C34C312=155.因此,ξ的分布列如下:所以Eξ=0×1455+1×2855+2×1255+3×155=1.【点评】了解茎叶图的绘制思想,会由茎叶图还原样本数据,并能应用样本估计总体的思想分析解决实际问题.随机抽取某中学甲、乙两班各10名同学,测量他们的身高(单位:cm),获得身高数据如下:甲班:182,158,162,170,179,163,168,179,171,168乙班:159,168,162,170,173,165,181,176,178,179(1)根据甲、乙两班身高的数据画出对应的茎叶图,并依据茎叶图判断哪个班的平均身高较高;(2)计算甲班的样本方差;(3)现从乙班这10名同学中随机抽取两名身高不低于173cm的同学,求身高为176cm的同学被抽中的概率.素材2【解析】(1)茎叶图如下:由茎叶图可知:甲班同学的身高集中于160cm~179cm之间,而乙班同学的身高集中于170cm~180cm之间,因此,乙班同学的平均身高高于甲班.(2)x-=158+162+163+168+168+170+171+179+179+18210=170(cm).甲班的样本方差为110[(158-170)2+(162-170)2+(163-170)2+(168-170)2+(168-170)2+(170-170)2+(171-170)2+(179-170)2+(179-170)2+(182-170)2]=57.2.(3)设身高为176cm的同学被抽中的事件为A.从乙班10名同学中抽取两名身高不低于173cm的同学有:(181,173),(181,176),(181,178),(181,179),(179,173),(179,176),(179,178),(178,173
本文标题:随机抽样、用样本估计总体、正态分布
链接地址:https://www.777doc.com/doc-420362 .html