您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > 统计学6抽样和抽样分(PPT99页)
第一节抽样及抽样组织形式第二节常见的概率分布第三节抽样分布几个概念总体:将要调查或研究的事物或现象的全体。个体:组成总体的每个元素。容量:总体中所含个体的个数。例如:某个城市居民家庭收入情况:总体这个城市所有家庭的收入个体这个城市每个家庭的收入容量这个城市所有家庭户数抽样:从总体中按一定的抽样技术抽取若干个个体的过程。样本:所抽取的部分个体样本量:所抽取的个体的个数如:某个城市居民家庭收入情况,抽取1000户进行调查,1000户为一个样本,样本量为1000第六章抽样和抽样分布第一节抽样及抽样组织形式一、抽样的几个基本概念(一)全及总体和样本总体全及总体全及总体的单位总数用N表示,称作总体容量,当确定了研究目标时,它具有唯一性。总体容量第六章抽样和抽样分布样本总体样本单位(单元):从全及总体中抽出的部分单位,每个单位称作样本单位。样本容量:样本总体的单位总数。样本总体不具有唯一性,它的可能个数与N、n及抽样方法有关。通常n30称为小样本,n≥30称为大样本第六章抽样和抽样分布例,某养猪场共有存栏肉猪10000头,现欲了解这批肉猪平均每头的毛重,从中抽取100头称其重量,计算这100头的平均每头毛重,以达到我们期望的目的。可能的样本数量:种(不考虑顺序的不重置抽样)10010000C全及总体样本容量第六章抽样和抽样分布(二)总体参数和样本统计量总体参数根据全及总体各单位变量值计算的反映全及总体某数量特征的综合指标,由于全及总体唯一确定,所以称为总体参数。样本统计量根据样本总体各单位变量值计算的反映样本总体某数量特征的综合指标,由于样本不具唯一性,故称为样本统计量,它是一个随机变量。第六章抽样和抽样分布表:总体参数和样本统计量符号x2总体平均数样本平均数总体标准差总体方差总体参数符号样本统计量符号总体容量N样本容量n总体成数P样本成数p样本标准差S样本方差S2第六章抽样和抽样分布二、抽样组织形式基本的抽样组织方式有以下几种:简单随机抽样类型抽样等距抽样整群抽样多阶段抽样第六章抽样和抽样分布(一)简单随机抽样1、简单随机抽样的概念简单随机抽样也称单纯随机抽样,它是指从总体的所有单位中按照随机原则抽取样本单位的方式。(分为重置抽样和不重置抽样)例:掷骰子总体中每个单位被抽取的机会是均等的第六章抽样和抽样分布1、重置(复)抽样又称放回抽样、抽样安排——对每次被抽到的单位经登记后再放回总体,重新参与下一次抽选的抽样方法。在每次的抽取中样本单位被抽中的概率都等于1/N。统计中称这样的抽样为相互独立的实验。从总体中随机抽取一个单位并把结果记录下来称为一次试验第六章抽样和抽样分布从总体N个单位,抽取样本容量为n个单位的重置试验,可能抽取的样本个数称为可重置的排列数,被抽中样本的概率为例1:考虑从包含有1-6的点数的总体中抽取n=2的样本(掷2个骰子具有相同点数)的概率nNAnnNNA第六章抽样和抽样分布2、不重置(复)抽样又称为不放回抽样、抽样安排——对每次抽到的单位登记后不再放回总体,不参加下一次抽选,下一次继续从总体中余下的单位抽取样本单位,这样连续进行n次试验的抽样方法。第六章抽样和抽样分布从总体N个单位,抽取样本容量为n个单位的试验,可能抽取的样本点个数称为不重置的组合数举例:例2:考虑从包含有1-6的点数的总体中抽取n=2的样本(掷2个骰子具有相同点数)的概率nNC!)(!!)1()1(nnNNnnNNNCnN!第六章抽样和抽样分布2、简单随机抽样的实施简单随机抽样的抽取样本的方法多种多样,首先必须先把总体各单位全部编号,然后利用摇号、掷骰子或随机数表的方法抽取样本。例5.3使用随机数表p116【随数表的使用】第六章抽样和抽样分布简单随机抽样的局限性:p117(1)必须有包含所有单元的一个完整抽样框,而当N很大时很难有完整的抽样框。(2)抽得的样本很分散,难以找到每个样本单元并实施调查。(3)当总体单位间所研究的数量特征值的差异较大时,抽样效果不理想。第六章抽样和抽样分布(二)分层随机抽样p118如果总体可以分为互不重叠且穷尽的若干个子总体,即每个单元必须属于且仅属于一个子总体,则称这样的子总体为层。抽样在每一层中独立进行,总的样本由各层的样本组成,所得的样本称为分层样本。如果每层中的抽样都是按简单随机抽样进行,那么这种抽样就称为分层随机抽样,所得的样本称为分层随机样本。也称类型抽样第六章抽样和抽样分布分层随机抽样的特点:p118(1)各层样本不仅可用于总体参数的估计外,还可用来对层的参数进行估计(2)分层抽样实施灵活方便,便于组织(3)与简单随机样本比较,分层样本在总体中的分布更均匀(4)分层抽样能较大的提高调查精度(仅取决于各层内的方差,与层与层之间的差异无关)注:分层抽样包括等比例抽样和不等比例抽样第六章抽样和抽样分布(三)整群抽样整群抽样又称为分群抽样或集团抽样。将总体划分为若干个群,然后以群为单位从中间按简单随机抽样的方式或等距抽样的方式抽取部分群,对中选群中的所有单位一一进行调查的抽样组织方式。第六章抽样和抽样分布注意:整群抽样和分层抽样的区别:整群抽样的缺点:在相同的条件下,抽样误差较大,代表性较低。(影响全及总体中各单位分配的均匀性)分层抽样整群抽样划组作用缩小总体扩大单位抽取的基本单位总体单位群第六章抽样和抽样分布(四)等距抽样系统抽样也称机械抽样,它是将总体中的单位按某种顺序排列,在规定的范围内随机抽取起始单位,然后按一套规则确定其他样本单元的一种抽样方法。等距抽样是先将总体各单位按某一标志顺序排列,然后按照固定的顺序和相同的间隔来抽取样本单位的抽样组织方式。有关标志排序:对总体个单位的变异情况有所了解。(如:职工家计按照职工人均工资排序)最简单的系统抽样,包括无关标志排序抽样和有关标志排序抽样第六章抽样和抽样分布(五)多阶段抽样阶段抽样又称为多级抽样。它是一种将抽取样本单位的过程划分为几个阶段,然后逐阶段抽取样本单位的抽样组织方式。单阶段抽样:抽出的样本单位直接是总体单位。二阶段抽样:将总体进行分组,从中随机抽出一些组,然后再从中选组中随机抽取总体单位。多阶段抽样:如我国农产量调查第六章抽样和抽样分布二阶及多阶段抽样的特点:(1)样本单元相对集中,与简单随机抽样相比,实施方便,每个基本单元的调查费用较低。(2)能充分发挥抽样的效率。第六章抽样和抽样分布多阶段抽样的优点:p121(1)便于组织。(2)可以获得各阶段单元的调查资料。(3)多阶段抽样的方式比较灵活。第六章抽样和抽样分布第二节常见的概率分布一、随机变量用大写字母X、Y、Z等表示随机变量,用相应的小写字母表示随机变量的取值,例如随机变量X的取值表示为,,···。某次试验结果的数值性描述,称为随机变量。2x1x包括:离散型随机变量、连续型随机变量第六章抽样和抽样分布定义:离散型随机变量只能取有限个或可数个值的随机变量,称为离散型随机变量(discreterandomvariable)。定义:连续型随机变量可以取一个或多个区间中任何值的随机变量,称为连续型随机变量(continuousrandomvariable)。第六章抽样和抽样分布两种随机变量举例试验随机变量X随机变量的取值(试验结果)检查50件产品一家餐馆营业一天合格品数顾客人数0,1,2,3,···,500,1,2,3,···某班期终考试及格率某电话用户每次通话时间长度考试及格的学生比例每次通话时长(分钟)0≤X≤100%X>0第六章抽样和抽样分布二、离散型随机变量(一)离散型随机变量的概率分布定义:离散型随即变量的概率分布列出随机变量X的所有可能值,,···,以及取每个值的概率···,并用表格的形式表现出来,称为离散型随机变量的概率分布。1x2x,,21pp第六章抽样和抽样分布表:离散型随机变量的分布(=1,2,···)也称概率分布。ixX1x2xiipxXP)(1p2p············iipxXP)(第六章抽样和抽样分布离散型概率分布具有以下性质:(1)(2)···0ipiiip,2,1,1第六章抽样和抽样分布例题3:投掷一颗骰子后出现的点数X是一个离散型随机变量。写出掷一颗骰子出现的点数的概率分布。例题4:一部电梯在一周内发生故障的次数X及相应的概率如下表所示。(1)确定的a值。(2)求正好发生2次故障的概率。(3)求故障次数不超过2次的概率。(4)故障次数多于1次的概率。ixXiipxXP)(0.100.250.350123第六章抽样和抽样分布(二)离散型随即变量的数学期望和方差1.数学期望定义:离散型随机变量X的数学期望是X所有可能取值(=1,2,···)与其相应的概率(=1,2,···)的乘积之和,用或表示,即==ixiip)(XE)(XEiiipxi第六章抽样和抽样分布2.方差定义:离散型随机变量X的方差等于与其相应的概率的乘积之和,用和D(X)表示,即=D(X)=2)(ixip22iiipx2)(方差或标准差放映了随机变量取值的离散程度第六章抽样和抽样分布例题5:一家电脑配件供应商声称,他所提供的配件100个中拥有次品的个数X及概率分布如表所示:表:每100个配件中的次品数及概率分布求该供应商提供的配件的次品数的数学期望和标准差。ixXip次品数(概率()0123)0.750.120.080.05第六章抽样和抽样分布(三)常用的离散型概率分布1.两点分布最简单的随机试验是只有两种可能结果的试验,称之为伯努利试验。若定义一次伯努利试验成功的次数为离散型随机变量X,它的概率分布就是最简单的一个分布类型,即两点分布,亦称伯努利分布。第六章抽样和抽样分布定义:如果随机变量X只可能取0和1两个值,它的概率分布为则称X服从参数为的两点分布,也称0-1分布。pXP)1(qpXP1)0()10()(1pqpxXPxxp第六章抽样和抽样分布二、二项分布【补充】(二项分布与伯努利有关)若将伯努利试验独立地重复n次,n是一个固定数值,则该试验称为n重伯努利试验。具体说,n重伯努利试验满足下列条件:(1)一次试验只有两种可能结果(2)一次试验“成功”的概率为p,“失败”的概率为q=1-p,而且概率对每次试验都相同(3)试验是相互独立的(4)试验可以重复n次(5)在次试验中,“成功”的次数对应一个离散型随机变量X。这样,在n次试验中,出现“成功”的次数的概率分布就是二项分布。第六章抽样和抽样分布定义:在n次试验中,出现“成功”的次数的概率为则称随机变量X服从参数(n,p)的二项分布,记作。二项分布的数学期望和方差分别为:==,==nxqpCxXPxnxxn,,2,1,0,)(),(~pnBX)(XEnp2)(XDnpq第六章抽样和抽样分布例题6:已知一批产品的次品率为4%,从中有放回地抽取5个。求5个产品中:(1)没有次品的概率是多少?(2)恰好有1个次品的概率是多少?(3)有三个以下次品的概率是多少?第六章抽样和抽样分布三、连续型随机变量(一)概率密度函数设X是一连续随机变量,它代表某一区间或多个区间中的任意数值,它的概率分布通过概率密度函数来表述,记作。)(Xf概率密度函数密度函数f(x)表示X的所有取值x及其频数f(x)值(值,频数)频数f(x)abx概率密度函数在平面直角坐标系中画出f(x)的图形,则对于任何实数x1x2,P(x1Xx2)是该曲线下从x1到x2的面积baxxfbXaPd)()(f(x)xab概率是曲线下的面积第六章抽样和抽样分布连续型随机变量的分布函数对于随机变量X,设为任意实数,则函数,称为随机变量X的分布函数。分布函数F在处的取值就是随机变量X的取值落在区间上的概率。x)()(xXPXFx),(x(二)正态分布(normaldistribution)1.由C.F.高斯(CarlFriedrichGauss,1777—1855)作为描述误差相对频数分布的模型而提出2.描述连续型随机变量的最重要的分布3.许多
本文标题:统计学6抽样和抽样分(PPT99页)
链接地址:https://www.777doc.com/doc-420113 .html