您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > 4-统计抽样和抽样分布
第四章统计抽样与抽样分布1/55为什么要进行抽样?如何进行简单随机抽样?正态分布、分布、F分布、t分布的定义、图形分布形态如何?中心极限定理的含义如何?2χ第四章统计抽样与抽样分布2/554.1关于抽样的基本概念为什么要抽样?为了收集必要的资料,对所研究对象(总体)的全部元素逐一进行观测,往往不很现实。抽样原因元素多,搜集数据费时、费用大,不及时而使所得的数据无意义总体庞大,难以对总体的全部元素进行研究检查具有破坏性炮弹、灯管、砖等第四章统计抽样与抽样分布3/55简单随机抽样(x1,x2,……,xn):简单随机抽样是指从总体中抽取样本容量为n的样本时,x1,x2,……,xn这n个随机变量必须具备以下两个条件:这n个随机变量与总体X具有相同的概率分布;它们之间相互独立。4.1关于抽样的基本概念第四章统计抽样与抽样分布4/55甲乙丙丁四个生产商,其产品质量如下表所示:如果仅从甲乙两个生产商的产品中进行抽样,抽样质量就偏高;如果仅从丙丁两个生产商的产品中进行抽样,抽样质量就偏低;因此采用简单随机抽样保证随机样本与总体具有相同的概率分布。甲乙丙丁质量高高低低表4-14.1关于抽样的基本概念第四章统计抽样与抽样分布5/55样本统计量与抽样分布:在简单随机抽样中,样本具有随机性,样本的参数,s2等也会随着样本不同而不同,故它们是样本的函数,记为g(x1,x2,…,xn),称为样本统计量。统计量的概率分布称为抽样分布(Sampledistribution)x4.1关于抽样的基本概念第四章统计抽样与抽样分布6/55统计量定义:设为来自总体X的一个样本,为一个函数,如果中不包含任何未知参数,则称为样本的一个统计量。niiXnX11样本均值样本方差K阶样本矩niiniiXnXnXXnS122212)(11)(11,2,1,11kXnAnikkinXXX,,,21),,,(21nXXXg),,,(21nXXXg常见的统计量练习证明:.)()(,)(22XVarSEEXXEg,2,1,)(11kXXnBnikikK阶中心矩第四章统计抽样与抽样分布7/55几种概率分布正态分布分布F分布t分布2χ4.2几种与正态分布有关的概率分布第四章统计抽样与抽样分布8/55若随机变量X的概率密度函数,21)(222)(xexfx),(~2NX记为(1)正态分布第四章统计抽样与抽样分布9/55uttfuUPd)()(图4-1一般正态分布(1)正态分布第四章统计抽样与抽样分布10/55标准正态分布:当时,记为U∽N(0,1)1,022221)(tet图4-2标准正态分布(1)正态分布第四章统计抽样与抽样分布11/55非标准正态分布向标准正态分布的转化若标准化因子则U∽N(0,1)),(~2NXXU(1)正态分布第四章统计抽样与抽样分布12/55查表当u大于零时,可查正态分布表但如果u0时,则可由式求出(1)正态分布)(1)(uu第四章统计抽样与抽样分布13/55第四章统计抽样与抽样分布14/55线性性质:如果,且相互独立。对于常数,有下式成立:),2,1)(,(~2niNXiii),(~1211niiniiniiNX),(~22iiiaaNaXa(1)正态分布第四章统计抽样与抽样分布15/55相互独立且均为服从N(0,1)分布的随机变量,则称随机变量所服从的分布是自由度为n的分布,且记。2χ12x,x,,xn221xniiχ)(~22n2χ定义(2)分布第四章统计抽样与抽样分布16/55自由度是指独立随机变量的个数,dfn2()n分布的密度函数为21221,022()0,0nynyeynfyy(1)!nn2——分布第四章统计抽样与抽样分布17/55图4-3χ2分布密度函数图形2χ(2)分布01357911131517x0.50.40.30.20.1n=1n=4n=10图4-3f(x)其图形随自由度的不同而有所改变.第四章统计抽样与抽样分布18/55查表:对于给定的α,0α1,可在分布表中查得,即例如即指2d22xx)n,x(f)n(P2χ15.987(10)χ20.110d9781510978152.x)n;x(f.)(P.2χ(2)分布第四章统计抽样与抽样分布19/55满足222()()()()dnPnnfyy的数为2分布的上分位数或上侧临界值,2()n其几何意义见右图所示.其中f(x)是2-分布的概率密度.f(x)x02()n图4-4显然,在自由度n取定以后,的值只与有关.2()n例如,当n=21,=0.05时,由附表4(P207)可查得,20.05(21)32.67即2(21)32.670.05.P2分布的上分位数第四章统计抽样与抽样分布20/55性质:①如果,则;②设,且相互独立,则③若,已知相互独立,,则)1,0(~NX)1(~22X)(~),(~22221221nn)(~2122221nn2221232221,)(~),(~2231221nn)(~1222nn2χ(2)分布第四章统计抽样与抽样分布21/55④总体,是X的一个样本,为样本的平均数,为样本的方差。则:a.相互独立b.),(~2NX12x,x,,xn11xxniin2211(xx)1niisn2xs与)1(~)1(222nsn2χ(2)分布第四章统计抽样与抽样分布22/55(b)式的自由度为什么是n-1?从表面上看,21()niiXX是n个正态随机变量的平方和,iXX但实际上它们不是独立的,它们之间有一种线性约束关系:11()nniiiiXXXnX=0这表明,当这个n个正态随机变量中有n-1个取值给定时,剩下的一个的取值就跟着唯一确定了,故在这n项平方和中只有n-1项是独立的.所以(b)式的自由度是n-1.第四章统计抽样与抽样分布23/55第四章统计抽样与抽样分布24/55第四章统计抽样与抽样分布25/55第四章统计抽样与抽样分布26/55设相互独立的随机变量V和W分别服从自由度为n1,n2的分布,即,则随机变量服从F分布。n1,n2分别是它的第一自由度和第二自由度,且通常记为2)(~),(~2212nWnV21//nWnVF),(~21nnFF定义(3)F分布第四章统计抽样与抽样分布27/55图4-5F分布图F(3)F分布第四章统计抽样与抽样分布28/55查表性质)10(d)()(FxxfFFP),(1),(12211nnFnnF(3)F分布(请自行给出证明)第四章统计抽样与抽样分布29/55设随机变量U服从标准正态分布,随机变量W服从自由度为n的分布,且U与W相互独立,则称随机变量服从自由度为n的t分布,记为T~t(n)。2χnWUT/定义(4)t分布(Students分布)第四章统计抽样与抽样分布30/55图4-6n=∞正态分布n=10n=1t分布图(4)t分布(Students分布)第四章统计抽样与抽样分布31/55查表或性质:当n很大时,此时,tα/2≈uα/2,t分布近似标准正态分布。)(||2/nttP)(nttP2221)(limtnetf(4)t分布(Students分布)第四章统计抽样与抽样分布32/55定理设(X1,X2,…,Xn)为来自正态总体X~N(,2)的样本,则统计量~(1)XTtnSn证由于与S2相互独立,且X~(0,1),XUNn222(1)~(1)nSn由定义得22~(1)(1)(1)XnXTtnSnnSn第四章统计抽样与抽样分布33/55无限总体:设总体X~N(μ,σ2),X1,X2,…,Xn是总体X的随机样本,样本平均数,则x/iXn),(~2nNX4.3样本平均数的抽样分布第四章统计抽样与抽样分布34/55有限总体有限总体若采取有放回抽样,则与无限总体等价。有限总体容量为N而采取无放回抽样,且n/N≤0.1,仍可视为无限总体,而当n/N0.1时则称式为有限总体的修正系数。1)(1)()(2NnNnXNnNnXDXE1NnN4.3样本平均数的抽样分布证明可以见抽样调查的方法和原理梁小筠p42一些复杂的展开,无技术含量(一网友留言)第四章统计抽样与抽样分布35/55从总体中抽取样本容量为n的简单随机样本,当样本容量n≥30时,样本均值的抽样分布可用正态概率分布近似。X4.4中心极限定理第四章统计抽样与抽样分布36/55图4-64.4中心极限定理第四章统计抽样与抽样分布37/55独立同分布的中心极限定理2122111112,,,,(),()0(1,2,)()()()1lim()lim2~niiniinnniiiiiinniintxnnnnXXXEXDXkXXEXXnYnDXFxxFxPYxedtXnn定理设是相互独立,服从同一分布且具有数学期望和方差:,则随机变量之和的标准化变量的分布函数对任意实数满足即当充分大时,(0,1)N近似的第四章统计抽样与抽样分布38/55德莫佛——拉普拉斯定理xtnnndtexpnpnpPxppnn2221)1(lim)10(,),2,1(,有意的二项分布,则对于任服从参数为设随机变量定理第四章统计抽样与抽样分布39/55德莫佛——拉普拉斯定理的证明二项分布的极限分布。定理说明,正态分布是特殊情形。同分布中心极限定理的可见,上述定理是独立限定理知由独立同分布的中心极。分布,有服从其中的二项分布,则令服从参数为由于定理xtnnkkknkknndtexpnpnpPppXDpXEXXppnn21221)1(lim)1()(,)()10()10(,),2,1(第四章统计抽样与抽样分布40/55中心极限定理的意义我们知道,正态分布是现实生活中使用最多、最广泛、最重要的一种分布。许多随机变量本身并不属于正态分布,但它们的极限分布是正态分布。中心极限定理阐明了在什么条件下,原来不属于正态分布的一些随机变量其总和分布渐近地服从正态分布。为我们利用正态分布来解决这类随机变量的问题提供了理论依据。第四章统计抽样与抽样分布41/55例1.57.522)1(.5.12,25),,12(22SXNX未止,但已知样本方差);(知已如果的概率大于求样本均值的样本抽取容量为服从正态分布设总体解252125.12252125.12)1(XPXP1063.0)25.1(125.14.012XP059.1255.1225125.12)2(TPSSXPXP.15.05.12.15.0059.1,059.1)24(,2415.0XPTPtt故有即分布表的查自由度为第四章统计抽样与抽样分布42/55例2.85.2)(2;401.,,)5.0,(101210121012iiiiXXpXpXXN)未知,求概率(,求概率)已知(中抽取样本从正态总体解)10(~5.01)1,0(~5.00)1(2101222iiiXYNX,则有,由165.045.01421012221012YpXpXpiiii第四章统计抽样与抽样分布43/55.10.04.16)1
本文标题:4-统计抽样和抽样分布
链接地址:https://www.777doc.com/doc-417095 .html