您好,欢迎访问三七文档
当前位置:首页 > 临时分类 > 概率论与数理统计—第六章样本及抽样分布
沈阳大学科技工程学院教案课程名称:工程数学——概率论与数理统计编写时间:2013年3月20日第次第1页授课章节第六章样本及抽样分布目的要求理解总体,样本,样本值,统计量;了解χ2分布,t分布和F分布,分位数;掌握正态总体的抽样分布等内容.重点难点重点:正态总体的某些常用统计量的分布。前五章,主要介绍了概率论的基本概念,掌握了描述随机变量取值规律的方法——离散型用分布律、连续型用密度函数。一旦知道了随机变量的取值规律,我们就可以计算这个随机变量满足各个条件的概率。而从第六章开始到第九章进入数理统计部分。它的思想方法是通过“样本”的数据对“总体”的分布或总体的某些未知参数做出“可靠”的推断。当然,在这个过程中,总体的全部或部分是未知的。第一节随机样本下面,通过一个例子,了解总体、样本、样本值、样本容量等数理统计中的基本概念。例某灯泡厂,一个季度内生产了一大批灯泡,出厂前要对这批灯泡的质量,比如它的寿命,做比较全面的分析。用X表示灯泡的寿命,显然,随取哪只灯泡的不同,它的寿命也不一样。因此,X是个随机变量。如果,我们知道它的分布,我们就知道这批灯泡的质量。称X为总体——我们所关心的某个数量指标的全体。想全面地了解总体,最好的方法就是“普查”,但普查对有些场合是不现实的。比如,本例中的灯泡的寿命就是如此。即便在某些场合,普查是允许的,但投入过多的人力、物力,而使成本加大不划算。注意,这并不是说,普查都不做,全国的人口普查已做了数次。因此,我们想到了“抽样”,在这批灯泡中随机地抽取n只灯泡,每只灯泡都有自己的寿命值,测试前它们都是随机变量,分别记做X1、X2、…、Xn。称X1、X2、…、Xn为样本——总体中的个体。测试后它们各自取到一批值:x1、x2、…、xn。称x1、x2、…、xn为样本值——样本取到的值。称n为样本容量——样本的个数。数理统计就是通过样本对总体做出推断,这就要求样本能够真实地反映总体,样本又是总体中为数不多的个体,那么什么样的样本可以做到这一点呢?就是随机样本。定义:设X为总体,X1、X2、…、Xn为样本,如果每个样本Xi(i=1、2、…、n)与总体X的分布相同,即同分布;X1、X2、…、Xn之间相互独立;则称X1、X2、…、Xn为简单随机样本。数理统计中所使用的样本就是这种样本。如果记总体X的分布函数为F(x)=P{Xx},则(X1,沈阳大学科技工程学院教案(续页)第次第2页X2,…,Xn)的联合分布函数为F(x1,x2,…,xn)=P{X1x1,X2x2,…,Xnxn}=∏F(xi)当总体X是连续型随机变量时,f(x)是它的概率密度,则(X1,X2,…,Xn)的联合概率密度为f(x1,x2,…,xn)=∏f(xi)。第二节抽样分布样本是统计推断的依据,但在使用时,要对不同的推断目标构造不同的样本函数。例如,要推断总体的均值E(X)时,需构造样本的均值11niiXn,要推断总体的方差D(X)时,需构造样本的方差211()niiXXn等等。由样本构成的函数称为统计量,定义如下。定义设X1、X2、…、Xn是来自总体X的一个样本,如果由样本构成的函数g(X1,X2,…,Xn)不含有未知的参数,则称为它为一个统计量。因为样本X1、X2、…、Xn是随机变量,所以g(X1,X2,…,Xn)也是随机变量。当各个样本取到样本值x1、x2、…、xn时,对应的统计量g(X1,X2,…,Xn)取到g(x1,x2,…,xn),称g(x1,x2,…,xn)为统计量g(X1,X2,…,Xn)的一个观测值。常见的统计量有:样本均值12111()nniiXXXXXnn,样本方差2211()1niiSXXn,2211()nniiSXXn,样本标准差211()1niiSXXn,样本k阶原点矩11nkkiiAXn,样本k阶中心矩11()nkkiiBXXn样本值x1、x2、…、xn是样本X1、X2、…、Xn的一个随机结果,自然,观测值g(x1,x2,…,xn)是统计量g(X1,X2,…,Xn)的偶然值。事实上,我们最后就是用偶然值g(x1,x2,…,xn)去推断总体的。那么,这个偶然值g(x1,x2,…,xn)有多大的价值?数理统计的主要工作就是分析这个“偶然值”。表面看,统计量g(X1,X2,…,Xn)取到观测值g(x1,x2,…,xn)是偶然的,但它也存在“必然”的成分。下面说明其中的道理。沈阳大学科技工程学院教案(续页)第次第3页假设两个随机变量21(,2)XN、22(,4)YN,其中μ1和μ2未知。它们的密度函数和图形如下:212()221()22xXfxe222()241()24xYfxe如果用X的测试值x估计μ1,用Y的测试值y估计μ2,从上面的图形可以看出,当可靠性(概率)取相同值(如90%)时,y比x更“接近”它的待估计量。当要求两个“接近”相同时,y比x的可靠性更高。能够得到这些有价值的结论,应归功于我们知道了X和Y的分布。综上所述,我们需要知道统计量g(X1,X2,…,Xn)的分布。那么,g(X1,X2,…,Xn)服从什么分布呢?不同的g会有不同的结果。下面给出几种常见的分布,这些分布在统计推断中起着重要的作用。(一)2分布(2distribution)设nXXX,,,21为相互独立的随机变量,它们都服从标准正态)1,0(N分布,则随机变量221niiX服从自由度为n的2分布,记作22()n.)(2n分布的密度函数为122/210()2(/2)00nynyeyfyny其中)(称为伽马函数,定义为10(),0xxedx。下图描绘了)(2n分布密度函数在n=1,4,10,20时的图形。μ10.16μ20.08沈阳大学科技工程学院教案(续页)第次第4页2分布具有可加性:如果2211()n、2222()n,则2221212()nn2分布期望和方差:设22~()n,则2()En,2()2Dn。2分布分位点对于给定的α(0α1),称满足条件222(){()()}()ααnnnfydyαP的数2()αn为2()n分布的上分位点。教材后附表的2分布表给出分位点2()αn,可通过查表得到。如20.99(17)6.408,20.90(17)10.085,20.05(17)27.587等等。(二)t分布(tdistribution)设)1,0(~NX,)(~2nY,X与Y独立,则随机变量nYXT服从自由度为n的t分布(tdistribution),记成~()tnt。利用独立随机变量商的密度公式,不难由已知的)1,0(N,)(2n的密度公式得到)(nt分布的密度:1221()2()(1),()2nnthttnnn显然它是x的偶函数,下图描绘了n=2、5时的)(nt分布概率密度曲线,作为比较,还描绘了)1,0(N的密度曲线。沈阳大学科技工程学院教案(续页)第次第5页利用伽马函数的斯特林)(Stirling公式可以证明221(),2thten从图形我们也可看出,随着n的增大,)(nt的密度曲线与)1,0(N的密度曲线越来越接近,一般若30n,就可认为它基本与)1,0(N相差无几了。)(nt分布分位点对于给定的α(0α1),称满足条件(){()()}()ααtntntnhtdtαP的数()αtn为()tn分布的上分位点。教材后附表的)(nt分布表给出分位点()αtn,可通过查表得到。如0.05(17)1.7396t,0.1(17)1.3334t等等。(三)F分布(Fdistribution)设21~()Un,22~()Vn,U与V独立,则随机变量12UnFVn服从自由度为(1n,2n)的F分布,记成),(~21nnFF.类似可得,),(21nnF的密度函数为112121212221212212()20()()()()2200nnnnnnnxnnxnnxnxnx下图描绘了几种F分布的密度曲线。沈阳大学科技工程学院教案(续页)第次第6页由F分布的定义容易看出,若),(~21nnFF,则),(~112nnFF。12(,)Fnn分布分位点对于给定的α(0α1),称满足条件121212(,){(,)(,)}()ααFnnFnnFnnxdxαP的数12(,)αFnn为12(,)Fnn分布的上分位点。(四)正态总体的样本均值和样本方差的分布在概率统计问题中,正态分布占据着十分重要的位置,这是基于一则在应用中,许多量的概率分布或者是正态分布,或者接近于正态分布;再则,正态分布有许多优良性质,便于进行较深入的理论研究。因此,我们着重来讨论一下正态总体下的抽样分布,其中最重要的统计量自然是样本均值X和样本方差2S.设总体),(~2NX,nXXX,,,21为总体的样本,则1)样本均值),(~2nNX,或~(0,1)/XNn。2)222~(1)nSn,其中2S为样本方差。3)X与2S相互独立。4)~(1)/XtnSn,其中S为样本标准差。
本文标题:概率论与数理统计—第六章样本及抽样分布
链接地址:https://www.777doc.com/doc-2362484 .html