您好,欢迎访问三七文档
§6.3抽样分布由于统计量是由样本决定的,而在一次具体的抽样之前,样本中的每一个分量都是随机变量,所以,在一次具体的抽样之前,统计量也是随机变量,也有自己的分布.我们称统计量的分布为抽样分布.下面,先介绍样本的频数分布.一、样本的频数分布将样本值中所有的不同数值由小到大排列,样本值中取这些值的频数分别记为(应有),这样就可得到样本的频数分布:当样本容量较大时,可将样本值的范围划分成若干个长度相等的间隔,然后计算样本值落在这些间隔中的频数,再按上表列出频数分布.频数分布通常用样本直方图(Histogram)kxxx21kmmm,,,21nmmmk21除频数直方图外,有时还需考虑概率直方图,它要求每个直方条的面积需等于相应间隔上的样本频率,这样直方条的高度就不再是频数了,并且所有直方条面积之和等于1.可见,概率直方图类似于概率密度函数的图像.更多的讨论这里就不再详述了.图6.5样本直方图(采用1000个模拟数据)二、经验分布函数对任意实数,定义,(6-19)则称其为样本的经验分布函数(EmpiricalDistributionFunction).是对总体X的分布函数的一个经验模拟并且可以验证它还具有分布函数的基本性质:单调不减,右连续,,.应当注意,当给定样本值之后,),(x),,,(21nXXX)(xFn)(xFn0)(nF1)(nF),,,(21nxxx是具有分布函数性质的普通阶梯形函数(如图6.6所示),但是对样本而言,它却是与确定值x有关的随机变量,因为对每个给定的x,值实际上就是在该次抽样中事件发生的频率(见01图6.6经验分布函数1x2x3x4x5x)(xFn6x}{xX(6-19)式),它完全由样本决定,而样本是随机的,所以,是随机变量.的这种双重性恰好反映了抽样前后不同的统计观点,请注意领会.进一步地,根据分布函数的定义,是事件发生的概率,又恰是在n次“试验”(抽样)中事件发生的次数,这样,还有以下结论:(1);(2)对任意给定的x和任意的,有)(xFn)(xFn}{)(xXPxF)(xF}{xX)(xnFn}{xX))(,(~)(xFnBxFnn0,(6-20)即,,(见定理5.1的推论2).可见,当样本容量n足够大时,事件在一次抽样中几乎是必然发生的,根据实际推断原理,从而抽样后得到的一般就可近似.这也是的一个重要应用.关于更深入的讨论见[4].另外,根据第三章讨论的随机变量最大值和最小值的分布,还可获得最大顺序统计量和最小顺序统计量的抽样分布.1}|)()({|limxFxFPnn)()(xFxFPnn}|)()(|{xFxFn)(xFn)(xF)(xFn)(xFn)(nX)1(X三、正态总体的抽样分布定理一般地,要确定一个统计量的分布,即抽样分布,并不是一件容易的事情.不过,当总体是正态总体(即总体X服从正态分布)时,一些常用统计量的分布却不难求出.下面的两个抽样分布定理在数理统计中占有极为重要的地位,必须牢固掌握.定理6.1(单个正态总体的抽样分布定理)设是取自正态总体的),,,(21nXXX),(2N一个样本,和分别为样本均值和样本方差,则(1);(6-21)(2);(6-22)(3)与相互独立;(6-23)(4).(6-24)定理中的结论(1)和(4)可通过对比来记忆.另外,还需强调的是,本定理只适用于正态总体,对其它总体无效.X2S)1,0(~NnX)1(~)1(222nSnX2S)1(~ntnSX定理6.2(两个正态总体的抽样分布定理)设是取自总体的样本,是取自总体的样本,且这两个样本相互独立,则(1);(6-25)(2)当时,;(6-26)(3).(6-27)其中与、与分别为两个样本的样本均值与样本方差,是‘合样本’),,,(121nXXX),(~211NX),,,(221nYYY)1,0(~)()(22212121NnnYX22221)2(~)()(21212121nntnnnnSYXw),1,1(~2122222121nnFSSX21SY22SwS,,(21XX1,nX),,,,221nYYY的标准差,定义为.(6-28)2)1()1(21222211nnSnSnSw
本文标题:抽样分布
链接地址:https://www.777doc.com/doc-418183 .html