您好,欢迎访问三七文档
柯莫哥洛夫与斯米尔诺夫检验一、柯莫哥洛夫检验设总体X的分布函数为(x)F,(x)F是x的连续函数。12,X,X……Xn是来自X的样本。设要检验的原假设是0H:0(x)(x)FF这里要保证0(x)F是一个已知的特定的连续分布函数,且不含任何未知参数。要进行假设检验首先要构造检验统计量,这里构造检验统计量的思路是从样本经验分布入手。定义样本的经验分布函数(x)nF,这里的(x)nF表示为:11(x)(x)nniiFIn其中的(x)iI为如下的示性函数:1(x)1,2,3,.....,,0iiixxIinxx这里要指出,(x)iI时相互独立同分布与b(1,F(x))的随机变量。证明如下:(I(x)1)(xx)(x)iippF(I(x)0)(xx)1(x)iippF于是有(x)iI服从退化分布。又由于,111111(F(x))E((x))E((x))F(x)(x)nnnniiiiiEIIFnnn所以,(x)nF是(x)F的无偏估计。再由,Bernoulli大数定律lim((x)(x))0nnpFF于是,(x)nF是(x)F的相合估计.在由中心极限定理可以知道:对于固定的X,在n较大的时候(x)nF有渐进正态分布(x)~(F(x),F(x)(1F(x))/n)nFN进一步有:[F(x)F(x)]~N(0,F(x)(1F(x)))nn通过以上的推导,我们似乎找到了一个合适的检验统计量[F(x)F(x)]nn,它的分布是已知的,如果[F(x)F(x)]n越大则越倾向于拒绝原假设。但是这里的分布的收敛性是对逐点收敛的,而不是一致收敛,因此并不适合用于构造检验统计量。我们还需进一步的处理样本。在这里需要介绍格里文科定理:对于任给的自然数n,设12,X,X……Xn是取自总体分布函数F(x)一组样布观察指标,F(x)n为其经验分布函数,记Dsup(x)(x)nnxFF则有:(limD0)1nnp这里的Dn几乎处处以概率1趋于0,但是我们还需要进一步的探讨其精确或者渐进分布。我们可以获得如下定理:TH1:设(x)F是连续的分布函数,y为任意实数,在原假设为真时:132122213211,2122200121{Dy}(xx)dx0222112nyyynnnnnnyyynnnynpfdxynnnyn这里的定理获得的分布是精确的分布,并且不要求(x)F的具体形式,只要求(x)F是连续分布函数,因此该定理的分布函数与(x)F的形式无关,至于样本量有关。显然,最大距离Dn越大,越倾向于拒绝原假设0H,故检验0H的拒绝域应有形式{}nWDc。对于给定的显著性水平(01),有定理给出的精确分布定出Dn分布的上侧分位数,nD,使得:n,(D)=npD。其中,11,2!01(xx)0nnxxelse但是,当n100时,利用上面的定理计算的Dn分位数已非常繁琐,这时可以用柯尔莫哥洛夫对给出的渐进分布计算拒绝域。TH2:设理论分布是连续分布函数,且不含任何未知参数,则在原假设为真且n趋于无穷时:22(1)exp(2)0()()00jjnjpnDK(*)该定理给出了最大距离Dn的渐进分布()K。由于对原假设0H做出做检验时的拒绝域任为{}nWDc,故对给定的显著性水平(01),可用定理给出Dn的上侧分位数',nD,使:'n,(D)=npD或'n,(D)=1-npD其中,',/nDn二、斯米尔诺夫检验斯米尔诺夫检验主要用于检验两个总体的真分布是否相同.其检验的思想方法与柯莫哥洛夫检验类似。设12,X,X……Xn是来自具有连续分布函数F(x)的总体X中的样本,设12,,YY……mY是来自具有连续分布函数(x)G的总体Y中的样本,且假定两个样本相互独立。欲检验假设:0H:(x)(x)FGvs1H:(x)(x)FG构造检验统计量为:,Dsup(x)G(x)nmnmxF其中(x)nF和G(x)m分别是这两个样本所对应的经验分布函数。当0H不真时,统计量有偏大的趋势。可以获得如下定理:TH1:如果(x)(x)FG,且(x)F为连续函数,则有:[n/c],22[n/c]01/{Dx}(1)/1/111jnjnnmnnjxnpCCnxx其中x为任意实数,[xn]c.TH2:如果定理TH1所述条件成立,则有,(x),0lim{/(nm)Dx}0,0nmnmKxpnmx其中K(x)由式(*)定义由定理1可见,统计量,Dnm的精确分布不依赖于总体的真分布函数(x)F,以上两个定理提供了比较两个总体的分布函数的方法。对于给定的显著性水平(01),令1212nnnnn,可以由表查出,Dnm和1,使得1,nDn,若,Dnm,nD,则拒绝原假设0H,若,Dnm,,nD,则接受原假设0H。
本文标题:柯莫哥洛夫检验
链接地址:https://www.777doc.com/doc-7206525 .html