您好,欢迎访问三七文档
1第十一章非参数检验本章讲述某些用于定序尺度的双样本检验。与上一章所讲的检验不同,使用这类方法不需要对总体分布作任何事先的假定(例如正态总体)。同时从检验的内容来说,也不是检验总体分布的某些参数(例如均值、成数、方差等),而是检验总体某些有关的性质,所以称为非参数检验。非参数检验,泛指“对分布类型已知的总体进行参数检验”之外的所有检验方法。与均值差等检验比较,非参数检验有什么优点呢?在对均值差进行t检验时,不仅要有定距尺度的假定,还要有正态总体的假定。当然,对于大样本,正态总体的假定可以放松。但正是对于小样本,这种假定最容易出问题。因此,在满足下面两条件之一时,我们期望用非参数检验代替均值差检验:①没有根据采用定距尺度,但可以安排数据的顺序(即秩);②样本小且不能假定具有正态分布。由于非参数检验不能充分利用全部现有的资料信息。因此,如果有根据采用定距尺度,并且如果对于小样本能够假定其具有正态性,或对大样本能够放松对正态性假定的要求,一般宁愿使用均值差检验,而不用非参数检验。非参数检验,无需做出经典统计所必要的关于分布的任何假设。唯一需要的假设是:全部数据或数据对都出自相同的基本总体,且取样是随机的、相互独立的。基于这种原因,非参数检验又称为分布自由(或无分布)检验。“无分布”不是指总体真的无分布,而是指虽有时对总体分布一无所知,但仍可以进行分析。不仅如此,这些很容易理解的方法还可以用于处理等级的资料和定性的信息。很显然,如果把从一个正态总体中抽取的数据用分布自由来处理,其效果肯定不如相应的参数检验有力。我们一般用下述指标来确定非参数检验的“效率”En=nn非参数检验中的参数检验中的0第一节符号检验“符号检验”是针对观察结果之差的符号来作估价的。在单一实验组的实验中,对于样本中每个个体的前测与后测,如果我们并不关心(X1―X0)的具体数值,而只关心是增大了还是减小了。符号检验的零假设就是配对观察结果的差平均起来等于零:人们期望这些差中有一半小于零(负号),而另一半大于零(正号),因此符号检验就是对差分布之中位数为零的零假设检验。符号检验是二项检验的一种实际应用,即先假设p=0.5,按二项分布计算正号“+”出现次数之抽样分布,然后以样本中正号“+”出现的次数x作为检验统计量。如果它是B(x;n,0.5)下的小概率事件,便否定对差分布之中位数为零的零假设,即认为两总体存在平均水平上的差别。像符号检验这样的非参数值验,在分布自由检验中称为简便检验(或快速检验)。这类检验方法的特点,不仅在于其计算方法具有简捷性,而且在于其应用范围十分广泛。其缺点是检验效力低,因为在统计决策中它仅利用了数据中的部分信息。同有关的最佳参数或非参数检验相比,简便检验的统计决策是保守的,即它接受零假设已远远超过了必要程度,它拒绝零假设则需要有更大的样本容量。2第二节配对符号秩检验对于配对样本,至此我们已经接触了两种检验,即符号检验和t检验。在符号检验中,只考虑差值d的符号而不管其大小,并且应用二项分布检验零假设。另一方面,最有力的检验——t检验,则不仅需要定距尺度,而且还要求假定差值d服从正态分布。配对符号秩检验兼备了上述两种检验的某些特征,其效力也介乎两者之间。配对符号秩检验对于非正态分布的d值,是最佳检验,其检验效力大大高于符号检验。如果t检验的假定成立,配对符号秩检验的检验效力对于大、小样本都近乎为95%。因此,在定距尺度测量的水平上,若由于样本容量太小而不能假定正态分布的时候,配对符号秩检验特别有用。配对符号秩检验的零假设基本上和符号检验以及用于配对样本的t检验的零假设相同。第三节秩和检验前面我们刚刚讨论过的符号检验和配对符号秩检验,都只适用于配对样本。当样本为独立样本时,可采用本节所讨论的秩和检验法。其具体步骤为:(1)设从两个未知的总体1和总体2中分别独立、随机地各抽取1个样本,样本1的容量为n1,样本2的容量为n2,两样本的数据分别列示如下:样本1:X1,X2,…,1nX样本2:Y1,Y2,…,2nY(2)把样本1和样本2混合起来,并按数值从小到大顺序编号,每个数据的编号即为它的秩。如果混合样本中有相同数值的数据,则将它们应得的秩均分。(3)分别计算两样本的秩和:样本l中所有X1,X2,…,1nX的秩和记作R1;样本2中所有Y1,Y2,…,2nY的秩和记作R2。(4)秩和检验是针对两个总体具有完全相同的形式的零假设而进行检验的。在均值差检验中,研究的重点放在中心趋势的差异上,而不是离差的差异或形式的差异。秩和检验的零假设则可以用任何差异形式表出。(5)计算检验统计量U。检验统计量U是对混合样本中n1+n2个元素根据它们的秩和和它们所属的总体标出的双重指标U1=n1n2+2)1(11nn―R1U2=n1n2+2)1(22nn―R2检验统计量U是U1和U2中较小的一个,即U=min(U1,U2),然后用U1+U2=n1n2核对计算(6)给出显著性水平α,从秩和检验表(附表10)中查出临界值Uα,如果计算出的U值小于或等于从附表10中查出的临界值Uα(n1,n2),则零假设被拒绝。第四节游程检验3游程检验是适用于独立样本的另一种检验法。游程检验的基本原理和计算方法很简单:先把两个样本混合起来,按大小排列,并赋予其秩。那么,当样本所属的总体是同分布的话,是不大可能出现来自总体1的样本全是高秩、而来自总体2的样本全是低秩的情况;反之亦然。可能性最多的情况是,来自总体1和总体2的样本,其秩是随机交错的。因此,根据混合样本中两样本交错的次数来检定秩交错次数是随机的零假设,这就是游程检验。其具体步骤如下:(1)设从两个未知的总体1和总体2中分别独立、随机地各抽取1个样本,样本1的容量为n1,样本2的容量为n2。(2)把样本1和样本2混合起来,并按数值从小到大顺序编号,每个数据的编号就是它的秩。(3)点算游程数目。一个游程指混合样本中接连属于一个样本的一串秩,其前后是另一个样本的秩。(4)根据显著性水平α确定否定域r(n1,n2)。游程数目r的抽样分布(见附表11)可用于建立否定零假设的否定域。(5)检定零假设。以混合样本中的游程数目r为检验统计量:如果游程的数目很大,就表明两个样本混合得很好,不能否定零假设;相反,如果游程的数目较小,零假设就很可能是错的,应该否定。第五节累计频数检验累计频数检验是另一种双样本的非参数检验,它所需要的假定同秩和检验和游程检验一样。以上各种非参数检验,对于定序变量,都要求等级分得较多较细,实际上用的是未分组资料。但在社会研究中,对定序变量往往也用分组资料。在样本容量较大而等级划分又很有限的情况下,累计频数检验就显得十分有用了。累计频数检验的原理很简单:如果独立随机样本取自两个形式完全相同的总体的零假设正确,即可期望两个样本累计相对频数分布基本上相似。累计频数检验使用的检验统计量是由两个累计频数分布构成的一系列差值之最大值D,即D=max(2211nFnF)如果D大于零假设前提下偶然性作用的期望值,就表明两个分布相差太大,以致应否定零假设。如果已经预测方向,检验统计量应改用卡方近似法求得,即2=4D22121nnnn~2(2)累计频数检验可以检验经验分布和理论分布拟合到了什么程度。要检验的零假设是,样本来自一个已知分布函数F(x)的总体。对立的备择假设是,样本来自不具有分布函数F(x)的总体。基本方法是:先算出零假设下各期望值的频数fe,这些值的累计频数为Fe。并且列出各观察值的频数fo,这些值的累计频数为Fo。然后可得到差(Fo―Fe),以及差的最大绝对值max(|Fo―Fe|)。用此最大值除以样本容量n,即为累计频数检验用于拟合优度检验(参见第十三章第一节)时的检验统计量D=nFFeo)max(或者D=max(nFnFeo)
本文标题:第十一章非参数检验
链接地址:https://www.777doc.com/doc-2162095 .html