您好,欢迎访问三七文档
第九章非参数检验已知总体分布类型,对未知参数进行统计推断依赖于特定分布类型,比较的是参数参数检验(parametrictest)非参数检验(nonparametrictest)对总体的分布类型不作严格要求不受分布类型的影响,比较的是总体分布位置优点:方法简便、易学易用,易于推广使用、应用范围广;可用于参数检验难以处理的资料(如等级资料等)缺点:方法比较粗糙,对于符合参数检验条件者,采用非参数检验会损失部分信息,其检验效能较低;样本含量较大时,两者结论常相同。非参数检验(亦称非参数统计),是根据样本资料对总体的某种性质或关系进行假设检验的统计推断方法。主要特点:(1)不要求总体分布已知或对总体分布作任何限制性假定;(2)不以估计总体参数为目的;(3)能用于定性变量(即定名测定和序列测定的变量);(4)方法直观,易于理解,运算比较简单。(5)缺点是检验的功效不如参数检验方法。成对比较检验一、符号检验这是略去两组样本数据之差的数值,只用其差的正、负符号进行判断的检验方法,亦称正负号检验。1、检验内容:检验的两组数据是否有显著差异或两总体的位置特征(均值、中位数)是否相同。2、适用条件:关联样本资料;定性变量。3、方法思想:设有关联样本的两组成对的数据xi与yi,比较各对的大小。若xi>yi,记作“+”“若xi<yi,记作“-”若xi=yi,删去,并相应减少n对数据若两组数据没有显著差异,它们之差的“+”、““-”号的个数应大致相等。出现““+”(或““-”)的概率为0.5。如果一次抽样的随机样本的配对数据中,“+”号出现过多或过少,在一定显著性水平α条件下属于小概率事件,就说明两组数据的平均水平或相对次数分布并不相同。可见,配对符号检验是二项检验的一种应用。由于P=0.5的二项分布呈对称型,所以,只要n>25,即可按正态分布近似处理。4、检验步骤(1)抽样。将样本资料配对比较,计算(+)、(-)号个数(2)建立假设:H0:P=0.5H1:P≠0.5(双侧)H1:P(+)>P(-)或P(+)<P(-)(单侧)(3)计算检验统计量n≤25时;“+”个数n>25时:(4)设定显著性水平α,查表确定临界值或否定域(5)比较并作出判断nPZ5.05.05.0ˆ例1:随机抽取13个单位,放映一部描述吸烟有害健康的影片,并调查得到观看电影前后各单位职工认为吸烟有害的人数的百分比。检验该电影宣传是否有效果(α=0.05)。单位编号12345678910111213(1)放映前(%)(2)放映后(%)(3)差异(2)-(1)6368+4149+5453-7175+3949+4441-6775+5658+4652+3749+6155-6869+5157+解:H0:P=0.5H1:P≠0.5)5.0,13(,)25.02(05.0Pn查二项分布表确定拒绝域由P(13)=0.000P(12)=0.002P(11)=0.010P(10)=0.035P(13)+P(12)+P(11)=0.000+0.002+0.010=0.012<0.025P(13)+P(12)+P(11)+P(10)=0.012+0.035=0.047>0.0250123456可见,拒绝域(双侧)应为0,1,2,11,12,13。78910111213拒绝域拒绝域现检验统计量(+)=10(即10个正号),0.035>0.025所以,原假设H0:P=0.5在5%显著性水平上不能被拒绝。也即不能认为职工在观看影片前后的认识有显著差异。例2:随机抽取60名消费者对甲、乙两种品牌的饮料评分,甲、乙得分之差为“+”号者35个,“-”号15个,“0”号10个。以显著性水平α=0.05检验两种饮料是否同等受欢迎。解:H0:P=0.5,H1:P≠0.5∵n>25,∴按正态分布近似处理该成数抽样分布的均值和标准差分别为071.0505.05.0)1(,5.0nPPSPpp82.2071.05.07.0ˆ7.050/35ˆ)(pSPPZP检验统计量号的成数样本2.82>1.96,所以,拒绝原假设。认为两种饮料并不受到同等欢迎。且乙种优于甲种。96.1||,05.02Z双侧检验临界值二、威尔科克森带符号检验(亦称威尔科克森秩和检验)这种检验方法不仅考虑了两组数据差异的正、负号,而且还利用了其差异大小的信息。因此,是一种更为有效的检验方法。1、应用条件和检验内容与符号检验相同。2、方法思想:若关联样本的两组数据没有显著差异,则不仅其差异的正、负符号应大致相等,而且将其差的数值按大小顺序排列编自然序号(即秩)后,它们的正号(+)的秩和(记为T+)与负号(-)的秩和(记为T-)也应该大致相等。其中之较小者也应趋近于总秩和的平均数()。若正秩和(T+)与负秩和(T-)相差太大,其中较小者偏离总秩和的平均()较远,以致超过给定显著性水平α所确定的临界点,就可以认为这两组数据存在显著差异,即总体的分布不相同。4)1(nnTT3.检验步骤(1)将样本数据配对并计算各对正负差值(2)按差之绝对数大小排序(等级),并按原正负号计算正秩和(T+)与负秩和(T-)(3)建立假设:H0:T+=T-H1:T+≠T-(双侧)H1:T+>T-或T+<T-(单侧)(4)计算检验统计量当n≤25时,取T+、T-中之小者24/)12)(1(4/)1(nnnnnTZ当n25时(5)设定α,并查表确定临界值Tα(或Zα/2)(6)比较统计量与临界值作出判断,对于n≤25,T≤Tα,拒绝H0;T>Tα接受H0曼—惠特尼U检验曼—惠特尼U检验适用于从两个总体中分别独立抽取两个样本的检验,方法思想与威尔科克森秩和检验相同。检验步骤:(1)从总体A、B中分别独立抽取样本nA和nB,将(nA+nB)个观察值从小到大编序(2〕分别计算两个样本,的秩和TA和TB(3)建立假设H0:两总体A和B相对次数分布相同H1:两总体相对次数分布不同(4)计算检验统计量①nA、nB<10时,取UA、UB中小者UA=nAnB+nA(nA+1)/2-TAUB=nAnB+nB(nB+1)/2-TB②nA、nB>10时12/)1()2/(BABABAnnnnnnUZ(5)设定显著性水平α,查U表或Z表得到临界值(6)比较统计量与临界值,作出判断,对于nA、nB<10U≤Uα,拒绝H0,U>Uα,接受H0游程检验一、什么是游程检验游程检验(亦称连贯检验)是根据样本标志表现排列所形成的游程的多少进行判断的检验方法。设某样本n=12人的标志表现为男、女,有以下三种排列。(i)男,男,女,女,女,男,女,女,男,男,男,男(ii)男,男,男,男,男,男,男,女,女,女,女,女(iii)男,女,男,女,男,女,男,女,男,女,男,男连续出现男或女的区段称为游程。每个游程包含的个数为游程长度。以r表示序列中游程的个数:(i)r=5,(ii)r=2,(iii)r=11(i)是随机性序列;(ii)(iii)是非随机性序列,所以,可以用游程的个数来检验样本的随机性,或总体的分布特征。二、游程检验方法1.检验总体分布是否相同。将从两个总体中独立抽取的两个样本的观察值混合有序后,观察游程个数,进行比较。2.检验样本的随机性将取自某一总体的样本的观察值按从小到大顺序排列,找出中位数(或平均数),分为大于中位数的小于中位数的两个部分。用上下交错形成的游程个数来检验样本是否是随机的。3.检验规则(小样本。n<20)应用附表11查找临界值观察到的游程个数ro≤临界值则否定H。反之,接受Ho。4.大样本(n1或n2大于20),游程个数r近似正态分布检验统计量rrErZ)()1()()2(212)(212212121212121nnnnnnnnnnnnnnrEr其中:
本文标题:第九章 非参数检验
链接地址:https://www.777doc.com/doc-3186184 .html