您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 项目/工程管理 > 第十一章-非参数检验
第十一章非参数检验假设检验的方法有两种:参数检验(parametrictest)和非参数检验(non–parametrictest)。各种参数检验的共同特点:是对总体参数的推论(包括参数估计与假设检验),要求样本所属的总体呈正态分布、总体方差齐性等等。参数检验主要适用于等距变量和比率变量的资料。非参数检验:不要求样本所属的总体呈正态分布,一般也不是对总体参数进行检验。非参数检验不仅适用于非正态总体名义变量和次序变量的资料,而且也适用于正态总体等距变量和比率变量的资料。非参数检验的特点1.一般不需要严格的前提假设。2.非参数检验特别适用于顺序资料或等级变量。3.非参数检验适用于小样本,且方法简单。4.非参数检验最大的不足是未能充分利用资料的全部信息,检验精度比参数检验要差。5.非参数方法目前还不能处理“交互作用”。非参数假设检验方法两独立样本均值差异的非参数检验秩和检验法(Mann-Whitney-U检验)两相关样本均值差异的非参数检验符号检验法符号秩和检验法(WilcoxonSigned–Ranktest)等级方差分析克-瓦氏单向方差分析(完全随机设计方差分析)Friedmantest(重复测量设计方差分析)一、两独立样本的非参数检验秩和检验(Mann-Whitney-U检验)最早是由Wilcox提出,后经Mann-Whitney加以完善。适合于相互独立的两个样本在总体分布不服从正态分布的前提下,比较其平均值是否存在显著差异的问题(对应于独立样本T检验)。例:从某班随机抽取5名走读生和6名住校生,测得英语口语成绩见下表。问走读生与住校生英语口语成绩是否有显著差异?走读生与住校生英语口语测验成绩走读生4238354132住校生561960433855基本思想假设两组数据没有显著性差异,那把这些数据充分混合再依大小顺序重新排列,则这两组数据中哪个数据排在第几的概率应该是一样的。如果相差太大则应否定没有显著差异的假设。秩和检验1.小样本情况n1和n2都小于10,且n1≤n2时,将两个样本的数据合在一起编秩次(从小到大赋予等级),计算容量小的样本的秩次和T(等级和)。走读生与住校生英语口语测验成绩走读生4238354132住校生561960433855学生英语口语测验成绩秩和检验计算表原始分数走读生4238354132住校生561960433855等级分数走读生74.5362住校生1011184.59T=22.5检验步骤①提出假设②编秩次(将两样本数据混合在一起)③求秩和(求容量较小的样本的秩次和,并表示为T)④查秩和检验表14,做出统计决断:秩和检验统计决断规则T与两侧临界值比较显著性T1<T<T2不显著T≤T1或T≥T2显著T=22.5例:从某班随机抽取5名走读生和6名住校生,测得英语口语成绩见下表。问走读生与住校生英语口语成绩是否有显著差异?走读生与住校生英语口语测验成绩走读生4238354132住校生561960433855学生英语口语测验成绩秩和检验计算表原始分数走读生4238354132住校生561960433855等级分数走读生74.5362住校生1011184.59T=22.5根据n1=5,n2=6查表当显著性水平为0.05(双侧)时,T1=19,T2=41差异不显著。2.大样本情况当n1和n2都大于10,秩和T的分布接近于正态分布,其平均数和标准差分别为:21211nnnT1212121nnnnTn1≤n2检验统计量计算为TTTZ1212/12121211nnnnnnnT小结秩和检验法(Mann-Whitney-U检验),针对的是两独立样本。如果样本的数据不能满足参数检验中独立样本t检验的要求(正态总体,方差未知),可以用这种方法进行差异检验,但检验精度比参数检验要差。二、两相关样本的非参数检验两相关样本的数据是一一对应的成对数据,因此相关样本又称为配对样本。符号检验法符号秩和检验又称为WilcoxonSigned–Ranktest,也简称为Wilcoxontest。1.符号检验法符号检验法(signtest)以每一对数据之差的正负符号的数目进行检验。检验思想是:如果两样本没有显著性差异,则两样本中每一对数据之差所得的正号与负号的数目应大致相当。实际应用中,遇到无法用数字描述的问题,符号检验法是一种简单而有效的检验方法。例1:将三岁幼儿经过配对而成的实验组施以五种颜色命名的教学,而对照组不施以教学,后期测验得分见下表。问进行教学与不进行教学,幼儿对颜色命名的成绩是否有显著差异?关于五种颜色命名得分的测验结果序号123456789101112实验组X1182026142525211214172019对照组X21320241027172181511622⑴.小样本情况(N≤25)检验步骤①.提出假设②.观察每一对数据的差数并记符号③.分别将正号和负号的个数记为n+和n-,0不计。④.将n+和n-较小的一个记为r,并计算N=n++n-⑤.确定检验形式,查表15并做出统计决断,若r大于临界值,则表示两组差异无统计意义。单侧符号检验统计决断规则r与临界值比较P值显著性检验结果r>r0.05P>0.05不显著在0.05显著性水平保留H0,拒绝H1r0.01<r≤r0.050.05≥P>0.01显著*在0.05显著性水平拒绝H0,接受H1r≤r0.01P≤0.01极其显著**在0.01显著性水平拒绝H0,接受H1例1:将三岁幼儿经过配对而成的实验组施以五种颜色命名的教学,而对照组不施以教学,后期测验得分见下表。问进行教学与不进行教学,幼儿对颜色命名的成绩是否有显著差异?关于五种颜色命名得分的测验结果序号123456789101112实验组X1182026142525211214172019对照组X21320241027172181511622关于五种颜色命名得分的符号检验计算表序号123456789101112实验组X1182026142525211214172019对照组X21320241027172181511622差数符号+0++-+0+-++-计算:n+=7,n-=3,因此N=n++n-=10,r=3查表:N=10时,r0.05=1,本题r=3,差异不显著练习研究者想调查特殊训练是否可以提高领导力,取了两组智力相当的被试进行匹配,其中一组进行特殊训练,一组不进行训练,问:受过特殊训练的被试的领导力是否优于没有受过训练的被试。组别实验组控制组1474024338336424332553029622267251682118914810124115712931355计算:n+=9,n-=3,因此N=n++n-=12,r=3查表:N=12时,r0.05=2,本题r=3,差异不显著⑵.大样本情况(N>25)n+与n-服从二项分布,大样本时,由于二项分布接近于正态分布,可用Z作为检验统计量,采用正态近似法。附表中的数据虽然可满足N从1到90的情况,但在实际应用中,当N>25时常常使用正态近似法。在零假设条件下,二项分布的平均数和标准差分别为2Nnp21:p假设22121NNNpqN=n++n-为了使计算结果更接近正态分布,可用校正公式计算:22NNrnpqnprrZ225.0NNrZ统计量的计算公式为:225.0NNrZN=n++n-min(n+,n-)例2:32人的射击小组经过三天集中训练,训练后与训练前测验成绩见下表。问三天的集中训练有无显著效果?集训前后成绩序号前测后测序号前测后测序号前测后测序号前测后测142409606417504425203623835104739182526266042353561112151963592751444494112323020453728282352421136561213932293430654601448582248533062687433415545223665631606085140166258245754324945计算n+=22,n-=9,N=n++n-=31,r=9338.231212319212NNrrZ16.231212315.092125.0NNrZ2.符号等级检验(符号秩和检验)(1)小样本情况(N≤25)当N≤25时,用查表法进行符号等级检验:①.提出假设:②.求差数的绝对值③.编秩次(赋予每一对数据差数的绝对值等级数)。④.添符号(给每一对数据差数的等级分数添符号)⑤.求等级和(分正、负求等级和,将小的记为T)⑥.查符号等级检验表16,做出统计决断,若T大于临界值,则表示两组差异无统计意义。符号等级检验统计决断规则T与临界值比较P值显著性检验结果T>T0.05P>0.05不显著在0.05显著性水平保留H0,拒绝H1T0.01<T≤T0.050.05≥P>0.01显著*在0.05显著性水平拒绝H0,接受H1T≤T0.01P≤0.01极其显著**在0.01显著性水平拒绝H0,接受H1例:将三岁幼儿经过配对而成的实验组施以五种颜色命名的教学,而对照组不施以教学,后期测验得分见下表。问进行教学与不进行教学,幼儿对颜色命名的成绩是否有显著差异?关于五种颜色命名得分的测验结果序号123456789101112实验组X1182026142525211214172019对照组X21320241027172181511622关于五种颜色命名得分的符号检验计算表序号123456789101112实验组X1182026142525211214172019对照组X21320241027172181511622计算:T+=47.5,T-=7.5,因此T=7.5查表16:N=10时(差数为0不计),T0.05=8,差异显著差数5024280416143等级72.55.52.595.518104添符号+++–++–++–练习某年级随机抽取英语成绩相当的8名男生和8名女生分别进行一段时间的训练,训练后的成绩如下表所示,该方法对男女生效果相同么?匹配组女生男生1141221310311104121251513610127131181514N=7T+=23.5,T-=4.5,因此T=4.5查表16:N=7时(差数为0不计),T0.05=2,差异不显著(2).大样本情况(N>25)当N25时,等级和的分布接近于正态分布,因此有41NNT24121NNNTTTTZ1/412124TNNNNN例:32人的射击小组经过三天集中训练,训练后与训练前测验成绩见下表。问三天的集中训练有无显著效果?集训前后成绩计算表序号前测后测序号前测后测序号前测后测序号前测后测142409606417504425203623835104739182526266042353561112151963592751444494112323020453728282352421136561213932293430654601448582248533062687433415545223665631606085140166258245754324945计算13.2241312131314/131315.139T+=356.5T-=139.5因此,T=139.5,N=311/412124TNNZNNN符号检验、符号等级检验法(WilcoxonSigned–Ranktest),针对的是相关样本。如果样本的数据不能满足参数检验中相关样本t检验的要求,可以用这两种方法进行差异检验,但检验精度比参数检验要差。小结三、等级方差分析方差分析前提条件:“总体正态”、“方差齐性”、“独立性”数据类型:连续型测量数据等级方差分析克-瓦氏单向等级方差分析弗里德曼双向等级方差分
本文标题:第十一章-非参数检验
链接地址:https://www.777doc.com/doc-3335421 .html