您好,欢迎访问三七文档
非参数性检验授课教师:吴立娟流行病与卫生统计学系主要内容•配对设计资料的符号秩和检验•单样本资料的符号秩和检验•完全随机化设计两独立样本的秩和检验•完全随机设计多个独立样本的秩和检验•随机化区组设计资料的秩和检验复习•参数统计:计量资料通常要求样本来自正态总体,或方差齐等,在此基础上用样本统计量对总体参数进行推断或作假设检验的统计分析方法。参数检验方法•t检验两独立样本t检验要求:正态、方差相等、个体独立配对t检验要求:差值正态、个体独立•方差分析完全随机设计方差分析要求:正态、方差相等、个体独立参数检验方法•两组性别结构是否相同?•两组某种不良反应的发生率是否相同?•多组发生率是否相同?•多组构成是否相同?定性无序分类资料未解决的问题•疗效用痊愈、显效、有效、无效四级分类法进行评价时,两组或多组如何比较?•对两组患者空腹胰岛素水平进行比较时,有的病例测量结果为Ins2.0或Ins300,如何处理?未解决的问题•对应于多分类变量(有序)•非正态分布•不完整数据:如,Ins2.0或Ins300•正态分布但方差不相等时非参数检验的概念•非参数检验又称为任意(不拘)分布检验(distribution-freetest),这类方法并不依赖总体分布的具体形式,应用时可以不考虑研究变量为何种分布以及分布是否已知,进行的是分布之间而不是参数之间的检验,故又称非参数检验(nonparametrictest),简称非参检验。非参数检验的优缺点1.优点适用范围广,且收集资料、统计分析比较简单。2.缺点损失了部分信息,检验效能降低了,容易犯第二类错误。已知总体分布类型,对未知参数(μ、π)进行统计推断依赖于特定分布类型,比较的是参数参数统计(parametricstatistics)非参数统计(nonparametricstatistics)对总体的分布类型不作任何要求不受总体参数的影响,比较分布或分布位置适用范围广;可用于任何类型资料(等级资料,或“50mg”)参数检验与非参数检验比较参数检验非参检验要求资料服从某种分布1.对资料的分布没有特殊要求,总体为偏态、总体分布未知的计量资料(尤其在n30的情况)2.等级资料3.有过大或过小值的数据,或数据的某一端没有具体值4.总体方差不齐检验效率高检验效能低,容易犯第二类错误原因:信息丧失或信息利用不足。方法的起点--排队与秩次•统计描述中排秩思想的成功应用百分位数、中位数•排队的优点广泛适用于多种分布•排队的结果将原始数据的比较转化为秩次的比较秩次和秩和“秩”即按数据大小排定的次序号,又称秩次号。编秩就是将观察值按顺序由小到大排列,并用序号代替原始变量值本身。用秩次号代替原始数据后,所得某些秩次号之和,即按某种顺序排列的序号之和,称为秩和。设有以下两组数据:A组4.76.42.63.25.2B组1.72.63.62.33.7两组各有5个变量值。现在依从小到大的顺序将它们排列起来,并标明秩次,结果如下:A组2.63.24.75.26.4B组1.72.32.63.63.7秩次12345678910上面A组和B组中各有五个原始值,按顺序排列:最小值设为1,再按绝对值大小对余下的变量逐个排序,最大值为两组变量个数之和10。依次可得1,2,3.5,3.5,5,6,7,8,9,10。这10个序号即是秩次。A组秩和就是等于3.5+5+8+9+10=35.5,B组秩和就是等于1+2+3.5+6+7=19.5。从两组的原始变量值也可以初步看出:A组偏大,B组偏小。现在得出的秩和也是A组大于B组,与由变量值所观察到的一致。秩次(rank)——将数值变量值从小到大,或等级变量值从弱到强所排列的序号。例111只大鼠存活天数:存活天数4,10,7,50,3,15,2,9,13,60,60例29名肺炎病人的治疗结果:危险程度治愈治愈死亡无效治愈有效治愈有效无效秩次364928157101110.510.5平均秩次2.52.597.52.55.52.55.57.5秩次129735468第一节配对设计资料的符号秩和检验复习:配对设计1.同一受试对象分别接受两种不同的处理2.同一受试对象处理前后3.两个同质受试对象分别接受两种不同的处理适用条件1.配对设计的计量资料,但不服从正态分布或分布未知2.配对设计的等级资料Wilcoxon符号秩检验,用于推断配对资料的差值是否来自中位数为0的总体。家兔号A照射B照射A-B秩次(1)(2)(3)(4)(5)139551610242541293515543443474355553-2-164563181172252301284844-4-39404886104555108114032-8-612495786合计R=10(68)表1家兔皮肤损伤程度(评分)(1)建立检验假设,确定检验水准Ho:差值总体中位数Md=0H1:差值总体中位数Md≠0α=0.05分析步骤:(2)编秩:•求差值•编秩方法:依差值的绝对值从小到大编秩。•编秩时注意两点:遇差值为0者,舍去不计,n相应减少;差值的绝对值相等,取平均秩次•编秩后,按差值的正负给秩次冠上符号。(3)求差值为正或负的秩和差值为正的秩和以T+表示差值为负的秩和以T-表示。T++T-=n(n+1)/2T=min(T+,T-)(4)确定P值和作出推断结论:当n≤50时,查T界值表T在界值范围内PαT在界值范围外或相等Pα分析步骤:例1临床某医生研究白癜风病人的白介素IL-6水平(u/l)在白斑部位与正常部位有无差异,调查的资料如表1所示:表10-1白癜风病人的不同部为白介素IL-6指标(u/l)病人号白斑部位正常部位140.0388.57297.1380.00380.32123.72425.3239.03519.6124.37614.5092.75749.63121.57844.5689.76一般步骤建立假设检验H0:差值的总体中位数为0;H1:差值的总体中位数不为0(双侧);或差值的总体中位数0(0)(单侧);确定检验水准为0.05。求出各对数据的差值表2白癜风病人的不同部为白介素IL-6指标(u/l)病人号白斑部位正常部位d=正常-白斑140.0388.5748.54297.1380.00-17.13380.32123.7243.40425.3239.0313.71519.6124.374.76614.5092.7578.25749.63121.5771.94844.5689.7645.20编秩次,求秩和去掉d=0的对子,总的对子数也要相应减去;用绝对值︱d︳编秩次,如果出现绝对值相等时(ties),则将它们的平均秩次值作为他们的秩次;把差值的符号标在秩上,如果d0,则秩次为“+”,d0,则秩次为“-”;求正负秩次之和T+与T-,绝对值较小者,作为统计量T值。表3白癜风病人的不同部为白介素IL-6指标(u/l)病人号白斑部位正常部位d=正常-白斑秩次140.0388.5748.54297.1380.00-17.13380.32123.7243.40425.3239.0313.71519.6124.374.76614.5092.7578.25749.63121.5771.94844.5689.7645.20合计1345678-3T+=33T-=32查配对比较的符号秩和检验表,确定P值范围。当n≤50时,查T界值表,当T恰为附表的界值时,P值一般小于表中对应的概率值;本例n=8,查T界值表T0.05(8)=3~33,P0.05,因此拒绝H0。正态近似法•当n50,可采用正态近似法,计算z值。24/)12)(1(5.04/)1(nnnnnTZ若相同秩次较多(超过25%),应作校正计算。Z或式中,tj为第j(j=1,2,…)个相同差值的个数。48)(24)12)(1(5.04/)1(3jjttnnnnnTZ正态近似法到例题问题1.在统计检验中是否选用非参数统计方法()。•A.要根据研究目的和数据特征作决定•B.可在算出几个统计量和得出初步结论后进行选择•C.要看哪个统计结论符合专业理论•D.要看哪个值更小•E.既然非参数统计对资料没有严格的要求,在任何情况下均能直接使用•问题2.配对样本差值的Wilcoxon符号秩和检验,确定P值的方法是()•A.T越大,P值越小•B.T越大,P值越大•C.T值在界值范围内,P值小于相应的α•D.T值在界值范围内,P值大于相应的α值•E.T值在界值范围上,P值大于相应的α第二节单样本资料的符号秩和检验•目的:推断样本中位数与已知总体中位数(常为标准值或大量观察的稳定值)有无差别,常用于不满足单样本t检验应用条件的资料;其检验假设是M=M0.•例10-2已知某地正常人尿氟含量的中位数为2.15mmol/L.今在该地某厂随机抽取12名工人,测得尿氟含量,结果见表2。问该工厂的尿氟含量是否高于当地正常人?表212名工人尿氟含量测定的结果尿氟含量X(1)差值d=X-2.15(2)秩次(3)2.1502.10-0.05-2.52.200.052.52.12-0.03-12.420.2742.520.3752.620.4762.720.5772.990.8483.191.0493.371.22104.572.4211•1.求差值Md=Xi-M0,见表2中的第二栏;•2.检验假设H0:Md=0,即差值的总体中位数等于零,H1:Md0,即差值的总体中位数大于零,取单侧检验水准为0.05。•3.编秩去掉d=0的对子,总的对子数也要相应减去;用绝对值︱d︳编秩次,如果出现绝对值相等时(ties),则将它们的平均秩次值作为他们的秩次;把差值的符号标在秩上,如果d0,则秩次为“+”,d0,则秩次为“-”;•4.求正负秩和并确定检验统计量–T+=62.5,T-=3.5;T=min(T+,T-)=3.55.确定P值并作出统计推断•本例n=11,T=3.5,查配对设计T界值表,得P0.005,差异有统计学意义,拒绝H0,接受H1.可认为工人尿氟含量高于当地正常人。第三节完全随机设计两独立样本的秩和检验•Wilcoxon秩和检验,目的是推断连续型变量资料或有序变量资料的两个独立样本代表的总体分布位置是否有差别适用条件:1.完全随机设计的两组定量资料,若不满足参数检验的应用条件,则用本法2.有序分类变量两组独立样本比较表2两独立样本秩和检验计算表A样本B样本观察值秩号观察值秩号4817145633936104037182220986n1=8n2=8一、原始数据的两样本比较例3用某方法对样品进行检测,得到样品的直径(mm),问两样本的直径有无差异?表2两独立样本秩和检验计算表A样本B样本观察值秩号观察值秩号481417714652631539123611105401331741882210209981663n1=8秩和R1=89n2=8秩和R2=471.建立检验假设,确定检验水准(α)H0:两总体分布相同H1:两总体分布不同α=0.05。2.编秩按两组数值由小到大统一编秩,若遇相同数据则取平均秩。分析步骤:3.计算秩和,确定检验统计量T值以样本例数较小者为n1,其秩和为T1.设N=n1+n2,则有T1+T2=N(N+1)/24.确定P值和作出推断结论当n1≤10或(n2-n1)≤10时,附表T界值表(两独立样本比较的秩和检验用)中查P值本例T=89或T=47查T界值表,得双侧P<0.05,差异有统计学意义,可以认为两样品的直径有差别。n110或(n2-n1)10时,T界值表(两独立样本比较的秩和检验用)中查不到P值,则可采用正态近似法求Z值来确定P值,其公式如下:正态近似法12/)1(5.0)1(21211NnnNnTZ种相持的秩次个数为第其中jtNNttcjjjj);/()(1c/ZZ33c若相同秩次较多,应作校正计算例4对无淋巴细胞转移与有淋巴细胞转移的胃癌患者,观察其生存时间,问两组患者的生存时间是否
本文标题:69非参数检验
链接地址:https://www.777doc.com/doc-4179232 .html