您好,欢迎访问三七文档
医学统计学(08)——基于秩次的非参数检验季聪华2012.11.22•非参数检验又称为任意分布检验,这类方法并不依赖总体分布的具体形式,应用时可以不考虑研究变量为何种分布以及分布是否已知,进行的不是参数之间的检验,故称非参数检验。•基本特点:与分布无关•基本方法:χ2检验基于秩(等级,rank)的方法基于特定参照点(如中位数)的方法……非参数检验的优点:①适用范围广②受限条件少。参数检验对总体分布等有特别限定,而非参数检验的假定条件少,也不受总体分布的限制,更适合一般的情况。③具有稳健性。参数检验是建立在严格的假设条件基础之上的,一旦不符合假设条件,其推断的正确性将受到怀疑;而非参数检验都是带有最弱的假定,所受的限制很少,稳健性好。①对符合用参数检验的资料,如用非参数检验,会丢失部分信息。②虽然非参数检验计算简便,但有些问题的计算仍显繁冗。非参数检验的缺点:已知总体分布类型,对未知参数进行统计推断依赖于特定分布类型,比较的是参数参数检验(parametrictest)非参数检验(nonparametrictest)对总体的分布类型不作严格要求不受分布类型的影响,比较的是总体分布位置优点:方法简便、易学易用,易于推广使用、应用范围广;可用于参数检验难以处理的资料(如等级资料,或含数值“50mg”等)缺点:方法比较粗糙,对于符合参数检验条件者,采用非参数检验会损失部分信息,其检验效能较低;样本含量较大时,两者结论常相同应用非参数检验的情况1.不满足正态和方差齐性条件的小样本资料;2.总体分布类型不明的小样本资料;3.一端或两端是不确定数值(如<0.002、>65等)的资料(必选);4.单向(双向)有序列联表资料;5.各种资料的初步分析。方法的起点--排队与秩次•统计描述中排秩思想的成功应用百分位数、中位数•排队的优点广泛适用于多种分布•排队的结果将原始数据的比较转化为秩次的比较秩次(rank)——将数值变量值从小到大,或等级变量值从弱到强所排列的序号。例111只大鼠存活天数:存活天数4,10,7,50,3,15,2,9,13,60,60例29名肺炎病人的治疗结果:疗效治愈治愈死亡无效治愈有效治愈有效无效秩次364928157101110.510.5平均秩次2.52.597.52.55.52.55.57.5秩次129735468SPSS中的菜单位置基于秩次的非参数检验•两个独立样本比较的非参数检验•多个独立样本比较的非参数检验•配对样本比较的非参数检验•随机区组设计多个样本比较的非参数检验两独立样本(A)受试对象随机分组样本1样本2A完全随机分组得到两独立样本甲药乙药两独立样本(B)样本1总体1样本2总体2B从两总体中随机抽样得到两独立样本随机抽样两独立样本(C)总体样本样本2样本1按某属性分类C按某一两分类的属性分组得到两独立样本1.建立检验假设,确定检验水准(α)H0:两总体分布相同H1:两总体分布不同α=0.05。2.编秩按数值由小到大排列,若有相同数据,取平均秩。分析步骤:基本思想两样本来自同一总体任一组秩和不应太大或太小假定:两组样本的总体分布形状相同T与平均秩和应相差不大=),,min(≠,=212121nnRRnnT较小例数组的秩和3.计算秩和,确定检验统计量秩和T值当n110或(n2-n1)10时,则可采用正态近似法求u(Z)值来确定P值,其公式如下:12/)1+(×5.0-)1+(21-=211nnnnnTu4.确定P值和作出推断结论当n1=10或(n2-n1)=10时,查表P值若相同秩次较多,应作校正计算个相同秩号的数据个数为第其中itNNttciiii);-/()-(-1=c/Z=Z33c∑【例1】某实验室观察缺氧条件下大鼠与小鼠的生存,以生存日数作为观察指标。试检验两组生存日数有无差别?序号123456789101112大鼠10121515161718202390以上小鼠2345678910111213T=170146,P0.05•T在界值范围内PαT在界值范围外PαT与界值相等P=αSPSS软件操作•第一步:建立变量。•第二步:输入原始数据•第三步:非参数检验(1)•第三步:非参数检验(2)•第四步:结果解读(1)结果解读:例数、均数、标准差、中位数、四分位间距等。标准差较大•第四步:结果解读(2)结果解读:Z=3.630,P=0.000【例2】20名正常人和32名铅作业工人尿铅定性检查结果如表。问铅作业工人尿铅是否高于正常人?结果-++++++++++正常人182000铅作业工人810734U检验:Zc=U,与1.96,2.58比较SPSS软件操作•第一步:建立变量。•第二步:输入原始数据•第三步:加权个案•第四步:非参数检验•第五步:结果解读结果解读:Z=4.503,P=0.000•两个独立样本比较的非参数检验•多个独立样本比较的非参数检验•配对样本比较的非参数检验•随机区组设计多个样本比较的非参数检验基于秩次的非参数检验完全随机设计多个样本比较的秩和检验由Kraskal和Wallis在Wilcoxon秩和检验基础上扩展而来,又称K-W检验或H检验。1.建立检验假设,确定检验水准(α)H0:k个总体分布相同;H1:k个总体分布不同或不全相同;α=0.05。2.混合编秩将各组数据混合,由小到大编秩。遇有原始数据相同时,若相同数据在同一组内,则仍按顺序编秩;若相同数据在不同组,则取它们的平均秩次。分析步骤:3.求秩和并计算检验统计量H将各组秩次分别相加,求出各组的秩和Ri。检验统计量值H可按下式计算:式中,Ri为各组的秩和,ni为各组样本含量,N为总样本含量。)1+(3-)1+(12=2NnRNNHii∑分析步骤:当各组相同秩次较多时,可对H值进行校正,按下式求值。∑)-()-(-1==33NNttCcHHjjc分析步骤:•tj相同秩次的数量4.确定P值和作出推断结论当组数K=3,每组样本含量ni≤5时,可查附表(H界值表)得到P值。若k3或ni5时,H值的分布近似于自由度为k-1的χ2分布,此时可查χ2界值表得到P值。最后按P值作出推断结论。分析步骤:【例3】比较小白鼠接种三种不同菌型伤寒杆菌9D、11C和DSC1后存活日数,结果见表。问小白鼠接种三种不同菌型伤寒杆菌的存活日数有无差别?序号12345678910119D222344457711C55666781012DSC135666779101111)1+(3-)1+(12=2NnRNNHii∑∑)-()-(-1==33NNttCcHHjjcP=1-CDF.CHISQ(9.97,2)SPSS软件操作•第一步:建立变量。•第二步:输入原始数据•第三步:非参数检验•第四步:结果解读结果解读:x2=9.940,P=0.007【例4】四种疾病患者痰液内嗜酸性白细胞的检查结果见表。问四种疾病患者痰液内的嗜酸性白细胞有无差别?白细胞-++++++支气扩张0296肺水肿3552肺癌5732病毒性呼吸道感染3530)1+(3-)1+(12=2NnRNNHii∑∑)-()-(-1==33NNttCcHHjjcP=1-CDF.CHISQ(15.52,3)SPSS软件操作•第一步:建立变量。•第二步:输入原始数据•第三步:加权个案•第四步:非参数检验•第五步:结果解读结果解读:x2=15.506,P=0.001【例5】某临床药理基地观察5组接受不同治疗的妇科病人,结果见表。问5组疗效有无差别?疗效对照组中药A组中药B组中药C组西药组合计I211900040II44413052III006113148IV023154262V000217798)1+(3-)1+(12=2NnRNNHii∑∑)-()-(-1==33NNttCcHHjjcP=1-CDF.CHISQ(195.50,4)SPSS软件操作•第一步:建立变量。•第二步:输入原始数据•第三步:加权个案•第四步:非参数检验•第五步:结果解读结果解读:x2=195.504,P=0.000•两个独立样本比较的非参数检验•多个独立样本比较的非参数检验•配对样本比较的非参数检验•随机区组设计多个样本比较的非参数检验基于秩次的非参数检验配对设计(A)甲药乙药A受试对象按某些特征配对,两对象随机接受两种处理配对设计(B)方法甲方法乙B一份样品,一分为二,随机接受两种处理治疗前治疗后治疗配对设计(C)C受试对象处理前后比较配对设计差值比较的符号秩和检验由Wilcoxon1945年提出,又称Wilcoxon符号秩和检验,常用于检验差值的总体中位数是否等于零。(1)建立检验假设,确定检验水准Ho:差值总体中位数Md=0H1:差值总体中位数Md≠0α=0.05分析步骤:(2)编秩:•求差值•编秩方法:依差值的绝对值从小到大编秩。•编秩时注意两点:遇差值为0者,舍去不计,n相应减少差值的绝对值相等,符号不同者应取平均秩次•编秩后,按差值的正负给秩次冠上符号。(3)求差值为正或负的秩和差值为正的秩和以T+表示差值为负的秩和以T-表示。T++T-=n(n+1)/2T=min(T+,T-)(4)确定P值和作出推断结论:当n≤50时,查T界值表T在界值范围内PαT在界值范围外PαT与界值相等P=α分析步骤:当n50,可采用正态近似法,计算u值。24/)1+2)(1+(5.0-4/)1+(-=nnnnnTu正态近似法若相同秩次较多,应作校正计算。Z或式中,tj为第j(j=1,2,…)个相同差值的个数。48)-(24)1+2)(1+(5.0-4/)1+(-=3∑jjttnnnnnTu正态近似法【例6】对10名患者分别用甲法与乙法,测得血汞值。问两种方法的结果有无差别?n=10-1=9•T=min(26.5,18.5)=18.5•n=9•p0.05SPSS软件操作•第一步:建立变量。•第二步:输入原始数据•第三步:非参数检验(1)•第三步:非参数检验(2)•第四步:结果解读(1)结果解读:例数、均数、标准差、中位数、四分位间距等。标准差较大•第四步:结果解读(2)结果解读:Z=0.474,P=0.635【例7】对12份血清分别用原方法(检测时间20分钟)和新方法(检测时间10分钟)测谷-丙转氨酶,结果见表。问两法所得结果有无差别?序号123456789101112原法6014219580242220190251983823695新法76152243822402202053824344190100•T=MIN(54.5,11.5)=11.5•n=11•P0.05SPSS软件操作•第一步:建立变量。•第二步:输入原始数据•第三步:非参数检验(1)•第三步:非参数检验(2)•第四步:结果解读(1)结果解读:例数、均数、标准差、中位数、四分位间距等。标准差较大•第四步:结果解读(2)结果解读:Z=1.913,P=0.056•两个独立样本比较的非参数检验•多个独立样本比较的非参数检验•配对样本比较的非参数检验•随机区组设计多个样本比较的非参数检验基于秩次的非参数检验随机区组设计资料比较,如果观察结果不满足方差分析条件,可用Friedman检验(Friedmantest)。1.建立检验假设和确定检验水准2.编秩:•先在每一配伍组内将数据从小到大编秩,如有相同数据,取平均秩次;•再求各处理组秩和Ri,i=1,2,...,g。分析步骤3.计算检验统计量M值(1)查表法(n≤15,g≤15):M=Σ(Rj-R)2(R=ΣRj/g)==》M界值表基于χ2分布近似法得到χ2值查有关的χ2界值表(2)χ2分布近似法分析步骤:)1+(3-)1+(12=∑1=22gnRgngχgjjr)1+(12=2gngMχr自由度为(g-1)当各区组间出现相同秩次时,需进行校正校正公式为cχχc22=)1-()-(-1=23∑gngttcjjb为区组个数,k为处理组个数4.确定P值和作出推断结论【例8】8名受试对象在相同实验条件下分别接受4种不同频率声音的刺激,他们的反应率(%)资料见表。问4种频率声音刺激的反应率是否有差别?SPSS软件操作
本文标题:医学统计学(8)
链接地址:https://www.777doc.com/doc-5017099 .html