您好,欢迎访问三七文档
陈学芬第九章非参数检验方法(nonparametrictest)2020/2/16陈学芬2检验方法的选择及应用条件t检验:u检验:方差分析:2020/2/16陈学芬3参数检验:若样本所来自的总体分布已知(如正态分布),对其总体参数进行假设检验,则称为参数检验。2020/2/16陈学芬4分析目的:对总体参数(μπ)进行估计或检验。分布:要求总体分布已知,如:•连续性资料——正态分布•计数资料——二项分布、POISSON分布等统计量:有明确的理论依据(t分布、u分布)有严格的适用条件,如:•正态分布Normal•总体方差齐EqualVariance•数据间相互独立Independent参数检验的特点:条件不满足时——采用非参数统计的方法。2020/2/16陈学芬5非参数检验:不考虑总体的参数和总体的分布类型,而是对样本所代表的总体的分布或分布位置进行假设检验。由于这类方法不受总体参数的限制,故称非参数检验,又称任意分布检验(distribution-freetest)2020/2/16陈学芬6①总体分布形式未知或分布类型不明(n30);②偏态分布的资料(非正态分布的资料):③等级资料:不能精确测定,只能以严重程度、优劣等级、次序先后等表示——单向有序R*C资料④不满足参数检验条件的资料:各组方差明显不齐。⑤个别数据偏大或数据一端或两端是不确定数值,(必选)如“50kg”等。非参数检验适用范围:2020/2/16陈学芬7非参数检验的优缺点:优点:适用范围广对数据要求不严方法简便、易于理解和掌握缺点:损失信息、检验效能低符合条件首选参数检验不符合条件非参数检验2020/2/16陈学芬8注意:凡符合或经过变换后符合参数检验条件的资料,最好用参数检验。当资料不具备参数检验的条件时,非参数检验是一种有效的分析方法。注:对符合用参数检验的资料,如用非参数检验,会丢失信息,导致检验效率下降,犯第Ⅱ类错误的可能性比参数检验大。2020/2/16陈学芬9本章介绍的非参数统计方法均基于秩次;秩次(rank):将数值变量值从小到大,或等级变量值从弱到强所排列的序号。秩和:用秩次号代替原始数据后,所得某些秩次号之和,即按某种顺序排列的序号之和,称为秩和。秩次和秩和2020/2/16陈学芬10秩和检验适用资料类型:计量、计数或等级资料基本思想:基于秩次(通过编秩,用秩次代替原始数据信息来进行检验)即检验各组的平均秩是否相等。如果经检验得各组的平均秩不相等,则可以推论数据的分布不同,进一步可推论各分布间分布位置发生了平移。2020/2/16陈学芬11内容提要:配对资料的符号秩和检验两样本比较的秩和检验多个样本比较的秩和检验2020/2/16陈学芬12第一节配对资料的符号秩和检验由Wilcoxon于1945年提出又称Wilcoxon符号秩和检验常用于检验差值的总体中位数是否等于零2020/2/16陈学芬13例2某医院对9例苯中毒患者用中草药抗苯一号治疗,得白细胞总数如表1,问该药是否对患者的白细胞总数有影响?2020/2/16陈学芬14表19名苯中毒患者治疗前后白细胞总数结果秩次(5)差值d(4)5.96.078.03.586.34.533.83.444.47.054.03.865.04.395.54.824.26.01治疗后(3)治疗前(2)病人号(1)0.1-4.5-1.8-0.42.6-0.2-0.7-0.71.81-9-6.5-38-2-4.5-4.56.5T+=15.5T-=29.5求d求出正、负秩和若治疗前后无差别正负d的个数应相差不多正秩和与负秩和相差不大将|d|按大小编秩基本思想:查表法或公式法确定P值秩表示差值的绝对值从小到大的排序号,正负号取之差值的正负号,相同大小的差值取平均秩。2020/2/16陈学芬15•H0:两法测得结果相同,即差值的总体中位数Md=0•H1:两法测得结果不相同,即差值的总体中位数Md≠0α=0.05单侧检验呢?(1)建立检验假设,确定检验水准2020/2/16陈学芬16①省略所有差值为0的对子数,并从观察单位数中减去0个数②按差值的绝对值从小到大编秩,若相同秩的符号不同则取平均秩,符号相同可依次编秩。③任取正秩和或负秩和为T,本例取T+=15.5。(T++T-=n(n+1)/2(1+2+…+n),可用验证计算正确与否)(2)求差值、编秩、求秩和并确定检验统计量:取较小的T作为检验的统计量T本例取T=T+=15.5。2020/2/16陈学芬17(3)确定P值并作出推断结论:根据T值(T+=15.5或T-=29.5)查T界值表(P258附表8)确定P值原则:如果T位于检验界值区间内,P,不拒绝H0;如果T位于检验界值区间外,P,拒绝H0,接受H12020/2/16陈学芬18(3)确定P值并作出推断结论:本例:n=9,T+=15.5,T0.05(9)=5-40T+(5-40)所以P0.05,按α=0.05的检验水准,不拒绝H0;尚不能认为治疗前后患者的白细胞总数差别有统计学意义。2020/2/16陈学芬19例9-2表9-2实行良好口腔卫生习惯6个月后牙周情况的变化程度变化对应的分数人数+34+25+1605-14-22-322020/2/16陈学芬20表9-3正负秩和计算表频数d-+总秩次范围平均秩次负秩和正秩和(1)(2)(3)(4)(5)(6)(7)=(2)*(6)(8)=(3)*(5)146101-105.52233225711-1714.02870324618-2320.54182合计81523T-=91T+=1852020/2/16陈学芬21正态近似法n25时,T分布近似正态分布可用正态近似法作u检验:|(1)/4|0.5(1)(21)/24TTTTnnunnn注意:这里的正态近似仍属非参数检验。2020/2/16陈学芬22正态近似法(校正)式中tj为第j(j=1,2…)次相同差值的个数。3(1)/40.5(1)(21)24()48jjTnnunnntt相同秩次较多时的校正值(如超过25%):注意:仍为非参数检验2020/2/16陈学芬23配对资料的编秩规则按照配对设计,先求出对子之间的差值;按其差值的绝对值,从小到大进行排序,其序号即秩次,并在秩次之前保持原差值的正负号不变;编秩遇到差值为零时则舍去不编秩;对绝对值相等的差值若符号不同取平均值,并在秩次之前保持原差值的正负号;2020/2/16陈学芬24第二节两样本比较的秩和检验Wilcoxon秩和检验法计量资料的两样本比较等级资料的两样本比较2020/2/16陈学芬25Wilcoxon秩和检验法假设检验的要点:1、混合编秩、数据相等时取平均秩2、分别求两组的秩和3、以样本量较小组的秩和为T4、查成组设计的T界值表、确定P值2020/2/16陈学芬26(一)计量资料两样本比较的秩和检验表9-4有无淋巴细胞转移的胃癌患者生存时间(月)无淋巴细胞转移有淋巴细胞转移时间秩次时间秩次124.5512510822711124.52912.5124.53817124.542191774620218462124956232912.5602430143415361640184822n1=10T1=162n2=14T2=1382020/2/16陈学芬27计量资料两样本比较的秩和检验例3检验步骤:(1)建立假设,确定检验水准H0:两总体分布相同H1:两总体分布不同α=0.05(2)计算检验统计量①将两组数据由小到大统一编秩,遇同组相同数据按顺序去秩次,遇不同组相同数取平均秩次;②以样本例数小者为n1,计算其秩和为T=162。2020/2/16陈学芬28计量资料两样本比较的秩和检验(3)确定P值作出推断结论查T界值表(两样本比较的秩和检验用):先从左侧找到n1(n1和n2中的较小者),本例为10;再从表上方找两组例数的差(n2-n1),本例,n2-n1=4;在两者交叉处即为T的临界值;将检验统计量T值与T临界值相比,若T值在界值范围内,其P值大于相应的概率,若T值等于界值或在界值范围外,其P值等于或小于相应的概率;本例,概率为双侧0.05对应的T界值为91~159;T=162超出该范围,故P0.05;按α=0.05检验水准,不拒绝H0。尚可认为两组患者的生存时间的差异有统计学意义,无….高于有…。陈学芬292020/2/16附T界值表(两样本比较的秩和检验用)部分T界值表(两样本比较的秩和检验用):上表中:单侧双侧1行P=0.05P=0.12行P=0.025P=0.053行P=0.1P=0.024行P=0.005P=0.01n2-n1n1(较小n)0123456789102……1096-15491-15985-16581-1692020/2/16陈学芬30如果n110或n220则可用正态近似法:112|(1)/2|0.5(1)/12TnNunnN若u超过标准正态分布的临界值,则拒绝H0。2020/2/16陈学芬31相同秩次较多时的校正:13312|(1)/2|0.5()12(1)jjTnNunnNNttNN“差值绝对值”相同情况较多时(比如超过25%),2020/2/16陈学芬32(二)等级资料的秩和检验表9-5两组人痰液嗜酸性粒细胞的秩和计算例数统一编秩秩和嗜酸性粒细胞健康人病人合计秩次范围平均秩次(病人组)(1)(2)(3)(4)(5)(6)⑺=(3)×⑹-511161—168.593.5+18102817—4430.5305.0++1631945—6354.0162.0+++50564—8866.00.0合计442484T1=560.5若选行列表资料的卡方检验,只能推断两组肺炎样本疗效构成比的差别有无统计学意义,损失疗效的“等级”信息,应采用秩和检验,可推断两组等级强度的差别有无统计学意义,比较两组病情的疗效。陈学芬332020/2/161.建立检验假设:H0:两总体分布相同H1:两总体分布不同α=0.052.计算检验统计量⑴编秩⑵求秩和⑶计算u值(u=0.4974,c=0.8443,uc=0.5413)3.确定P值;做出推断结论表9-5两组人痰液嗜酸性粒细胞的秩和计算例数统一编秩秩和嗜酸性粒细胞健康人病人合计秩次范围平均秩次(病人组)(1)(2)(3)(4)(5)(6)⑺=(3)×⑹-511161—168.593.5+18102817—4430.5305.0++1631945—6354.0162.0+++50564—8866.00.0合计442484T1=560.52020/2/16陈学芬34第三节多个样本比较的秩和检验Kruskal-WallisH检验•计量资料多个样本比较的秩和检验•等级资料多个样本比较的秩和检验2020/2/16陈学芬35基本步骤:1、建立检验假设,确定检验水准2、混合编秩,分组求秩和Ti3、计算检验统计量H2020/2/16陈学芬36H值的计算2123(1)(1)iiTHNNNn33()1cjjHHHttcNN2020/2/16陈学芬374、确定P值,作出推断结论小样本情况:当组数k≤3,且ni≤5时,可查H界值表,确定P值。如果HH,则P;反之,P。大样本情况:若k3或ni5时,理论上,H近似服从自由度为k-1的χ2分布,可查χ2界值表确定P值。2020/2/16陈学芬38表9-6各组大鼠脾DNA含量(mg)的秩和计算正常脾患自发性白血病的脾患移植白血病的脾(甲组)患移植白血病的脾(乙组)含量秩次含量秩次含量秩次含量秩次(1)(2)(3)(4)(5)(6)(7)(8)12.31810.889.319.5213.22211.61310.33.310.33.513.72612.31811.11110.5515.22812.72111.71410.5615.82913.52311.71510.5716.93013.52412
本文标题:非参数检验方法.
链接地址:https://www.777doc.com/doc-3795632 .html