您好,欢迎访问三七文档
9非参数统计分析方法non-parametricstatistics余小金东南大学公共卫生学院流行病学与卫生统计学系1主要内容Outline9.0Introductiontononparametrictest9.1Wilcoxonsignedranktest(paireddesign)9.2Wilcoxonranksumtest(completelyrandomizeddesign,2groups)9.3Wilcoxonranksumtest(completelyrandomizeddesign,morethan2groups)9.4multiplecomparison29.0非参数检验简介9.1配对设计秩和检验9.2完全随机设计秩和检验9.3多组比较秩和检验9.4两两比较两类统计方法参数统计方法总体均数的可信区间估计均数比较的t检验或z检验均数比较的方差分析率比较的u检验非参数统计方法卡方检验秩和检验3t检验等的条件正态性方差齐性非参数统计(nonparametricstatistics)概念不以一定的抽样分布为基础;不通过统计量来估计参数或对参数进行推断。常用的有符号检验,秩和检验,卡方检验,游程检验等优缺点计算简单;不需严格的正态性假设,因而适用范围广;;对异常数据不敏感;单调转换下的不变性;检验效能低;4非参数统计方法的适用范围1.分布类型不明或偏态分布2.等级资料3.方差明显不齐,无法变换4.个别数据偏离,或开口资料5.正态分布资料5统计学家们Wilcoxon-Mann-Whitney20世纪40年代,美国氰胺公司化学家Frankwilcoxon实验中由于仪器的预热过程,数据变异较大,导致t检验方法似乎有误。基于组合与排列的方法。Wilcoxon,F.(1945)IndividualComparisonsbyRankingMethods.BiometricsBulletin1:80–83.经济学家HenryB.Mann和OhioStateUniversity统计学研究生D.RansomWhitney20世纪30年代,苏联数学家安德烈柯尔莫哥洛夫和N.V.Smirnov发展了无需使用参数的分布比较方法6Frankwilcoxon(1892-1965)位次(rank)的概念中位数(median)复习概念数值的具体大小与相对大小(exactmagnitudeandrelativemagnitude)不考虑数值的具体大小,只考虑其相对大小,用对代表秩次的连续整数的统计来代替对具体数值计算统计指标。所以,秩和检验不是针对总体的数值分布,而是总体的位置排列。Observation3.15.56.010.211.9rank123457一个小问题比较男生与女生的平均身高(不许用任何测量工具)89.2两样本比较的秩和检验Wilcoxonrank-sumtest表9.2两种方法治疗胆道梗阻患者测得血清总胆红素下降量9对照组(1)秩次(2)试验组(3)秩次(4)140.21148.65268.516246.515-28.23415.721-94.42378.220328.419133.810118.99308.41885.97308.11746.64487.32272.16113.38-209.61155.613228.514144.012n1=10T1=78n2=12T2=175检验假设H0:…………….的分布位置相同。H1:…………………..的分布位置不同。α=0.051011求检验统计量T值统一排序,并给予秩次(为什么?)。遇相同数据时,怎么办?分别求两组秩和,以样本含量较小者为n1,其秩和为统计量T。若n1=n2,可取任一组的秩和为T。本例T1=78(n1=10),T2=175(n2=12),T=78。12确定P值和作出推断结论由n1,n2-n1查附表18,若T值在界值Tα范围内,则Pα;若T值在界值Tα外,或恰好等于下界值(或上界值),则P≤α。本例n1=10,n2-n1=23,T=78,查附表12得双侧P0.05,按α=0.05水准,拒绝H0,接受H1,故认为可以认为两组患者血清总胆红素下降量是不相同的。13基本思想N=n1+n2秩次应从1到N,总秩和是一定的,即从1到N的连续整数的求和。如果两样本来自一个总体,样本例数相等时,应平分总秩和;样本例数不等时则按比例分总秩和。14正态近似与校正数如果n1或n2-n1超出附表的范围,可用正态近似法即u检验计算u值.相同秩次较多时要作校正。12/)1(5.02/)1(211NnnNnTu15uc=cuucNNttcjj33/表9.3两种疗法对急性脑梗死Ⅱ期的疗效比较疗效(1)试验组(2)对照组(3)合计(4)秩次范围(5)平均秩次(6)秩和试验组(7)=(2)×(6)对照组(8)=(3)×(6)基本痊愈398471~4724936192显著进步43489148~1389339994464进步213253139~19116534655280无效51621192~21220210103232合计108104212--941013168169.1配对符号检验Wilcoxonsigned-ranktest表9.1治疗前后测得患者血清总胆红素样品编号(1)术前(2)术后(3)差值d(4)=(2)-(3)秩次(5)1395.5255.3140.272299.230.7268.593577.5605.7-28.2-14158.4252.8-94.4-55428.099.6328.4106123.54.6118.96795.910.085.948218.6172.046.629394.1322.072.1317检验假设H0:所测前后值的总体分布位置相同,差值的总体中位数Md=0);H1:所测前后值的总体分布位置不同(Md≠0);α=0.0518求检验统计量T值编秩依差值的绝对值从小到大编秩,再根据差值的正、负给秩次冠以正负号;编秩时如遇差值等于0,舍去不计,有效对子数n相应减少,本例有效对子数n=8;遇有差值的绝对值相等,符号不同,则取其平均秩次。如表10.6第(4)栏中差值绝对值等于0.02的有4个,它们位次是4、5、6、7,其平均秩次为(4+5+6+7)/4=5.5。分别求出正、负秩次之和T+和T-(二者之和等于n(n+1)/2。可用于验算计算是否正确)。本例T+=41,T-=14(和为55),任取T+(或T-)作检验统计量T.本例取T=1419确定P值和作出推断结论当n25时,查附表11T界值表。查表时,若T在Tα上、下界值范围外或等于界值时,则Pα;若T在Tα上、下界值范围内,则Pα。本例n=10,T=14;查附表,得T在双侧界值范围内,P0.05。按双侧α=0.05水准,不拒绝H0,故尚不能认为术前和术后患者血清总胆红素检测结果有差别。20正态近似法当n25,超出附表17的范围,可用正态近似法即u检验,按式(10.6)计算u值:48/24/1215.04/13jjttnnnnnTu219.3多个样本比较的秩和检验Kruskal-WallisHtest22肝癌(1)秩次(2)肝炎(3)秩次(4)肝硬化(5)秩次(6)健康组(7)秩次(8)4.716.52.141.511.725.8182.352.032.4613.3214.716.52.892.67.522.9237.8194.5152.67.5205.92550.6249.0202.910274.026452.32721.1223.31171348.8283.6122134.8293.9139402.0304.414159261.031Ri247.595.57083ni10669表9.44组人群AFP检测结果假设检验步骤23H0:四组人群AFP检测结果总体分布相同;H1:四组人群AFP检测结果总体分布不同或不完全相同(1)编秩;(2)求秩和(3)计算统计量H确定P值和作出推断结论若组数k=3,每组例数ni≤5,可查附表19,H界值表得出P值;若k3最小样本例数不小于5,则H近似服从ν=k-1的χ2分布。本例k=4,每组例数ni5,查附表10界值表,=3,得P0.05(P=0.001),按的检验水准,拒绝H0,接受H1,可以认为四组人群AFP检测结果总体分布不同或不完全相同。131122NnRNNHii多个样本两两比较的秩和检验24BABAnnNNRR1112121kk作业选择题P123第11,12题25谢谢您的认真听讲!26
本文标题:秩和检验【统计学】
链接地址:https://www.777doc.com/doc-5600186 .html