您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 企业财务 > 卫生统计学课件 第十七章 非参数统计1
第十七章非参数统计(一)•对总体参数(如总体均数)进行估计和检验,称为参数统计parametricstatistics。•医学实践中,有许多资料不符合参数统计分析的要求,这时参数统计方法就不适用。需要一种不依赖总体分布类型,也不对总体参数进行统计推断的假设检验,称非参数检验nonparametrictest•非参数检验的效率通常较低。能用参数检验的最好用参数检验•非参数统计方法的优点:对资料分布特征无特殊要求。以下均可用非参数统计:–不论样本所来自的总体分布形式如何,甚至是未知;(任意分布)–不能或未加精确测量的资料:如等级资料–只能以严重程度、优劣等级、次序先后等表示的资料–当参数检验的条件得不到满足,如非正态或样本例数较少分布类型显示不清的资料–有些分组资料一端或两端是不确定数值,如5克以上第一节成对资料的检验•一、符号检验signtest•用于配对资料差别的统计意义检验•以例17-1说明检验过程–1、确定每个对子的符号:新法大于老法记+号,新法小于老法记-号,相等记为0。–2、符号为0可不予考虑,计算+、-总数;+=116,--=28;合计为144•3、按无效假设正负号应各半,即+理论数T=144/2=72•4、应用校正公式计算卡方(通用公式)。由于+号理论值一经确定,负号理论值即确定,故自由度为1。2=52.56–亦可用正号b,负号为c,运用配卡方检验的校正公式,结果同上•注意:符号检验没有t检验敏感(约为其65%)。见P220,实例17-2•二、符号等级(或秩和)检验(Wilcoxon法)•signedranktest是上述方法的改进,由于用了差数的大小,故效果较好。•计算步骤:–1、将差数按绝对值大小,从小到大排列并写上等级(秩次)–2、在各等级前按差数之正负,标上正负号–3、分别计算正号和负号等级数之和,两者中较小的称为T–4、当对子数n=25时,可查附表17-1。若T愈小,P值越小–5、当对子数25时,用正态近似法TTTTTTunnnnn5.024)12)(1(T4)1(TTT或校正为的标准差的均数•本法的基本思想:–假定从一总体中随机抽取一个样本,当重复所有可能组合的样本,得秩和T+或T-的分布。T的分布为以均数为中心对称的非连续分布。当H0成立,从总体抽取任一样本,所得T在均数附近的概率最大,若T远离均数概率较小,随着n增大,T分布逐渐逼近均数为n(n+1)/4,方差为n(n+1)(2n+1)/24的正态分布,当n25时,T分布已较好的近似正态分布。–计算时可进行连续性校正,但影响甚微,常可略去–当相同差值(计绝对值)多时,应改用更复杂的校正公式第二节成组资料的检验•一、两样本秩和检验(Wilcoxon,MannandWhitney法)•ranksumtest计算步骤:–1、将两组数据混合由小到大排列编秩,相同数据用平均秩–2、将小样本等级相加称为T–3、计算T':T'=n1(n1+n2+1)-T•n1为较小样本观察数–4、以T和T‘两等级总和数中较小者与附表17-2数值比较,小于表中数值即为差别有统计意义。•见P218例17-3•n115或n228不能查表,改用正态近似法•若相同秩次太多,如超过25%,需改更复杂的校正公式TTTTTTunnnnnnn5.012)1(2)1(2121T211T或校正为•本法基本思想:–分别有n1和n2的两个样本,来自同一总体或分布相同的两个总体,即检验假设H0成立,则n1样本的秩和T与平均秩和n1(n1+n2+1)/2一般相差不大,也就是u值小于u;若T与n1(n1+n2+1)/2相差很大,uu,则表示抽得的样本统计量T值的概率很小,因而拒绝H0。•二、中位数检验•原理:如果两分布位置相同则在两组资料合并算得的中位数的上下每组应各有一半数目,故可检验其中位数上下各有观察值数目的差异在两组是否有统计意义。•计算步骤–1、两样本资料混合由小到大排列–2、求混合资料的中位数–对每一样本分别数出超过混合资料的中位数的数目,记为m1和m2–4、用m1、m2及样本中个体含量n1、n2列出四格表–5、如两样本含量均超过10,用四格表卡方检验。否则用精确计算概率法–P219实例中位数检验符号示意表md数m1m2n1+n2-a≤md数n1-m1n2-m2a∑n1n2n1+n2第三节完全随机化设计资料的检验•一、H检验(KruskalandWallis法)•对应于参数检验的完全随机化设计资料的方差分析•应用该方法的前提:假定抽样总体是连续的和相同的,检验其分布位置是否相同。•方法步骤:以例17-4,P224•1)假设:–H0:五个不饲料组小鼠肝中铁含量总体分布相同–H1:五个不饲料组小鼠肝中铁含量总体分布不同或不完全相同–=0.05•2)编秩:–将各组数据混合由小到大排列,统一编秩。如遇同组相同数据,秩次顺列,遇不同组相同数据取平均秩次。•3)求秩和:将各组秩次相加(Ti)•4)求各Ti2/ni•5)求各秩次的平方和Tij2•6)计算方差S2,n为总例数12/)1()4)1((112222nnsnnTnsij无相同数据时,•7)计算H值•8)判断结果:如果处理数3,ni5,则可查附表17-3作判断。•如超出附表范围,根据ni不太小时,H近似于自由度为k-1(处理数k-1)的2分布)4)1((1)1(3)1(122222nnnTsHnnTnnHiiii有相同数据时:无相同数据时,•二、各处理组间相互比较•与方差分析一样,H检验只能总的判断各组是否来自同一总体。H检验有意义时,再进行多重比较(即对各组两两间差别进行显著性检验)•两两比较步骤:–1、计算各组平均等级数这差jjiiijnTnTd•2、计算判断有无统计意义的临界值d0.05•自由度=n-k,dd0.05差别有统计意义。查t值表时如有的自由度没有可用内插法近似估计•3、列各组平均秩间的两两比较表:比较组别、两组平均秩差值、P值(P227)jinnknHnstd1112)(05.005.0•三、中位数检验法•以上资料亦可用中位数检验法,步骤:–1、将各组数据由小到大混合排列–2、求出混合数据中位数–3、列出各组超出中位数的观察值m1、m2、m3……–4、用上节的方法求ni-mi值,列2×k表–5、用2基本公式,计算2值,自由度=组数-1。判断结果•注意:各组例数最好超过10,否则理论值可能太小第四节等级分组资料的检验•P228表17-10的资料,可用2检验,但只能说明:各组在疗效等级的构成上有无不同,而不能说明哪组疗效较好,哪组较差•利用H检验中,相同等级可用平均秩•其检验步骤同H检验•若有显著性意义,再进行多重比较第五节随机区组设计资料的检验•一、M检验(Friedman法)查表法•M检验计算步骤:例17-6–1、将每一区组(患者)的4个时间的ALT单位数按大小排成等级。相同数据用平均秩,列计算表17-13–2、计算各时间等级和mi–3、求平均等级E,E=0.5×b(k+1)•为理论上每组的平均等级和•b为区组数,k为处理数–4、求mi-E值–5、求M:M=(mi-E)2–6、查附表17-4,判断结果–M大于或等于表中数字则差别有统计意义。附表是按没有相等数据的情况制作的,相等数据不多时影响不大•二、F检验•当b、k值超过附表17-4时,改用F检验。且计算过程中的一些数据可被两两比较时所用•计算步骤:•1、将每一区组(患者)的4个时间的ALT单位数按大小排成等级。相同数据用平均秩,如计算表17-13•2、计算各处理组秩和mi•3、计算表中所有等级Rij的平方和为A–A=Rij2–各区组内无相同等级时,可用•4、计算B值•5、计算F值6)12)(1(kkbkA21imbBBAkbkBbF]4/)1()[1(2•6、自由度–1=k-1–2=(b-1)(k-1)•7、查附表6-2F表(ANOVA表),判断结果•三、各组间相互比较•若两组等级和之差的绝对值大于或等于下式的C0.05值,则两组间差别有统计意义)1)(1()(2)(kbBAbtC•为第一类错误概率,t值的自由度=(b-1)(k-1)•各组间的比较列成如表17-14样式•四、中位数检验•当总体分布为连续和相同时,可用中位数法,计算步骤:–1、求出各区组中数据的中位数–2、每区组小于中位数者记“-”,大于中位数者记“+”–3、列出2×k表,见表17-15–4、用一般2检验法,自由度为k-1。–判断结果。为防止理论数偏小,该方法宜用于区组数b大于或等于10的情况
本文标题:卫生统计学课件 第十七章 非参数统计1
链接地址:https://www.777doc.com/doc-4212545 .html