您好,欢迎访问三七文档
0第七章非参数检验1方差齐数值变量资料正态分布方差不齐偏态分布资料类型二分类分类变量资料无序多分类有序非参数检验2参数统计(parametricstatistics):以样本来自已知分布(如正态分布)的总体为假设基础,对未知总体参数进行估计或检验的方法,如t检验、u检验和方差分析等;非参数统计(nonparametricstatistics):总体分布不易确定,或分布呈明显偏态、方差不齐又无适当的变量转换方法以满足参数统计条件。3非参数检验(nonparametrictest)•对总体分布不作严格假定,又称任意分布检验(distribution-freetest)。•先将变量按照数值由小到大,或等级由弱到强转换成秩后,再计算检验统计量。•非参数检验的基础:比较总体分布是否相同,而不是比较总体参数是否相等。•特点:假设检验的结果对总体分布的形状差别不敏感,只对总体分布的位置差别敏感。4非参数检验的优点与缺点优点:①适用范围广,不受总体分布的限制;②对数据的要求不严,如某些指标难以准确测定,只能以严重程度、优劣等级、先后次序等表示的资料也可应用;③方法简便,易于理解和掌握。缺点:如果对符合参数检验的资料应用非参数检验,因不能充分利用资料提供的信息,会使检验效能低于参数检验;若要使检验效能相同往往需要更大的样本含量。5本章主要内容•§1Wilcoxon符号秩和检验•§2Wilcoxon两样本比较法•§3完全随机设计多样本比较的Kruskal-Wallis检验•§4随机区组设计的Friedman检验6第一节Wilcoxon符号秩和检验Wilcoxon符号秩和检验(Wilcoxonsignedranksumtest)是推断其差值是否来自中位数为零的总体的方法,可用于:配对设计的两样本的比较单一样本与总体中位数的比较7一、配对设计的两样本的比较例7.1某医院用中草药“抗苯一号”治疗9例苯中毒患者,其治疗前后的白细胞总数如表7-1,问该药是否对患者的白细胞总数有影响?表7-19名苯中毒患者治疗前后白细胞总数结果(单位为109/L)秩次+-病人号(1)治疗前(2)治疗后(3)差值d(4)=(2)-(3)(5)(6)16.04.21.86.524.85.5-0.74.534.56.3-1.86.543.43.8-0.4357.04.42.6863.84.0-0.2276.05.90.1183.58.0-4.5994.35.0-0.74.55.15T5.29T8查表法:1.建立检验假设,确定检验水准H0:Md=0H1:Md≠0α=0.052.计算检验统计量T值(1)求各对的差值(2)编秩按差值的绝对值由小到大编秩,依差值的正负给秩次冠以正负号。编秩时,若差值为0,舍去不计;若差值的绝对值相等,则取其平均秩次。配对设计两样本比较9(3)求秩和并确定统计量T分别求出正、负秩次之和,正秩和以T+表示,负秩和以T-表示,可任取正秩和或负秩和为统计量T。T++T-=n(n+1)/2,n为不等于0的对子数。3.确定P值,做出推断结论当n≤25时,以T值查“附表10T界值表”(配对设计用),若检验统计量T值在T界值范围内,则P值大于相应的概率水平;若T值在T界值范围外或等于界值,则P值小于或等于相应的概率水平。配对设计两样本比较10Wilcoxon符号秩和检验的基本思想T分布以均数为中心,均数处频数最多,左右对称,向两侧逐渐减少。当H0成立时,从总体随机抽取的一个样本,所得T值在均数附近的概率最大,而T值远离均数的概率较小。随着n增大,T分布逐渐逼近正态分布,当n25时,T分布较好地近似正态分布。假定从一总体中,随机抽取n=5的样本,按上述步骤,可以求出T+、T-。当重复抽取所有可能组合的样本,秩和T+的分布见下表。配对设计符号秩和检验,n必须大于5。115n时秩和T的分布秩和T+差值为正的秩次组合情况f概率0010.031251110.031252210.03125331+220.06250441+320.06250551+42+330.0937561+2+31+52+430.0937571+2+42+53+430.0937581+2+53+51+3+430.0937591+3+54+52+3+430.09375101+4+52+3+51+2+3+430.09375111+2+3+52+4+520.06250121+2+4+53+4+520.06250131+3+4+510.03125142+3+4+510.03125151+2+3+4+510.03125合计321.0000012正态近似法:•若n25,超出附表的范围,用正态近似法作u检验:•若相同秩次较多时(不包括差值为0者),计算校正uc:其中tj为第j(j=1,2…)组相同秩次的个数。48)(24)12)(1(5.04/)1(3jjcttnnnnnTu241215041/))((./)(nnnnnTu配对设计两样本比较13表7-212名工人尿氟含量(mmol/L)测定结果尿氟含量差值秩次(1)(2)=(1)-2.15+-2.1502.10-0.052.52.200.052.52.12-0.0312.420.2742.520.3752.620.4762.720.5772.990.8483.191.0493.371.22104.572.4211T+=62.5T-=3.5二、单一样本与总体中位数的比较例7.2已知某地正常人尿氟含量的中位数为2.15mmol/L。今在该地某厂随机抽取12名工人,测得尿氟含量如表。问该厂工人的尿氟含量是否高于当地正常人?141.建立检验假设,确定检验水准H0:M=2.15H1:M2.15单侧α=0.052.计算检验统计量(1)求差值差值为各观察值与已知总体中位数之差。(2)编秩次方法同配对设计。(3)求秩和并确定统计量本例T+=62.5,T-=3.5,取T=3.5。3.确定P值,做出推断结论本例n=11,T=3.5,查T界值表,得P0.01,按α=0.05检验水准,拒绝H0,接受H1,可认为…单一样本与总体中位数比较15第二节成组设计两样本比较的秩和检验成组设计两样本比较的秩和检验(Wilcoxon两样本比较法,Wilcoxontwo-Sampletest),研究目的是推断两样本分别代表的总体分布是否相同。原始数据的两样本比较频数表资料(或等级资料)的两样本比较16一、原始数据的两样本比较例7.3某医师为研究血铁蛋白与肺炎的关系,随机抽查了10名肺炎患者和16名正常志愿者,测得血铁蛋白(g/L)见表7-3,问肺炎患者与正常人血铁蛋白含量有无差别?1.建立检验假设,确定检验水准H0:肺炎患者与正常人的血清铁蛋白总体分布相同H1:肺炎患者与正常人的血清铁蛋白总体分布不同α=0.05成组设计两样本比较的秩和检验17表7-3正常人与肺炎患者血铁蛋白检测结果(μg/L)肺炎患者正常人血清铁蛋白秩次血清铁蛋白秩次311177176811.5172152371934217416477457231321449224541019918477515255295992647723820294226811.5433.527721445433.59513n1=10T1=183.5n2=16T2=167.5182.计算统计量T值(1)编秩次将2组数据由小到大统一编秩。遇有相同数据且不同组时取平均秩次。(2)求秩和并确定统计量T2组秩次分别相加,其对应的秩和分别为183.5和167.5。若2组例数相等,则任取一组的秩和为统计量;若2组例数不等,以样本例数较小者为n1,其对应的秩和为统计量T。3.确定P值,做出推断结论以n1、(n2-n1)和检验统计量T值查“附表11T界值表”确定P值:若T值在界值范围内,则P值大于相应的概率;若T值在界值范围外或等于界值,则P值小于或等于相应概率。本例0.01P0.02,……成组设计两样本比较的秩和检验原始数据的两样本比较19•若n1或n2-n1超出了附表11T界值表的范围,可用正态近似法:式中N=n1+n2,0.5为连续性校正数。•若相同秩次较多(如超过25%)时应进行校正,,其中tj为第j个相同秩次的个数。12/)1(5.02/)1(211NnnNnTucuuc/)/()(133NNttcjj成组设计两样本比较的秩和检验原始数据的两样本比较正态近似法:20二、频数表资料(或等级资料)的两样本比较例7.4用某药治疗不同病型的老年慢性支气管炎病人,疗效见表7-4,试比较该药对2种病型的疗效?表7-4某药对两种病情支气管炎的疗效疗效人数单纯性单纯合并肺气肿合计(1)(2)(3)(4)控制6542107显效18624有效302353无效131124合计12682208211.建立检验假设,确定检验水准H0:两种病型的病人疗效总体分布相同H1:两种病型的病人疗效总体分布不同α=0.052.计算检验统计量(1)编秩本例为等级资料,先计算各等级的合计人数,再确定各等级的秩次范围,并计算其平均秩次。(2)求秩和并检验统计量以各等级的平均秩次分别乘以两组相应等级的例数,再分别求秩和得到T1、T2。成组设计两样本比较的秩和检验频数表或等级资料的两样本比较22表7-4某药对两种病情支气管炎的疗效疗效人数单纯性肺气肿合计秩次范围平均秩次56秩和单纯性肺气肿12347=2×68=3×6控制65421071~10754108~131119.5132~184158.0185~208196.535102268显效186242151717有效30235347403634无效1311242554.42161.5合计12682208——12955.58780.523本例T1=8780.5,T2=12955.5,n1=82,n2=126,故检验统计量T=8780.5。因n1=82,需用u检验;又因该等级资料的相同秩次过多,需进行校正:3.确定P值,做出推断结论uc=0.54131.96,P0.5,按α=0.05检验水准,不拒绝H0,尚不能认为该药对两种病型支气管病人的疗效分布不同。4974.012/)1208(126825.0|2/)1208(825.8780|u8443.0208208242453532424107107113333333NNttCjj5413.08443.0/4974.0/CuuC成组设计两样本比较的秩和检验频数表或等级资料的两样本比较24基本思想分别有n1与n2的两个样本,来自同一总体或分布相同的两个总体(即检验假设H0成立),则n1样本的秩和T与平均秩和n1(N+1)/2一般相差不大,也就是uuα/2,Pα;若T与平均秩和n1(N+1)/2相差悬殊,即u≥uα/2,P≤α,则表示抽得现有样本统计量T值得概率很小,因而拒绝检验假设H0。成组设计两样本比较的秩和检验25第三节成组设计多样本比较的秩和检验Kruskal–Wallis检验。该法是由Kruskal和Wallis在Wilcoxon秩和检验的基础上扩展的方法,亦称为K-W检验或H检验。研究目的是推断各样本分别代表的总体分布有无差别。原始数据的比较频数表资料的比较26基本思想:若H0成立,第i组的秩和Ti的期望与方差分别为:2)1(NniTi12)1)((2NnNniiTi其检验统计量为:)1(3)1(122NnTNNHiikiTTiiiTH12227一、原始数据的比较例7.5某院外科用3种手术方法治疗肝癌患者15例,每组5例,每例术后生存月数如表7-5。试问3种不同手术方法治疗肝癌的效果有无不同?表7-53种手术方法治疗肝癌患者的术后生存月数甲法乙法丙法月数(1)秩次(2)月数(3)秩次(4)月数(5)秩次(6)3491311710121522.5710111467.567.58124522.5
本文标题:非参数检验
链接地址:https://www.777doc.com/doc-4341217 .html