您好,欢迎访问三七文档
医学统计学第七章秩和检验本章学习要点:●非参数检验的概念●参数检验与非参数检验的区别●几种常用的秩和检验方法参数统计和非参数统计的概念参数统计概念参数统计是指在样本资料满足一定条件(正态分布,方差齐)的基础上,对总体的参数(总体均数或率)进行假设检验的方法,称为参数统计。参数统计均有一定的条件要求,若不满足条件则不能使用,可考虑进行变量变换或采用不要求条件的其它统计方法,如秩和检验。非参数统计概念、优点和缺点1、概念非参数统计是指不考虑资料的分布类型,不对总体参数进行检验,而对资料的分布是否相同进行检验,这种统计方法称非参数检验。秩和检验、符号检验、游程检验、Ridit分析、X2检验等均属于非参数检验方法。2、优点(1)不受总体分布的限定,适用范围广;可用于各种统计资料,主要用于偏态分布资料、分布不明资料;(2)对数据要求不严格;可用于不能准确定量的资料,主要用于等级资料,开口资料;(3)有些方法在样本例数不多时,尚简便易行。3、缺点不能充分利用资料所提供的信息(仅考虑位次大小),故检验效率较参数检验低,犯第二类错误的概率β较参数检验大,同一资料要达到相同的检验效能(1-β),则非参数检验比参数检验所需的样本例数多。因此,在进行统计分析时,应首先考虑是否满足参数检验,不满足参数检验时才考虑使用非参数检验。首选非参数检验的情况:1、等级资料2、开口资料3、明显偏态分布的资料第一节Wilcoxon符号秩和检验一、配对设计的两样本比较例7.1本例应首先考虑用配对t检验,这里只是用于说明配对设计秩和检验的方法。首选配对秩和检验的例子:P291,习题4.24.44.6。(用于配对设计的计量资料)1、建立假设和确定检验水准H0:差值总体中位数Md=0H1:差值总体中位数Md≠0α=0.052、求差值3、编秩:(1)依差值绝对值从小到大编秩,再根据差值的正负给秩次冠以正负号;(2)差值为零时,舍去不计(例数相应减1);(3)差值相等,符号相同,按顺序编秩;(4)差值相等,符号不同,取平均秩次4、求秩和并确定检验统计量T(1)分别求正、负秩次之和T+、T-本例:T+=3.5;T-=41.5(2)以绝对值较小的秩和为检验统计量T,本例T=T-=3.5注:总秩和=,本例T++T_=45,而2)1(nn452)19(95、确定P值(1)查表法当n≤50时,查附表6:T界值表(配对比较的符号秩和检验)以例数n确定查哪一行,然后自左向右用T与每一栏界值相比。T在界值范围之内,P值大于表上方相应概率T在界值范围之外,P值小于表上方相应概率(往右移一栏继续查)本例n=9,T=3.5,在双侧P=0.05的界值范围(5~40)之外,在双侧P=0.02的界值范围(3~42)之内,故0.02P0.05。6、推断结论∵0.02P0.05,∴在α=0.05水准上,拒绝H0,接受H1,差异有统计学意义,故可认为两法测定大气中SO2日平均浓度结果不同,乙法较高。(二)正态近似法当n50时,可计算u值,确定P值(此时仍属于非参数法)注:n50时,T近似呈正态分布而当相同秩次较多(超过25%)时,需计算校正u值。(注:tj为相同差值的个数)24/)12)(1(5.0|4/)1(|nnnnnTu48)(24)12)(1(5.0|4/)1(|3jjttnnnnnTutj为相同差值的个数。如例7.1,有两个5,两个15。故,t1=2,t2=2,122222332321313ttttttjj方法与例7.1类似。将样本各观察值与已知的总体中位数相减,用差值进行符号的秩和检验。二、单一样本与总体中位数比较1、建立假设和确定检验水准H0:该厂工人尿氟含量总体中位数等于2.15H1:该厂工人尿氟含量总体中位数大于2.15单侧α=0.052、求差值3、编秩:(1)依差值绝对值从小到大编秩,再根据差值的正负给秩次冠以正负号;(2)差值为零时,舍去不计(例数相应减1);(3)差值相等,符号相同,按顺序编秩;(4)差值相等,符号不同,取平均秩次4、求秩和并确定检验统计量T(1)分别求正、负秩次之和T+、T-本例:T+=62.5;T-=3.5(2)以绝对值较小的秩和为检验统计量T,本例T=T-=3.5注:总秩和=,本例T++T_=66,而2)1(nn662)111(115、确定P值用查表法以n=11查附表6:T界值表(配对比较的符号秩和检验)得单侧T0.005=(5~61),本例,T=3.5,在单侧T0.005范围之外,故P0.005。6、推断结论∵0.005,∴在α=0.05水准上,拒绝H0,接受H1,差异有统计学意义,故可认为该厂工人尿氟含量高于当地正常人。第二节成组设计两样本比较的秩和检验(Wilcoxon两样本比较法)一、原始数据的两样本比较1、建立假设和确定检验水准H0:两组雌鼠增重的总体分布相同H1:两组雌鼠增重的总体分布不同α=0.052、编秩:(1)先将两组数据分别从小到大排序,再将两组数据统一由小到大编秩;(2)相同数据在同一组里,按顺序编秩;(3)相同数据在不同组里,取平均秩次。3、求秩和并确定检验统计量T(1)分别求各组的秩和T1、T2;(2)以样本例数n较小者的秩和T为检验统计量T(若n1=n2,任取一组秩和为T);本例T=T2=44.54、确定P值(1)查表法:以n1和n2-n1,查附表7T界值表(两样本比较的秩和检验用):T在界值范围之内,P值大于表上方相应概率T在界值范围之外,P值小于表上方相应概率T恰好等于界值,P值等于表上方相应概率本例n1=7,n2-n1=12-7=5;查附表7T界值表得:T界值P值49—910.1046—940.0542—980.0240—1000.01T=44.5,在双侧P=0.05的界值范围之外,在双侧P=0.02的界值范围之内,则0.02P0.05。本例T=T2=44.56、推断结论∵本例0.02P0.05,∴在α=0.05水准上,拒绝H0,接受H1,两组雌鼠增重的总体分布不同,因为高蛋白组平均秩和=145.5/12=12.1,低蛋白组平均秩和=44.5/7=6.4,故可认为高蛋白组增重较多。1T2T二、正态近似法:当n1或/和n2-n1超出附表7范围时,可计算u值,确定P值。而当相同秩次较多(超过25%)时,需计算校正u值。12/)1(5.0|2/)1(|211NnnNnTucuuc/)/()(133NNttCjj三、等级资料(频数表资料)两样本比较疗效组别控制显效有效无效合计未合并肺气肿65183013126合并肺气肿426231182某药物对两类老年慢性支气管炎的疗效单向有序列联表分析某药对两类慢性支气管炎的疗效有无差别。X2检验:两组疗效的构成有无差别秩和检验:两组疗效有无差别表9.3正常人和慢性气管炎病人痰液中嗜酸性粒细胞检查结果━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━人数秩和结果────────合计秩次范围平均秩次────────正常人病人正常人病人(1)(2)(3)(4)(5)(6)(7)=(2)(6)(8)=(3)(6)───────────────────────────────-115161-168.593.542.5+10182817-4430.5305549.0++3161945-6354.0162864.0+++05564-6866.00330.0───────────────────────────────合计n1=24n2=4468——T1=560T2=1785.5━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━检验步骤:1、建立假设和确定检验水准H0:两类病人疗效的总体分布相同H1:两类病人疗效的总体分布不同α=0.052、编秩(1)计算各等级的合计数;(2)确定秩次范围;(3)求平均秩次;(下限+上限)/23、求秩和并确定检验统计量T(1)分别求各组的秩和T1、T2(各个等级秩和:例数╳平均秩和)(2)以样本例数小者n1的秩和为检验统计量T,本例T=T1=8780.54、计算u值和校正u值,确定P值12/)1(5.0|2/)1(|211NnnNnTu4974.012/)1208)(126)(82(5.0|2/)1208(825.8780|uc=u/C=1-∑(t3j-tj)/(N3-N)=1-[(1073-107)+(243-24)+(533-53)+(243-24)]/(2083-208)=0.8443uc=0.4974/=0.5413uc=0.5413<u0.5,=0.6745,P0.55、推断结论本例P0.5,在α=0.05水准上,不拒绝H0,差别无统计学意义,尚不能认为该药对两种支气管炎的疗效不同。c8443.0查u值表df=∽的t值,就是u值!第三节成组设计多个样本比较的秩和检验(Kruskal-Wallis法)H检验一、原始数据多个样本比较二、等级资料(频数表资料)多样本比较一、原始数据多个样本比较的秩和检验例7.5表9.4教室在不同时间空气中CO含量(mg/m)课前课中课后含量秩次含量秩次含量秩次(1)(2)(3)(4)(5)(6)0.4814.4512.52.9570.5324.73143.0780.5534.77153.1890.5544.82163.20100.5854.89173.30110.6265.00184.4512.52192.557.5666iRin1、建立假设和确定检验水准H0:三个总体的位置相同H1:三个总体的位置不同或不全相同α=0.052、编秩:(1)各组分别从小到大排列,再将各组数据由小到大统一编秩;(2)在同一组里有相同的数据,按顺序排列;(3)在不同组里有相同数据,取平均秩次。3、求各组的秩和iR4、计算检验统计量H而当相同秩次较多(超过25%)时,需计算校正HC值.HC=H/CC=1-本例:)1(3)1(1212NnRNNHi)()(33NNttjj)1(3)1(1212NnRNNHi245.9)115(3)55.61405.18()115(15122225、确定P值(1)若k=3,每组例数≤5,查附表8,H界值表;(2)若组数k3,每组例数5,以自由度v=k-1,查附表5,X2界值表(此时H服从X2分布)。本例k=3,每组例数=5,以n=15,查附表8,H界值表得:H0.01=7.98。H=9.245H0.01P0.016、推断结论本例P0.01,在α=0.05水准上,拒绝H0,接受H1,故可认为3种不同菌型伤寒杆菌的小白鼠的存活天数不同或不全相同。(进一步做两比较)二、等级资料多个样本比较秩和检验例7.61、建立假设和确定检验水准H0:三种疗法治疗效果的总体分布相同H1:三种疗法治疗效果的总体分布不同或不全同α=0.052、编秩:(1)计算各等级的合计数(2)确定秩次范围(3)求平均秩次3、求各组的秩和Ri09.665233)42158581015.338013795.86843(52352212)1(3)1(122222NnRNNHii9206.0)522552()8686()100100()155155()181181(133333C7901.719206.009.66CHHc4、计算H值和校正Hc值5、确定P值本例k=3,故以自由度v=3-1=2,查附表5,X2界值表:X20.005,2=10.6HcX20.005,2P0.0056、推断结论本例P0.005,在α=0.05水准上,拒绝H0,接受H1,故可认为三种方法治疗小儿腹泻的疗效不同或不全相同(尚需进行两两比较)。第四节随机区组设计资料的秩和检验随机区组设计又称配伍组设计,它是配对的扩大。A处理B处理配对设计A处理B处理C处理配伍设计对子区组ABABC治疗前、后治疗前、中、后配对设计配
本文标题:医学统计学秩和检验
链接地址:https://www.777doc.com/doc-4042432 .html