您好,欢迎访问三七文档
当前位置:首页 > 行业资料 > 其它行业文档 > 第07章卡方检验(正式)
华中科技大学公卫学院流行病与卫生统计系1χ2检验Chi-squaredtest第7章蒋红卫Email:JHWCCC@21CN.COM2讲课内容:1.概述——基本思想2.2×2表卡方检验3.配对四格表卡方检验4.Fisher确切概率检验5.R×C表卡方检验6.多个样本率的多重比较7.有序分组资料的线性趋势检验3概念回顾在总体率为π的二项分布总体中做n1和n2抽样,样本率p1和p2与π的差别,称为率抽样误差。在总体率为π1和π2的不同总体中抽样,得p1和p2,在nπ>5,可通过率的u检验推断是否π1=π2。二项分布的两个样本率的检验同样可用χ2检验。u2121ppSpp4目的:推断两个总体率或构成比之间有无差别多个总体率或构成比之间有无差别多个样本率的多重比较两个分类变量之间有无关联性频数分布拟合优度的检验。检验统计量:χ2应用:计数资料5基本概念例1某院比较异梨醇(试验组)和氢氯塞嗪(对照组)降低颅内压的疗效,将200名患者随机分为两组,试验组104例中有效的99例,对照组96例中有效的78例,问两种药物对降低颅内压疗效有无差别?6表200名颅内高压患者治疗情况编号年龄性别治疗组舒张压体温疗效137男A11.2737.5有效245女B12.5337.0有效343男A10.9336.5有效459女B14.6737.8无效…………………20054男B16.8037.6无效如何整理此类资料?如何分析此类资料?7行分类(X)列分类(Y)合计发生数未发生数甲aba+b乙cdc+d合计a+cb+dn四格表(fourfoldtable)资料的基本形式实际频数(actualfrequency)是指各分类实际发生或未发生计数值,记为A。a=99b=5104c=75d=219617426200单元格8NnnTCRRC理论频数(theoreticalfrequency)是指按某H0假设计算各分类理论上的发生或未发生计数值,记为T。式中,TRC为第R行C列的理论频数nR为相应的行合计nC为相应的列合计疗法有效人数无效人数合计有效率试验组99(90.48)5(13.52)10495.2对照组75(83.52)21(12.48)9678.1合计1742620087.09残差–设A代表某个类别的观察频数,T代表基于H0计算出的期望频数,A与T之差(A-T)被称为残差残差可以表示某一个类别观察值和理论值的偏离程度,但残差有正有负,相加后会彼此抵消,总和仍然为0。为此可以将残差平方后求和,以表示样本总的偏离无效假设的程度类似于方差的计算思想,22)()0()(TATAXxi10Pearsonχ2检验的基本公式残差大小是一个相对的概念,相对于期望频数为10时,20的残差非常大;可相对于期望频数为1000时20就很小了。因此又将残差平方除以期望频数再求和,以标准化观察频数与期望频数的差别。卡方统计量,1900年由英国统计学家K.Pearson首次提出。KarlPearson(1857–1936))1)(1()(22列数行数TTA11从卡方的计算公式可见,当观察频数与期望频数完全一致时,卡方值为0;观察频数与期望频数越接近,两者之间的差异越小,卡方值越小;反之,观察频数与期望频数差别越大,两者之间的差异越大,卡方值越大。当然,卡方值的大小也和自由度有关检验的自由度取决于可以自由取值的格子数目,而不是样本含量n。理论上,在n≥40时下式值与χ2分布近似,在理论数>5,近似程度较好。12连续型分布:正态分布(Normaldistribution),学生氏t分布(Student’st-distribution),F分布(Fdistribution)另一个同样重要的分布—χ2卡方分布(Chi-squareddistribution)。此分布在1875年,首先由F.Helmet所提出,而且是由正态分布演变而来的,即标准正态分布Z值之平方而得χ2分布13设Xi为来自正态总体的连续性变量。iiXu21222)(iXui212212)(nniiniXui称为自由度df=n的卡方值。显然,卡方分布具有可加性。140.00.10.20.30.40.50369121518卡方值纵高自由度=1自由度=2自由度=3自由度=62/)12/(2222)2/(21)(ef3.847.8112.59P=0.05的临界值χ2分布的概率密度函数曲线15附表8χ2界值表自由度υ概率,P0.9950.990…0.1000.0500.025…0.00512.713.845.02…7.8820.010.02…4.615.997.38…10.6030.070.11…6.257.819.35…12.8440.210.30…7.789.4911.14…14.8650.410.55…9.2411.0712.83…16.7560.680.87…10.6412.5914.45…18.5570.991.24…12.0214.0716.01…20.2881.341.65…13.3615.5117.53…21.952220.05,10.05/21.96u当υ=1时,16第二节2×2表卡方检验17两组样本率比较的设计分类:1.两组(独立)样本率的比较组间数据是相互独立,非配对设计。2×2表卡方检验2.配对设计两组样本率的比较组间数据是相关的,配对设计。配对四格表卡方检验18两组(不配对)样本率的比较1)四格表形式2)四格表不配对资料检验的专用公式二者结果等价各组样本例数是固定的组别阳性数阴性数合计率%甲组aba+b=n1a/n1乙组cdc+d=n2c/n2合计a+cb+dN(a+c)/N))()()(()(dbdccabaNbcad22TTA22)(19例1(续)组别颅内压治疗合计有效无效异山梨醇99(a)5(b)104(a+b)氢氯噻嗪75(c)21(d)96(c+d)合计174(a+c)26(b+d)200(N)2086.122617496104200)7552199(22H0:π1=π2即试验组与对照组降低颅内压的总体有效率相等H1:π1≠π2α=0.05。以ν=1查附表8的χ2界值表得P0.005。按α=0.05检验水准拒绝H0,接受H1,可以认为两组降低颅内压总体有效率不等,即可认为异梨醇口服液降低颅内压的有效率高于氢氯噻嗪+地塞米松的有效率。1)12)(12(21值得指出,成组设计四格表资料的2检验与前面学习过的两样本率比较的双侧u检验是等价的。若对同一资料作两种检验,两个统计量的关系为2=u2。其对应的界值也为平方关系。两者的应用条件也是基本一致的,连续性校正也基本互相对应。22卡方检验假设的等价性•两组颅内压治疗有效率相同–两组有效率的比较•实际数据的频数分布和理论假设相同–理论分布与实际分布的检验•使用不同的药物并不会影响颅内压的治疗(两个分类变量间无关联)–两变量的相关分析23四格表2值的校正•英国统计学家Yates认为,2分布是一种连续型分布,而四格表资料是分类资料,属离散型分布,由此计算的2值的抽样分布也应当是不连续的,当样本量较小时,两者间的差异不可忽略,应进行连续性校正(在每个单元格的残差中都减去0.5)–若n40,此时有1T5时,需计算Yates连续性校正2值–T1,或n40时,应改用Fisher确切概率法直接计算概率24(1)校正公式的条件:1T5,同时N≥40,用校正公式计算(2)连续校正(continuitycorrection)公式:(3)当T1,或N40,用Fisher确切概率法四格表χ2检验的校正公式(两组不配对资料)TTA2250).())()()(()/(dbdccabaNNbcad22225例2某医师欲比较胞磷胆碱与神经节苷酯治疗脑血管疾病的疗效,将78例脑血管疾病患者随机分为两组,结果见表7-2。问两种药物治疗脑血管疾病的有效率是否相等?H0:π1=π2即两种药物治疗脑血管疾病的总体有效率相等H1:π1≠π2α=0.05。26表两种药物治疗脑血管疾病有效率的比较组别有效无效合计有效率(%)胞磷胆碱组4665288.46神经节苷酯组188(4.67)2669.23合计64147882.0527本例n=78,但T22=4.67,故用四格表资料χ2检验的校正公式143146426527827818684622.)/(c不校正χ2=4.35,p<0.0511212))((以ν=1查附表8的χ2界值表得P0.05。按α=0.05检验水准,不拒绝H0,无统计学意义,尚不能认为两种药物治疗脑血管疾病的有效率不等。28卡方检验的连续性校正问题正方观点:卡方统计量抽样分布的连续性和平滑性得到改善,可以降低I类错误的概率;校正结果更接近于Fisher确切概率法;校正是有条件的。反方观点:经连续性校正后,P值有过分保守之嫌;连续性校正卡方检验的P值与Fisher确切概率法的P值没有可比性,这是因为Fisher确切概率法建立在四格表双边固定的假定下,而实际资料则是单边固定的四格表。29•就应用而言,无论是否经过连续性校正,若两种检验的结果一致,无须在此问题上纠缠。但是,当两种检验结果相互矛盾时,如例2,就需要谨慎解释结果了。•为客观起见,建议将两种结论同时报告出来,以便他人判断。当然,如果两种结论一致,如均为有或无统计学意义,则只报道非连续性检验的结果即可。30第二节配对设计两个样本率的χ2检验(McNemer检验)•配对设计:通常为同源配对。对同一观察对象分别用两种方法处理,观察其阳性与阴性结果。•基本用途:常用于比较两种检验方法或两种培养基的阳性率是否有差别。•数据形式:配对四格表形式。31例3某实验室采用两种方法对58名可疑红斑狼疮患者的血清抗体进行测定,问:两方法测定结果阳性检出率是否有差别?测定结果为:阳性、阴性(共116标本,58对)方法(X)乳胶凝集法免疫荧光法对子例数++11--33+-2-+12结果32上述配对设计实验中,就每个对子而言,两种处理的结果不外乎有四种可能:①两种检测方法皆为阳性数(a);②两种检测方法皆为阴性数(d);③免疫荧光法为阳性,乳胶凝集法为阴性数(b);④乳胶凝集法为阳性,免疫荧光法为阴性数(c)。其中,a,d为两法观察结果一致的两种情况,b,c为两法观察结果不一致的两种情况。33免疫荧光法乳胶凝集法合计+-+11(a)12(b)23-2(c)33(d)35合计134558表两种方法的检测结果34方法原理•按照配对设计的思路进行分析,则首先应当求出各对的差值,然后考察样本中差值的分布是否按照H0假设的情况对称分布。•按此分析思路,最终可整理出如前所列的配对四格表。•主对角线上两种检验方法的结论相同,对问题的解答不会有任何贡献•斜对角线上两种检验方法的结论不相同,显示了检验方法间的差异35cbcb22)(,1当b+c40时,cbcbc22)1(,1=配对χ2检验统计量为36H0:b=c=(12+2)/2=7(两法总体阳性率相等)H1:bc(两方法总体阳性率不等)=0.05本例b+c=12+2=1440,用校正公式本例χ2=5.79>3.84,P<0.05。在α=0.05水准,拒绝H0,接受H1,有统计学意义。认为两方法的检测率不同,乳胶凝集法的阳性检测率22.41%低于免疫检测率39.66%。179521212121222,.)()(cbcb37注意事项McNemar检验只会利用非主对角线单元格上的信息,即它只关心两者不一致的评价情况,用于比较两个评价者间存在怎样的倾向。因此,对于一致性较好的大样本数据,McNemar检验可能会失去实用价值。例如对1万个案例进行一致性评价,9995个都是完
本文标题:第07章卡方检验(正式)
链接地址:https://www.777doc.com/doc-2152795 .html