您好,欢迎访问三七文档
当前位置:首页 > 金融/证券 > 综合/其它 > 6.卡方检验,秩和检验
2检验Chi-squaretest2检验(Chi-squaretest)是现代统计学的创始人之一,英国人K.Pearson(1857-1936)于1900年提出的一种具有广泛用途的统计方法,可用于两个或多个率间的比较,计数资料的关联度分析,拟合优度检验等等。目的:推断两个总体率或构成比之间有无差别推断多个总体率或构成比之间有无差别多个样本率比较的分割和趋势检验两个分类变量之间有无关联性频数分布拟合优度的检验检验统计量:应用:计数资料2处理组发生数未发生数合计甲aba+b乙cdc+d合计a+cb+dn四格表资料的基本形式一、卡方检验的基本思想疗法死亡生存合计病死率(%)盐酸苯乙双胍26(a)178(b)204(a+b)12.75(p1)安慰剂合计2(c)62(d)64(c+d)3.13(p2)28(a+c.)240(b+d.)268(a+b+c+d=n)10.45(pc)表1两种疗法治疗心血管疾病的病死率比较P1≠P2H0:π1=π2H1:π1≠π2疗法死亡生存合计病死率(%)盐酸苯乙双胍26(a)178(b)204(a+b)12.75(p1)安慰剂合计2(c)62(d)64(c+d)3.13(p2)28(a+c.)240(b+d.)268(a+b+c+d=n)10.45(pc)nnncolumnrowTCR总例数合计列合计行)()(表1两种疗法治疗心血管疾病的病死率比较•实际频数A(actualfrequency)(a、b、c、d)•理论频数T(theoreticalfrequency)(H0:π1=π2=π≈Pc):•a的T11=(a+b)×pc=(a+b)×[(a+c)/n]=nRnC/n=21.3•b的T12=(a+b)×(1-pc)=(a+b)×[(b+d)/n]=nRnC/n=182.7•c的T21=(c+d)×pc=(c+d)×[(a+c)/n]=nRnC/n=6.7•d的T22=(c+d)×(1-pc)=(c+d)×[(b+d)/n]=nRnC/n=57.3通过构造A与T吻合程度的统计量来反映两样本率的差别!26178262实际数A理论数T21.3182.76.757.3各种情形下,理论与实际偏离的总和即为卡方值(chi-squarevalue),它服从自由度为ν的卡方分布。(1)分布是一种连续型分布:按分布的密度函数可给出自由度=1,2,3,……的一簇分布曲线。(2)分布的一个基本性质是可加性:如果两个独立的随机变量X1和X2分别服从自由度ν1和ν2的分布,即,那么它们的和(X1+X2)服从自由度(ν1+ν2)的分布,即~。22122212~,~XX212()XX(3)2界值:当确定后,2分布曲线下右侧尾部的面积为时,横轴上相应的2值,记作2,(见附表7)。2值愈大,P值愈小;反之,2值愈小,P值愈大。12200.10.20.30.40.502468101214162()f216102/)12/(2222)2/(21)(ef卡方表给出了自由度取不同值时,分布单侧尾部面积的界值,它满足条件根据的定义,当自由度时,分布的界值为标准正态分布界值的平方,即四格表的双侧z检验与检验等价22,22,()P01122二、2检验的基本公式)1)(1()(22CRTTA上述基本公式由Pearson提出,因此软件上常称这种检验为Pearson卡方检验,下面将要介绍的其他卡方检验公式都是在此基础上发展起来的。它不仅适用于四格表资料,也适用于其它的“行×列表”。式中,A为实际频数(actualfrequency),T为理论频数(theoreticalfrequency)。检验统计量值反映了实际频数与理论频数的吻合程度。若检验假设H0:π1=π2成立,四个格子的实际频数A与理论频数T相差不应该很大,即统计量不应该很大。如果值很大,即相对应的P值很小,若P<α,则反过来推断A与T相差太大,超出了抽样误差允许的范围,从而怀疑H0的正确性,继而拒绝H0,接受其对立假设H1,即π1≠π2。222由公式还可以看出:值的大小还取决于个数的多少(严格地说是自由度ν的大小)。由于各皆是正值,故自由度ν愈大,值也会愈大;所以只有考虑了自由度ν的影响,值才能正确地反映实际频数A和理论频数T的吻合程度。检验的自由度取决于可以自由取值的格子数目,而不是样本含量n。四格表资料只有两行两列,=1,即在周边合计数固定的情况下,4个基本数据当中只有一个可以自由取值。22()ATT2()ATT222(1)建立检验假设:假设两总体率相等H0:两种疗法病死率相同,即π1=π2;H1:两种疗法有病死率不同,即π1≠π2;α=0.05。χ2检验的步骤疗法死亡生存合计病死率(%)盐酸苯乙双胍26(21.3)178(182.7)204(a+b)12.75(p1)安慰剂2(6.7)62(57.3)64(c+d)3.13(p2)合计28(a+c.)240(b+d.)268(a+b+c+d=n)10.45(pc)表1两种疗法治疗心血管疾病的病死率比较(2)计算检验统计量:实际数与理论数的差值服从χ2分布自由度为1的2分布界值0.00.10.20.30.40.53.840.05(3)查2分布界值表确定P值并作出推论按=(2-1)×(2-1)=1查附表3,2界值表,得P<0.05,差异有统计学意义,按=0.05水准拒绝H0,可以认为两组治疗方案的总体病死率不同。为了不计算理论频数T,可由基本公式推导出,直接由各格子的实际频数(a、b、c、d)计算卡方值的公式:(四格表专用公式)基本公式:;1))()()(()())(())(())(())(())(())(()(222222dbcadcbanbcaddcbadbdcdcbadbdcddcbadbbadcbadbbabdcbacabadcbacabaaTTA三、四格表专用公式2(1)~u2=2.19492=4.82(n40,所有T5时)四、连续性校正公式2分布是连续性分布,而四格表资料属分类资料,不连续;计算所得偏大,对应概率P偏小,增加了I类错误概率。⑴当n≥40,且T≥5时,用前述基本公式⑵当n≥40,而1≤T<5时,用连续性校正公式(3)当n<40,或T<1时,用Fisher精确检验(Fisherexacttest)校正公式:TTAc22)5.0())()()(()2/(22dbcadcbannbcadc连续性校正仅用于的四格表资料,当时(多行多列),一般不作校正。2122治疗方法有效无效合计有效率(%)高压氧组66(62.8)4(7.2)7094.3常规组38(41.2)8(4.8)4682.6合计1041211689.7例将116例癫痫患者随机分为两组,一组70例接受常规加高压氧治疗(高压氧组),另一组46例接受常规治疗(常规组),治疗结果见表。问两种疗法的有效率有无差别?012112:,:,0.05HH本例,故用四格表资料检验的校正公式22116,4.8nT但2,查界值表得。按检验水准不拒绝,尚不能认为组有效率不等。1210.005.0P05.00H2(6684381162)11622.92704610412c本资料若不校正时,结论与之相反。24.080.05P,五、四格表的确切概率检验法在四格表χ2检验中,若n40,或有理论频数T1,采用Fisher确切概率法。六、配对四格表资料的χ2检验配对设计表两种药物的毒理实验结果甲药物乙药物合计死亡(+)生存(-)死亡(+)6(a)12(b)18生存(-)3(c)18(d)21合计93039成组设计(完全随机设计)表两种药物的毒理实验结果分组死亡(+)生存(-)合计甲药物(a)(b)乙药物(c)(d)合计78对子号甲药物乙药物1死亡死亡2死亡生存………39生存生存编号药物结果1甲死亡2乙生存………78甲生存(+,)和(,+)两个格子中的理论频数均为2cb40cb时2)2(2)2()(2222cbcbccbcbbTTAcbcb2)(~2分布同理可得40cb时校正公式:cbcbTTA222)1|(|)5.0|(|配对四格表资料的χ2检验也称McNemar检验(McNemar'stest)1,27.4312)1312(22,4015采用连续性校正本例cb05.0;84.321,05.02PH0:B=C,两种药物的致死率相同;H1:B≠C,两种药物的致死率不同;α=0.05。两个例子1.把已确诊的乳腺癌患者120名随机分为两组,每组60人。分别用两种方法分别检查。甲法的检出率为60%,乙法检出率为50%。问:两种方法何者为优?2.分别用两种方法检查已确诊的乳腺癌患者120名。甲法的检出率为60%,乙法检出率为50%,甲乙两法阳性一致的检出率为35%。问:两种方法何者为优?七、行×列(R×C)表资料的χ2检验前述四格表,即2×2表,是最简单的一种R×C表形式。因为其基本数据有R行C列,故通称行×列表或R×C列联表(contingencytable),简称R×C表。R×C表的资料形式有:1.多个样本率的比较2.多组构成比的比较R×C表的χ2检验通用公式nnnTCR总例数列合计行合计理论频数代入基本公式可推导出:基本公式通用公式)1()(2222CRnnAnTTA自由度=(行数1)(列数1)1.多个样本率的比较例:用三种不同治疗方法治疗慢性支气管炎的疗效如表3,试比较三种治疗方法治疗慢性支气管炎的疗效。表3三种不同治疗方法治疗慢性支气管炎的疗效组别有效无效合计有效率%A药组3554087.50B药组20103066.67C药组7253221.88合计624010260.78卡方检验的步骤:1.建立检验假设:假设两总体率相等H0:三种治疗方法的疗效相同,即1=2=3;H1:1,2,3不全相等;α=0.05。2.计算统计量:3.确定P值,下结论查卡方界值表,,p0.05,差异有统计学意义。按α=0.05拒绝H0,可认为三种药物的治疗效果不全相同。32.741-043225...404056240351022222)(99.532.745.99220.05,,2)12()13(2.多个构成比的比较例某研究人员收集了亚洲、欧洲和北美洲的A、B、AB、O血型资料,结果见表4,其目的是研究不同地区的人群血型分类构成比是否一样R×C表的计算举例地区ABABO合计亚洲321369952951080欧洲2584322194517北美洲40810637444995合计9875181549332592表4三个不同地区血型样本的频数分布12.596)14()13(56.297)199399544451810803699871080321(2592260.052222,3.多个样本率(构成比)的两两比较若多个样本率(构成比)间直接用四格表χ2检验多重比较,会增加I类错误概率,1-(1-α)n故采用矫正α’(1)多个实验组两两比较,,k为组数(2)多个实验组与同一对照组比较,(3)插值法估计α’对应的界值R×C表χ2检验的应用注意事项1.对R×C表,若较多格子(1/5)的理论频数小于5或有一个格子的理论频数小于1,则易犯第一类错误。出现某些格子中理论频数过小时怎么办?(1)增大样本含量(最好)(2)删去该格所在的行或列(丢失信息)(3)根据专业知
本文标题:6.卡方检验,秩和检验
链接地址:https://www.777doc.com/doc-3241104 .html