您好,欢迎访问三七文档
当前位置:首页 > 临时分类 > 分类变量资料的统计推断
第二节分类变量资料的统计推断三、χ2检验(chi-squaretest)推断两个总体率或构成比之间有无差别;推断多个总体率或构成比之间有无差别;配对资料比较的χ2检验推断两个分类变量之间有无关联性以及频数分布的拟和优度检验。㈠χ2检验的基本思想A、B两种疗法的疗效比较设H0:π1=π2,H1:π1≠π2,α=0.05若H0成立,两组合计治愈率=20.0%未治愈率=80.0%疗法治愈人数未愈人数合计治愈率(%)A11(20)89(80)10011.0B31(22)79(88)11028.0合计4216821020.0理论上:A组治愈例数为100(42/210)=20未愈例数为100(168/210)=80B组治愈例数为110(42/210)=22未愈例数为110(168/210)=88A为实际频数(actualfrequency)T为理论频数(theoreticalfrequency)TTA22nnnTCRRC11CRχ2检验的基本思想χ2值反映了实际频数与理论频数的吻合程度,若检验假设H0成立,实际频数与理论频数的差值会小,则χ2值也会小;反之,若H0不成立,实际频数与理论频数的差值会大,则χ2值也会大;χ2值大到超过某个界值时,则拒绝H0,接受H1。但因χ2值大小还取决于自由度的大小,因此,根据样本计算得到的χ2值应与比较,当χ2≥时,P≤α,则拒绝H0,接受H1;当χ2<时,P>α,则不拒绝H0。2,2,2,㈡四格表资料的χ2检验χ2检验基本公式四格表资料χ2检验专用公式应用条件:n≥40且所有T≥5dbcadcbanbcad22TTA22四格表资料χ2检验的校正公式应用条件:n≥40但有1≤T<5四格表Fisher确切概率法:应用条件:n<40,或T<1TTA225.0dbcadcbannbcad222H0:π1=π2,H1:π1≠π2,α=0.0566.922TTA66.942168110100210)89317911(222dbcadcbanbcad=(2-1)(2-1)=1,查χ2界值表得χ2,得P0.005。按α=0.05水准,拒绝H0,接受H1,差异有统计学意义。B疗法治愈率高于A疗法。11CR88.721,005.021,005.0两种药物对小儿单纯性消化不良的疗效比较药物有效无效合计有效率(%)甲26(28.28)7(4.18)3378.7乙36(33.18)2(4.67)3897.4合计6297187.375.25.022TTA75.2962383371)271367226(2222dbcadcbannbcad㈢配对四格表资料的χ2检验配对四格表资料的基本结构b+c≥40ν=1b+c<40ν=1甲法乙法合计+-+aba+b-cdc+d合计a+cb+dncbcb22cbcb221表4-3两种方法的检测结果甲试剂乙试剂合计+-+801090-311142合计11121132H0:B=C,H1:B≠C,α=0.05ν=1,χ2>,P<0.005。按α=0.05水准,拒绝H0,接受H1,认为甲乙两种试剂的检出率不同,乙试剂高于甲试剂。76.103110)3110(222cbcb88.721,005.0㈣行×列表资料的χ2检验①多个样本率比较时,有R行2列,称为R×2表;②两个样本的构成比比较时,有2行C列,称为2×C表;③多个样本的构成比比较,有R行C列,称为R×C表。行×列表资料χ2检验的用途①多个样本率比较②两个或多个构成比比较③双向无序分类资料的关联性检验行×列表资料χ2检验公式TTA22122CRnnAn11列数行数基本公式专用公式•例8.5某医院将急性病毒性肝炎254例随机分为三组,分别用三种方案治疗,结果见表。问三种疗法的有效率是否相同?表8-8三种方案治疗肝炎的有效率比较组别有效无效合计有效率(%)西药514910051.00中药35458043.75中西医结合59157479.73合计14510925457.09H0:π1=π2=π3H1:π1、π2、π3不等或不全等α=0.0581.22110974151091004914510051254222221213查χ2界值表得P<0.005,按α=0.05水准,拒绝H0,接受H1,差异有统计学意义,可认为三种疗法治疗慢性支气管炎的有效率有差别。60.1021,005.0•例8.6某研究人员收集了亚洲、欧洲和北美洲人的ABO血型资料,结果见表。问不同地区人群ABO血型分类构成比是否相同?表8.7三个地区人群的血型构成比较地区ABABO合计亚洲321369952951080欧洲2584322194517北美洲40810637444995合计9875181549332592H0:三个不同人群血型构成的总体构成比相同H1:三个不同人群血型构成的总体构成比不同或不全相同α=0.0538.2971995933444108051836910809873212592222261413•查χ2界值表得P<0.005,按α=0.05水准,拒绝H0,接受H1,差异有统计学意义,可认为三个不同人群血型构成的总体构成比不同或不全相同.55.1826,005.0行×列表资料χ2检验注意事项⒈行×列表中各格的理论频数不应小于1,并且1≤T<5的格子数不宜超过1/5。出现上述情况时,可以:①最好是增加样本含量,使T增大;②根据专业知识,考虑能否删去T太小的行或列,或将T太小的行或列与性质相近的邻行或邻列合并;③改用Fisher确切概率法。行×列表资料χ2检验注意事项⒉多个样本率比较,若所得统计推断结论为拒绝H0,接受H1,只能认为各总体率之间总的有差别,要推断两两之间的差别,应进一步做多个样本率的多重比较如:χ2分割法和bonferroni法。⒊χ2检验并不是适用于所有的行×列表资料。R×C表的分类及其检验方法的选择⒈双向无序R×C表①若研究目的为了比较多个样本率(或多个构成比),可用χ2检验。②若研究目的为分析两个变量之间有无关联及其关联的密切程度,可用χ2检验以及Pearson列联系数。⒉单向有序R×C表①分组变量有序(如年龄),而指标变量无序(如某种传染病的类型),研究目的是比较不同年龄间构成情况有无区别,可用χ2检验。②分组变量无序(如疗法),而指标变量有序(如疗效按等级分组),研究目的是比较不同疗法的疗效,宜用非参数检验。表8.8三组重症肝炎患者疗效比较组别治愈有效无效死亡合计A组19514921140B组17354510107C组2859155107合计6414510936354⒊双向有序属性相同的R×C表表8.9两种方法检查心室壁收缩运动测定结果的符合情况研究目的是要考察两种测定方法的测定结果之间是否具有一致性,应采用Kappa检验。对比法冠心病人数核素法:正常减弱异常合计正常582363减弱142750异常891734合计675327147表8.10年龄与冠状动脉硬化的关系年龄(岁)冠状动脉硬化等级(Y)合计-++++++20~7022429830~2724936340~16231375950~920151458合计122894126278若研究目的是分析两有序分类变量间是否存在线性变化趋势,宜选用有序分组资料的线性趋势检验。小结卡方检验的应用:⑴四格表资料的卡方检验⑵配对计数资料的卡方检验⑶行×列表资料的卡方检验
本文标题:分类变量资料的统计推断
链接地址:https://www.777doc.com/doc-8138840 .html