您好,欢迎访问三七文档
第八章χ2检验(ChiSquareTest)宁波大学医学院沈其君检验的适用范围:一种用途十分广泛(计数资料,等组资料)的假设检验方法,常用于:两个率的比较四格表资料的χ2检验多个率比较两组或多组构成比的比较行列表χ2检验两事物关联性检验配对设计计数资料的检验配对四格表资料χ2检验2第一节四格表资料的χ2检验目的:推断两个总体率(构成比)是否有差别要求:两样本的两分类个体数排列成四格表资料例8.1为了解某中药治疗原发性高血压的疗效,将70名高血压患者随机分为两组。试验组用该药加辅助治疗,对照组用安慰剂加辅助治疗,观察结果如表8-1,问该药治疗原发性高血压是否有效?一、什么叫四格表资料组别有效无效合计有效率(%)对照组20(25.8)a24(18.2)b44)(ba45.45试验组21(15.2)c5(10.8)d26)(dc80.77合计41)(ca29)(db70)(n58.57表8-1两种疗法治疗原发性高血压的疗效为什么叫四格表资料?什么叫四格资料处理组发生数未发生数合计甲aba+b乙cdc+d合计a+cb+dn四格表资料的基本形式两组比较两种对立结果组成四个格子的表二、四格表资料的χ2检验的基本思想与步骤1。建立检验假设,确定检验水平。H0:π1=π2即试验组与对照组的总体有效率相等H1:π1≠π2即试验组与对照组的总体有效率不等α=0.05。二、四格表资料的χ2检验的基本思想与步骤1、计算理论数T在H0:π1=π2条件下理论上可以计算出两组的有效数和无效人数。总体率π可以用两组样本的合并率来估计,41/70=58.57%•T11=44(41/70)=25.8•T12=44-25.8=18.2•T21=26(41/70)=15.2•T22=26-15.2=10.83.构建实际频数A与理论频数T的吻合程度的统计量•若检验假设H0:π1=π2成立,四个格子的实际频数A与理论频数T间较为接近,由于抽样误差使T与A会有差别,但相差不应该很大,如何构建A与T吻合程度的统计量•(A-T)•(A-T)222(),ATT这一统计量近似服从2分布当自由度确定后,2分布曲线下右侧尾部的面积为时,横轴上相应的2值记作2,0.00.10.20.30.40.50369121518卡方值纵高自由度=1自由度=2自由度=3自由度=6不同自由度的2分布计算检验统计量值222222(2025.8)(2418.2)(2115.2)(510.8)8.4025.818.215.210.81)12)(12(检验统计量χ2值反映了实际频数与理论频数的吻合程度。若检验假设H0:π1=π2成立,四个格子的实际频数A与理论频数T相差不应该很大,即统计量χ2不应该很大。如果χ2值很大,即相对应的P值很小,若P≤α,则反过来推断A与T相差太大,超出了抽样误差允许的范围,从而怀疑H0的正确性,继而拒绝H0,接受其对立假设H1,即π1≠π2。4.确定P值,作出结论•确定自由度•本例=(2-1)(2-1)=1•将χ2值与作比较,确定P值()(1)行数-1列数22,0.05,13.84220.05,18.403.84,0.05PP<0.005,按α=0.05水准,拒绝H0,接受H1,可以认为两组治疗原发性高血压的总体有效率不等,即可认为该中药治疗原发性高血压有效。三、四格表资料2检验的几种形式1、定义公式和专用公式n≥40,T≥522()()()()()adbcnabacbdcd22(2052421)708.404426412922(),ATTχ2分布是一连续型分布,而四格表资料属离散型分布,由此计算得的χ2统计量的抽样分布亦呈离散性质。为改善χ2统计量分布的连续性,则需行连续性校正(correctionforcontinuity)。Χ2连续性校正仅用于ν=1的四格表资料,当ν≥2时,一般不作校正。2.四格表资料检验的校正公式22(0.5)cATT22()2()()()()cn|ad-bc|-n=a+bc+da+cb+d40,15nTA:实际频数(actualfrequency)T:理论频数(theoreticalfrequency)TRC:第R行C列的理论频数nR:相应的行合计,nC:相应的列合计RCRCnnTn四格表资料χ2检验公式的选择:40,5nT,专用公式;,校正公式;,直接计算概率。40,15nT401nT或例8.2某医学院抽样调查大学四年级和五年级学生近视眼患病情况,四年级学生的近视率为7.14%,五年级学生的近视率为35.71%,调查结果见表8-2。问该大学四年级与五年级学生的近视眼患病率是否不同?表8-2两个年级大学生的近视眼患病率比较年级近视非近视合计近视率(%)四年级2(4.67)26(23.33)287.14五年级5(2.33)9(11.67)1435.71合计7354216.672242(|29265|)4223.62(25)(269)(226)(59)cP>0.005,按α=0.05水准,不拒绝H0,还不能认为四年级与五年级学生近视眼患病率不等。本资料若不校正时,结论与之相反。25.4905.0P条件:理论依据:超几何分布。40n,或1T,或P时,四、四格表资料的Fisher确切概率法基本思想在四格表周边合计数固定不变的条件下,计算表内4个实际频数变动时的各种组合之概率Pi;再按检验假设用单侧或双侧的累计概率P,依据所取的检验水准α做出推断。各组合概率Pi的计算在四格表周边合计数不变的条件下,表内4个实际频数a,b,c,d变动的组合数共有“周边合计中最小数+1”个。如例8.3,表内4个实际频数变动的组合数共有8+1=9个,见表8-4。各组合的概率Pi服从超几何分布,其和为1。()()!()!()!!!!!!iabcdacbdPabcdn!表8-3两种疗法对腰椎间盘脱出症的疗效疗法治愈未治愈合计治愈率(%)新疗法72977.78保守疗法26825.00合计981752.94例8.3将17名腰椎间盘脱出症患者随机分到两组,分别用两种方法治疗,结果见表8-3,问两种疗法的疗效是否不同?表8-4各种组合的四格表计算的概率四格表序号治愈未治愈a-TaP11880-3.760.00037022771-2.760.01184733662-1.760.09675044553-0.760.290251554440.240.362814663351.240.1935017*72262.24*0.041464*881173.240.002962990084.240.000041*:为实际四格表二、检验步骤(本例n=1740)0H:21,1H:21,05.0计算表内四个格子数据的各种组合的概率Pi(表8-4)本例(a-T)*=2.24,P*=0.041464确定累计概率值1.双侧检验P=P(1)+P(2)+P(7)+P(8)+P(9)=0.0572.单侧检验P=P(7)+P(8)+P(9)=0.044第二节配对四格表资料的χ2检验与计量资料推断两总体均数是否有差别有成组设计和配对设计一样,计数资料推断两个总体率(构成比)是否有差别也有成组设计和配对设计,即四格表资料和配对四格表资料。例8.4现有198份痰标本,每份标本分别用A、B两种培养基培养结核菌,结果见表8-5。问A、B两种培养基的阳性培养率是否不等?编号12197198配对四格表资料的特点:两法四种结果上述配对设计实验中,就每个对子而言,两种处理的结果不外乎有四种可能:①A、B两种检测方法皆为阳性数(a);②A、B两种检测方法皆为阴性数(d);③A法为阳性、B法为阴性数(b);④A法为阴性、B法为阳性数(c)。其中,a,d为两法观察结果一致的两种情况,b,c为两法观察结果不一致的两种情况。cbcb22)(,1cbcbc22)1(,1=检验统计量(McNemartest)0:HBC在的条件下,估计b和c的理论频数,构建理论频数与实际频数吻合度统计量,经变换后得:注意:本法一般用于样本含量不太大的资料。因为它仅考虑了两法结果不一致的两种情况(b,c),而未考虑样本含量n和两法结果一致的两种情况(a,d)。所以,当n很大且a与d的数值很大(即两法的一致率较高),b与c的数值相对较小时,即便是检验结果有统计学意义,其实际意义往往也不大。0H:CB,1H:CB,05.0检验步骤:22(2420)0.3624201P0.05.按α=0.05水准,不拒绝H0。尚不能认为两种培养基的阳性培养率不同。第三节行×列表资料的χ2检验问题提出与行×列表资料概念①多个样本率比较时,有R行2列,称为R×2表;②两个样本的构成比比较时,有2行C列,称2×C表;③多个样本的构成比比较,有R行C列,称为R×C表。行数或者列数大于2列联表资料称为行×表资料或称R×C表资料表8-63种方案治疗肝炎的疗效组别有效无效合计有效率(%)西药组514910051.00中药组35458043.75中西药结合组59157479.73合计14510925457.09表8-7三个不同地区血型样本的频数分布地区ABABO合计亚洲321369952951080欧洲2584322194517北美洲40810637444995合计9875181549332592检验统计量22(1)(1)(1)RCAnnn行数列数TTA22)(多个样本率的比较表8-63种方案治疗肝炎的疗效组别有效无效合计有效率(%)西药组514910051.00中药组35458043.75中西药结合组59157479.73合计14510925457.09例8.5某医院用3种方案治疗急性无黄疸型病毒肝炎254例,观察结果见表8-6,问3种疗法的有效率是否不同。检验步骤:H0:3种治疗方案的有效率相等H1:3种治疗方案的有效率不全相等α=0.05)110974151457459109804514580351091004914510051(2542222222)10279.03244.02322.01056.02203.01794.0(25481.22υ=(3-1)(2-1)=2P0.05(P0.01),在α=0.05的检验水准下,拒绝H0,接受H1,可以认为三种疗法的有效率有差别。2222220.05,20.01,20.05,20.01,25.99,9.21,22.81,22.81查=样本构成比的比较例8.6某研究人员收集了亚洲、欧洲和北美洲人的A、B、AB、O血型资料,结果见表8-7,问不同地区人群ABO血型分类构成比是否不同。表8-7三个不同地区血型样本的频数分布地区ABABO合计亚洲321369952951080欧洲2584322194517北美洲40810637444995合计9875181549332592检验步骤H0:不同地区人群血型分布总体构成比相同H1:不同地区人群血型分布总体构成比不全相同α=0.0522223213694442592(1)297.3898710805181080933995(31)(41)6P0.05,在α=0.05检验水准下,拒绝H0,认为三个不同地区的人群血型分布总体构成比有差别。2220.01,60.01,616.81,297.3816.81查χ2分割法(partitionsofχ2method)Scheffe’可信区间法SNK法多个样本率间的多重比较行×列表的分割重新规定检验水准:I型错误的概率不变。检验水准的估计方法:根据分析目的1.多个实验组间的两两比较2)1(2
本文标题:统计学 卡方检验
链接地址:https://www.777doc.com/doc-3738907 .html