您好,欢迎访问三七文档
在前一章中我们介绍了计数资料的u检验,用以推断两个率是否相等。χ2检验用以检验多个率(或构成比)之间差异是否具有显著性,当然也适合于两组比较。χ2检验χ2检验的用途:1.推断多个总体率之间有无差别2.推断几组总体构成比之间有无差别3.两个变量之间有无关联性4.频数分布的拟合优度检验第一节:四格表资料的χ2检验在医学资料中,常常需要比较两个样本率之间的差异有无显著性,如推断某人群男与女的某种疾病的患病率是否相等,即该病是否与性别有关。这类资料由4个数据构成:男与女的患病人数和未患病人数,统计学称这类资料为四格表资料。下面介绍四格表资料的χ2检验的几种计算一.通用公式法二.专用公式法三.四格表χ2值的校正公式四.精确概率法五.配对四格表资料的χ2检验一.通用公式法例1为了解铅中毒病人是否有尿棕色素增加现象,分别对病人组和对照组的尿液作尿棕色素定性检查,结果如下,问铅中毒病人和对照人群的尿棕色素阳性率有无差别?两组人群尿棕色素阳性率比较组别阳性数阴性数合计阳性率(%)铅中毒病人2973680.56对照组9283724.32合计38357352.05(1)建立检验假设和确定检验水准H0:两种方法总体阳性率相同,即π1=π2H1:两种方法总体阳性率不相同,即π1≠π2检验水准α=0.05(2)计算检验统计量iiiTTA22其中为Ai实际频数,Ti为理论频数,nR是行和,nC是列和,n是四格数之和。理论频数是在H0成立的条件下每个格子理论上的数据。若H0成立,则合计的消除率为38/73=52.05%,则铅中毒病人理论上应有36*38/73=18.74人呈阳性。组别阳性阴性合计阳性率(%)铅中毒病人2973680.56对照组9283724.32合计38357352.05理论频数T11=36*38/73=18.74T12=17.26T21=19.26T22=17.74χ2=23.12自由度ν=(R-1)(C-1)=1(3)确定p值自由度ν=(R-1)(C-1)=1查χ2界值表得P0.005(4)推断按α=0.05拒绝H0,认为两种方法总体阳性率不相同。二.专用公式法以上计算χ2统计量的公式对任意行×列表都适合,而对于四格表资料,可以用其简化公式χ2=例1(续)dbcadcbanbcad2)(12.233538373673)972829(22三.四格表χ2值的校正一.由于χ2界值表是由连续分布:χ2分布计算出来的,但原始数据属计数资料是离散的,由此计算出来的χ2值也是离散的,特别是四格表,有时若不校正,所求χ2值偏大,所得概率p值偏低。二.①n≥40,且T≥5时,用未校正的χ2值②1≤T5,且n≥40时,宜用校正χ2值或用精确概率计算法③T1或n40时,宜用精确概率计算法三.校正公式dbcadcbannbcad2/22TTA5.022例2某矿石粉厂当生产一种矿石粉石时,在数天内即有部分工人患职业性皮肤炎,在生产季节开始,随机抽取15名车间工人穿上新防护服,其余仍穿原用的防护服,生产进行一个月后,检查两组工人的皮肤炎患病率,结果如下:穿新旧两种防护服工人的皮肤炎患病率比较防护服种类阳性例数阴性例数合计患病率新114156.7旧10182835.7合计11324325.6问两组工人的皮肤炎患病率有无差别?H0:两组工人的皮肤炎患病率无差别,即π1=π2H1:两组工人的皮肤炎患病率有差别,即π1≠π2最小的理论频数T11=15*11/43=3.84,1T115且n=4340,所以宜用χ2值的校正公式χ2=2.94查χ2界值表得0.10p0.05,按α=0.05水平不拒绝H0,尚不能认为穿不同防护服的皮肤炎患病率有差别。若不校正,χ2=4.33p0.05四.确切概率法(Fisher’sexactprobability)例3在某牧区观察慢性布鲁氏病患者植物血凝素皮肤试验反应,资料如下,问活动型与稳定型布氏患者反应阳性率有无差别?H0:两型阳性率相等,即π1=π2H1:两型阳性率不等,即π1≠π2在将原四格表周边数字(行和与列和)不变的情况下,变动a值,以得到不同情况:计算每种情况下的|P1-P2|和p(i)值,p(i)值按下列公式来计算:p为|P1-P2|大于等于原来表中的|P1-P2|值(0.233)的情况下的p(i)的和,即p=p(0)+p(1)+p(4)=0.2668五.配对资料的χ2检验在前面已介绍了配对设计的t检验,配对设计的t检验是对于计量资料(观察值),将两种处理分别施于条件相同的两个受试对象,或施于同一受试对象某种处理前后某指标的变化,比较两总体均数的差异。若是对于计数资料,我们用配对资料的χ2检验(McNemar检验)。例用两种检验方法对某食品作沙门氏菌检验,结果如下,试比较两种方法的阳性结果是否有差别?配对设计两种方法结果比较荧光抗体法常规培养法合计+-+160(a)26(b)186-5(c)48(d)53合计16574239分析:我们可以用上节的方法计算χ2值来判断两种处理的结果有无相关关系(有无联系)但是我们现在的目的是比较两法结果的差异,如果将两法的阳性率186/239与165/239作比较(用前节方法)是不正确的,因为理论频数是在两法结果相互独立假设下推算出来的,χ2=相关19.1137416553186239526481602+-合计荧光抗体法18653239常规培养法16574239合计351127478比较两法结果有无差别,要着眼于两法结果不一致的部分。H0:总体B=C检验统计量当b+c≥40时χ2=当b+c40时χ2=ν=1样本例数较少时还可以用精确概率法,原理同配对设计的符号检验。cbcb2cbcb1||2H0:甲法阳性乙法性例数与甲法阴性乙法阳性例数相同,即总体B=CH1:总体B≠Cα=0.05χ2=12.90查χ2界值表p0.005,拒绝H0,认为两法检验结果不一样,荧光抗体法阳性结果高于常规培养法。第二节:行×列表的χ2检验前面介绍的四格表只有2行2列,只能对2个率或2类构成比作出比较。在医学研究中有时要比较几个率,如:要比较某市重污染区、一般市区和农村三个地区的出生婴儿的致畸率。有时要分析几组多类构成的构成比是否相同,如:以母乳、牛乳、混合三种不同方式喂养的新生儿体重增长的构成是否一致。有时要推断2个分类变量是否有关联,如:研究冠心病与眼底动脉硬化的关系。行×列表的χ2值计算χ2==ν=(R-1)(C-1)TTA212nnACRn1.多个率比较例3研究复方哌唑嗪对高血压病治疗效果的临床试验并与复方降压片和安慰剂作对照,结果如下表,问三种药物效果有无差别?三种药物治疗高血压病的有效率比较组别有效无效合计有效率%复方哌唑嗪3554087.50复方降压片20103066.67安慰剂7253221.88合计624010260.78H0:三种药物的总体有效率相同,即π1=π2=π3H1:π1π2π3不全相等α=0.05χ2=ν=2查χ2界值表得p0.00574.3213240326230406230404062401022571020535222222按α=0.05水平拒绝H0,认为三种药物的治疗效果不全相同。例41979年某地爆发松毛虫病,333例患者按年龄以14岁为界分成2组,资料如表,试考察两组病人病变类型的构成比有无差别?某地两组松毛虫病患者型别构成比较年龄分组皮炎型骨关节炎型软组织炎型混合型合计儿童组50481872188成人组10510723145合计155582595333H0:两组患者中患各型松毛虫病的构成比相同H1:两组患者中患各型松毛虫病的构成比不同α=0.05χ2=70.14查表得p0.005,拒绝H0,认为两组患者中患各型松毛虫病的构成比不同。2.多个构成比比较3.双向有序且属性不同的分类资料的关联性检验例6某矿工医院探讨矽肺不同期次患者的胸部平片密度变化,492例患者资料整理如下,问矽肺患者肺门密度的增加与期次有无差别?H0:矽肺期次与肺门密度级别无关,即各期矽肺构成比相同且各级肺门密度构成比相同H1:矽肺期次与肺门密度级别有关α=0.05χ2=163.01ν=4查表得p0.005,拒绝H0,认为矽肺期次与肺门密度级别有关。1.行×列表的χ2检验要求理论频数不宜太小,要求不宜有1/5以上的格子的理论频数小于5,或有一个理论频数小于1。2.如果以上条件不能满足,可采用:l增加样本含量l删去某行或某列l合理地合并部分行或列l用精确概率法3.多个率或构成比比较的χ2检验,结论为拒绝H0时,仅表示几组有差别,并非任2组之间都有差别。若要了解之,可进行χ2表的分割。注意事项行×列表的分割例3(续)哌唑嗪组与降压片组的有效率接近,将此2组合并,得到2个分割表:分割表1分割表2组别有效无效计组别有效无效计哌唑嗪35540用药组551570降压片201030安慰剂72532合计551570合计6240102χ21=4.419χ22=29.615可以得出χ21+χ22=34.034约等于原来的χ2=32.74,两者不相等是由于分割表中理论频数的数值与总表中理论频数不同所致。即有结论,哌唑嗪、降压片与安慰剂的有效率均不相同。第五节频数分布拟合优度的χ2检验在医学实际工作中常需要考察一个样本的频数分布是否符合某种概率模型规定的理论分布,如果符合就可将它按该理论分布来处理。例8某地爆发流行细菌性痢疾,为了分析这次爆发流行是否存在家庭内成员间的传播,共调查了四口之家288户,数据如下,试检验能否用二项分布模型来拟合这一组实际资料。分析:如果能够拟合,表明家庭成员发病与否是独立、等概率的。H0:此次流行不存在家庭内成员间的传播估计二项分布的总体率π:π=发病总人数/调查总人数=0.18576χ2=81.00ν=4-1=3,查表得p0.05拒绝H0,认为本次调查的四口之家内发病人数的分布不符合二项分布,此次流行可能存在家庭成员间的传播。第六节高维列联表资料的统计分析例9为研究心肌梗塞与近期使用避孕药之间的关系,采用病例—对照研究方法调查了234名心肌梗塞病人与1742名对照者使用口服避孕药情况,资料如下:试在排除了年龄因素影响后,分析口服避孕药与否对是否患心肌梗塞病的影响情况。分析:各年龄组发病的比例是不等的,直接用简单合并栏的四格表资料计算不合理。也不可将每个年龄组的数据分别进行检验,然后将其结论综合,这样做往往会因为每个四格表的频数都很小,不宜得出显著性。服药与不服药发病的比数比OROR的分子=4×224/292+9×390/444+4/330/393+6×362/442+6×301/405=23.706OR的分母=2×62/292+12×33/444+33×26/393+65×9/442+93×5/394=5.971OR=3.97χ2MH的分子=314.514χ2MH的分母=9.058χ2MH=34.723p0.01说明口服避孕药者患患心肌梗塞的危险性显著地高于不服此药者。第七节趋势性χ2检验当暴露水平按多个等级分类时,经常需要检验是否存在剂量-反应关系,即随着暴露水平的升高,阳性率是否有增加或减少的趋势。例一项心肌梗塞发生前饮酒的病例-对照研究结果如下,试分析每日饮酒量与心肌梗塞发生之间是否存在剂量反应关系。心肌梗塞患者及对照者的每日饮酒量每日饮酒量(ml)饮酒量的等级病例数对照数001361100-1001202238100-20024246200+31124调查总数391418STATISTICSFORTABLEOFIBYJCochran-ArmitageTrendTest---------------------------Statistic=2.736Prob(Right-sided)=0.003Prob(Two-sided)=0.00
本文标题:χ2检验
链接地址:https://www.777doc.com/doc-6788529 .html