您好,欢迎访问三七文档
金英良流行病学与卫生统计学教研室第八章检验2Chi-squareTest本章主要内容:第一节四格表检验第二节配对四格表检验第三节行×列表检验222分布2是一种连续型分布,可用于检验资料的实际频数和按检验假设计算的理论频数是否相符等问题。早在1875年,F.Helmet即得出来自正态总体的样本方差的分布服从卡方分布。1900年,K.Pearson也独立地从检验分布的拟合优度发现这一相同的卡方分布。KarlPearson(1857-1936)ν个相互独立的标准正态变量ui(i=1,2,…,ν)的平方和称为变量,即22222121...iuuuXu它的分布即为卡方分布,其自由度为υ。卡方分布02468100.00.10.20.3Χ2检验读作卡方检验,是一种用途广泛的统计方法,主要用于:检验两个(或多个)总体率或构成比之间是否有统计学意义,从而推断两个(或多个)总体率或构成比是否相同。χ2检验的用途检验实际频数(A)和理论频数(T)的差别是否由抽样误差所引起的,也就是由样本率(或样本构成比)来推断总体率(或总体构成比)。χ2检验的基本思想基本计算公式式中,A为实际频数(actualfrequency),T为理论频数(theoreticalfrequency)RCRCnnTnback例8.1为了解某中药治疗原发性高血压的疗效,将70名高血压患者随机分为两组,试验组用该药加辅助治疗,对照组用安慰剂加辅助治疗,观察结果见表8-1。问:该药治疗原发性高血压是否有效?表8-1两种药物治疗原发性高血压的疗效组别有效无效合计有效率(%)对照组20244445.45试验组2152680.77合计41297058.57表8-22×2表格式反应结果阳性阴性观察总频数阳性频率(%)样本1aba+bP1=a/(a+b)样本2cdc+dP2=c/(c+d)合计a+cb+da+b+c+d(a+c)/n1、建立检验假设并确定检验水准H0:π1=π2,即试验组与对照组的总体有效率相等H1:π1≠π2,即试验组与对照组的总体有效率不等α=0.052、计算检验统计量8.2570414411T2.1870294412T2.1570412621T8.1070292622T用基本公式计算卡方值:40.88.108.1052.152.15212.182.18248.258.252022222)()()()(22()()()()()adbcnabacbdcd四格表卡方检验的专用公式:13、查界值表,确定P值,做出推断结论自由度=1,Χ20.05(1)=3.84,Χ2Χ20.05(1),所以,P0.05,在α=0.05的检验水准下,拒绝H0,差异有统计学意义,也就是试验组与对照组的总体有效率不等.40.82941264470)2124520(22(四格表专用公式)基本公式:;1))()()(()())(())(())(())(())(())(()(222222dbcadcbanbcaddcbadbdcdcbadbdcddcbadbbadcbadbbabdcbacabadcbacabaaTTA推倒过程卡方分布是连续型的分布,卡方界值是由其分布计算而来的。而卡方检验用于分类资料比较时,原始数据是不连续的,用卡方界值表确定P值时可能存在误差。四格表资料中,当n≥40,有理论频数1≤T<5时,因为理论值太小,会导致χ2值变大,易出现假阳性结论。四格表χ2值的连续性校正22(0.5)cATT222()()()()()nc|ad-bc|-n=a+bc+da+cb+d连续性校正公式11四格表资料χ2公式的正确选择1)当n≥40,所有T≥5时,用专用公式或普通公式;2)当n≥40,但有理论频数1≤T<5时,用校正公式;3)n40或有T1,或P≈α时,用确切概率法。连续性校正仅用于的四格表资料,当时,一般不作校正。212例8.2某医学院抽样调查大学四年级和五年级学生近视眼患病情况,四年级学生的近视率为7.14%,五年级学生的近视率为35.71%,调查结果见下表,试问该大学四年级与五年级学生的近视眼患病率是否一样?年级近视非近视合计近视率(%)四年级226287.14五年级591435.71合计7354216.67表8-2两个年级大学生的近视眼患病率比较1、建立检验假设并确定检验水准H0:π1=π2,即四年级与五年级学生的近视眼患病率相同H1:π1≠π2,即四年级与五年级学生的近视眼患病率不同α=0.052、计算检验统计量62.3)95)(262)(926)(52(42)24252692(223、查界值表,确定P值,做出推断结论自由度=1,Χ20.05(1)=3.84,Χ2Χ20.05(1),所以,P0.05,在α=0.05的检验水准下,不拒绝H0,说明四年级与五年级学生近视眼患病率差别没有统计学意义,可认为尚未发现四年级与五年级学生近视眼患病率有显著性差异。22(29265)425.49(25)(269)(226)(59)若不采用校正公式:在α=0.05水准下,χ2χ20.05(1),则P0.05。back甲种属性乙种属性+-合计+aba+c-cdc+d合计a+cb+dn=a+b+c+d注意:a、b、c、d代表对子数!表8-16配对四格表基本结构的甲种属性乙种属性++a+-b-+c--d甲属性的阳性率:(a+b)/n乙属性的阳性率:(a+c)/n若H0成立,则有(a+b)/n-(a+c)/n=0,即(b-c)/n=0可见,两个变量阳性率的比较只和b、c有关,而与a、d无关。若H0成立,两种属性不一致的两个格子理论频数都应该是(b+c)/2(+,)和(,+)两个格子中的理论频数均为2cb40cb时2)2(2)2()(2222cbcbccbcbbTTAcbcb2)(~2分布同理可得40cb时校正公式:cbcbTTA222)1|(|)5.0|(|配对检验公式推导:式中,a,d为两法观察结果一致的两种情况,b,c为两法观察结果不一致的两种情况。b+c>40,cbcb22)(,1b+c≤40,cbcbc22)1(,1=配对卡方检验公式使用条件:例8.4现有198份痰标本,每份标本分别用A、B两种培养基培养结核菌,结果如下表,A培养基的阳性培养率为36.36%,B培养基的阳性培养率为34.34%,试问A、B两种培养基的阳性培养率是否相等?B培养基A培养基+-合计+482472-20106126合计68130198表8-5两种培养基的培养结果A培养基B培养基结果统计痰标本A培养基B培养基1++2++3+-4++5+-6+-7-+8++9--10--11++12++13+-14--痰标本A培养基B培养基15++16++17+-18++19+-20+-21--22+-23--24--25++26+-27++28--1、建立检验假设并确定检验水平H0:π1=π2,即两种培养基的阳性培养率相等H1:π1≠π2,即两种培养基的阳性培养率不相等α=0.052、计算检验统计量22(2420)0.3624203、查界值表,确定P值,做出推断结论查χ2界值表,υ=1,χ20.05(1)=3.84,χ2χ20.05(1),则P0.05,在α=0.05的检验水准下,不拒绝H0,尚不能认为两种培养基的培养率不同。back一、行×列表χ2检验行或列超过两组时称为行×列表,或称R×C表。nnnTCR总例数列合计行合计理论频数代入基本公式可推导出:基本公式通用公式)1()(2222CRnnAnTTA自由度=(行数1)(列数1)例8.5某医院用3种方案治疗急性无黄疸型病毒肝炎254例,观察结果如下表,试比较3种疗法的有效率是否一样。组别有效无效合计有效率(%)西药组514910051.00中药组35458043.75中西医结合组59157479.73合计14510925457.09表8-33种方案治疗肝炎的疗效1.建立检验假设并确定检验水准H0:三种治疗方案的有效率相同H1:三种治疗方案的有效率不全相同α=0.052.计算检验统计量2222222514935455915254(1)10014510010980145801097414574109254(0.17940.22030.10560.23220.32440.02791)22.813.查χ2界值表,确定P值,做出推断结论υ=2,χ20.05(2)=5.99,χ2χ20.05(2),则P0.05,在α=0.05的水准下,拒绝H0,可以认为三种治疗方案的有效率有差别。例8.6某研究人员收集了亚洲、欧洲和北美洲人的A、B、AB、O血型资料,结果见下表,其目的是研究不同地区的人群血型分类构成比是否一样。地区ABABO合计亚洲321369952951080欧洲2584322194517北美洲40810637444995合计9875181549332592表8-1三个不同地区血型样本的频数分布图8-1三个不同地区血型样本构成情况22222(321411.25)(369215.83)(9564.17)(444358.15)411.25215.8364.17358.1519.81108.7014.8120.58297.592(A-T)T代如基本公式:代如通用公式:22222321369954442592(1)1080987108051810801549959332592(0.09670.24340.05430.21241)297.561、建立检验假设确定检验水准H0:不同地区的人群血型分布总体构成比相同H1:不同地区的人群血型分布总体构成比不全相同α=0.052、计算检验统计量3、查界值表,确定P值,做出推断结论查χ2界值表,υ=6,χ20.05(6)=12.59,χ2χ20.05(1),则P0.05,在α=0.05的水准下,拒绝H0,认为三个不同地区的人群血型分布总体构成比有差别。二、多个样本率间多重比较行×列表χ2检验的结果说明差异有统计学意义,需作两两比较时,先调整α值,再进行率的两两比较。检验水准α=0.05,做多次比较时,按概率理论,两两比较均正确的概率为(1-0.05)(1-0.05)(1-0.05)…(1-0.05),将使Ⅰ类错误α扩大,因此,必须重新规定检验水准。1.多个实验组间的两两比较α’=α/N2(1)2kkkNCN为要进行两两比较的次数,k为参加检验的组数。组别有效无效合计有效率(%)西药组514910051.00中药组35458043.75合计869418047.781、建立检验假设并确定检验水准H0:西药与中药治疗肝炎的有效率相同;H1:西药与中药治疗肝炎的有效率的有效率不同;α’=0.05/3=0.017表8-4西药与中药治疗肝炎疗效的比较2222251493545180(1)0.941008610094808680943、查χ2界值表,确定P值,做出推断结论υ=1,χ20.017(1)=5.70,χ2χ20.017(1),则P0.017,在α’=0.017的水准下,不拒绝H0,故可以认为西药与中药治疗肝炎的有效率差异没有统计学意义。2、计算检验统计量组别有效无效合计有效率(%)西药组514910051.00中西医结合组59157479.73合计1106417463.222222251495915174(1)15.10100110
本文标题:第八章--卡方检验
链接地址:https://www.777doc.com/doc-4451012 .html