您好,欢迎访问三七文档
定性资料的假设检验第九章定性资料的比较:1.样本率和总体率的比较:直接计算概率法(二项分布)和z检验2.两样本率的比较:z检验、卡方检验和确切概率法3.多个样本率、两组或多组构成比的比较:卡方检验、确切概率法分类变量的关联性检验:计算列联系数、一致性检验等样本率和总体率的比较(补充)一、直接计算概率法补充例1根据以往经验,新生儿染色体异常率一般为1%,某医院观察了当地400名新生儿,只有l例染色体异常,问该地新生儿染色体异常率是否低于一般?knkknkxP)()(1H0:=0.01H1:0.01单侧=0.05P(x1)=P(0)+P(1)=0.99400+4000.010.99399=0.0905因P=0.09050.05,按=0.05水准尚不能拒绝H0,尚不能认为该地新生儿染色体异常率低于一般。二、正态近似法当n较大,总体率既不接近0也不接近1,n和n(1-)均大于5,二项分布近似正态分布,利用正态分布的原理,计算检验统计量z值作假设检验。nppzp/)1(0000补充例2已知一般人群中慢性支气管炎患病率为9.7%,现调查了500名吸烟者,其中有95人患慢性支气管炎,试推断吸烟人群中慢性支气管炎患病率是否比一般人群高?H0:=0H1:0单侧=0.05本例n=500,X=95,p=0.19,0=0.097,得:026.7500/)097.01(097.0097.019.0z因单z0.05=1.64,zz0.05,p0.05,按=0.05水准,拒绝H0,接受H1.完全随机设计两个样本率比较的z检验条件:当n较大,n11、n1(1-1)、n22、n2(1-2)均大于等于5时21||21ppSppz)11)(1(212121212121nnnnXXnnXXSpp当n较小时,则可以利用校正的z检验:212/)/1/1(||2121ppcSnnppz例1某市在2008年6月实施了第四次国家卫生服务抽样调查,以近两周患病情况作为调查指标。分别在城区和农村进行了抽样调查,其中城区调查了680人,有95人近两周患病,农村调查了660人,有148人近两周患病,问两组人群的两周患病率是否相同?H0:1=2H1:1≠2=0.05X1=95,n1=680,X2=148,n2=660p1=95/680=0.1397,p2=148/660=0.224202105.0)11()660680148951(660680148952121nnSpp01.402105.0|2242.01397.0|z因为z0.05/2=1.96,zz0.05/2,P0.05,所以拒绝H0。第一节完全随机设计两样本率比较的2检验z检验2检验两个率(或两类构成)是否相等两个或多个两类构成(或率)或两个或多个多类构成总体的构成比(或率)或行变量和列变量是否独立将例1的资料整理成表格如下:表9-1某市2008年城乡居民的两周患病率两周患病情况分组有无合计患病率(%)城区95(123.31)585(556.69)68013.97农村148(119.69)512(540.31)66022.42合计2431097134018.132检验的基本思想一、四格表资料的2检验组别阳性数阴性数合计I组aba+b=n1.II组cdc+d=n2.合计a+c=n.1b+d=n.2a+b+c+d=n理论频数TRC的计算公式为:TRC=nR×nC/n基本步骤H0:该市城乡居民的两周总体患病率相同即1=2=H1:该市城乡居民的两周总体患病率不同即1≠21、建立假设TTA22)(2、实际频数与理论频数的差值服从2分布计算2值的基本公式:=(R-1)(C-1)22222295123.31585556.69148119.69512540.31)16.12123.31556.69119.69540.31ATT()()()()(f02468图9-12分布的概率密度曲线10=1=3=5查附表9可知,自由度=1时,20.05,1=3.84,20.001,1=10.83,本例值16.1210.83,因此P0.001。按照=0.05的检验水准,拒绝H0假设,接受H1假设。即该市城乡居民的总体两周患病率不同。根据现有资料看出,农村的患病率高于城区。3、查表,判断结果,下结论。))()()(()(22dbcadcbanbcad二、四格表的专用公式对于四格表资料,通过推导可将式9-4转换成四格表的专用公式:表9-2某市2008年城乡居民的两周患病率两周患病情况分组有无合计城区95(a)585(b)680(a+b)农村148(c)512(d)660(a+c)合并243(a+c)1097(b+d)1340(n)22(95512585148)134016.126806602431097分类资料为间断的,不连续分布。故计算的2值不连续,尤其是自由度为1的四格表,求出的概率可能偏小,因此需进行连续性校正:22(0.5)ATT三、四格表资料校正1.2值的校正x1、x2……xk~Nikxzkiikxzzz12222212TTA22)(2.四格表2检验的条件(1)当n≥40,且每个格子的理论频数T≥5时,可用基本公式:))()()(()(22dbcadcbanbcad注:对于两个率的比较,2检验和z检验是等价的,2=z2。(3)T1或n40时,需用确切概率法。(2)当总合计数n≥40,而有1T5时,用校正公式或确切概率法。校正公式:TTA22)5.0())()()(()2/|(|22dbcadcbannbcad例2某医生观察冠心软胶囊治疗冠心病心绞痛的临床疗效。用冠心软胶囊(治疗组)与复方丹参片(对照组)作对比治疗,以临床症状及心电图疗效等为观察指标。所有冠心病心绞痛患者均为门诊患者,均符合世界卫生组织(WHO)制定的《缺血性心脏病的命名及诊断标准》,将患者随机分为两组,其中患者性别、年龄、病情、病程等在两组间是均衡的。两组病人临床症状改善效果见下表,试比较两种药物治疗冠心病心绞痛的总体有效率有无差别?组别有效人数无效人数合计有效率(%)治疗组32(28.64)3(6.36)3591.43对照组13(16.36)7(3.64)2065.00合计45105580.82表93两组治疗心绞痛疗效比较1.建立检验假设H0:1=2H1:12=0.05=12.计算检验统计量因本例n40且有一个格子的1T5,需要用校正公式。3.得出P值,作出统计推断本例23.84,P0.05,拒绝H0,可以认为冠心软胶囊治疗的冠心病心绞痛的临床疗效比复方丹参片好。33.41020453555)2/55|133732(|22配对四格表资料示意甲法乙法合计+-+aba+b-cdc+d合计a+cb+da+b+c+d第二节配对四格表资料例3疑似肺结核患者的痰液标本120例镜检后分别接种于变色培养基和罗氏培养基进行培养,观察结核杆菌的生长情况,结果为变色培养基阳性率为70%,罗氏培养基阳性率为60%,共同阳性率为45%。试比较两种培养基的效果有无差别?表9-4两种培养基的培养结果罗氏培养基变色培养基+-合计+54(a)30(b)84-18(c)18(d)36合计7248120(n)1.建立检验假设H0:两种培养基的阳性率相同,即总体B=CH1:两种培养基的阳性率不同,即总体B≠C=0.052.计算检验统计量在H0条件下,b、c的理论频数,代入公式有2/)(cbTTcb2222222cbcbccbcbb)()(22cbcb)()1(22cbcb当b+c40时当b+c40时本例b+c40,代入上式得2=3.00查界值表得:20.05,1=3.84,2=3.003.84,因此P0.05,不拒绝H0假设,尚不能认为两种方法检出细菌的阳性率不同。3.得出P值和结论TTA22)()1(22CRnnAn第三节完全随机设计的行×列表2检验(多组率或构成比比较)基本公式:专用公式:如有R行C列的构成比资料,称为RC表。将行数或列数大于2的频数分布表统称行列表。一、多组率的比较•例4某研究者把具有典型症状并经胃镜证实的良性活动性胃溃疡患者280例随机分为三组,分别给予奥美拉唑、雷尼替丁和硫糖铝片进行治疗6周,疗程结束时复查胃镜,溃疡面消失者为愈合,试分析三种药物的总体溃疡愈合率是否有差别?(假设三组研究对象的年龄、性别与病程均衡)表9-5三种药物治疗胃溃疡的疗效治疗效果分组愈合未愈合合计愈合率(%)奥美拉唑901010090.00雷尼替丁60309066.67硫糖铝片48429053.33合计1988228070.711.建立检验假设H0:三种药物治疗胃溃疡的愈合率相等H1:三种药物治疗胃溃疡的愈合率不等或不全相等=0.052.计算理论值和检验统计量ν=(3-1)(2-1)=23.确定P值,作出统计推断查2界值表,得P0.05,拒绝H0,可以认为三种药物有效率不等或不全相等。80.31)1829042821001019810090(2802222二、两组或多个构成比比较例5某研究人员收集了亚洲、欧洲和北美洲人的A、B、AB、O血型资料,结果见表9-6所示,其目的是研究不同地区的人群血型分类构成比是否一样。分组ABABO合计亚洲321369952951080欧洲2584322194517北美洲40810637444995合计9875181549332592表9-6三个不同地区人群血型的频数分布1.建立检验假设H0:不同地区人群血型构成分布相同H1:不同地区人群血型构成分布不同或不全相同=0.052.计算检验统计量3.确定P值,作出统计推断3750.297)193399544451810803699871080321(25922222(31)(41)6220.05,612.59,P0.05,按=0.05水准拒绝H0,接受H1三、单向有序资料分组变量无序,结果变量为有序的资料称单向有序资料。在比较各处理组的效应有无差别时,可用CMH(Cochran-Mantel-Hanenszel)方法计算行平均分检验统计量进行分析,也可以进行秩和检验,Ridit分析等。补充例子某医生用三种药物治疗某种疾病,结果分四个等级,结果见下表,问三种药物的总体疗效有无差别?表三种药物疗效比较结果疗效药物无效好转显效治愈合计A5314915100B22509485C244515185合计511267320270四、多个率的多重比较1.校正检验水准如果所要比较的有k个组,则任意两组做检验的次数为C=K(K-1)/2。原来假设检验水准为,两两比较的水准为’=/C。如果此时例数较少不宜用检验,则应计算确切概率。•例9-4的资料进行两两比较的结果(两两比较的具体P值使用统计软件计算得到)见表9-7。对比组四格表2值P值检验水准检验结果奥美拉唑与雷尼替丁15.51670.0010.0167*奥美拉唑与硫糖铝片32.03730.0010.0167*雷尼替丁与硫糖铝片3.33330.0680.0167表9-7三种药物治疗胃溃疡的疗效之间的两两比注:表中“*”表示差别有统计学意义,“”表示差别无统计学意义2.Scheff’可信区间法•pA、pB分别是两个比较组的样本率,nA、nB为两比较组的样本含量,K为组数,为总卡方值。如果此可信区间包含0,则可以认为pA、pB无差别,反之,有差别。))1
本文标题:第9章卡方检验
链接地址:https://www.777doc.com/doc-4254999 .html