您好,欢迎访问三七文档
混杂偏倚的识别与控制一、混杂偏倚的概念在病因研究中,当对所关心的某种暴露因素(E)与某种疾病(D)之间的关联进行定量估计时,由于其他因子(F)的影响,致使E和D之间关联的真实性被歪曲,关联强度被放大或缩小,这种歪曲关联真实性的作用被称作混杂作用(confoundingeffect),起到混杂作用的因子被称为混杂因子(confounder或confoundingfactor,F)。♦混杂偏倚本质√一种人为造成的偏倚√是在研究的设计阶段未对混杂因子加以控制或资料分析时未能进行正确校正所致√是完全可以避免和控制的一种系统误差♦混杂因子成立的条件(1)必须是所研究疾病的危险因素或保护性因素(2)必须和暴露因素之间存在统计学关联(3)一定不是暴露因素与疾病因果链上的中间变量二、混杂偏倚产生的机理例:氡气与肺癌的定群研究♠以RR值描述暴露于氡气人群与不暴露于氡气人群在肺癌发生频率之间的关联强度。肺癌患者(D+)未患肺癌者(D–)暴露于氡气的人群(E)aba+b未暴露于氡气的人群(Ē)cdc+da/(a+b)RR=----------------------c/(c+d)以四格表的数据计算关联强度指标RR值♦RR值的真实性评价此RR值是否真实地反映了氡气与肺癌之间的关联强度,完全取决于下述条件:(1)氡气暴露人群(E)和未暴露人群(Ē)之间在产生肺癌的易感性方面是否可比(2)导致肺癌的其它危险因素在两组人群之间的分布频率是否可比。“a”例肺癌的归因可能性(来自暴露人群):(A)由氡气所致(B)由吸烟所致(研究者已知道的致肺癌因素)(C)由其它未知因素所致“c”例肺癌的归因可能性(来自非暴露人群):(B)由吸烟所致(C)由其它未知因素所致♦对RR值的解读此相对危险度RR在本项研究中包含有三种效应:(A)氡气的致癌效应(B)吸烟的致癌效应(C)其它未知因素的致癌效应♦RR值产生混杂偏倚的条件(B)吸烟的致癌效应RRS≠1(C)其它未知因素的致癌效应RRU≠1♦当吸烟的致癌效应RRS≠1时下述情况下吸烟可导致该研究产生混杂偏倚:◘研究设计阶段:未保证吸烟者在两人群中的均衡性◘分析阶段:未先将两人群按吸烟和未吸烟分层,然后再按每一层去确定氡气暴露和肺癌之间的关联该研究中混杂偏倚产生的机理:是因为导致肺癌产生的另一因素吸烟在两组人群中分布不均衡。三、混杂偏倚和混杂因子的判别♦根据专业知识确定研究中可能存在的混杂因子在流行病学研究中,混杂因子可分为两类:1.人口统计学因子:年龄、性别、种族、职业、经济收入、文化水平等人口统计学指标,是经常遇到的混杂因子。2.暴露因素以外的其它危险因子:研究中混杂因子广泛存在,表现形式多样,常常在隐匿中起到混杂作用。♦利用分层分析进行定量判别-以定群研究为例-分层分析:将研究人群按是否暴露于可疑混杂因子F分类(最简单可分为暴露与不暴露两组),然后再做单因素分析。未分层资料的分析cRR暴露人群(E)aba+b未暴露人群(Ē)cdc+d患者(D+)非患者(D-)暴露人群(E)a1b1未暴露人群(Ē)c1d1患者(D+)非患者(D-)aRR1aRR2分层资料的分析a2b2c2d2患者(D+)非患者(D-)暴露第三因子F未暴露第三因子FD+D-E+a1b1E-c1d1D+D-E+a2b2E-c2d2D+D-E+abE-cdcRRaRR1aRR2F+F-♦用简单公式描述:1.cRR=aRR2或aRR1:F不是混杂因子,cRR值不存在F的混杂偏倚。2.cRRaRR2或aRR1:F是混杂因子,cRR值存在F的混杂偏倚。上述分析也可适用于病例对照的OR值分析。四、混杂偏倚的方向根据偏倚的产生机理,当混杂因子对暴露与疾病之间的关联产生歪曲时,混杂偏倚具有一定的方向性和大小。其方向可正可负,其作用可大可小,取决于E、F和D之间的关系。♦正混杂:cRR或cOR被放大,高于真实值♦负混杂:cRR或cOR被缩小,低于真实值五、混杂偏倚的控制(一)在设计阶段进行控制1.限制。2.随机分配:随机分配又可细分为简单随机分配和分层随机分配(stratifiedrandomization)两种方式。3.匹配(matching):匹配是最经常用于控制混杂因子的方法。♦群体频数匹配指混杂因子发生的频度在不同组应大致平横;♦个体匹配指按一个至数个混杂因子分层,为病例选择同层的对照,一个病例配的对照数多为1-4个。♦匹配的好处√可以有效地控制混杂因子的作用,提高研究结果的真实性;√在减少总样本数的情况下得到结论,提高研究的效率。♦匹配的缺点:(A)难以对匹配掉的混杂因子及交互作用做深入分析;(B)在病例对照调查中,用匹配的方法控制混杂经常低估暴露对疾病的作用,严重时会引起过度匹配(overmatching)的问题,掩盖暴露的真实作用。(C)过分苛刻的匹配,会使得部分病例找不到对照,致使信息浪费,使研究的效率反而降低。(二)在分析阶段控制混杂1.分层分析:分层分析是按混杂因素分层后,分别就暴露对疾病的关联做分析,可以使用Mantel-Haenszel方法在分析阶段控制混杂因子。-可以评价在各层中暴露与疾病的关联;-可整体估价用分层技术排除混杂后的暴露与疾病总的关联强度。例:食管癌病因研究—病例对照研究设计因素病例对照年龄(岁)25-111535-919045-4616755-7616665-5510675+1331均值60.050.2标准差9.214.3酒精(克/天)0-2938640-7528080-5187120+4522均值84.944.4标准差48.431.9食管癌病例组和对照组暴露因素分布♦对资料进行初步审查(1)对照组年轻人比重大于病例组(2)在病例组中,饮酒消耗量的均值大于对照组,且重度饮酒者的比例大于对照组(3)年龄和饮酒之间呈现轻度的负相关根据上述资料和已往医学知识,即食管癌在年龄大者中多见,推测年龄这一因素可能对判断饮酒与食管癌之间的关联起一定的混杂作用。饮酒(E)→食管癌(D)\∕年龄(F)♦计算未分层时总的比值比cOR饮酒不饮酒计食管癌病例96(a)104(b)200(n1)对照109(c)666(d)775(n0)计205(m1)770(m0)975(N)cOR=ad/bc=(96x666)/(104x109)=5.64[(ad-bc)–0.5N]2(N–1)X2=--------------------------------------n0m0n1m1=108.11df=1,P0.0001cOR的95%可信限区间估计公式为:lnORU,lnORL=EXP[lnOR±1.96x(Var(lnOR))1/2]式中:Var(lnOR)=1/a+1/b+1/c+1/dlnORu,lnORL=1.730.34,即:ORL=4.02,ORu=7.93年龄(岁)组别每日饮酒量aORi80克0-79克25-病例对照19010635-病例对照42651645.0545-病例对照2529211385.6755-病例对照4227341396.3665-病例对照191836882.5875+病例对照50831♦按可疑的混杂因子年龄分层计算每层比值比aOR♦比较cOR和aOR发现cOR与多组aORi有较大不一致,提示年龄可能起了一定混杂作用。♦用Mantel-Haenszel方法计算调整年龄这一混杂因子影响后总的ORmh。∑(aidi/Ni)ORM-H=-----------------------∑(bici/Ni)∑(aidi/Ni)ORM-H=-----------------------∑(bici/Ni)(1x106/116)+(4x164/199)+…+(5x31/44)]ORM-H=--------------------------------------------------(0x9/116)+(2x26/199)+…+(8x0/44)]=5.158♦对分层后总的ORmh=5.158做X2检验确定这一样本来自OR=1的总体的概率,计算公式为:(∑ai–∑Ai–1/2)2X2=-----------------------------------[∑Var(ai;OR=1)]式中:ai为各年龄组中第一小格内的实际观察值Ai为各年龄组中第一小格内理论值,其估计公式为:m1in1iAi=---------------(1)NiVar(ai;OR=1)为来自总体OR=1的样本分层后各层暴露病例数ai的方差,其计算公式为:m1in1im0in0iVar(ai;OR=1)=-------------------------(2)Ni2(Ni–1)An1-Am1-An0-m1+An1n0m0m1在特定的无效假设下,即H0:OR=1时,可根据前述公式(1)计算理论值A:m1in1iAi=--------------Ni计算每一层内第一小格理论值Ai的结果如下:25-岁组:A1=(10x1)/116=0.08635-岁组:A2=(30x9)/199=1.356······75+岁组:A7=(5x31)/44=1.477每层的方差按述前公式(2)计算Var(a1;OR=1)如下:25-岁组:Var(a1;OR=1)=(10x106x1x115)/1162X(116-1)=0.07935-岁组:Var(a2;OR=1)=(30x169x9x190)/1992X(199-1)=1.106·········75+岁组:Var(a7;OR=1)=(5x39x13x31)/442X(44-1)=0.944每层的Ai值和Var(ai;OR=1)值见下表:年龄(岁)aiAiVar(ai;OR=1)25-10.0860.07935-41.3561.10645-2511.6636.85855-4221.66810.67065-1912.6406.44975+51.4770.9449648.89026.106代入上述X2公式,得:(96–48.890–1/2)2X2=--------------------------------=83.2226.106df=1,P0.0001ORmh的95%可信限区间估计公式为:ORu,ORL=ORmh[1±1.96/(x2)1/2]式中:X2应为未作连续校正的值,该值为:X2=(96-48.890)2/26.106=85.01;以此带入[1±1.96/(x2)1/2]计算得:[1±1.96/(x2)1/2]=0.7874,1.2126代入上式得:ORu,ORL=5.1580.7876,5.1581.2126=3.64,7.31比较cOR和ORmh,显示两者有较小的差别,表明年龄起轻微的混杂作用,经分层调整消除年龄的混杂作用后,食管癌与饮酒之间的关联为:ORmh=5.158,95%可信限为3.64-7.31。2.多因素分析-当分析多个因子的混杂效应时,会出现分层过多的现象,以至难于实现对混杂的调整;-应用多因素分析方法可有效控制混杂因子的影响常用的方法有下述几种。(1)多元Logistic回归分析和Cox回归分析适用于因变量为二值函数(患病,不患病)的定群研究病和例对照研究。(2)协方差分析适用于因变量是一连续变量的资料分析。效应修正作用的识别与描述D+D-E+a1b1E-c1d1D+D-E+a2b2E-c2d2aRR1aRR2F+F-效应修正作用概念:外部因子改变了研究因素与疾病的关联强度测量:如果aRR1≠aRR2,存在效应修正作用:如果aRR1=aRR2,不存在效应修正作用:意义:探讨病因正交互作用:aRR1aRR2负交互作用:aRR1aRR2年龄(岁)组别每日饮酒量aORi80克0-79克25-病例对照19010635-病例对照42651645.0545-病例对照2529211385.6755-病例对照4227341396.3665-病例对照191836882.5875+病例对照50831第三因子年龄分层后计算的每层比值比aOR•各层aORi值不太一致,提示年龄可能是效应修正因子•通过一致性χ2检验
本文标题:混杂偏倚-效应修正
链接地址:https://www.777doc.com/doc-4029542 .html