您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 信息化管理 > 病例对照研究(case-control-study)-
第五章、病例对照研究case-controlstudy华中科技大学同济医学院叶临湘第一节、基本原理一、概念选定患有某病和未患某病的人群,分别调查其暴露(如环境因素、遗传因素、内分泌作用以及保护因子的缺乏等)于某个危险因子的情况及程度,以判断暴露危险因子与某病有无关联及关联程度大小的一种观察研究方法。暴露或特征病例组对照组合计+–acbda+b=n1c+d=n0合计a+c=m1b+d=m0A+b+c+d=t病例对照研究资料整理表二、特点1、从果到因的研究2、由回顾调查获得暴露资料3、一次病例对照研究可以研究许多因素4、病例对照研究的本质符合队列研究设计原理第二节、病例对照研究的分类(一)、按目的分类:探索性的、检验性的(二)、按设计分类:1、病例对照不匹配:2、病例对照匹配:(1)频数匹配(frequencymatching)要求配比的因素所占的比例,两组一致。(2)个体配比(individualmatching)以个体为单位匹配。3、病例对照研究的衍生类型(1).巢式病例对照研究(nestedcase-controlstudy)(2).病例-队列研究(case-cohortstudy)(3).单纯病例研究(caseonlystudy)(4).病例交叉研究(case-crossoverdesign)。(5).病例-时间-对照设计(case-time-controldesign)。四、用途1、探索疾病可疑的危险因素。2、深入检验某个或某几个病因假设。3、评价防治措施的效果。4、用于疾病预后因素的比较:第三节:实例第四节、病例对照研究的设计与实施一、提出病因假设:二、研究类型的选择.1.配比因素的确定已知或非常怀疑某种因素为研究中的混杂因子2、配比方法三、病例与对照的来源与选择:(一)病例的选择1.病例内外部特征的限制内部━━患病部位、病理类型、诊断标准。外部━━年龄、性别、种族。2.病例类型的选择新发、现患、死亡。3.病例来源限制医院确诊、普查。(二)对照的选择条件1.未患此病的人(可以是其它疾病);2.不能有共同危险因素的疾病病人;3.除研究因素外其它条件一致;4.来自同一人群;来源1.从医院病人中选对照;2.从全人口中选对照;3.从亲属、同事、邻居中选对照。四、样本大小的估计1、有关的影响因素:(1)、研究因素在对照组中的暴露率;(2)、估计该因素引起相对危险度;(3)、希望达到的精确度;(4)、希望达到的检验把握度;(5)、是单侧还是双侧检验;2、估计的方法:样本只是一个估计值,过大、过小都不好,相等时效率最高。(见下页)除查表法,还可按分式估计样本含量:(1)、非配比两组人数相等的样本估计:例:在吸烟与肺癌的病对研究中。某人群有吸烟史的人为20%(P0),假定OR=2,设α=0.05,β=0.1,求N?P1=(0.2×2)/[1+0.2(2–1)]=0.333q1=1–P1,P=(P0+P1)/2,q=1–P.代入公式:单侧:N=186(人)双侧:N=228(人)Zα=1.645Zβ=1.282,Zα=1.960Zβ=1.2822012)/()(2ppUUpqN)]1(1/[001RRppp(2)、非配比两组人群不相等的样本估计设:病例数:对照数=1:c病例数:N=(1+1/c)pq(Zα+Zβ)2/(P0–P1)2P=(P1+cP0)/(1+c)对照数=CN例:按上例,设c为1.2,P=(0.33+1.2×0.2)/(1+1.2)=0.26q=1-0.26=0.74(单侧)N=(1+1/1.2)×0.26×0.74/(1.645+1.282)2=186(人)对照数CN=223(人)(3)、1:1配比样本估计:所需要的总对子数:M=m/(p0q1+p1q0)m=[Zα/2+Zβ^/p(1–p)]2/(p–1/2)2P=OR/(1+OR)≈RR/(1+RR)例:设α=0.05,β=0.1,P0=0.3,RR=2,双侧。那麽:Zα=1.960,Zβ=1.282,P1=P0·RR/[1+P0(RR–1)=0.46,q1=1–P1=0.54,q0=1–P0=0.7,P=2/3代入公式:m=[1.960+1.282^/2/3x1/3]2/(2/3–1/3)2=90M=90/(0.3×0.54+0.46×0.70)≈186(对)(当RR从2—4时,样本对子数从186对下降至45对)(4)、1:R配比样本的估计:N=(1+1/R)pq(Zα+Zβ)2/(P1–P0)2P=(P1+RP0)/(1+R)按上例:设α=0.05(双侧),β=0.1,R(对照)=2RR=2,Zα=1.960,Zβ=1.282,P=0.35,q=1–0.35=0.65.代入公式:N=(1+1/2)×0.35×0.65×(1.96+1.282)2/(0.46–0.3)2=140病例140人,对照140×2五、研究因素的确定和资料的收集(一)研究因素的确定1、变量的选定2、变量的标准3、变量的测量4、变量的可靠性(二)调查表的编制(三)调查员的培训第五节、资料的整理与分析一、资料整理资料的分组、归纳、编码、输机。二、资料分析(一)、描述性分析1、描术研究对象的一般特征:研究对象人数及各种特征的构成、如性别、年龄、职业、疾病类型的分布等.2、均衡性检验:比较两组某些基本特征是否相似或齐同.目的是检验病例组与对照组是否有可比性。(二)、统计性分析1.不匹配、未分层资料的分析.病例对照研究资料整理表暴露或特征病例组对照组合计+–acbda+b=n1c+d=n0合计a+c=m1b+d=m0A+b+c+d=t(1)显著性检验(2)联系强度比值比(oddsratio,OR)bcaddbcadbddbbcaccaaOR//)]/(/[)]/([)]/(/[)]/([RR(relativerisk)称为相对危险度,表示暴露组与非暴露组发病率之比,分析疾病与暴露之间联系强度,是一种概率。病例对照秒研究中不能计算概率,只能用OR代替RR。RR=暴露组的发生率/非暴露组的发生率.(表示E组的发生率是非E组的多少倍)RR=1(无意义)RR1(正相关)(危险因素)RR1(负相关)(保护因素)OR的含义与RR均同。疾病率小于5%时,OR是RR的极好近似值。例题:X2=(ad–bc)2t/m1m0n1n0=7.70,P0.01,OR=ad/bc=2.20.OR95%CI=OR(1±1.96/)=1.26-3.84口服避孕药与心肌梗死的病对研究OCDD合计+–39(a)114(c)24(b)154(d)63n1268n0合计153m1178m0331tx2Woolf方法求Z:Z=InOR/√(1/a+1/b+1/c+1/d)=0.7885/0.2874=2.74·:Z=2.772.58׃.P0.01如X2判断结果一致Woolf求OR95%CI:Var(InOR)=1/a+1/b+1/c+1/d=0.0826lnOR95%CI=InOR±1.96√Var(InOR)=1.3218—0.2250exp(1.3218,0.2252)=3.75,1.25.即OR95%CI=1.25-3.75如前类同。2、非配比的分层分析分层分析的目的是排除混杂因素的干扰。分层就是把研究人群按其特征分为不同层次然后分别分析各层中暴露与疾病的关联性。年龄例:肺癌年龄可能是混杂因素吸烟混杂因素—是指与研究因素和研究疾病均有关。若在比较人群组中分布不均,可以歪曲因素与疾病之间真正联系的因素。分层分析的步骤如下(1)按归纳表整理资料,先不分层,计算X2和OR;(2)按估计的混杂因素分层,并计算各层Xi2和Ori(3)判断分层因素与研究因素和疾病的关系;(4)计算X2MN,ORMN和95%CI;(5)判断分层因素是否为混杂因素:OR(分层前)≈ORMH无混杂存在。OR(分层前)ORMH正相关。OR(分层前)ORMH负相关。可采用Mantel–Haenszel分式计算X2MH.ORMH和95%CI:X2MH=[∑ai–∑E(ai)]2/∑v(ai)i为第n层∑E(ai)=∑(MliNli/Ti)∑Var(ai)=∑MliMoiNli/Ti(Ti-1)2ORMH=∑(aidi/Ti)/∑(bici/Ti)ORMH95%CI=ORMH(1±1.96/^/¯X2)例题:(1)分层前:OC与MI的关系OCDD合计+392463–114154268合计153178331X2=7.70P0.01OR=2.20OR95%CI=1.25—3.75(2)按年龄分层OR1=2.80OR2=2.78暴露特征40岁合≥40岁合DD计DD计服OC21a117b138n1118a27b225n12未服OC26c159d185n0188c295d2183n02合计47m1176m01123t1106m12102m02208t2(3)、判断分层因素与研究因素和疾病的关系年龄与OC40岁≥40岁X2=8.99OC(+)177OR=3.91OC(-)5995年龄与口服避孕有关年龄与MI的关系40岁≥40岁X2=7.27MI2688OR=0.48非MI5995年龄与心肌更死有关(小年龄有保护作用)所以年龄具有混杂因素的条件,可能为混杂因素。(4)、计算XMH2,ORMH和ORMH的95%可信限∑E(ai)=27.26,∑V(ai)=11.77,XMH2=[∑ai—∑E(ai)]2/∑V(ai)=11.79(有统计学联系),ORMH=∑(aidi/ti)/∑(bici/ti)=2.79(联系强度为2.79),ORMH95%CI=2.22—3.80(不包括l,有显著性水平)(5)、判断年龄是否为混杂因素因为OR分层前=2.20,ORMH=2.78,OR分层前ORMH(为负相关),由于年龄的混杂作用,使得暴露因素避孕药与心肌梗死的关联性趋向l,即减弱了它们之间的关联性。3、分级资料的分析X2=N[∑(a2/nR×nc)—1]=43.15,df=3,P〈0.01,OR1=ald/cbl=33×27/2×55=8.10各级之间有显著性差异。OR值随着吸烟量的增加,呈现明显的剂量反应关系。吸烟与肺癌分级资料归纳表组别每日吸烟支数0——1——5——15——合计病例对照2(c)27(d)3(a1)55(b1)250(a2)293(b2)364(a3)274(b3)649(nR)649合计OR29nc1888.1054311.5263817.934、配比资料的分析:配比研究是在设计阶段消除混杂因素干扰研究因素与疾病关系的一种方法。1:1配比病例对照研究:X2=(b-c)2/(b+c)或X2=(∣b-c∣-1)2/(b+c),OR=c/b,OR95%Cl=OR(1±1.96/^/¯X2)整理表对照组病例组合计对子数+—+—acbda+bc+d合计对子数a+cb+dtDD+—+—++——abcd例:X2=(lb-c1-1)2/(b+c)=34.23,P0.01,OR=c/b=39,OR95%CI=14.3—106.5,说明脑动脉管炎与患有钩体病有密切联系,其联系强度为39.钩体病与脑动脉管炎的1:1病对研究补体结合试验病例组合计对子数+-对照组+-4(a)39(c)1(b)19(d)558合计对子数432063(5)归因分值(attributablefraction,AF)也叫病因分值(etiologicfraction,EF)、暴露人群的归因分值:AFe=(Ie-Iu)/Ie=(OR-1)/OR人群归因分值记为AFPAFP=(Ip-Iu)/Ip=Pe(OR-1)/1+Pe(OR-1)归因分值是具有公共卫生意义的指标,它同时还代表人群中随机抽取一个病例可能因该暴露引起的概率。其他方法如果暴露是分等级的,可按不同暴露等级计算OR值,作剂量-反应关系的分析。Logistic回归等统计分析方法在病例对照研究资料分析中应用颇为广泛。第四节偏倚和控制一、常见的偏倚(一)选择性偏倚由于研究对象与非研究对象间的特征有系统区
本文标题:病例对照研究(case-control-study)-
链接地址:https://www.777doc.com/doc-2164398 .html