您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > 循证医学__第2讲循证医学中常用的统计学方法和指标
循证医学中常用的统计方法和指标吉林大学公共卫生学院流行病与卫生统计学教研室循证医学中常用的统计方法一、临床证据的数据资料类型分类变量资料数值变量资料等级变量资料循证医学中常用的统计方法二、统计学方法的正确抉择统计描述统计分析假设检验统计推断可信区间估计循证医学中常用的统计方法三、数据资料统计描述的基本要求1.关于数值变量资料的统计描述表1数值变量资料的集中趋势表达指标作用适用条件均数描述一组资料的平均水平或集中趋势正态或近似正态分布中位数与均数意义相似偏态或分布未知或两端无界限几何均数与一般均数一样对数正态分布、等比资料循证医学中常用的统计方法三、数据资料统计描述的基本要求1.关于数值变量资料的统计描述表2数值变量资料的离散趋势表达指标作用适用条件标准差描述一组资料离散的程度正态及近似正态分布四分位数间距与标准差同义偏态或分布未知或两端极差与标准差同义变异系数与标准差同义循证医学中常用的统计方法四、数据资料统计描述的基本要求2.关于分类变量资料的统计描述表3分类变量资料的常用表达指标表达方式意义率事件发生例数/观测总例数分析事件发生的强度和频率构成比单个事件发生例数/多个事件例数的总和总事件数的各个事件所占比重相对比甲事件发生率与乙事件发生率比值发生甲事件与乙事件相比的倍数值循证医学中常用的统计方法四、统计学假设检验方法的正确抉择表4数值变量资料比较的常用假设检验方法循证医学中常用的统计方法四、统计学假设检验方法的正确抉择注:n为样本例数,p为阳性事件发生率,T为理论频数表5分类变量资料比较的常用假设检验方法循证医学中常用的统计指标五、可信区间可信区间(confidenceinterval,CI)是循证医学中常用的统计指标之一。可信区间主要用于估计总体参数,从获取的样本数据资料估计某个指标的总体值(参数)。如:率的可信区间估计总体率,均数的可信区间估计总体均数。循证医学中常用的统计指标五、可信区间此外,可信区间还可用于假设检验,尤其是试验组与对照组某指标差值或比值的可信区间,在循证医学中更为常用。通常,试验组与对照组某指标差值或比值的95%可信区间与为0.05的假设检验等价,99%的CI与为0.01的假设检验等价。。循证医学中常用的统计指标五、可信区间常用的可信区间有:率的可信区间、两率差值的可信区间、均数的可信区间、两均数差值的可信区间、相对危险度可信区间等。循证医学中常用的是率的可信区间、均数的可信区间、两均数差值的可信区间、相对危险度(RR)或比值比(OR)的可信区间等。循证医学中常用的统计指标六、分类资料的指标在循证医学的研究与实践中,除了有效率、死亡率、患病率、发病率等常用率的指标外,RR、OR及由此导出的其他指标也是循证医学中富有特色的指标。目前,在循证医学中分类资料常用的描述指标主要有EER、CER、OR、RR、RRR、ARR、NNT等。循证医学中常用的统计指标六、分类资料的指标1、EER与CER循证医学中预防和治疗性试验中,率可细分为EER和CER两类。EER即试验组中某事件的发生率(experimentaleventrate,EER),如对某病采用某些防治措施后该疾病的发生率。CER即对照组中某事件的发生率(controleventrate,CER),如对某病不采取防治措施的发生率。循证医学中常用的统计指标六、分类资料的指标2.RD(率差)及可信区间两个发生率的差即为率差,也称危险差(ratedifference,riskdifference,RD),如,试验组发生率(ERR)与对照组发生率(CER)的差,其大小可反映试验效应的大小。两率差的可信区间由下式计算:(p1-p2)±uSE(p1-p2)=(RD-uSE(p1-p2),RD+uSE(p1-p2))循证医学中常用的统计指标六、分类资料的指标2.RD(率差)及可信区间两率差的标准误:SE(p1-p2)=p1(1-p1)n1+p2(1-p2)n2两率差为0时,两组的某事件发生率没有差别。如果两率差的可信区间不包含0(上下限均大于0或上下限均小于0),表示两个率的差别有统计学意义;如果两率差的可信区间包含0,表示两个率的差别无统计学意义。循证医学中常用的统计指标六、分类资料的指标2.RD(率差)及可信区间阿斯匹林治疗心肌梗死的效果死亡未死亡例数阿斯匹林治疗组15(a)110(b)125(n1)对照组30(c)90(d)120(n2)合计45(m1)200(m2)245(n)循证医学中常用的统计指标六、分类资料的指标2.RD(率差)及可信区间阿斯匹林治疗心肌梗死的效果:EER=15/125=12%,对照组:CER=30/120=25%,率差:RD=EER-CER=0.12-0.25=-0.13两率差的标准误:阿斯匹林治疗心肌梗死的效果EER=12%,CER=25%两率差的标准误:SE(p1-p2)=p1(1-p1)n1+p2(1-p2)n2=0.12(1-0.12)125+0.25(1-0.25)120=0.049循证医学中常用的统计指标六、分类资料的指标2.RD(率差)及可信区间该试验两率差(RD)的可信区间为:RD±uSE(p1-p2)=(0.12-0.25)±1.96×0.049=-0.23~-0.03该例两率差的可信区间为-0.23~-0.03,上下限均小于0(不包含0),两率差别有统计学意义。可认为阿斯匹林可降低心肌梗死的病死率。循证医学中常用的统计指标六、分类资料的指标3.RR及可信区间相对危险度RR(relativerisk,RR)是前瞻性研究中较常用的指标,它是试验组某事件发生率p1与对照组(或低暴露)的发生率p0之比,用于说明前者是后者的多少倍,常用来表示试验因素与疾病联系的强度及其在病因学上的意义大小。其计算方法为:RR=P1/P0=EER/CER循证医学中常用的统计指标六、分类资料的指标3.RR及可信区间当RR=1时,可认为试验因素与疾病无关;当RR>1时,可认为试验组发生率大于对照组;当RR<1时,可认为试验组发生率小于对照组。循证医学中常用的统计指标六、分类资料的指标3.RR及可信区间RR的可信区间,应采用自然对数进行计算,即应求RR的自然对数值ln(RR)和ln(RR)的标准误SE(lnRR),其计算公式如下:SE(lnRR)=1a+1c-1a+b-1c+d循证医学中常用的统计指标六、分类资料的指标3.RR及可信区间ln(RR)的(1-)可信区间为:ln(RR)±uSE(lnRR)RR的可信区间为:exp[ln(RR)±uSE(lnRR)]由于RR=1时为试验因素与疾病无关,故其可信区间不包含1时为有统计学意义;反之,其可信区间包含1时为无统计学意义。循证医学中常用的统计指标六、分类资料的指标3.RR及可信区间阿斯匹林治疗组的病死率p1=15/125;对照组的病死率p0=30/120,其RR和可信区间为:RR=p1p0=15/12530/120=0.48ln(RR)=ln(0.48)=-0.734SE(lnRR)=1r1+1r2-1n1-1n2=115+130-1125-1120=0.289循证医学中常用的统计指标六、分类资料的指标3.RR及可信区间RR的95%可信区间为:exp[ln(RR)±1.96SE(lnRR)]=exp(-0.734±1.96×0.289)=(0.272,0.846)该例RR的95%可信区间为0.272~0.846,使用阿斯匹林治疗的病人,其病死率小于对照组,可认为阿斯匹林可降低心肌梗死有效。循证医学中常用的统计指标六、分类资料的指标4.OR及可信区间odds1是病例组暴露率p1和非暴露率1-p1的比值,即odds1=p1/(1-p1),odds0是对照组暴露率p0和非暴露率1-p0的比值,即odds0=p0/(1-p0),以上两个比值之比即为比值比(oddsratio,OR),又称机会比、优势比等。公式为:OR=ad/bc循证医学中常用的统计指标六、分类资料的指标4.OR及可信区间当所研究疾病的发病率较低时,即a和c均较小时,OR近似于RR,故在回顾性研究中可用OR估计RR;由于前瞻性研究中,RR的可信区间与OR的可信区间很相近,因此,常用OR可信区间的计算来代替RR的可信区间的计算。OR值的解释与RR相同。循证医学中常用的统计指标六、分类资料的指标4.OR及可信区间OR的可信区间同样需要采用自然对数计算,其ln(OR)的标准误SE(lnOR)按下式计算:SE(lnOR)=1a+1b+1c+1d循证医学中常用的统计指标六、分类资料的指标4.OR及可信区间ln(OR)的可信区间为:ln(OR)±uSE(lnOR)OR的可信区间为:exp[ln(OR)±uSE(lnOR)])]循证医学中常用的统计指标六、分类资料的指标4.OR及可信区间例如:前述阿斯匹林治疗心肌梗死的效果试估计其OR的95%可信区间。OR=15×9030×110=0.409ln(OR)=ln(0.409)=-0.894SE(lnOR)=(1/30+1/90+1/15+1/110)=0.347循证医学中常用的统计指标六、分类资料的指标4.OR及可信区间OR的95%可信区间为:exp[ln(OR)±1.96SE(lnOR)]=exp(-0.894±1.96×0.347)=(0.207,0.807)该例OR的95%可信区间为0.207~0.807,可以认为阿斯匹林治疗心肌梗死有效。循证医学中常用的统计指标六、分类资料的指标5.RRR及可信区间RRR为相对危险度减少率(relativeriskreduction),其计算公式为:RRR=|CER-EER|/CER=1-RRRRR的可信区间可由1-RR计算得到。如前例RR=0.48,其95%的可信区间为0.272~0.846,其RRR=1-0.48=0.52,RRR的95%可信区间为0.154~0.728。循证医学中常用的统计指标六、分类资料的指标5.RRR及可信区间RRR反映了某试验因素使某结果的发生率增加或减少的相对量,但是,该指标无法衡量发生率增减的绝对量。如:试验人群中某病的发生率EER=39%,而对照组人群的发生率CER=50%,RRR=(CER-EER)/CER=(50%-39%)/50%=22%。但是,若在另一研究中,试验组的疾病发生率为0.39/10万,对照组的疾病发生率为0.50/10万,其RRR仍为22%。循证医学中常用的统计指标六、分类资料的指标6.RRIRRI,相对危险度增加率(relativeriskincrease,RRI),试验组中某不利结果的发生率为EERb,对照组某不利结果的发生率为CERb,RRI可按下式计算:RRI=|EERb-CERb|/CERb该指标可反映采用试验因素处理后,患者的不利结果增加的百分比。循证医学中常用的统计指标六、分类资料的指标7.RBIRBI,相对获益增加率(relativebenefitincrease,RBI),试验组中某有益结果的发生率为EERg,对照组某有益结果的发生率为CERg,RBI可按下式计算:RBI=|EERg-CERg|/CERg该指标可反映采用试验因素处理后,患者的有益结果增加的百分比。循证医学中常用的统计指标六、分类资料的指标8.ARR及可信区间绝对危险度减少率(absoluteriskreduction,ARR),其计算公式为:ARR=|CER-EER|ARR的可信区间为:ARR±uSE(ARR)=(ARR-uSE(ARR),ARR+uSE(ARR))循证医学中常用的统计指标六、分类资料的指标8.ARR及可信区间ARR的标准误:SE=p1(1-p1)n1+p2(1-p2)n2ARR的可信区间:ARR±uSE=(ARR-uSE,ARR+uSE)例如:试验组某病发生率为15/125=12%,而对照组人群的发生率为30/120=25%,其ARR=25%-12%=13%,标准误为:
本文标题:循证医学__第2讲循证医学中常用的统计学方法和指标
链接地址:https://www.777doc.com/doc-4378625 .html