您好,欢迎访问三七文档
生存分析survivalanalysis内容生存资料1生存分析的基本概念2STATA实现3生存资料一些医学事件所经历的时间:从开始观察到事件发生的时间,不是短期内可以明确判断的乳腺癌病人术后生存时间幼儿乳牙萌出的时间白血病病人化疗后缓解持续的时间两种方法治疗某慢性病产生疗效的时间针对这类生存资料的分析方法:生存分析生存分析生存分析基本目的描述生存过程比较不同人群的生存过程分析生存时间的相关因素研究既有事件的发生时间又有事件结局资料的统计学方法强调所研究问题的结果变量是某一事件发生的时间生存资料的特点生存资料的特点随访资料时间和结局(失效、删失)有不完全数据通常不服从正态分布生存资料患者编号性别年龄从确诊到手术的时间(月)手术时间终止随访时间结局生存时间1男32101994.01.231994.12.24死亡112女48121998.02.141999.01.01失访10+3女2661992.03.041995.04.12死亡374男5531999.08.202001.09.21死于其他25+5女5882001.03.102001.12.31存活9+315241992.03.042001.12.31生存分析的基本概念---终点事件/起始事件终点事件outcomeevent:失效事件failureevent,指研究者所关心的特定事件,如死亡、复发、出牙;起始事件:标志研究对象生存过程开始的特征事件称为起始事件,与终点事件相对应,如确诊、手术、开始采取措施,开始观察生存时间survivaltime(失效时间failuretime):终点事件与被观察对象发生终点事件之间所经历的时间间隔,用t表示要获得准确的生存时间研究目的不同,时间单位不同,使用恰当的时间单位•从疾病确诊到死亡•从治疗开始到治愈•从出生到第一颗乳牙萌出生存分析的基本概念---生存时间生存分析的基本概念---死亡概率/生存概率p活过该时间区间人数某时间区间初期尚存活人数q在该时间区间死亡人数某时间区间初期尚存活人数死亡概率q:在某时间区间内的被观察对象在该时间区间内(无失访)死亡的概率估计生存概率p:在某时间区间内(无失访)的被观察对象在该时间区间内生存的概率估计终检censoring:删失值,在终点事件发生前,由于某种原因被观察对象的观测过程终止了右删失:终点事件发生在最后一次观察的右方特点:不完全信息(不知道确切生存时间),但可知真实的生存时间不会短于现在观察到的时间。发生的原因•失访•随访结束时仍存活•死于其他原因•治疗措施改变生存分析的基本概念---终检生存函数(累计生存概率):个体生存时间大于t的概率。任一时刻t对应的生存函数就是该时点的生存率。S(0)=1;2年生存率:个体生存时间超过2年的概率S(2)生存曲线:所有时点的生存率构成生存曲线生存分析的基本概念---生存率生存率计算无删失:有删失:需分段计算各时间段的生存概率pi,然后利用概率乘法将pi相乘得到t时刻的生存率第i个时段开始的人数为,在第i个时段内死亡人数为,删失人数为,则,()tSt时刻仍存活的观察例数总观察例数12()...tStppp生存分析的基本概念---生存率12()tStpppinid1iiidpnic1iiiinndc乘积极限法(K-M法)估计生存率适用于原始数据的资料例:研究人员对20名某肿瘤术后病人进行跟踪随访三年,记录他们的生存时间。试估计生存率绘制生存曲线,资料如下3,5+,5,8,9,9,9+,9+,11,15,15+,16,20,20+,25,28,28+,28+,28+,32乘积极限法(K-M法)估计生存率序号i(1)时间(月)ti(2)t时刻期初例数ni(3)t时刻死亡数di(4)t时刻终检数ci(5)死亡概率q=d/n(6)生存概率pi=(ni-di)/ni(7)生存率S(ti)(8)1320100.05000.95000.95002519110.05260.94740.90003817100.05880.94120.84714916220.12500.87500.741251112100.08330.91670.679561511110.09090.90910.61777169100.11110.88890.54918208110.12500.87500.48049256100.16670.83330.400410285130.20000.80000.320311321101.0000.00000.0000总体生存率的区间估计K-M法计算的样本生存率是总体生存率的点估计区间估计:SE是标准误/2[()]exp(exp(ln(ln(())))()ln(())iiiiSEStStuStSt生存曲线及中位生存期生存曲线survivalcurve:以随访时间为横坐标,生存率为纵坐标绘制的曲线中位生存期mediansurvivaltime:半数生存时间/平均生存时间,恰好由50%个体存活s(t)=0.5的时间生存时间一般为非正态,故用中位生存期可采用内插法计算:t0.5=20.4(月)如果生存期最长的死亡对象的生存率高于50%,则无法估计中位生存期。适用于大样本资料数据按时间区间分组利用删失资料信息,按删失资料对进行校正区间中的删失个体折算半个人时生存寿命表法计算生存率寿命表法计算生存率序号(1)术后生存天数t(2)期初观察例数n(3)期内死亡人数d(4)期内终检人数c(5)校正人数nc=n-c/2(6)死亡概率q=d/nc(7)生存概率p=1-q(8)生存率S(t+1)(9)10-6816366.50.24060.75940.7594250-49110490.22450.77550.58893100-3842370.10810.89190.52534200-3254300.16670.83330.43775400-2326200.10000.90000.39396700-154313.50.29630.70370.277271000-811270.14290.58710.237681300-5133.50.28570.71430.169791600101---例:10.2生存率曲线的比较Log-rank检验:时序检验,属于非参数方法,比较整个生存时间的分布大样本卡方检验2条或多条生存曲线比较H0:总体生存率曲线相同H1:总体生存率曲线不同例10.3:现有两组白血病病人的随访研究资料,其缓解时间(周)记录如下,现欲比较治疗组与安慰剂组的病人生存曲线是否一样?•资料治疗组(第1组):6,6,6,7,10,13,16,22,23,6+,9+,10+,11+,17+,19+,20+,25+,32+,32+,34+,35+安慰剂组(第2组):1,1,2,2,3,4,4,5,5,8,8,8,8,11,11,12,12,15,17,22,23生存率曲线的比较两组生存曲线的统计描述生存率周0102030400.000.250.500.751.00group1group2试验组对照组Log-ranktest方法,计算时,先将两组每一生存时间t(j)的资料列成一个2×2表的形式死亡生存合计治疗组(i=1)d1jn1j-d1jn1j安慰剂组(i=2)d2jn2j-d2jn2j合计DjSjNj计算理论死亡数11jjijnDeN计算Log-rank检验统计量H0为真时,Log-rank统计量2服从自由度为1的卡方分布2112122()(1)iiijjjjjjjdennDSNNLog-rank检验的实例计算•本例的检验统计量计算为•查卡方界值表,P0.001,基于两组生存曲线的位置,可以认为试验组的生存率高于对照组,差异有统计学意义。22(10.26)16.796.2685Stata软件实现一、用Stata软件计算生存率及95%可信区间1.定义生存分析的时间变量是time,结果变量是statusstsettimestatus2.显示Kaplan-Meier方法的计算生存率结果stslistStata软件实现二、用Stata软件绘制生存曲线1.定义生存分析的时间变量是time,结果变量是statusstsettimestatus2.绘制Kaplan-Meier法估计的生存曲线stsgraphStata软件实现三、用Stata软件进行LogRank检验1.确定生存分析的时间变量是week,结局变量是outcomeStsetweekoutcome2.对两条曲线进行LogRank检验ststestgroup,logrank即:Ststest分组变量,logrank
本文标题:23生存分析
链接地址:https://www.777doc.com/doc-3136707 .html