您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 管理学资料 > 17章生存分析2010-12-8
1第十七章生存分析SurvivalAnalysis授课老师:曾小敏公共卫生学院卫生统计学教研室2例17-1有人研究了甲种手术方法治疗肾上腺肿瘤病人23例的生存情况,定义从手术后到病人死亡的时间为生存时间,得到的生存时间(月)如下,其中有“+”者是截尾数据,表示病人仍生存或失访,括号内为重复死亡数。1(1),3(1),5(3),6(3),7(1),8(1),10(2),14+,17(1),19+,20+,22+,26+,31+,34(1),34+,44(1),59(1)。试计算其生存率与标准误。(结果信息和时间信息)3表17-1甲种手术方式后病人生存率的计算方法序号i时间(月)t(1)死亡人数d(2)期初观察人数n(3)条件死亡率F(4)条件生存率S(5)生存率()PXt(6)标准误pS(7)111230.0430.9570.9570.0425231220.0450.9550.9140.0588353210.1430.8570.7830.0860463180.1670.8330.6520.0993571150.0670.9330.6090.1018681140.0710.9290.5650.10347102130.1540.8460.4780.1042814+0110.0001.0000.4780.10419171100.1000.9000.4300.10411019+090.0001.0000.4300.10411120+080.0001.0000.4300.10411222+070.0001.0000.4300.10411326+060.0001.0000.4300.10411431+050.0001.0000.4300.10411534140.2500.7500.3230.12161634+030.0001.0000.3230.12161744120.5000.5000.1610.12931859111.0000.0000.000-1(1)3(1)5(3)6(3)7(1)8(1)10(2)14+17(1)19+20+22+26+31+34(1)34+44(1)59(1)4第一节生存分析中的基本概念第二节生存率的估计与生存曲线第三节生存曲线的log-rank检验第四节Cox比例风险回归模型第五节寿命表生存分析:将事物发生的结果和随访时间两个因素结合在一起进行分析的一种统计学方法。能充分利用得到的研究信息,更加准确地评价和比较随访资料。5第一节生存分析中的基本概念一、基本概念1.生存时间(survivaltime)2.失效事件(failureevent)与起始事件(initialevent)3.截尾值(censoredvalue)4.生存率与风险函数(1)生存函数(survivalfunction):又称为累积生存率,简称生存率。(2)风险函数(hazardfunction)5.死亡概率与死亡密度函数(1)死亡概率(2)死亡密度函数61.生存时间:生存时间(survivaltime)是任何两个有联系事件之间的时间间隔,常用符号t表示。狭义的生存时间—患某种疾病的病人从发病→死亡所经历的时间跨度广义的生存时间—从某种起始事件→终点事件所经历的时间跨度(如:戒烟)。明确:事件的起点、终点、时间的测度单位(小时、日、月、年等)2.失效事件与起始事件:失效事件(failureevent)——反映治疗效果特征的事件,又称为死亡事件、终点事件。它是根据研究目的确定,因此在设计时必须明确规定,并在研究中严格遵守。起始事件(initialevent)——反映生存时间起始特征的事件,如疾病确诊、某种疾病治疗开始、接触毒物等,设计时也需要明确规定。73.截尾值:指在随访过程中,由于某种原因未能观察到病人的明确结局(即终止事件),所以不知道该病人的确切生存时间,它提供的生存时间的信息是不完全的。提示:真实的生存时间只能长于观察到的时间而不会短于这个时间。产生截尾值的原因:①病人失访。②病人的生存期超过了研究的终止期。③在动物实验中,有时事先规定观察期限或动物数,虽然有一部分动物在到达实验终止日期时尚未出现规定的终止事件,但仍停止实验,或者当达到了事先规定的终止事件的动物数后实验停止。84.生存率与风险函数(1)生存函数:又称为累积生存率,简称生存率。——具有协变量X的观察对象其生存时间T大于时间t的概率,常用),(),(XXtTPtS表示。在实际工作中,生存率是用生存时间大于t的病人数与总病人数的比例来估计的。特点:观察起点即0t时的生存率为1;当观察期为无穷大时,其生存率为0。(2)风险函数——具有协变量X已生存到时间t的观察对象,从生存时间t到tt这一非常小的区间内死亡的概率极限,即生存时间已达到t的一群观察对象在时刻t的瞬时死亡率。影响生存时间的因素95.死亡概率与死亡密度函数(1)死亡概率——表示一个观察对象从开始观察到时间t为止的死亡概率,它是一个随时间上升的函数:),(),(XXtTPtF,当t趋于无穷大时,死亡概率等于1。),(XtF为死亡分布函数,和生存函数的关系为),(1),(XXtFtS。(2)死亡密度函数——表示具有协变量X的所有观察对象在t时刻的瞬时死亡率。0(,)(,)lim(,)tPtTttftFttXXX生存函数、风险函数、死亡密度函数具有以下关系:),(),(),(XXXtStfth10二、资料收集(一)随访内容1.确定开始随访的时间:入院时间、确诊时间、开始治疗时间等。2.随访的结局和终止随访的时间:随访的结局可能有以下几种:①“死亡”,即处理失效,终止时间即为“死亡”时间;②生存但中途失访,包括拒绝访问、失去联系或中途退出试验,其终止时间以最后一次访问时间为准;③死于其他与研究疾病无关的原因,如肺癌患者死于心肌梗死、自杀或车祸等,其终止随访的时间为死亡时间;④随访截止,随访研究结束时观察对象仍存活,终止随访时间为研究结束时间。3.记录影响生存时间的有关因素:如患者的年龄、病程、术前健康状况、经济、文化、职业等,以便分析这些因素对生存时间的影响。11(二)随访方式1.全体观察对象同时接受处理措施,观察到最后一例出现结果,或者事先规定的随访截止时间,如图17-1a。图中“×”表示“死亡”,“o”表示失访、退出研究或死于与本研究无关的其他原因。0始点终点ta时间0始点终点tb时间图17-1随访资料常见形式示意图0始点终点ta时间0始点终点tb时间图17-1随访资料常见形式示意图122.全体观察对象在不同时间接受治疗处理,完成一定数量随访病例后决定随访截止时间,或按事先规定的时间停止随访,这是临床试验最常见的形式,如图17-1b。如病人在不同时间接受心脏移植手术,有的病人可能术后20年仍然存活,而随访难以持续那么长的时间,可根据不同的研究内容,按设计时的要求观察到预定时间,如3年或5年截止随访。0始点终点ta时间0始点终点tb时间图17-1随访资料常见形式示意图0始点终点ta时间0始点终点tb时间图17-1随访资料常见形式示意图13(三)生存分析研究的主要内容1.描述生存过程:研究生存时间的分布特点,估计生存率及平均存活时间,绘制生存曲线等。根据生存时间的长短,可以估计出各时点的生存率,并根据生存率来估计中位生存时间,同时也可根据生存曲线分析其生存特点。2.比较生存过程:通过生存率及其标准误对各样本的生存率进行比较,以探讨各总体的生存过程是否有差别。例如比较手术治疗和化学治疗乳腺癌患者的生存率,以探讨何种治疗方案效果较好。3.分析影响生存时间的因素:重点是通过生存分析模型来探讨影响生存时间的因素,通常以生存时间和结局作为应变量而将影响他们的因素作为自变量,比如年龄、性别、病理分型、治疗方式等。通过拟合生存分析模型,筛选影响生存时间的保护因素和有害因素。4.预测14三、生存分析的基本方法1.非参数法特点:不论资料是什么样的分布形式,只根据样本提供的顺序统计量对生存率进行估计常用的方法:乘积极限法(又称Kaplan-Meier法,有精确生存时间的大小样本资料))和寿命表法(大样本)。对于两个及多个生存率的比较,其无效假设(H0)只是假定两组或多组总体生存时间分布(生存过程)相同,而不对其具体的分布形式及参数进行推断(推断的方法:log-rank检验(对远期差异敏感)、Breslow检验——又称Wilcoxon检验(对近期差异敏感))。2.参数法特点:假定生存时间服从于特定参数的分布,然后根据已知分布的特点对影响生存时间进行分析常用的方法:指数分布法、Weibull分布法、对数正态回归分析法和对数logistic回归分析法等。参数法通过估计的参数得到生存率的估计值。对于两组及以上的样本,可根据参数估计对其进行统计推断。3.半参数法半参数法兼有参数法和非参数法的特点,主要用于分析影响生存时间和生存率的因素,属多因素分析方法,其典型方法是Cox模型分析法。15生存分析的结果报告:一、生存率估计:报告估计方法、生存曲线、中位生存时间。二、生存曲线比较:报告生存曲线、生存曲线比较方法、检验统计量及P值。三、影响因素分析:报告变量筛选方法、检验水准a、各变量RR、RR95%可信区间及P值。16第二节生存率的估计与生存曲线一、小样本资料生存率及其标准误的计算二、大样本资料的生存分析17一、小样本资料的分析——生存率及其标准误的计算1.计算生存率2.计算生存率的标准误3.生存曲线4.中位生存时间18例17-1有人研究了甲种手术方法治疗肾上腺肿瘤病人23例的生存情况,定义从手术后到病人死亡的时间为生存时间,得到的生存时间(月)如下,其中有“+”者是截尾数据,表示病人仍生存或失访,括号内为重复死亡数。1,3,5(3),6(3),7,8,10(2),14+,17,19+,20+,22+,26+,31+,34,34+,44,59。试计算其生存率与标准误。19表17-1甲种手术方式后病人生存率的计算方法序号i时间(月)t(1)死亡人数d(2)期初观察人数n(3)条件死亡率F(4)条件生存率S(5)生存率()PXt(6)标准误pS(7)111230.0430.9570.9570.0425231220.0450.9550.9140.0588353210.1430.8570.7830.0860463180.1670.8330.6520.0993571150.0670.9330.6090.1018681140.0710.9290.5650.10347102130.1540.8460.4780.1042814+0110.0001.0000.4780.10419171100.1000.9000.4300.10411019+090.0001.0000.4300.10411120+080.0001.0000.4300.10411222+070.0001.0000.4300.10411326+060.0001.0000.4300.10411431+050.0001.0000.4300.10411534140.2500.7500.3230.12161634+030.0001.0000.3230.12161744120.5000.5000.1610.12931859111.0000.0000.000-20(1)将生存时间由小到大排列:如表17-1第(1)栏,对于生存时间相同的非截尾值和截尾值,则将截尾值排在后面。(2)生存时间t对应的死亡人数d:(3)期初观察人数:(4)计算条件死亡率(F)及条件生存率(S):按下式计算:ndF,1SF(17-1)(5)计算活过t时点的生存率:按下式计算:()PXtS(17-2)其中为连乘积的符号,即活过某时刻t的生存率是其对应的各时点条件生存率的连乘积。如:(1)0.957PX,(3)0.9570.9550.914P
本文标题:17章生存分析2010-12-8
链接地址:https://www.777doc.com/doc-3023171 .html