您好,欢迎访问三七文档
浙江大学医学院流行病与卫生统计学教研室沈毅生存分析浙江大学医学院流行病与卫生统计学教研室沈毅生存分析生存分析:在临床诊疗工作的评价中,慢性疾病的预后一般不适用于治愈率、病死率等指标来考核,因为其无法在短时间内明确判断预后情况,为此,只能对患者进行长期随访,统计一定时期后的生存或死亡情况以判断诊疗效果。生存分析还适用于现场追踪研究(发病为阳性)、临床疗效试验(痊愈或显效为阳性)、动物试验(发病或死亡)等。浙江大学医学院流行病与卫生统计学教研室沈毅基本概念生存时间(SurvivalTime):从狭义的角度来说:生存时间是患某病的病人从发病到死亡所经历的时间跨度。开始发病病人死亡从广义的角度:从某种起始事件到达某种终点时间所经历的时间跨度。起始事件终点事件生存时间生存时间浙江大学医学院流行病与卫生统计学教研室沈毅生存时间的数据类型2.截尾数据(CensoredData):由于某种原因未能观察到观察对象的明确的结局,所以不知道该观察对象的确切的生存时间,就象该观察对象的生存时间在未到达规定的终点之前就被截尾了。截尾数据提供了部分关于生存时间的信息,使研究者知道该观察对象至少在已经经历的这个时间长度内没有发生终点事件,其真实的生存时间只能长于我们现在观察到的时间而不会短于这个时间。(符号t+)1.完全数据(CompleteData)指达到了明确结局的观察对象的生存时间数据。某个观察对象具有明确的结局时,该观察对象所提供的关于生存时间的信息是完整的。浙江大学医学院流行病与卫生统计学教研室沈毅生存时间资料的特点有2个效应变量:一是生存时间(天数),二是结局(死亡与否、是否阳性等)。存在截尾数据:由于某种原因未能明确观察到随访对象发生事先定义的终终事件。分布类型复杂:生存时间资料常通过随访获得,因观察时间长且难以控制混杂因素,故其分布常呈偏态,影响因素较多,规律难以估测。浙江大学医学院流行病与卫生统计学教研室沈毅生存分析方法Kaplan-meier过程这是一种非参数法,主要用于小样本,适用于能够准确记录事件和删失发生时点的数据。LifeTables过程也叫寿命表法,适用于样本量大,且不太可能准确记载每个观察对象的死亡或删失发生时间的数据。Cox回归模型分析法用于描述多个变量对生存时间的影响浙江大学医学院流行病与卫生统计学教研室沈毅Kaplan-meier过程Kaplan-meier法用于:估计某因素不同水平的中位生存时间比较研究因素不同水平的生存时间有无差异控制一分层因素后对研究因素不同水平的生存时间比较浙江大学医学院流行病与卫生统计学教研室沈毅例1:3种疗法治疗66例白血病患者缓解时间(天),数据(kaplanm.sav)如下A疗法:4,5,9,10,11,12,13,28,28,28,29,31,32,37,41,41,57,62,74,100,139,20+,258+,269B疗法:8,10,10,12,14,20,48,70,75,99,103,162,169,195,220,161+,199+,217+,245+C疗法:8,10,11,23,25,28,28,31,31,40,48,89,124,143,12+,159+,190+,196+,197+,205+,219+Kaplan-meier过程浙江大学医学院流行病与卫生统计学教研室沈毅Kaplan-meier过程浙江大学医学院流行病与卫生统计学教研室沈毅Kaplan-meier过程时间变量结局变量分组变量浙江大学医学院流行病与卫生统计学教研室沈毅当变量为二分类变量时,一般以死亡、复发、恶化等为终结事件,如本例就是以恶化为终结事件,标记值为1,所以在Singlevalue框中输入1;如果生存状态变量取值为连续变量时,则在Rangeofvalues框分别输入下限值和上限值。Kaplan-meier过程浙江大学医学院流行病与卫生统计学教研室沈毅浙江大学医学院流行病与卫生统计学教研室沈毅LogRank法和Breslow法较为常用Kaplan-meier过程对组间生存函数的差异进行检验的方法浙江大学医学院流行病与卫生统计学教研室沈毅Kaplan-meier过程Survival:累积生存率估计,选中,表明要求将各观察样本的生存率存入原始数据库中Standarderrorofsurvival:累积生存率估计的标准误Hazard:累积风险函数估计Cumulativeevents:终结事件的累积频数浙江大学医学院流行病与卫生统计学教研室沈毅生存分析表平均生存时间和中位生存时间及其标准误和可信区间累积生存函数曲线Kaplan-meier过程浙江大学医学院流行病与卫生统计学教研室沈毅Kaplan-meier过程分析结果…1.观察时间2.生存状态3.累积生存率4.累积生存率的标准差5.累积死亡数6.组中剩余人数123456(1)生存表分析浙江大学医学院流行病与卫生统计学教研室沈毅Mean是生存时间的算术均数,Median为中位生存时间,同时表格中也给出它们的95%的可信区间。Kaplan-meier过程分析结果(2)生存时间估计浙江大学医学院流行病与卫生统计学教研室沈毅LogRank、Breslow和Tarone-Ware三种检验方法的检验统计量分别为3.282、2.861和3.360,它们的p值分别为0.194、0.239和0.186,说明三组疗法之间生存时间的差异无显著性Kaplan-meier过程分析结果(3)水平间的整体比较浙江大学医学院流行病与卫生统计学教研室沈毅分析结果(4)生存曲线Kaplan-meier过程浙江大学医学院流行病与卫生统计学教研室沈毅LifeTables过程用于:制作寿命表绘制各做曲线如生存函数、风险函数曲线等。对某一研究因素的不同水平的生存时间分布进行比较,控制另一个因素后对研究因素不同水平的生存时间分布进行比较,包括从总体上比较和不同水平间进行两两比较。Life-Tables过程浙江大学医学院流行病与卫生统计学教研室沈毅例2:某医院对114名男性胃癌患者接受手术后的生存情况进行了11年的随访,得到数据(lifetb.sav)如下Life-Tables过程浙江大学医学院流行病与卫生统计学教研室沈毅Life-Tables过程浙江大学医学院流行病与卫生统计学教研室沈毅输出生存时间范围及组距:前一个框输入生存时间上限,后一个框输入生存时间的组距Life-Tables过程浙江大学医学院流行病与卫生统计学教研室沈毅Life-Tables过程生存曲线风险函数曲线寿命表浙江大学医学院流行病与卫生统计学教研室沈毅Life-Tables过程分析结果(1)寿命表(分三部分讲解)浙江大学医学院流行病与卫生统计学教研室沈毅1.生存时间的组段下限2.进入该组段的观察例数3.该组段的删失例数4.暴露于危险因素的例数5.所关心的事件的例数,即死亡例数Life-Tables过程分析结果(1)寿命表Ⅰ12345浙江大学医学院流行病与卫生统计学教研室沈毅1.所关心事件的观察单位数的比,即各组的死亡概率2.各组的生存概率3.至本组段上限的生存函数估计值,由各组的生存概率累积相乘所得。4.概率密度,所有个体在时点t后单位时间内死亡概率估计值。Life-Tables过程分析结果(1)寿命表Ⅱ1234浙江大学医学院流行病与卫生统计学教研室沈毅1.风险率。活过时点t个体在时点t后单位时间内死亡概率的估计值2.生存函数估计的标准误。3.概率密度的标准误4.风险率的标准误。1234Life-Tables过程分析结果(1)寿命表Ⅲ浙江大学医学院流行病与卫生统计学教研室沈毅Life-Tables过程分析结果(2)累积生存函数曲线浙江大学医学院流行病与卫生统计学教研室沈毅基本思想不同:LifeTables过程是将生存时间分成许多小的时间段,计算该段内生存率的变化情况,分析的重点是研究总体生存规律;而Kaplan-Meier过程则是计算每一“结果”事件发生时点的生存率,分析的重点除了研究总体生存规律外,还热心于寻找相关影响因素。对于分层变量的处理不同:LifeTables过程仅按该分层变量进行分层,没有考虑其对生存时间的影响,即没有提供控制该分层变量的情况下对研究因素对生存时间的影响进行统计分析的能力;Kaplan-Meier过程则是在控制该分层变量的情况下对研究因素对生存时间的影响进行统计分析。做出的生存曲线不同统计学检验方法不同:LifeTables过程采用Wilcoxon法,Kaplan-Meier过程用Logrank法、Breslow法、Tarone-are法Kaplan-Meler法和寿命表法的比较浙江大学医学院流行病与卫生统计学教研室沈毅Cox回归模型上面介绍的两种生存分析方法只能研究一至两个因素对生存时间的影响,当生存时间的影响因素有多个时,它们就无能为力了,下面介绍CoxRegression过程,这是一种专门用于生存时间多变量分析的统计方法。浙江大学医学院流行病与卫生统计学教研室沈毅模型结构:设有n名病人,第i名病人的生存时间为ti,同时该病人具有一组伴随变量xi1,xi2…xip。该病人生存到时间ti的风险函数hi(t)是其基础风险函数ho(t)与相应伴随变量的函数的乘积,其数学表达式为:hi(t)=h0(t)f(β1xi1+….+βpxip)Cox建议伴随变量的函数为指数形式,故Cox比例风险回归可写为:hi(t)=h0(t)exp(β1xi1+….+βpxip)式中的h0(t)是当所有伴随变量xi1,xi2,…xip都处于0或标准状态下的风险函数,是一个不确定的值,β1,β2…,βp为回归系数,须用实际资料来估计。Cox回归模型浙江大学医学院流行病与卫生统计学教研室沈毅将h0(t)移至等式左边并去自然对数得:ln[hi(t)/h0(t)]=β1xi1+….+βpxip等式左边的部分为相对风险度的自然对数值,等式右边部分为伴随变量与相应回归系术的线性组合。βj(j=1,2,…,p)的实际意义是:在p-1个伴随变量为一定值时,当伴随变量xj每改变一个测定单位时所引起的相对风险度自然对数值的改变量。Cox模型假定各自变量xj的回归系数βj与危险度间呈指数函数关系。当βj=0时,说明xj对危险度不起作用;βj为正值时xj为危险因子,增大了危险度;βj为负值时xj=1与xj=0的两个危险度相比,则得到一个与h0(t)无关的比值,称为相对危险度。Cox回归模型浙江大学医学院流行病与卫生统计学教研室沈毅例3数据pancer.sav是关于胰脏癌术中接受放疗会否延长病人生存时间的研究。该研究的终点为死亡,接受手术被定义为计算生存时间的起点。由于该研究是一项未经随机化的观察研究,要正确估计术中接受放疗提高患者生存时间的效果,还需考虑对其他因子的效果进行调整。变量名变量说明变量类型分类变量的编码caseno患者编号time生存时间(月)连续censor删失2分类0:死亡、1:删失age手术时的年龄连续trt处理组别(有无手术中放疗)2分类0:无术中放疗、1:有术中放疗sex性别2分类0:男、1:女bui占位处2分类0:胰脏头部、1:头部以外ch胰胆管浸润程度有序多分类1:ch0、2:ch1、3:ch2、4:ch3p有无腹膜转移2分类0:无、1:有stageTNM分类2分类3:Ⅲ期、4:Ⅳ期Cox回归模型浙江大学医学院流行病与卫生统计学教研室沈毅Cox回归模型浙江大学医学院流行病与卫生统计学教研室沈毅Cox回归模型浙江大学医学院流行病与卫生统计学教研室沈毅ch为有序多分类,将其指定为哑变量进行分析Cox回归模型浙江大学医学院流行病与卫生统计学教研室沈毅累积生存函数曲线Cox回归模型浙江大学医学院流行病与卫生统计学教研室沈毅Cox回归模型相关性估计浙江大学医学院流行病与卫生统计学教研室沈毅上表输出总例数、删失例数、失访例数Cox回归模型分析结果(1)记录汇总表浙江大学医学院流行病与卫生统计学教研室沈毅Cox回归模型分析结果(2)哑变量对照表浙江大学医学院流行病与卫生统计学教研室沈毅p=0
本文标题:生存分析
链接地址:https://www.777doc.com/doc-1908058 .html