您好,欢迎访问三七文档
当前位置:首页 > 金融/证券 > 综合/其它 > 医学统计学第16-章生存分析
第十六章随访时间资料的分析生存分析(survivalanalysis)是既考虑结局又考虑生存时间的一种分析方法,并可以充分利用不完全数据,对生存时间的分布特征进行统计描述和统计推断,也可以通过多因素模型对影响生存时间的主要影响因素进行分析。通过生存分析方法才能对临床随访资料进行全面和准确的评价。表16-1甲(手术组)、乙(手术+放疗)两组治疗方案肺癌病人临床随访结果分组编号开始治疗日期终止日期结局生存日数生存率(%)平均生存日数甲101.5.2105.5.15生1454甲202.6.1502.10.15死120甲301.6.1701.9.15死8860.0749甲403.6.2005.5.15生695甲501.7.2505.5.15生1390乙602.6.1305.5.15生1067乙701.7.105.5.15生141460.0958乙801.7.303.6.13死710乙901.8.905.5.15生1376乙1001.9.502.4.11死221第一节生存分析的基本概念一、基本概念1、生存时间(survivaltime)是任何两个有联系事件之间的时间间隔,常用符号t表示。从狭义的角度来讲,生存时间指患某种疾病的病人从发病到死亡所经历的时间。广义的生存时间定义为从某种起始事件到终点事件所经历的时间。2、失效事件(failureevent)一般是指反映治疗效果特征的事件,又称死亡事件或终点事件。它是根据研究目的所确定,因此在研究设计时必需明确规定,并在研究的实施中严格遵守。起始事件(initialevent)是反映生存时间起始特征的事件终点事件(死亡事件、失效事件):反映研究对象生存过程特定结局的事件完全数据:对研究对象观察到死亡,得到准确的生存时间不完全数据:对失访、研究结束时仍存活等研究对象,无法得到准确的生存时间3、生存资料的类型截尾的主要原因有三种:(1)失访:指失去联系;(2)退出:是指退出研究,如死于其它原因、临时改变治疗方案等;(3)终止:指研究时限已到而终止观察。●▲●起始事件●▲●╳▲终点事件●▲●▲╳失访●╳●╳○截尾●○●○●○研究时间研究时间研究起点研究终点研究起点研究终点图16-1队列研究示意图16-2临床随访研究示意5、生存时间资料的分布特征生存时间资料常通过随访获得,因观察时间长且难以控制混杂因素,再加上存在截尾数据,规律难以估计,一般为正偏态分布。6、生存率(survivalrate)与死亡概率①生存率:又叫累积生存率或生存函数。表示观察对象其生存时间T大于t时刻的概率,常用S(t,X)=P(Tt,X)表示。在实际工作中,如无截尾数据,生存率是用生存时间大于t的病人数除以开始观察的病人总数来估计的。ˆ()tSt生存时间大于的病例数病人总数②死亡概率:表示观察对象从开始到时间t为止的死亡概率,是一个随时间上升的函数,F(t,X)=P(T≤t,X)。死亡概率与生存率的关系是:S(t,X)=P(Tt,X)=1-F(t,X)。当t=0时,死亡概率为0;当观察期为无穷大时,其死亡概率为1。(条件)死亡概率(ConditionalProbabilityofFailure):是指在某单位时段开始时存活的个体在该时段内死亡的可能性大小。(条件:在某时段的条件下)某年年初观察例数某年内死亡数qˆ截尾例数年初观察例数校正人口数217、死亡密度函数(deathdensityfunction)死亡密度函数是死亡概率函数的导数,表示所有观察对象在t时刻的瞬时死亡率。f(t)定义如下:PDF:概率密度函数的估计值'0()()lim()tPtTttftttF如果无截尾数据时,f(t)可估计如下:区间长度病人总数人数开始的区间内死亡的病在时刻ttf)(ˆ8、风险函数(hazardfunction)风险函数:生存时间达到t的一群观察对象在t时刻的瞬时死亡率。0()lim()thtPtTttTt生存函数、风险函数、死亡密度函数的关系:()()()fthtSt无截尾数据时,h(t)可估计为:2/)(ˆ内死亡的病人数生存的病人数-在区间在时刻亡的病人数在区间内每单位时间死tth例16-1现有40个肝癌病人的随访资料,见表16-2,试估计生存函数、死亡密度函数和风险函数。(SAS程序见例16-1无截尾程序)由于本资料无截尾数据,故可用16-1、16-2和16-3式作出估计。以5~区间为例:875.04035)5(ˆs;035.05407)5(ˆf;044.02/7355/7)5(ˆh一般来讲,生存函数、死亡密度函数和风险函数具有以下关系)()()(tstfth,即044.0)5(ˆ04.0875.0035.0)5(ˆ)5(ˆhsf表16-240个肝癌病人的随访资料时间(月)t期初例数期内死亡数生存函数)(ˆts死亡密度函数)(ˆtf风险函数)(ˆth0~4051.0000.0250.0275~3570.8750.0350.04410~2860.7000.0300.04815~2240.5500.0200.04020~1850.4500.0250.06525~1340.3250.0200.07230~940.2250.0200.11435~500.1250.0000.00040~520.1250.0100.10045~310.0750.0050.08050~220.050--datali16_1;inputcountctime;cards;510715611041155120412541300135214011452150;proclifetestplots=(s)method=lifewidth=5;timetime*c(0);freqcount;run;LifeTableSurvivalEstimatesConditionalEffectiveConditionalProbabilityIntervalNumberNumberSampleProbabilityStandard[Lower,Upper)FailedCensoredSizeofFailureErrorSurvivalFailure055040.00.12500.05231.000005107035.00.20000.06760.87500.125010156028.00.21430.07750.70000.300015204022.00.18180.08220.55000.450020255018.00.27780.10560.45000.550025304013.00.30770.12800.32500.67503035409.00.44440.16560.22500.77503540005.0000.12500.87504045205.00.40000.21910.12500.87504550103.00.33330.27220.07500.925050.202.01.000000.05000.9500SurvivalMedianMedianPDFHazardIntervalStandardResidualStandardStandardStandardLower,UpperErrorLifetimeErrorPDFErrorHazardError05017.50003.95280.02500.01050.0266670.0118995100.052315.50002.95800.03500.01200.0444440.01669410150.072514.00002.64580.03000.01130.0480.01945415200.078712.50002.93150.02000.009490.040.019920250.078710.00002.65170.02500.01050.0645160.02847525300.07418.12502.25350.02000.009490.0727270.03575830350.066011.25003.75000.02000.009490.1142860.05476135400.052312.50005.59020.0.40450.05237.50005.59020.01000.006890.10.06846545500.0416..0.005000.004940.080.07838450.0.0345......二、生存分析研究的主要内容1、描述生存过程:研究生存时间的分布特点,估计生存率及平均存活时间,绘制生存曲线等。根据生存时间的长短,可以估计出各时点的生存率,并根据生存率来估计中位生存时间。同时也可以根据生存曲线分析其生存特点2、比较生存过程可通过生存率及其标准误对各样本的生存率进行比较,以探讨各总体的生存过程是否有差别。3、影响生存时间的因素分析通过生存分析模型来探讨影响生存时间的因素,通常以生存时间和结局为应变量,而将影响它们的因素作为自变量,通过拟合生存分析模型,筛选出影响生存时间的保护因素和风险因素,为临床治疗及预防提供重要的参考。三、生存分析的基本方法1.非参数法:不论资料呈何分布,可根据样本提供的顺序统计量,采用乘积极限法、寿命表法对生存率作估计。对两个及多个生存率的比较,无效假设是“两组或多组总体生存时间分布相同”,不对其具体的分布形式及参数作推断。2.参数法假定生存时间服从某种参数分布⑴指数分布法⑵Weibull分布法⑶对数正态回归分析法⑷对数logistic回归分析法通过估计分布的参数得到生存率的估计值,两组及多组生存率的比较,对分布的参数进行统计推断。3.半参数法:兼有参数法和半参数法的特点对生存时间、生存率作多因素影响分析典型方法Cox模型第二节生存率的估计与生存曲线一、小样本资料的生存分析例16-2在儿童急性淋巴细胞白血病(ALL)的生存研究中,有21例高危儿童ALL的临床随访资料。生存时间定义为确诊日期到病人死亡日期的时间跨度,得到的生存时间(月),见表15-3第(1)栏,其中有“+”者是截尾数据,表示病人仍生存或失访。试计算其生存率与标准误。表16-3高危ALL儿童生存率计算方法序号i时间(月)t(1)死亡人数d(2)期初观察人数n(3)条件死亡率F(4)条件生存率S(5)生存率P(Tt)(6)标准误Sp(7)111210.0480.9520.9520.0465231200.0500.9500.9050.0641341190.0530.9470.8570.0764451180.0560.9440.8100.0857561170.0590.9410.7620.0929681160.0630.9370.7140.09867101150.0670.9330.6670.10298111140.0710.9290.6190.10609121130.0770.9230.5710.108010141120.0830.9170.5240.109011171110.0910.9090.4760.109012181100.1000.9000.4290.10801324190.1110.8890.3810.10601430180.1250.8750.3330.10291531170.1430.8570.2860.09861651160.1670.8330.2380.09291762+050.0001.0000.238-1878+050.0001.0000.238-1988+050.0001.0000.238-20115+050.0001.0000.238-21124+050.0001.0000.238-dataex16_2;inputmonthcensor@@;cards;10304050608010011012014017018024030031051062178188111511241;proclifetestplots=(s);timemonth*censor
本文标题:医学统计学第16-章生存分析
链接地址:https://www.777doc.com/doc-3149437 .html