您好,欢迎访问三七文档
19生存分析回归分析1个因变量Y1个自变量X2个以上自变量XY是数值变量Y是分类型变量两个因变量(结局分类变量+时间)生存分析Cox回归④一元回归SimpleregressionLogistic回归Logisticregression多重回归Multipleregression①②③常用的回归分析:曲线回归线性回归主要特点:考虑到了每个研究对象出现某一结局所经历的时间长短。生存分析(survivalanalysis)——将终点事件和出现终点时间所经历的时间结合起来分析的一类统计分析。例:某医院泌尿外科医师对可能影响膀胱肿瘤术生生存的因素进行了调查,选择1996-2000年间手术治疗的膀胱肿瘤患者30例,随访截止日期2000年12月30日:编号年龄(岁)肿瘤分级肿瘤大小/cm是否复发手术日期终止观察日期结局生存时间/月162I≤3.0002/10/199612/30/2000存活59264I≤3.0003/05/199608/12/2000死于膀胱瘤54352II≤3.0104/09/199612/03/1999失访44460I≤3.0006/06/199610/27/2000死于冠心病53559II>3.0007/20/199606/21/1998死于膀胱瘤23659I>3.0108/19/199609/10/1999死于膀胱瘤37…表19-230例膀胱肿瘤患者生存资料的原始记录表对缺损数据无法处理。Logistic分析的缺陷:只考虑终点事件的出现与否。但在研究中,还需要考察对象到达终点时所经历时间的长短,也就是说研究者对医学事件发生、发展所经历的时间感兴趣。如恶性肿瘤、慢性病等各个观察对象随访各时间点的发生情况,以评价临床疗效和控制的好坏。生存分析有结局和生存时间两个因变量;生存时间分布不正态—非负且右偏;可能含有删失数据(censor)。生存资料特点:生存分析特点:同时考虑结局和生存时间两个因变量;可处理生存时间分布不正态的问题;可处理删失数据。生存分析19.1概述。19.2生存率的估计。19.3生存曲线的比较。19.4Cox比例风险回归模型19.1生存分析的概述三要素:1.生存时间(survivaltime)——从规定的观察起点到某一特定终点事件出现的时间长短。终点事件生存时间观察起点生存分析中的基本概念:随机对照临床试验研究:观察起点通常是随机化分组的时间。观察性研究:观察起点可以是发病时间、第一次确诊时间或接受正规治疗的时间;终点事件可以是某种疾病发生、某种处理的反应、疾病的复发或死亡等。终点事件生存时间观察起点⑴疾病确诊死亡痊愈死亡⑵治疗开始复发痊愈⑶症状缓解疾病恶化⑷接触毒物出现毒性反映⑸接触危险因素发病观察性研究:合格的研究对象出现结果尚未出现结果失访、脱落试验组对照组伴随因素干扰因素随访研究(follow-upstudy)示意图随机对象的临床试验研究:随访研究:时间终点事件:死于膀胱肿瘤研究截止时点2000/12/30死亡失访死于冠心病死亡死亡生存时间到截止时间事件尚未发生死亡删失完全数据:在规定的观察期内,对某些观察对象观察到了终点事件发生,从起点到终点事件所经历的时间,称为生存时间的完全数据(completedata)。用符号“t”表示。删失数据(截尾数据):规定的观察期内,对某些观察对象,由于某种原因未能观察到病人的终点事件发生,并不知道其确切的生存时间,就象病人生存时间在未达到规定的终点就被截尾一样,称为生存时间的删失数据,又称截尾数据,用符号“t+”表示。2.生存数据类型:产生删失数据的常见原因有:研究结束时终点事件尚未发生;失访;死于其它原因;由于严重药物反应而终止观察或改变治疗措施。生存分析的特点:特点:同时考虑生存结局和生存时间可能含有删失数据(censor);生存时间分布不正态—非负且右偏。生存分析生存资料可处理删失数据;可处理生存时间分布不正态的问题。处理删失/截尾数据时两种错误的做法:错误1:只考虑确切数据,丢弃截尾数据(损失信息);错误2:将截尾数据当作确切数据处理(低估了生存时间的平均水平)。在处理正偏态分布数据时两种错误的做法:错误1:采用平均生存时间而不是采用中位生存时间来表示生存时间的平均水平。错误2:采用常规t检验或方差分析进行组间比较。(应采用log-rank检验比较几组生存时间)2.生存分析中常用概念:死亡概率(probabilityofdeath);生存概率(probabilityofsurvival);生存率(survivalrate)及其标准误;中位生存期(mediansurvivaltime)及四分位间距;风险函数(hazardfunction):t时刻存活的个体在t时刻的瞬时死亡率。针对单位时间的⑴死亡概率(probabilityofdeath):表示某单位时段开始存活的个体,在该时段内死亡的可能性;如年死亡概率。某年年初人口数某年内死亡人数)死亡概率(q注意:如果年内有删失,则分母用校正人口数:校正人口数=年初人口数—删失例数/2末人口数:n-k初人口数:n期间死亡人数:k⑵生存概率(probabilityofsurvival):单位时段开始时存活的个体,到该时段结束时仍然存活的可能性。注意:若年内有删失,分母用校正人口数。qp1某年年初人口数某年活满一年人数)生存概率(末人口数:n-k初人口数:n期间死亡人数:k⑶生存率(survivalrate):0时刻存活的个体经历tk时个单位时间段后仍存活的可能性。观察总例数时刻仍存活例数kkttTPtS)()(ˆ若资料中无删失数据时:解:1.各年生存概率p1=(50–10)/50=0.80p2=(40–10)/40=0.75p3=(30–10)/30=0.672.3年生存率S(3)=P(T≥3)=(50–30)/50=0.4=p1×p2×p3【举例】手术治疗50例肺癌病人,术后1,2,3年的死亡数分别为10,10,10例,无截尾数据。试求各年的生存概率和3年生存率。故生存率又称为累积生存概率(cumulativeprobabilityofsurvival),它是随着时间的变化而变化着的,是关于时间的函数,称为生存函数(survivalfunction)。若资料中有删失数据,则须分段计算生存概率,再应用概率乘法定理将分时段的生存概率相乘得到生存率:kkkkkptSppptTPtS)(ˆ......)()(ˆ121区分:生存率——生存概率生存概率是针对单位时间而言的;生存率是针对某个较长时段的,是生存概率的累计结果。②生存期的四分位数间距:Q=P75-P25是反映离散程度大小的指标。⑷中位生存期及四分位数间距①中位生存期(mediansurvivaltime):也称半数生存期,是生存时间中位数(M/P50),表示恰有50%的个体存活的时间,即生存率为50%时对应的生存时间,是描述集中趋势的指标。中位生存期越长,表示疾病的预后越好。⑸风险函数(hazardfunction):t时刻存活的个体在t时刻的瞬时死亡率。h(t)近似地等于t时刻存活的个体在此后一个单位时段内的死亡概率。ttTttTtPthtlim0)(生存分析的基本步骤:估计生存率(生存函数)估计生存曲线评价生存时间影响因子的效果生存时间分布的组间比较1.寿命表法2.Kaplan-Meier法在不考虑其它混杂因素的情况下,可用寿命表法和Kaplan-Meier法作Cox回归模型Logrank检验21.2生存曲线的估计生存率估计或称乘积极限法(productlimitmethod)大样本资料:寿命表法小样本资料:kaplan-meier法19.2.1寿命表法(lifetablemethod)例21-1收集374名某恶性肿瘤患者的随访资料,取时间区间均为1年,整理结果见下午表,试估计各年生存率。解析:该生存资料为大样本,生存时间粗略且含有删失数据。方法原理:1.计算期初有效例数,注意删失数据期初有效例数=期初病例数-期内删失数/22.计算死亡概率、生存概率死亡概率=期内死亡数/期初有效例数生存概率=1-死亡概率3.计算生存率。4.作生存曲线。寿命表法寿命表法①②③④寿命表法曲线为折线。该法只估计时段右端点的生存率,省略了时段内的生存率估计。恶性肿瘤患者确诊后5年内生存率下降较快,5年后下降较平缓,说明确诊5年内该恶性肿瘤患者的死亡威胁较大。中位生存期【电脑实现】—SPSS1.数据录入:频数形式生存分析—寿命表法【Time】生存时间(年)【Status】0:删失数据1:完全数据(死亡)【Freq】频数2.加权3.SPSS过程4.结果及结果输出:期初病例数期内删失数期初有效例数期内死亡数死亡概率生存概率生存率概率密度生存率标准误概率密度标准误风险率风险率标准误19.2.2乘积极限法——kaplan-meier法例19-2按下表数据,14例膀胱肿瘤<3.0cm患者和16例膀胱肿瘤≥3.0cm患者的生存时间(月)如下,试估计两组生存率。<3.0cm14192628293236404244+4553+5459+≥3.0cm67910111213202325273034374350解析:以“<3.0cm”组为例,n=14,样本含量较小且含删失数据。方法原理:1.将生存时间由小到大依次排列,2.在每个时间区间上,计算死亡人数、删失人数、期初人数、死亡概率、生存概率和生存率。3.作生存曲线。乘积极限法——kaplan-meier法+++①②③④Kaplan-Meier法生存曲线为阶梯形曲线。中位生存期【电脑实现】—SPSS1.数据录入生存分析—Kaplan-Meier【Group】1:3.0cm;2:3.0cm【dtime】生存时间(月)【Status】0:删失数据1:完全数据(结局事件)2.SPSS过程CaseProcessingSummary1411321.4%16160.0%3027310.0%group3.0cm=3.0cmOverallTotalNNofEventsNPercentCensored3.结果及结果输出:SurvivalTable14.000完全.929.06911319.000完全.857.09421226.000完全.786.11031128.000完全.714.12141029.000完全.643.1285932.000完全.571.1326836.000完全.500.1347740.000完全.429.1328642.000完全.357.1289544.000删失..9445.000完全.268.12310353.000删失..10254.000完全.134.11311159.000删失..1106.000完全.938.0611157.000完全.875.0832149.000完全.813.09831310.000完全.750.10841211.000完全.688.11651112.000完全.625.12161013.000完全.563.1247920.000完全.500.1258823.000完全.438.1249725.000完全.375.12110627.000完全.313.11611530.000完全.250.10812434.000完全.188.09813337.000完全.125.08314243.000完全.063.06115150.000完全.000.000160123456789101112131412345678910111213141516group3.0cm=3.0cmTimeStatusEstimateStd.ErrorCumulativeProportionSurvivingattheTimeNofCumulativeEventsNofRemainingCasesMeansandMediansforSurvivalTime38.1523.74030.82245.48236.00
本文标题:生存分析
链接地址:https://www.777doc.com/doc-7122348 .html