您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 企业财务 > 医学统计学课件--生存分析第十七章
2020/1/5医学统计学1第十七章生存分析(SurvivalAnalysis)随访研究及统计分析第二军医大学卫生统计学教研室孟虹2020/1/5医学统计学2本章内容第一节生存分析的基本概念第二节生存率的估计与生存曲线*第三节生存曲线的Log-rank检验第四节COX比例风险回归模型*第五节寿命表(不讲)*要求掌握概念、方法、用途。2020/1/5医学统计学3概述•临床上疗效、预后的评价常用疾病的结局指标:如有效率、治愈率、死亡率比较。对于短期内能明确治疗效果的疾病是适用的。但对于远期疗效,上述指标的评价不全面。2020/1/5医学统计学4例某病的疗效比较治愈率(%)平均治愈时间(月)甲药8020乙药8112疗效除了应评价“结局”的好坏,结局所经历时间长短也是评价疗效重要的指标。2020/1/5医学统计学5例2:两种方法对疾病的疗效方法治疗人数生存人数生存率%甲方法1002020乙方法1005050经χ2检验p<0.05,乙法预后优于甲法。假定:1.观察期间疾病的死亡率不随时间变化。2.研究对象观察时间长度相等。2020/1/5医学统计学6随访研究随访研究(follow-upstudy)是医学中常用前瞻性研究.例:两种方法肾移植病人术后肾的生存时间和结局(生存率)比较.例:不同方法对某病人(癌症、反复发作疾病)生存时间(缓解时间)与结局(生存率)比较.该类数据通过随访得到,称为随访资料。2020/1/5医学统计学7随访研究资料•当研究事件(y)的结局是两分类数据(发生,不发生),并且结局与时间(t)有关,如同时收集事件发生的时间(t),该类数据称为随访资料,分析该数据的统计方法用生存分析。•生存分析是将“结局”与“时间”两个因素结合一起研究的统计分析方法。2020/1/5医学统计学8一、随访数据概念1.分析的变量(y)1)结局事件:指结局出现的特征,如疾病的死亡、复发、发生(y=1或0)。2)时间间隔变量记为(t)t=结局事件出现日期-事件的起始日期(起始日期可规定:如诊断、用药、手术日期等),t的单位:可用年、月、周表示第一节生存分析的基本概念2020/1/5医学统计学92.截尾数据观察过程中个体因其他原因未观察到明确的结局,称为截尾或删失数据(censoreddata)。截尾原因有:①失访,②退出研究,如其他原因死亡。③研究时间结束,未出现结局事件。截尾值(censoredvalue):时间(t)=截尾事件日期-起始事件日期记为t+。(例:10+月)2020/1/5医学统计学103.生存数据的特点1)完全数据:研究对象在规定研究期间提供确切的“时间和结局”。2)截尾数据(t+):截尾数据虽然提供的信息不完全,但提供了部分信息,如t=10+年>9年。3)生存数据的结果变量(Y)有两个:时间(t)值,t>0结局状态(y)=“如死亡或截尾值”2020/1/5医学统计学11二资料的收集(一)随访研究设计1.明确研究对象的起始事件时间,如手术日期等。2.明确结局事件:如死亡或复发。3.明确研究跨度时间:如2000年至2005年结束。4.记录个体影响结果(y)的其他自变量。2020/1/5医学统计学12例:收集生存数据和影响预后的因素。某病不同药后随访记录(天)预后因素随访记录病例性别处理开始终止是否生存号组日期日期死亡时间11A药98/07/1298/11/29114022B药98/07/0198/12/29116031A药98/08/2298/11/2909942B药98/10/2098/11/25车祸死亡3602020/1/5医学统计学13(二)随访的方式1.全部观察对象同时接受不同处理(起点相同)随访方式:多见于动物实验(见图17-1,a)2.观察对象在不同时间接受处理因素(起点不同)随访方式:临床试验研究(见图17-1,b)2020/1/5医学统计学14起始事件时间如给药0研究结束时间t×O××O×为死亡O为截尾动物实验随访数据(图17-1,a)2020/1/5医学统计学1590年91年92年93年(研究结束)死亡失访死亡一批病人不同时间进入研究的随访资料起点存活起点起点起点起点存活2020/1/5医学统计学16资料整理和记录某人研究手术方法治疗23位肾上腺肿瘤病人的生存时间(月)如下:1,3,5(3),6(3),7,8,10(2),14+,17,,19+,20+,22+,26+,31+,34,34+,44,59注:()括号内的数为相同时间点的人数数据另一种记录:对象编号生存时间(t)结局状态(0为截尾值)11121402020/1/5医学统计学17(三)生存分析主要研究的内容1.统计描述:计算不同时间点(t)的生存率,描述生存过程。2.统计推断:检验不同处理方式的生存过程有无统计差别.3.自变量(x)对生存时间(t)的关系:影响生存时间的危险因素分析.2020/1/5医学统计学18第二节生存率的估计与生存曲线(一)描述生存资料的几个指标1.不同时间点生存率2.生存曲线3.中位生存时间2020/1/5医学统计学19几个率概念死亡率、死亡概率、生存概率、生存率死亡率:表示在单位时间(年)内死亡发生的频率(年平均死亡水平)。%1000某年的平均人数某年内死亡数某年死亡率2020/1/5医学统计学20死亡概率(F):在某时间段(t)开始存活的个体,死于(t+△t)该时段内的可能性。生存概率(pi=1-F):指某时间段开始存活的个体到该时间段结束时仍存活的概率。dFn某时间段内的死亡数某时间段初的观察数(17-1)某时间段初的观察数某时间段存活人数p死亡概率、生存概率2020/1/5医学统计学21生存率(survivalrate)称为生存函数记为S(t)S(t):指观察对象从起始事件(如手术时间为0点)开始,到t时刻仍存活的概率。常用n年生存率表示。()()itXnst时刻存活的人数年生存率观察的总人数时间ti,i=1,2,3…n假设数据是完全数据,计算见例2020/1/5医学统计学22例:某病病人术后生存率生存期初死亡生存死亡生存生存率人数人数人数概率概率[0,1]10010900.10.90.90[1,2]9010800.110.890.80[2,3]8020600.250.750.609.010090)1(s观察的总人数时刻存活的人数年生存率iittsn)()(its)(,1iitt80.010080)2(s2020/1/5医学统计学23生存时间数据分析时整理示意图•••死亡02468101214161820年“t”表示从研究起点到结局出现时间t失访失访死亡死亡死亡2020/1/5医学统计学24生存率S(t)的概率乘法估计S(t)也称累计生存概率,t时刻存活是t时刻之前一直生存的累积。概率乘法原理计算(359页)Pi为某时间区间(ti)的生存概率。假定个体在各时段生存是独立。(公式17-2)iiippppts...)(212020/1/5医学统计学252.生存曲线:(survivalcurve)指各时点(t)为横轴,生存率S(t)为纵轴,连接一起的曲线图。描述生存率在各时点(t)的变化过程。3.半数生存期(中位数生存时间)即生存率为0.5时对应的时间(t),描述一组数据平均生存时间。注:生存时间(t)是正偏态分布。2020/1/5医学统计学26SurvivalFunctions6050403020100CumSurvival(%)1.21.0.8.6.4.20.0-.2甲手术乙手术图17-2两种手术治疗方式术后病人生存曲线的比较月2020/1/5医学统计学27(二)生存率估计的统计方法(非参数方法)1.小样本数据生存率计算*。用kaplan-Meier的乘积极限法(product-limitmethod,PL法)方法:1)将生存时间t由小到大排列。截尾值排在完全数据后,例:20,20+2)列出t时刻死亡数(d)3)生存率估计用概率乘法原理例:17-1和表17-12020/1/5医学统计学28例17-1:某手术方法(甲法)治疗23例肾上腺肿瘤病人后生存情况(讲义358页)生存时间(t,月),其中“+”者为截尾数据1,3,5(3),6(3),7,8,10(2),14+,17,19+,20+,22+,26+,31+,34,34+,44,59计算生存率s(t)和生存曲线2020/1/5医学统计学29表17-1甲种手术后病人生存率的计算方法时间(月)死亡期初死亡生存生存率ti人数人数概率概率11230.0430.9570.95731220.0450.9550.91453210.1430.8570.78363180.1670.8330.65271150.0670.9330.60981140.0710.9290.565102130.1540.8460.47814+0110.0001.0000.478tt)(txp2020/1/5医学统计学30表17-1资料甲手术描述指标(SPSS软件)SurvivalStandard95%ConfidenceTimeerrorIntervalMean:24.234.99(14.44,34.01)Median:10.006.96(.00,23.63)••表17-2资料乙手术描述指标•SurvivalStandard95%ConfidenceTimeErrIntervalMean7.801.18(5.50,10.10)Median6.002.98(0.16,11.84)2020/1/5医学统计学312.大样本资料的生存分析方法—寿命表法(Life-tablemethod)表17-32418例男性心绞痛病人生存率情况术后死亡截尾期初校正生存生存率年数人数人数人数人数概率(t+1)0-4560241824180.81140.81141-2263919621942.50.88370.7172-15222169716860.90980.6524校正人数=1962-39/2=1942.5例17-32020/1/5医学统计学32寿命表法与PL的区别1.计算在时间段的生存率。如0-1年、1-2年,时间段组距相等。2.寿命表方法计算死亡概率,用校正观察人数计算。假定有截尾事件的人在各时间组内平均生存为1/2时间。死亡概率=某时间组内死亡人数/校正观察人数(校正观察人数=期初观察人数-截尾人数/2)1,()iitt2020/1/5医学统计学33第三节生存曲线的统计检验比较不同方法的生存率,常进行生存率曲线间的比较。方法:时序检验(Log-Ranktest),可对两组或多组生存率曲线做比较.检验假设:H0:两总体的生存率曲线相同H1:两总体的生存率曲线不同α=0.05,如P≤α,拒绝H02020/1/5医学统计学34Log-rank检验检验统计量:该χ2服从自由度=比较组数-1Ai为某组各时点实际死亡频数合计.Ti为某组各时点期望死亡频数合计i表示比较组,i=1,2,…k组22()iiiATT2020/1/5医学统计学35Log-rank检验的基本思想时间甲法手术组乙法手术组合计tT1iT2i12311.6052021.39543322200.5501810.450401•1in1id2in2idinid1113231.60543iiidTnn2123201.39543iiidTnn表17-4部分数据,365页按两组合计死亡率计算各组理论频数(T).2020/1/5医学统计学36两组生存率曲线的检验H0:s(t1)=s(t2)ν=组数-1=2-1,p<0.01结论:两生存率曲线有统计差别,甲手术方法后生存率高于乙法.222(1623.809)(2012.191)7.5623.80912.19163.656.721,01.02乙乙乙甲甲甲)()TTATTA222(2020/1/5医学统计学37SurvivalFunctions6050403020100CumSurvival(%)1.21.0.8.6.4.20.0-.2甲
本文标题:医学统计学课件--生存分析第十七章
链接地址:https://www.777doc.com/doc-2640433 .html