您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > 生存分析与Cox回归
生存分析与Cox回归流行病与卫生统计学教研室曹明芹2020/3/15生存分析与Cox回归2生存分析与Cox回归生存资料概述生存分析的基本概念生存资料的统计描述生存曲线的比较Cox回归2020/3/15生存分析与Cox回归3一、生存资料概述举例某医师分别用中药、西药各治疗急性肝炎病人40例,结果如下表,试问:哪种药物的治疗效果好?药物治疗例数谷丙转氨酶阴转率%平均阴转时间(天)中药4080.0021西药4080.0035两种药物的结局比较2020/3/15生存分析与Cox回归4一、生存资料概述随访研究(followup)是医学研究中常用的设计方法随访研究不仅要考虑观察对象的结局,还要考虑出现结局所经历的时间这类(既要考虑结局又要考虑结局出现的时间)资料称为生存资料(survivaldata)生存分析(survivalanalysis)是将观察的结局和出现结局所经历的的时间结合起来进行分析的统计方法。2020/3/15生存分析与Cox回归5一、生存资料概述医学随访研究一般有两种所有研究对象同时进入研究(观察起始时间相同)例如,队列研究、动物的随访观察被研究对象逐个进入研究(观察起始时间不同)例如,临床随访研究由于受经费和时间的限制,最终观察时间不能无限延长2020/3/15生存分析与Cox回归81.基本概念起始事件与终点事件起始事件—反映研究对象生存过程的起始特征事件。终点事件(outcomeevent)又称失效事件(failureevent)或死亡事件(deathevent)终点事件—研究者所关心的研究对象的特定结局,可以标志某种处理措施失败或失效的特征事件起始事件和终点事件是由研究目的决定的,在设计时就明确规定,并在研究期间严格遵守不能随意改变2020/3/15生存分析与Cox回归91.基本概念举例说明下列研究的起始事件与终点事件①急性白血病患者进行骨髓移植后以是否复发来评价骨髓移植效果②职业性铅中毒的危险因素(开始职业性接触至出现铅中毒症状)③冠心病患者两次发病的时间间隔④大肠癌患者手术后存活情况(手术、死亡)⑤接受健康教育对青少年戒烟到复吸的影响因素分析⑥接受某种保险方式后的中途退保分析2020/3/15生存分析与Cox回归101.基本概念生存时间(survivaltime)或失效时间(failuretime)生存时间指观察到的存活时间常用符号t表示生存时间是生存分析中的重要信息,必须准确明确规定起始事件、终点事件时间的测度单位(年、月、日)2020/3/15生存分析与Cox回归111.基本概念整个研究的观察时间研究开始到研究结束的时间因为有起始事件发生时间、终点事件发生时间、观察开始时间、观察结束时间,生存资料数据分为完全数据(completedata)和截尾数据(censoreddata)2020/3/15生存分析与Cox回归121.基本概念完全数据:指从观察起点到发生死亡事件所经历的时间,生存时间是完整确切的。截尾数据或截尾值(censoredvalue),又称删失值或终检值。生存时间观察过程的截止不是由于死亡/终点事件,而是由于其他原因引起的,称为截尾(censored)从观察起点到截尾时点所经历的生存时间称为截尾数据,习惯上在生存时间右上角标注“+”表示2020/3/15生存分析与Cox回归131.基本概念截尾的主要原因:①失访(withdrawal):失去联系,如信访无回音、电话采访不应答、上门采访找不到人、搬迁没留地址等②退出:死于非研究因素或非处理因素而退出研究,如死于意外或其他疾病③终止:设计时规定的研究时限已到而终止观察,但研究对象仍然存活患者编号性别年龄(岁)dtime手术时间终止随访时间结局生存时间(月)1男32101994-1-231994-12-24死亡112女48121998-2-141999-1-1失访10+3女2661992-3-41995-4-12死亡374男5531999-8-202001-9-21死于其他25+5女5882001-3-102001-12-31存活9+……………………表20-1 10年间346例大肠癌患者手术后的生存时间记录2020/3/15生存分析与Cox回归161.基本概念完全数据提供了观察对象确切的生存时间,是生存分析的主要依据;截尾数据仅提供了部分信息,研究者并不知道观察对象确切的生存时间。截尾数据太多会影响生存分析的效果那么截尾数据能不能删除?2020/3/15生存分析与Cox回归171.基本概念对生存资料的两种错误分析①抛弃截尾数据,只考虑确切数据损失样本含量、损失了信息,截尾数据提供部分信息,说明在某时刻之前仍存活②将截尾数据当作确切数据处理低估了生存时间的平均水平,截尾数据中存在生存时间较长的数据,如果损失,会使结果产生偏性2020/3/15生存分析与Cox回归181.基本概念对截尾数据进行分析是生存分析的重要特点,在生存分析中,结局变量常以1表示出现结局,0表示截尾。应变量有2个:生存时间t和结局变量(0-1)2020/3/15生存分析与Cox回归192.生存资料的特点①蕴涵有结局和时间两个方面的信息;②结局为两分类互斥事件;③一般是通过随访收集得到,随访观察往往是从某统一时间点(如确诊、入院或实施手术等某种处理措施后)开始,观察到某规定时间点截止;④常因失访等原因造成某些研究对象的生存时间数据不完整;⑤分布类型复杂,需用生存分析2020/3/15生存分析与Cox回归203.生存资料的数据形式患者编号性别年龄(岁)dtime结局生存时间(月)11321011122481201032266137415530255258809………………10年间346例大肠癌患者手术后的生存时间2020/3/15生存分析与Cox回归214.生存分析的基本内容①描述生存过程:研究生存时间的分布特点,估计生存率及其标准误、绘制生存曲线等。例如,根据乳腺癌患者手术后的生存资料,可以估计不同时间点的生存率及其标准误,如1年生存率、3年生存率、5年生存率等,还可以绘制生存曲线,观察乳腺癌患者手术后的生存过程。常用方法有乘积极限法和寿命表法。2020/3/15生存分析与Cox回归224.生存分析的基本内容②比较生存过程:获得生存率及其标准误的估计值后,可进行两组或多组生存曲线(生存过程)的比较。例如,比较两种不同治疗措施治疗恶性肿瘤患者的生存曲线,可了解哪种治疗措施较优,从而为临床决策提供依据。常用方法有对数秩检验。2020/3/15生存分析与Cox回归234.生存分析的基本内容③生存过程的影响因素分析例如,为了改善鼻咽癌患者的预后,应先了解可能影响患者预后的因素,如年龄、病程、病情、术前健康状况、有无淋巴结转移、术后有无感染、辅助治疗措施、营养状况等,通过随访收集患者术后的生存时间和上述因素的资料,然后采用多因素生存分析方法确定影响患者预后的主要因素,从而为在手术前后进行预防或干预提供参考依据。常用的多因素生存分析方法:Cox比例风险回归模型2020/3/15生存分析与Cox回归24生存分析的基本方法统计描述统计指标:生存率、中位生存时间列表和绘图:生存曲线统计推断参数法:指数分布、威布尔分布等非参数法:log-rank检验(单因素分析)半参数法:Cox回归(多因素分析)2020/3/15生存分析与Cox回归25二、生存资料的统计描述生存率及其标准误中位生存期生存曲线2020/3/15生存分析与Cox回归26基本概念2020/3/15生存分析与Cox回归27基本概念2020/3/15生存分析与Cox回归28基本概念2020/3/15生存分析与Cox回归29基本概念2020/3/15生存分析与Cox回归30基本概念2020/3/15生存分析与Cox回归31基本概念2020/3/15生存分析与Cox回归32常用方法乘积极限法(product-limitmethod)也称为K-M法(Kaplan-Meier法)小样本资料或大样本未分段(未按时间分组)资料寿命表法(lifetablemethod)大样本分段(按时间分组)资料2020/3/15生存分析与Cox回归331.未分组资料(乘积极限法/Kaplan-Meier法)0102030400.00.20.40.60.81.0(711):(7)(0.58330.4861):(0.58330.5)t4.104861.05833.0)5.05833.0)(117(7t2020/3/15生存分析与Cox回归362.分组资料(寿命表法life-tablemethod)kkkkDCLL12/kkkCLN/kkkqDN1kkpq0123456789100.00.20.40.60.81.0中位生存期为2.3生存资料的统计描述SPSS实现——例1生存资料的统计描述SPSS实现——例22020/3/15生存分析与Cox回归45三、生存曲线比较(单因素分析)2020/3/15生存分析与Cox回归46对上例进行分析时两种错误的做法:错误1:采用平均生存时间而不是中位生存时间来表示生存时间的平均水平。错误2:采用常规t检验或方差分析进行组间比较。2020/3/15生存分析与Cox回归48三、生存曲线比较(单因素分析)2020/3/15生存分析与Cox回归49三、生存曲线比较(单因素分析)2020/3/15生存分析与Cox回归52生存资料分析的基本要求样本应由随机抽样得到,要保证一定的样本含量死亡例数不宜太少截尾例数不宜太多生存时间应尽可能精确2020/3/15生存分析与Cox回归53对数秩检验(log-rank)注意事项①属于单因素分析方法,适用于两组及多组间的比较②可用于时间未分组的资料,也可用于时间分组资料③各组间生存时间的比较根据各组生存曲线的高低及中位生存时间判断④需满足生存资料的基本要求,且各样本生存曲线不能交叉⑤生存曲线若出现交叉,则提示可能存在混杂因素,应采用分层对数秩检验或Cox比例风险回归模型进行分析生存曲线比较SPSS实现——例32020/3/15生存分析与Cox回归56四、Cox回归对生存时间资料进行单因素分析(log-rank检验)时,要求各对比组在非处理因素方面均衡可比,而实际工作中却很难做到;很多因素会对生存时间产生影响,需用多因素分析方法。Cox回归也称比例风险模型(Proportionalhazardsmodel)是对生存资料进行多因素分析常用的统计方法2020/3/15生存分析与Cox回归57四、Cox回归Cox回归模型的一般形式回归系数的解释Cox回归应用条件回归系数的估计及假设检验Cox回归分析应注意的问题2020/3/15生存分析与Cox回归581.Cox回归模型的一般形式)...exp()()()...exp()()(2211022110ppppxxxththxxxtt病人处理组号性别(男=1)生存天数结局(死=1)风险函数(因人而异)风险率(随时变化)Namex1x2tdh(t)=h0(t)2211xbxbe18天48天90天王一11181h0(t)21bbeh0(18)21bbe黄二00481h0(t)h0(18)0eh0(48)0e张三01700h0(t)2beh0(18)2beh0(48)2be李四10901h0(t)1beh0(18)1beh0(48)1beh0(90)1be条件死亡概率(第i个死亡时刻))()(ththqjii,1211221121001,,eebbbbibbbbbbeeqeeeeee:偏似然函数(条件概率连乘)kpqqqL21,1211221211001eebbbpbbbbbbbeeLeeeeeeCox回归结构与原理示意图(4例肺癌)2020/3/15生存分析与Cox回归601.Cox回归模型的一般形式),...,,exp()(),...,,exp()(),...,,|(),...,,|(2102102121ppppxxxthxxxth
本文标题:生存分析与Cox回归
链接地址:https://www.777doc.com/doc-4379611 .html