您好,欢迎访问三七文档
当前位置:首页 > 金融/证券 > 综合/其它 > 生存分析-医学统计学
2020/2/31引例现用新旧两种方法治疗某癌病患者各100人,结果如下表,试评价其疗效表3新旧两种方法治疗某癌病死亡人数新法组旧法组RR一年16151.01二年25350.70五年40800.50*2020/2/322020/2/33一、基本概念•生存时间(survivaltime):疾病治疗的预后情况,一方面看结局好坏,另一方面还要看出现这种结局所经历的时间长短。所经历的时间称为生存时间。•完全与不完全数据•一部分研究对象可观察到死亡,从而得到准确的生存时间,所提供的信息是完全的,称为完全数据;另一部分病人由于失访、意外事故、或到观察结束时仍存活等原因,无法知道确切的生存时间,它提供了不完全的信息,称为不完全数据(截尾数据、删失数据:censordata)。2020/2/34•始点终点2020/2/35•始点终点2020/2/36•生存分析(survivalanalysis):生存时间一般是通过随访收集。不完全数据提供了部分信息。须要用专门的方法进行统计处理,这类统计方法起源于对寿命资料的统计分析,故称为生存分析。2020/2/37“生存”的概念生物生存与死亡仪器始使正常与出现故障疾病产生与治愈疾病治愈与复发阴性与阳性2020/2/38截尾数据的处理•因为不太好处理截尾数据,很多临床研究工作者常常将失访或中止等原因造成的截尾数据在分析时抛弃。截尾数据提供的信息虽然是不完全的,但也很有价值,不应随便删掉它。2020/2/39生存分析的主要内容第一,描述生存过程研究生存时间的分布特点,估计生存率,生存曲线;第二,比较生存过程(假设检验)对两组或多组生存率进行比较;第三,影响生存时间的因素分析了解影响生存过程的主要因素为改善预后提供指导。2020/2/310例在对资料进行描述时:5名癌症患者存活时间(月)610142020n=5平均生存时间,mean=18,median=1478+2535+50当有截尾数据时,?2020/2/311死亡概率(mortalityprobability)•是指死于某时段内的可能性大小.记为q,年死亡概率计算公式为:•某年内死亡数•q=───────•某年年初人口数•若年内有删失,则分母用校正人口数:•校正人口数=年初人口数-1/2删失数•二、生存资料常计算的几种率2020/2/312死亡概率(2)•死亡概率是指已活满t时刻的个体,在此后一段时期内(t至)死亡的可能性。死亡概率的计算公式为时刻的个体数活过数时段内死于本病的个体至ttttqtt2020/2/313•若t至内有截尾值,上式的死亡概率也偏低,可对分母加以调整,为:•如果很短,即时,死亡概率为t时刻的瞬时死亡概率,或称为危险函数(hazardfunction,h(t)),其意义为刚刚活过t时刻的个体在t时刻死亡的概率。2/期内截尾值个数时刻的个体数活过数时段内死于本病的个体至ttttq0ttt2020/2/314生存概率(survivalprobability)•表示在某单位时段开始时存活的个体到该时段结束时仍存活的可能性大小,记为p。年生存概率计算公式为:•活满某一年人数•p=1-q=────────•某年年初人口数•若年内有删失,则分母用校正人口数。2020/2/315•若在t至时段内有截尾值,也应计算调整生存概率•生存概率与死亡概率之间有以下关系:p=1-qtt2/截尾值个数时刻观察的个体数时刻仍存活的个体数tttp2020/2/316生存率与生存函数•累积生存概率,简称生存率,是指病人经过t个时间单位之后仍存活的概率。•若令s(t)为任意时刻t的生存率,T为生存期,得s(t)=p(T≥t)0≤t∞,称s(t)为生存率函数,简称生存函数观察病人总数时刻仍存活的例数ttTPtS)()(kkkppptTPtS21)()(2020/2/317三、生存率估计(描述)•医学研究中的生存资料分布常常不规则、不确定或未知分布,因而常用非参数法估计生存率。•根据样本含量的大小可分别选择–乘积极限估计法(小样本时)–寿命表法(大样本时)2020/2/3181.乘积限估计法Product-limitmethod•简称积限法或PL法,直接用概率乘法原理估计生存率,它是由统计学家Kaplan和Meier于1958年首先提出的,因此又称为Kaplan-Meier法.•基本思想:将生存时间(包括截尾数据)逐个由小到大依次排列,并对其中的每个死亡点进行死亡概率、生存概率和生存率估计。•应用条件:数据个数较少时。2020/2/3192.寿命表法(Lifetablemethod)•简称LT法。•基本思想:随访时间划分成若干个时间区间,t时刻的生存率为t时刻前各时间区间生存概率的乘积。•应用条件:数据个数多,经分组时应用。2020/2/3203.Kaplan-meier法计算生存率•此法计算生存率时,先将每个个体的生存时间按照由小到大的顺序排列,排序时若截尾值与非截尾值的观察时间相同,则规定非截尾值小于截尾值,排在截尾值之前。•然后依次计算出各时段的死亡概率、生存概率,进而计算出从观察开始至各时刻的生存率及其标准误。2020/2/321小样本生存分析Kaplan-Meier方法在SPSS中的实现生存状态:1死亡,0截尾2020/2/322SPSS软件实现方法•File→Open→相应数据文件→Analyze→Survival→Kaplan-Meier→Time(时间)→Status→Defineevent→singlevalue(1)→Continue→OK2020/2/3232020/2/324选择选项2020/2/325MeansandMediansforSurvivalTime246.66775.00699.654393.679133.00043.27448.182217.818EstimateStd.ErrorLowerBoundUpperBound95%ConfidenceIntervalEstimateStd.ErrorLowerBoundUpperBound95%ConfidenceIntervalMeanaMedianEstimationislimitedtothelargestsurvivaltimeifitiscensored.a.2020/2/326•例1:某临床试验对20名第III或第IV期黑色素瘤的患者进行随访研究,截至研究期结束,记录的生存资料见下表,试计算100周的生存率。4.大样本寿命表法2020/2/327表120名第III或第IV期黑色素瘤的患者的治疗后的生存时间(周)12.8077.2015.6082.4024.00+87.20+26.4094.40+29.2097.20+30.80+106.00+39.20114.80+42.00117.20+58.40+140.00+72.00+168.00+2020/2/328建立数据文件“生存分析.sav”定义两个变量:反应变量,即生存时间变量,“time”分类变量,即生存状态变量,“status”2020/2/329Analyze—Survival—LifeTables….2020/2/3302020/2/331LifeTablea20020.0002.10.90.90.07.005.003.01.0018217.0003.18.82.74.10.008.004.01.0113112.5001.08.92.68.11.003.003.00.0011110.5001.10.90.62.12.003.003.01.00937.5001.13.87.53.13.004.004.01.01533.5000.001.00.53.13.000.000.00.00202.0000.001.00.53.13.000.000.00.00211.5000.001.00.53.13.000.000.00.0011.5000.001.00.53.13.000.000.00.00IntervalStartTime020406080100120140160NumberEnteringIntervalNumberWithdrawingduringIntervalNumberExposedtoRiskNumberofTerminalEventsProportionTerminatingProportionSurvivingCumulativeProportionSurvivingatEndofIntervalStd.ErrorofCumulativeProportionSurvivingatEndofIntervalProbabilityDensityStd.ErrorofProbabilityDensityHazardRateStd.ErrorofHazardRateThemediansurvivaltimeis160.0000a.LifeTablea20020.0002.10.90.90.07.005.003.01.0018217.0003.18.82.74.10.008.004.01.0113112.5001.08.92.68.11.003.003.00.0011110.5001.10.90.62.12.003.003.01.00937.5001.13.87.53.13.004.004.01.01533.5000.001.00.53.13.000.000.00.00202.0000.001.00.53.13.000.000.00.00211.5000.001.00.53.13.000.000.00.0011.5000.001.00.53.13.000.000.00.00IntervalStartTime020406080100120140160NumberEnteringIntervalNumberWithdrawingduringIntervalNumberExposedtoRiskNumberofTerminalEventsProportionTerminatingProportionSurvivingCumulativeProportionSurvivingatEndofIntervalStd.ErrorofCumulativeProportionSurvivingatEndofIntervalProbabilityDensityStd.ErrorofProbabilityDensityHazardRateStd.ErrorofHazardRateThemediansurvivaltimeis160.0000a.本例100周生存率为53%。2020/2/3322020/2/333•三、生存过程的比较(假设检验)非参数方法:对数秩检验(log-ranktest)广义Wilcoxon检验似然比(Likelihoodratio)检验生存率组间比较实际上是对两条或多条生存曲线的分布情况比较(齐性检验)特点:检验过程一般不顾及生存率,而是利用死亡数和死亡率函数作统计推断2020/2/334应用范围均为两组或多组生存率比较的方法:对数秩检验Log-ranktest:且近似服从Weibull分布,数值较小的失效时间所起的作用较大,(是SAS默认的选项检验方法);广义Wilcoxon检验:最适合数值较大的失效时间所起的作用较大。似然比(Likelihoodratio)检验:最适合生存资料近似服从指数分布。2020/2/335例题:22例非小细胞肺癌患者在不同日期经随机化分配到放疗组和放化疗联合组,从缓解出院日开始随访,随访时间(月)见下表,试比较放疗和放化疗联合两种治疗方案的生存率曲线有无差别。甲(放疗组):1,2,3,5,6,9+,11,13,16,26,37+乙(放化疗联合组):10,11+,14,18,22,22,26,32,38,40+,42+2020/2/336选择检验方法LogrankBreslowTarone-Wa
本文标题:生存分析-医学统计学
链接地址:https://www.777doc.com/doc-3446079 .html