您好,欢迎访问三七文档
当前位置:首页 > 金融/证券 > 综合/其它 > 分析一生存分析数据所想到的
0501001502000.00.20.40.60.81.0分析一个存分析数据所想到的--出现的问题往往多于结论吴喜之阎洁中国人民大学统计学院2004年12月从教科书可期待什么?整齐的数据(可能有些缺失值)选好的意义明确的变量完全确定的研究目标按照一定的模型进行拟合得到可合理解释的结果和漂亮的输出根据理论(条件当然满足)做出解释一切都令人满意但是在实际中……数据形式和想象的差别可能很大可能很难摸清大量变量的内在含义和关系研究目标经常无法事先确定没有任何现成的理论来确定什么模型合适得到各种从统计或医学均不易解释的输出永远不知数据是否满足一些定理和方法的条件还需面对许多医学和统计的决策这些决策很难说哪个“对”或“错”我们的数据一个鼻咽癌数据*只有136个观测值其中仅有129个可用一共41个变量,其中包括性别;病人诊断资料,如原发症状、原发部位、病理分级、B症状有无、国际预兆指数、国际预兆指数合并B症状、淋巴结大小、肿瘤M分期、WHO得分、分化程度、肿瘤T分期、淋巴结单双侧、肿瘤TNM分期等指标;病人治疗资料,如治疗方案、化疗方案、化疗周期;病人治疗近期效果资料,放疗疗效、化疗疗效、总初次治疗疗效;病人远期疗效资料,复发资料----是否复发、复发时间、复发部位、复发肿瘤的TNM分期,合并症资料----是否发生合并症、合并症发生时间,生存资料----是否死亡(指因癌症死亡)、生存时间。我们面对的第一个决策问题我们所关心的是复发还是死亡没有任何理论上的理由来排斥哪一个它们都和医疗效果相关,但是从实践的角度,复发数据显然比死亡完整因此我们仅以复发事件作为考虑重点这里我们只考虑和此目的有关的22个变量(其中20个为“自变量”)常规的分析方法进行“复发时间”的常规生存分析这些方法包括:简单寿命表Kaplan-Meier分析Cox比例风险模型等等生命表起始时间进入人数删失人数暴露人数发生终点事件人数死亡比例生存比例累积生存比例死亡密度危险率.0130.023.0118.523.0.1941.8059.8059.0162.017912.084.016.076.07.0.0921.9079.7317.0062.008024.061.07.057.53.0.0522.9478.6935.0032.004536.051.05.048.51.0.0206.9794.6792.0012.001748.045.06.042.02.0.0476.9524.6469.0027.004160.037.04.035.01.0.0286.9714.6284.0015.002472.032.02.031.0.0.00001.0000.6284.0000.000084.030.03.028.51.0.0351.9649.6063.0018.003096.026.05.023.5.0.00001.0000.6063.0000.0000108.021.05.018.5.0.00001.0000.6063.0000.0000120.016.06.013.0.0.00001.0000.6063.0000.0000132.010.04.08.0.0.00001.0000.6063.0000.0000144.06.02.05.0.0.00001.0000.6063.0000.0000156.04.01.03.5.0.00001.0000.6063.0000.0000168.03.02.02.0.0.00001.0000.6063.0000.0000180.01.0.01.0.0.00001.0000.6063.0000.0000192.01.01.0.5.0.00001.0000.6063.0000.0000Kaplan-Meier方法为了检验复发时间与哪些因素有关通常采用了以下三种检验方法:LogRank检验Breslow检验Tarone-Ware检验三者的区别在于其检验统计量对不同时间的事件赋予的权重不同。Kaplan-Meier方法根据三种检验结果可知有显著影响意义的因素包括:T分期、放疗疗效、化疗疗效、总初次治疗疗效可能有意义的因素包括:性别、原发症状、ipi和b症、有无转移、化疗周期数等于是可以估计生存函数(画图)变量方法statisticsdfSig.LogRank2.471.1157Breslow2.951.0860性别Tarone-Ware2.751.0973LogRank9.134.0578Breslow8.634.0712原发症状Tarone-Ware8.994.0614LogRank2.173.5379Breslow2.693.4412原发部位Tarone-Ware2.533.4690LogRank2.385.7951Breslow2.835.7267病理分级合并Tarone-Ware2.655.7541LogRank1.251.2632Breslow1.151.2830B症状有无Tarone-Ware1.221.2700LogRank2.942.2295Breslow2.112.3486ipiTarone-Ware2.472.2901LogRank7.893.0483Breslow6.813.0780Ipi和b症Tarone-Ware7.423.0597LogRank3.371.0664Breslow1.591.2073有无远处转移(M分期)Tarone-Ware2.341.1260LogRank2.313.5104Breslow1.943.5840淋巴结大小Tarone-Ware2.173.5369LogRank13.108.1083Breslow14.268.0751化疗周期数Tarone-Ware13.808.0870LogRank.193.9787Breslow.253.9691分化程度Tarone-Ware.133.9877LogRank18.373.0004Breslow14.553.0022T分期Tarone-Ware16.513.0009LogRank.922.6324Breslow1.242.5383淋巴结单双侧Tarone-Ware1.062.5894LogRank.462.7937Breslow.182.9117TNM分期Tarone-Ware.312.8563一些变量的三种检验结果一些累积生存函数估计图有些可以区别明显有些不明显有些看不出来050100150200治疗开始-复发或进展的时间0.00.20.40.60.81.0CumSurvivalsex女男女-censored男-censoredSurvivalFunctions生存函数图(性别区分)050100150200治疗开始-复发或进展的时间0.00.20.40.60.81.0CumSurvivalAJCCT2cmor鼻咽一个壁4cmor鼻咽超腔2~4cmor鼻咽二个壁巨大or鼻咽侵犯颅骨或颅N2cmor鼻咽一个壁-censored4cmor鼻咽超腔-censored2~4cmor鼻咽二个壁-censored巨大or鼻咽侵犯颅骨或颅N-censoredSurvivalFunctions生存函数图(关于T分期)生存函数图(关于初次疗效)050100150200治疗开始-复发或进展的时间0.00.20.40.60.81.0CumSurvivalresultafterprimarytherapycrpdprscr-censoredpd-censoredpr-censoreds-censoredSurvivalFunctions050100150200治疗开始-复发或进展的时间0.00.20.40.60.81.0CumSurvivalipi和b症01230-censored1-censored2-censored3-censoredSurvivalFunctions生存函数图(ipi和b症)050100150200治疗开始-复发或进展的时间0.00.20.40.60.81.0CumSurvival放疗疗效crenpdprscr-censoreden-censoredpd-censoredpr-censoreds-censoredSurvivalFunctions生存函数图(放疗疗效?)EN:巩固治疗,CR:完全治愈,PR:部分治愈,S:轻微缓解(或者是没变化)PD:肿瘤进展050100150200治疗开始-复发或进展的时间0.00.20.40.60.81.0CumSurvival化疗疗效crenpdprscr-censoreden-censoredpd-censoredpr-censoreds-censoredSurvivalFunctions生存函数图(化疗疗效?)EN:巩固治疗,CR:完全治愈,PR:部分治愈,S:轻微缓解(或者是没变化)PD:肿瘤进展CoxRegression自变量:20个变量逐步回归:Forward:LROrdinal变量处理:当作分类变量。CoxRegression注:M分期为”有无转移”T分期为“肿瘤组织学分期”VariablesintheEquation-1.223.5484.9701.026.29417.1993.001-2.6501.0786.0411.014.071-.594.4451.7781.182.552-1.606.44612.9491.000.201M分期T分期T分期(1)T分期(2)T分期(3)BSEWalddfSig.Exp(B)选中了M分期和T分期-50050100150200治疗开始-复发或进展的时间0.00.20.40.60.81.0CumSurvivalT分期和M分期24.00M分期为1,T分期为1M分期为1,T分期为2M分期为1,T分期为3M分期为1,T分期为4M分期为2,T分期为1M分期为2,T分期为2M分期为2,T分期为324.00-censoredM分期为1,T分期为1-censoredM分期为1,T分期为2-censoredM分期为1,T分期为3-censoredM分期为1,T分期为4-censoredM分期为2,T分期为2-censoredM分期为2,T分期为3-censoredSurvivalFunctionsCoxRegression生存函数图(TM分期)对这些结果的解释企图:确诊时的T分期和M分期对于肿瘤的复发有显著影响。确诊时其T分期较早的话,则治疗后复发的可能性要小于T分期较晚的人群,即使复发,其复发时间也相对要晚一些。M分期也是一样。因此,能在癌症早期及时发现是鼻咽癌诊治的一个重点。三种检验不一致时的解释:控制“有无B症状”因素,分析放疗效果与复发的关系其复发时间分布的LogRank检验结果并不显著,p-值=0.0744,而另外两个检验的结果是显著的,Breslow检验,p-值=0.0280,Tarone-Ware检验,p-值=0.0403teststatisticsdfSig.LogRank3.181.0744Breslow4.831.0280Tarone-Ware4.211.0403三种检验不一致时的解释:多数文献只进行LogRank检验,而很少用后两种这三种检验有什么区别呢?看看这些检验背后的机理这三个检验的零假设都是检验各组间生存分布相同三个检验的统计量均是基于比较每个时点的实际发生事件数与期望发生事件数三种检验不一致时的解释:这三个检验的主要区别在于对不同时间点的权重不同:LogRank检验对每个事件的权重相同,无论其发生早晚Breslow检验按照在风险中的个体数对事件加权,而在风险中的个体时间而减少,因此早期发生的事件权重晚期发生的事件权重大TaroneWare检验按照在风险中的个体数的平方根对事件加权,因此结果则介于前面二者之间,对早期事件的权重要小于Breslow检验,大于LogRank检验,因而其统计量和p-值也介于二者之间三种检验不一致
本文标题:分析一生存分析数据所想到的
链接地址:https://www.777doc.com/doc-3555338 .html