您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 管理学资料 > 生存曲线中Meta分析适宜数据的提取与转换-周支瑞
中国循证心血管医学杂志2014年6月第6卷第3期ChinJEvidBasedCardiovascMed,Jun,2014,Vol.6,No.3•243••循证理论与实践•生存曲线中Meta分析适宜数据的提取与转换周支瑞,张天嵩,李博,毛智,曾宪涛,刘士新【摘要】生存分析是处理生存数据重要的统计学方法,生存数据的Meta分析在预后研究的系统评价中应用广泛,但生存资料原始数据通常较难获得。本文通过实例演示的形式介绍如何通过文献中的生存曲线提取生存资料数据并通过提取的生存率数据计算Meta合并所需要的数据。【关键词】生存数据;生存分析;生存曲线;预后;Meta分析;系统评价【中图分类号】R195.1【文献标志码】A【文章编号】1674-4055(2014)03-0243-05ExtractingandtransformingofappropriatedataofMeta-analysisinsurvivalcurveZHOUZhi-rui*,ZHANGTian-song,LIBo,MAOZhi,ZENGXian-tao,LIUShi-xin.*FirstDepartmentofRadiotherapy,OncologyHospitalofJilinProvince,Changchun130012,China.Correspondingauthor:ZENGXian-tao,E-mail:zengxiantao1128@163.com;LIUShi-xin,E-mail:liushixin1964@126.com[Abstract]Surviveanalysisisanimportantstatisticalmethodforprocessingsurvivaldata.TheMeta-analysisonsurvivaldataisappliedwidelyinsystemicevaluationofprognosisresearch,buttheoriginaldataofsurvivalmaterialisverydifficulttobeobtained.Thepaper,throughdemoofexamples,introduceshowtoextractsurvivalmaterialbymeansofsurvivalcurve,andhowtocalculatedatarequiredbyMeta-analysisbymeansofsurvivalratedata.[Keywords]Survivaldata;Surviveanalysis;Survivalcurve;prognosis;Meta-analysis;Systemevaluation作者单位:130012长春,吉林省肿瘤医院放疗一科(周支瑞,刘士新);上海市静安区中心医院中医内科(张天嵩);中国中医科学院西苑医院消化内科(李博);中国人民解放军总医院骨科(毛智);湖北医药医学附属太和医院循证医学中心(曾宪涛)通讯作者:曾宪涛,E-mail:zengxiantao1128@163.com;刘士新,E-mail:liushixin1964@126.com.doi:10.3969/j.1674-4055.2014.03.02生存分析(surviveanalysis)即是将终点事件的出现与否和出现终点事件所经历的时间结合起来的一种统计分析方法,生存分析得名于其通常研究的终点事件是死亡。当前,生存分析已广泛的运用于恶性肿瘤、慢性疾病或其他情况的随访研究中事件分析,比如疾病的发生、复发、伤口的愈合、某种症状的消失等。生存资料的分析主要特点就是考虑每个研究对象出现某一结局所经历的时间。生存曲线则是以生存时间为横轴,生存率为纵轴,将各个时间点对应的生存率连接在一起的曲线图[1]。系统评价Meta分析中对生存资料的合并是一个棘手的问题,主要原因是较多原始研究无法直接获得效应量及其可信区间或原始数据。当前使用软件进行合并时,一般来说要获得以下三类数据:(1)O-E(logrankObservedminusExpectedevents)和V(logrankVariance);(2)lnHR(风险比的对数)和SelnHR(风险比对数的标准误);(3)lnHR(风险比的对数),lnLL(风险比可信区间下限的对数)和lnUL(风险比可信区间上限的的对数)[2,3]。这些类型的数据一般在原始研究中不会直接报告或仅报告了其中的某一部分,在这样的情况下就需要对数据进行正确的转换。然而,即便如此,有些数据还是无法获得,但多数的预后研究的文章会提供生存曲线,如何从生存曲线中获取有效的数据呢?本文将系统介绍如何从生存曲线中提取数据并进行合理的计算,最终获得可以用于合并的数据[4-6]。1生存资料Meta分析的方法当前,制作生存资料Meta分析的方法有以下几种方法[2,7-10]:第一,通过非编程软件完成。当前可用的有ReviewManager5(RevMan5)和ComprehensiveMetaAnalysisV2(CMAV2)。一般来说要直接获得或通过数据转化获得以下三类数据才能进行有效合并:(1)O-E和V;(2)lnHR和SelnHR;(3)lnHR,lnLL和lnUL。第二,通过编程软件完成。如Stata、R、JAGS、BUGS、Stan软件。一般来说要获得以下两类数据才能进行有效合并:(1)lnHR和SelnHR;(2)lnHR,lnLL和lnUL。第三,在HR无法计算的条件下,也可选择相对危险度(RR)或者比值比(OR)为效应量。这种方法存在一些固有的缺陷,主要因为HR考虑了发生终点的时间所经历的时间,但RR或者OR并未考虑时间因素,较HR丢失了一些重要的信息,故采用RR或者OR作为生存资料的效应量不作为常规选择。这种方法与常规的二分类数据的Meta分析是一样的。第四,IPD的Meta分析。因该类Meta分析数据难以获取且国内开展的可能性极小,故不作展开介绍。中国循证心血管医学杂志2014年6月第6卷第3期ChinJEvidBasedCardiovascMed,Jun,2014,Vol.6,No.3•244•2生存曲线图的获取及处理以下将以实例的形式演示如何从生存曲线中提取Meta分析所需要的各时间段的生存率并通过计算获得Meta分析所需要的数据。2.1软件的下载与安装本文主要应用的软件为图形数据提取软件EngaugeDigitizer4.1,软件下载地址为:。此类软件有很多种,本文仅介绍EngaugeDigitizer,因为该软件相对简单并且容易获得,而且完全免费。下载软件并解压后双击Engauge.exe即可使用,可创建桌面快捷方式方便下一步操作。2.2图片获取从原始文献中获取的图片要足够清晰,建议至少到达300dpi,原始文献尽可能选择下载高质量的PDF格式。本文示例为《lancetoncology》上的一篇Ⅲ期随机对照试验《Continuationofbevacizumabafterfirstprogressioninmetastaticcolorectalcancer(ML18147):arandomisedphase3trial》[11]。获得PDF格式的全文以后,再通过Windows操作系统自带的截图工具截取该图片。具体操作方法为:尽可能放大使图在屏幕上完全显示,并且包含完整纵横坐标,点击键盘右上角的“PrtScn”键,再按照“所有程序→附件→截图工具”打开画图工具并使用“Ctrl+V”将图片黏贴到画图工具中,再存为JPG格式并重新命名。2.3图片处理由于EngaugeDigitizer4.1软件仅能识别灰度图,对于生存曲线为彩色线条的图片需要常规将其调整为黑白图片。此时可以借助于很多图片处理软件实现,最常用的就是AdobePhotoshop。将截图并保存的图片导入AdobePhotoshopCS5软件进行去色,去色的方法为依次点击“图像→调整→去色”即可实现。去色后,还需通过色阶功能使黑白对比明显,操作方法为通过“图像→调整→色阶”调出对话框,详见图1。处理后的图片如图2所示。3连续取点法提取生存曲线数据3.1图片导入把处理后的图(图2)导入EngaugeDigitizer4.1软件,导入方法及导入后状态如图3所示。3.2新建曲线并命名因为本例坐标中有2条生存曲线,故需要新建2条待提取数据的曲线。根据原文,将两条曲线分别命名为“chemotherapy”和“bevaci”。如图4所示,依次点击“Settings→Curves→New”。新建曲线可点击“properties”设置线型和颜色,有助于取点时区别两条生存曲线。图1通过色阶功能处理图片图2通过去色及色阶处理后的图片图3将图片导入EngaugeDigitizer4.1软件图4新建及命名生存曲线的方法中国循证心血管医学杂志2014年6月第6卷第3期ChinJEvidBasedCardiovascMed,Jun,2014,Vol.6,No.3•245•3.5导出并存储生存率数据软件默认的导出数据的文件格式为“.csv”,这也是通用的数据存储格式,可通过Excel软件打开。本例选择存贮于桌面,方法为依次点击“File→Export”,在弹出的对话框中选择桌面进行命名(本文命名为“图5.csv”)后,点击“保存”即可。3.6筛选生存率数据由于采用的是连续取点法提取数据,故密集的取了很多点,得到了很多数据。然而,实际操作中并不需要如此多的数据用于后续的计算,故还需对提取的数据进行初步的筛选。首先通过Excel打开“图5.csv”文件,然后把X这一列设置小数位数为0位,其余两列数据小数位数设置为2位,如图7所示。然后,选取时间点图5确定原点及纵横坐标轴的刻度的方法片图6使用连续取点工具分别对两条曲线连续取点片3.3确定原点及纵横坐标轴的刻度一般首先确定原点,然后分别确定X轴与Y轴的刻度,此步骤其实是在原图的基础上重新构建一个二维坐标系,在这个新建的二维坐标系中的任何一个点都可以通过(x,y)表示。依次点击“Digitize→AxisPoint”,调出图5所示对话框并行相关设置。3.4分别对两条曲线进行连续取点选择连续取点工具分别对“chemotherapy”及“bevaci”两条曲线进行连续取点,此工具把鼠标移动到相应的位置可自动识别取点的区域,但需要注意同一个坐标轴中有2条曲线时需要按照原图进行分辨,尤其是当两条曲线非常接近之时,不能把一条曲线上的点误认为是另外一条曲线的点。取点方法如图6所示。图7导出的数据及设置各列小数位数的方法片图8最终用于生存率计算的数据片为0、3、6、9、12、15、18、21、24、27、30、33、36、39、42、45月时对应的生存率数据,并删除不需要的数据。需要说明一点:一般后一个时间点的生存率不可能大于前一个时间点,但因数据提取时存在误差,可能出现后时间点生存率略大于前时间点,且这种情况多出现于生存曲线是水平线时,故需要对数据进行合理的整理。如果出现后一个时间点生存率的数据大于前一个时间点的情况,需要把后一个时间点的数据用前一个时间点的生存率数据代替,理由是前后时间点生存率相等是符合客观情况的。此外还要注意,在随访开始时,一般0时间点的生存率为100%。处理后的数据如图8所示。4计算lnHR和SelnHRlnHR和SelnHR计算的具体方法可参考JayneFTierney等人的文献[5]。实际上并不需要根据这些原始数据去直接计算Meta合并需要的数据,JayneFTierney等人的文献提供了计算lnHR和SelnHR的excel程序文件,使用者只需要按要求填入相应的数据及对应的信息即可,该程序文件下载地址为。这个Excel计算程序共计7个工
本文标题:生存曲线中Meta分析适宜数据的提取与转换-周支瑞
链接地址:https://www.777doc.com/doc-5744720 .html