您好,欢迎访问三七文档
当前位置:首页 > IT计算机/网络 > 数据结构与算法 > 基于重症监护数据库MIMIC的临床数据挖掘研究
ChineseJournalofMedicalInstrumentation2014年38卷第6期研究与论著402收稿日期:2014-06-03基金项目:北京市自然基金资助项目(3122034);国家科技支撑计划项目(2013BAI03B05)通信作者:张政波,E-mail:zhengbozhang@126.com文章编号:1671-7104(2014)06-0402-05王剑1,张政波2,王卫东2,潘亮3,柴晓珂41解放军总医院医学保障部,北京市,1008532解放军总医院生物医学工程研究室,北京市,1008533解放军总医院重症医学科,北京市,1008534解放军医学院,北京市,100853该文介绍了麻省理工计算生理学实验室、哈佛医学院BID医学中心以及飞利浦医疗合作建立的、开源的、多参数智能重症监护数据库MultiparameterIntelligentMonitoringinIntensiveCareII:MIMIC-II,简单介绍了其结构、功能和临床应用。基于MIMIC-II临床数据库,开展了ICU脓毒血症病人血压和心率的昼夜节律性研究。该研究发现了脓毒血症患者死亡组和存活组在生理参数昼夜节律性上的显著性差异,解决了使用关系型数据库MIMIC-II开展生理参数昼夜节律性研究的很多技术问题。数据挖掘;重症监护数据库;MIMIC-II;脓毒血症;昼夜节律性R197.324Adoi:10.3969/j.issn.1671-7104.2014.06.003WangJian1,ZhangZhengbo2,WangWeidong2,PanLiang3,ChaiXiaoke41MedicalSupportDepartment,ChinesePLAGeneralHospital,Beijing,1008532DepartmentofBiomedicalEngineering,ChinesePLAGeneralHospital,Beijing,1008533DepartmentofSurgicalIntensiveCareUnit,ChinesePLAGeneralHospital,Beijing,1008534ChinesePLAPostgraduateMedicalSchool,Beijing,100853ThispaperintroducesafreeandpubliclyopenICUdatabase:multi-parameterintelligentmonitoringinintensivecareII:MIMIC-II,whichhasbeenbuiltupandmaintainedbythelaboratoryofcomputationalphysiologyattheMassachusettsInstituteTechnology,BethIsraelDeaconessMedicalCenterandPhilipsHealthcareoverthepastdecade.Thispaperbrieflyintroducesitsinfrastructure,implementationandapplicationsinclinicalstudies.ClinicalstudypertainingtocircadianvariationinheartrateandbloodpressureduringsepsisisshownasatypicalexampleofresearchperformedwithMIMIC-II.Inthisstudy,itwasfoundtherewassignificantdifferenceincircadianvariationinbothheartrateandbloodpressurebetweensurvivalandnon-survivalgroupsinsepticpatients.Thisstudytackledseveralimportanttechniquesnecessaryfortheinvestigationofthecircadianrhythm.datamining,intensivecaredatabase,MIMIC-II,septicpatients,circadianrhythm基于重症监护数据库MIMIC-II的临床数据挖掘研究【作者】【摘要】【关键词】【中图分类号】【文献标志码】【Writers】【Abstract】【Keywords】ClinicalDataMiningbyExploringPublicMIMIC-IIIntensiveCareDatabase0引言 临床数据挖掘是指针对临床数据开展的数据挖掘技术,其目的是从回顾性的、海量的、多维度临床数据中获取新知识、发现新模式、新趋势,获取有用信息[1]。在“大数据”背景下,针对“医疗大数据”开展数据挖掘研究正逐渐成为热点研究领域。电子病例和医院信息系统的发展使医疗数据的提取、组织和再利用成为可能,医生和研究人员在一定程度上可以通过信息检索获得诊疗过程中的基本数据,用于科研和临床决策支持。虽然随着信息化进程的加快,医院信息系统收集到越来越多的数据,但是目前的医院信息系统在最初设计时没有考虑到医疗数据的再利用问题,更多的是满足医院收费和运营管理,因此基于医院现有临床数据库开展数据挖掘研究仍存在很多困难。由于缺乏有效的方法从来自医疗实践中的海量数据系统性地获取、分析和整合信息,医疗活动在一定程度上缺少循证支持,这实际上阻碍了医疗质量的持续提高[2-3]。相对而言,一些科室基于自身业务建立起来的专科数据库,能够更好的支持临床数据挖掘工作,从回顾性数ChineseJournalofMedicalInstrumentation2014年38卷第6期研究与论著403据分析中获取新知识,从而有望形成临床数据收集-挖掘-临床决策支持的闭环,支持回顾性临床研究,达到医疗质量持续改进和提高的目的。 相比一般临床数据库,重症监护(Intensivecareunit:ICU)数据库更能体现出临床数据分析的价值。ICU病人通常会接受很多治疗和干预,这些治疗和干预的效果需要客观数据的进一步验证,而实际过程中,支持或者反对某项治疗方法的高质量的临床数据却非常缺乏[4-5]。目前已经有一些商用和非商用的ICU数据库,这些数据库的功能主要是对人口统计学特征以及分布信息的归档,如疾病情况,严重程度以及就诊医院和科室信息等等。这些数据库的目的主要是评估和比较ICU病人疾病严重程度与治疗结果,以及治疗成本等,如由澳大利亚和新西兰重症监护协会建立的非商用数据库目前含有900000多个ICU住院记录[6]。有些商用的ICU数据库虽然数据量比较大,但是生理和检验结果不完整,并缺少有效标识和生理波形数据库[7-9]。本文介绍了由美国麻省理工学院计算生理学实验室以及贝斯以色列迪康医学中心(BIDMC)和飞利浦医疗共同构建的多参数智能重症监护数据库(MultiparameterIntelligentMonitoringinIntensiveCareII:MIMIC-II)。该数据库经过多个学科10多年的建设,目前已经被成功应用于ICU临床数据挖掘的多个研究领域。本文首先简单介绍MIMIC-II数据库的结构、功能和使用方法,然后介绍了基于MIMIC-II开展的研究项目:ICU脓毒血症患者生理参数昼夜节律性研究。1MIMIC-II数据库及其使用1.1MIMIC-II简介MIMIC-II()是一个对公众免费开放的重症监护病人数据库,收集了2001至2008年间来自BIDMC医学中心的ICU病人数据[10-11],目的是为了发展和评价先进的ICU病人监护系统,以提高ICU临床决策支持的有效性、准确性和时效性。该数据库包含临床数据库(clinicaldatabase)和生理波形数据库(physiologicalwaveformdatabase)两大部分。其中临床数据库目前已经收集了超过4万例ICU病人的临床信息,包括病人人口统计特征、检验检查结果、基本体征记录、输液和医疗干预记录、护理记录、影像学检查结果以及出院记录等,每个记录都有详细的时间信息;生理波形数据库记录了来自飞利浦床旁监护仪的高分辨率波形数据如心电、血压、脉搏波以及其他生理参数如呼吸、血氧、中心静脉压等等。所有这些数据资源经过严格的去除身份信息处理后,对全球研究人员免费开放,可以通过生理数据资源网站PhysioNet()访问。全球每天有大量研究人员访问PhysioNet网站下载生理波形、趋势信息以及报警信息用于科学研究。由于生理波形数据库的使用相对简单,且目前国内已经有很多研究人员在使用,本文重点介绍了临床数据库部分,配合MIMIC-II数据库的使用,介绍了目前基于临床数据库开展的研究工作。1.2MIMIC-II使用MIMIC-II临床数据库(2.6版)是一个关系型数据库,数据库中的原始数据以表格的形式存储,基本上是通过个人、医院和ICU住院的ID号关联组织起来的。目前麻省理工学院计算生理学实验室为数据库访问者提供了两个途径访问MIMIC-II数据库,一个是通过基于网页的在线访问工具:QueryBuilder,另一个是可下载的虚拟机(virtualmachine:VM)镜像,以满足不同使用者的要求[12]。QueryBuilder功能相对简单,主要为使用者提供数据库的概况信息,使用者通过QueryBuilder可以快速的查询数据库的表格,检索基本信息,以查看数据库中是否有满足研究需求的相关信息;VM的功能更全,包含了MIMIC-II数据库的所有信息,使用者可以在本地安装后使用。QueryBuilder和VM都需要使用结构化查询语句(structurequerylanguage:SQL)对数据库进行操作,目前尚没有其他临床数据库支持类似的SQL查询功能。QueryBuilder和VM为使用者提供了访问MIMIC-II临床数据库的方法,要求使用者同时具有SQL和MIMCI-II的使用经验。为了便于研究人员使用MIMIC-II临床数据库,计算生理学实验室结合临床研究问题举例介绍了如何使用SQL访问MIMIC-II数据库[12]。目前基于MIMIC-II临床数据库已经开展了大量的研究工作,全球已经有遍布32个国家的600多名研究者通过协议使用MIMIC-II临床数据库的数据资源,使用人数以每年50%的速度增长。与美国国家医学院复杂生理信号国家级科研资源中心PhysioNet配合[13],每年度的PhysioNet/CinCChallenges()都会邀请全世界的研究人员一起解决临床实践中的富有挑战性和趣味性的问题。2ICU脓毒血症病人心率和血压昼夜节律性研究2.1问题来源 近来的一些研究表明,临床危重病人的昼夜生理节律性随病情的加重而消失。通过观察褪黑激素的分泌情况,研究人员发现在使用镇定药物和机械通气的ChineseJournalofMedicalInstrumentation2014年38卷第6期研究与论著404ICU患者身上,昼夜生理节律性明显被破坏[14]。重度脓毒血症患者尿液中6-羟基硫酸褪黑素水平较非脓毒血症患者明显紊乱的事实也证明危重病人身上的昼夜生理节律性被破坏[15]。昼夜生理节律性对危重病人的临床意义是一个很难回答的问题,危重病人昼夜生理节律性的改变是一个生理补偿性反应还是一个病理反应,答案还不清楚。目前开展的所有关于ICU病人昼夜生理节律性的研究,由于ICU病人数据获取的困难性,样本量都比较小。这阻碍了在ICU病人大样本人群基础上开展昼夜生理节律性的研究。使用MIMIC-II数据库,我们可以使用数据库中已有的心率和血压等生理参数来建模昼夜生理节律性,从而在大样本数据集的基础上研究ICU病人
本文标题:基于重症监护数据库MIMIC的临床数据挖掘研究
链接地址:https://www.777doc.com/doc-7032342 .html