您好,欢迎访问三七文档
使用疾病特异特征选取分类心跳类型摘要自动分类心跳类型是协助医生找出在长期的动态心电图记录中异常的心跳的重要手段。在本文中,我们介绍了一种新的疾病特异特征选取的方法,它由一个一对一的特征排名阶段和一个包含在同一个一对一的支持向量机的二类分类器中的特征搜索阶段组成。本文提出的方法与传统方法的不同之处在于它的重点是对有效的特征子集的选择,从而能通过一对一的对比从其他分类器中挑选出一个分类器。从MIT-BIH心律失常数据库中得到的心电图被用来评估本文所提出的特征选取方法。所采用的心电图特征包括跨节拍内和逐次心跳间期,振幅形态,面积形态和形貌上的距离。采取美国医疗仪器促进协会(AAMI)提出的建议,MIT-BIH-AR的所有心率样本分为四类,即:正常搏动或束支传导阻滞(N),室上性早搏(S),室性早搏(V)和心室融合心跳(F)。训练和测试数据的划分遵守个体间的图示。实验结果表明,所提出的特征选取方法的的平均分类精度是86.66%,胜过那些无特征选择的方法。对N,S,V和F分类的灵敏度分别是88.94%,79.06%,85.48%和93.81%,相应的阳性预测值分别为98.98%,35.98%,92.75%和13.74%。在灵敏度和阳性预测值的算术平均值方面,所提出的方法也有比其他的最先进的特征选择方法更好的性能。1.简介心电图(ECG)是一个无创,廉价且相当成熟的诊断工具。它含有基本的生理信号,被广泛得用于分析心脏功能。然而,对于长期的心电图记录的分析,逐拍的手动检查既乏味又耗时,尤其是对于床边监护或可穿戴式在线医疗监护,其中实时诊断对初级医生来说是一项艰巨的任务。因此,临床医生通常采用计算机辅助方法来分析和解释ECG信号。在临界条件下,心律失常可以被分成两种类型,即致命的和非致命的。致命的心律失常可能引发心脏骤停而突然死亡,如心室颤动和心动过速。患者在这种情况下,需要紧急治疗。虽然非致命的心律失常可能不会立即导致心脏衰竭,但是仍然需要及时的治疗,以避免病情进一步恶化。在某些情况下,心律失常只会偶尔发生在患者的日常生活中。为了捕捉到这些稀少的信号,通常采用动态心电图装置来记录长期的心电数据。因此,从大量的ECG数据中自动识别出异常的心跳是一个既重要又必要的任务。第一类型的心律失常已经被详细的研究过了,并且一些检测算法已经被开发和实施在自动体外除颤器(AED)。识别第二类的异位搏动检测是关键的一步。在这项研究中,我们只专注于非致命的心律失常研究以及相关的异位搏动检测。在过去的几十年里,大量的研究一直致力于心跳类型自动分类。该工作可被分为两种分类模式,即“内患者”和“跨患者”或者也分别被称为“面向类的”和“面向主题的”。内患者模式仅根据节拍标签划分整个数据集为训练和测试子集,其中部分的心电图上的记录可能同时出现在两个数据子集上。通过这样的方案,分类通常会产生过于乐观的结果。在临床实践中,由于的个体间差异会导致分类性能的下降。为了适应实际的情况中,deChazal等人建议当训练和测试的子集是从不同的心电图记录中构造得到时,将会把个体间的差异考虑在内,并且分类器将会呈现较好的泛化能力。这种模式已经被采纳并用来评估对MIT-BIH心律失常数据集的分类性能。此外,一个被称为“患者特异性”的混合模式也被deChazal等人提出,其中,先训练一个全局分类器,然后再用一个本地分类来调整全局分类器。据文献指出,这种方法优于那些纯粹由患者间的分类实现的分类器。Ince等人受这种模式的启发,提出了“患者特异性”神经网络,其中训练数据由两部分组成:(ⅰ)从训练记录中随机选出的共同的具有代表性的节拍以及(ⅱ)从每个记录的前5分钟取出的患者特异性节拍。此外,Wiens等人采用了一种主动学习的方法来检测室性早搏和室上性异位早搏。另外,Llamedo等人研究发现,当专家们能有效的改进在主动学习中的迭代步骤时,性能将得到许多改善。大多数研究参考美国医疗仪器促进协会(AAMI)的意见,对心律指定使用5个标签,分别是正常搏动或束支传导阻滞(N),室上性早搏(S),室性早搏(V)和心室融合心跳(F),以及不能被分类的心律(Q)的。这一建议使得各心律之间能进行公平的比较分类。考虑到通常用心电图的特征来分类,被最广泛使用的是RR间隔周围的特征,例如前一笔RR间期,后一笔RR间期,当下的RR间期,平均的RR间期和其它基于RR间期的特征。其他的时域特征,包括PP间期,P波持续时间,QRS宽度,PR间期,T波间期和QT间期。此外,ECG样本在P波,QRS波群和T波上的“形态学”特征以及节拍和平均节拍之间的形态的距离也已经被采用。这些特征已经用于临床上的研究,相关的诊断标准也已被规定。虽然基于向量图(VCG)的特征可以提供有关心脏疾病的全面信息,但是VCG的重建需要更多的信息,因此这些特征的应用是相当有限的。此外,频域上的特征分析还可以用来深入了解ECG信号。信号处理方法包括小波分解(WT),主成分分析(PCA),独立成分分析(ICA)。虽然这些功能都具有明确的数学相关解释,但是他们没有可以让医生以直观的方式来理解的生理意义。因此,从大量的特征中选择最相关的特征来改善分类的性能群众是一个极大的挑战。Llamedo等人采用一种顺序浮动特征选择(SFFS)算法以增强贝叶斯分类器。他们试图为所有的子分类器寻找一个最佳的特征子集。可是,在临床实践中,不同的疾病所参考的特征不同。通过对特征的分析,临床医生可以把一种疾病从其他疾病中分别出来,或者把有疾病的状态和健康的状态区别开来。基于这个想法,我们试图提出一个新颖的“疾病特异”特征选取方法并且用它来增强心律分类器的性能。为了评估这种方法,我们采用了患者间分类模式来保证更好的泛华能力,并且关注于四个在临床上已经被较全面的研究过了的种类,N,S,V和F。所呈现的测试结果采用了美国医疗仪器促进协会的建议。2.ECG数据在本文的研究中,用MIT-BIH心律失常数据集来训练以及测试分类器。该数据集包括了从47个被试者(201和202记录采自从同一个被试者中)中得到的48笔双导联记录,每一笔记录长约30分钟,采样率都为360Hz。在48笔记录中,23笔(“100系列”)从日常的非固定的训练中得到,从在23笔100系列中没有被很好的呈现出来的,不平常的但在临床上是非常重要的心律失常案例中提取出剩余的25笔(“200系列”)。ECG的导联随被试者的改变而改变,取决于电极放置的物理位置。对于大多数的记录来说,第一个通道是一个改进的第二肢导联(MLII)(只有114记录使用V5来当做第一导联,用MLII当做第二导联;在这篇论文中我们交换了导联)。第二个通道通常是V1(有时是V2,V4或者V5,取决于被试者)。该数据库包含了QRS位置和节拍种类的信息注释,至少被两个专家验证过。为了保证对相关文献有一个公平的比较,并且遵守AAMI的意见,我们放弃了四笔有步调节拍的记录,即102,104,107以及217。另外,所有的原始心律标签同AAMI的标签相对应,对应规则如表1所示。同时,我们也采用了文献6中所采用的划分计划训练集(DS1)和训练集(DS2)。请注意我们放弃了AAMI中的Q种类(未被分类且有节奏的心跳),因为这种类型在MIT-BIH-AR中比较少。DS1和DS2中的数据集的数量按类型列在表1中。表1.数据集DS1和DS2的大小以及他们在AAMI和MIT-BIH-AR标签中的映射。aDS1中的记录:101,106,108,109,112,114,115,116,118,119,122,124,201,203,205,207,208,209,215,220,223,230.bDS2中的记录:100,103,105,111,113,117,121,123,200,202,210,212,213,214,219,221,222,228,231,232,233,234.3.方法在本文中我们采用了一个四阶的分类策略来分析ECG数据。如图1所示,整个分类策略由四个阶段组成:信号预处理,特征提取,特征选取和分类器调谐。相对于之前文献中的方法来说,多加了形态学和间隔的特征。在本文中P波下的面积,QRS波群和T波也被采用做心脏特征。此外,我们用特征选取阶段来决定合适的特征。另外,我们通过将一些被独立训练的一对一的二类支持向量机分类器与从两个导联中得到的数据相结合,完善了一个具有增强型泛化能力的混合分类器。Llamedo等人使用同样的特征子集来分类,与他们的方法不同,我们提出的基于特征排序方法的一对一的分类器更合理。现实的特征选取方法,即获取最佳的特征子集是具有疾病特异性的,并且只能是二类分类器任务。这个优点将会在3.3部分被详细讨论。3.1.ECG预处理自从MIT-BIH-AR资料库中的ECG信号被动态心电图装置采集到了后,信号被基线漂移,电源线噪声以及高频肌电图干扰所污染。用被文献6,12所采用的方法,先用一个200-ms宽度的中频滤波器除掉所有的ECG信号中的P波和QRS波群,再用一个600-ms宽度的中频滤波器来除掉T波。将得到的信号被视为随后从原始信号中减去,以产生基线校正的心电图信号的基线。用一个12序列截止频率为35Hz的FIR低通滤波器来去除因为电源线和高频产生的噪声。最后,滤波后的二导联心电信号会被送入下一步进行进一步的处理。图1.全自动心律分类过程。3.2心跳划分和分割在心跳特征提取之前,由QRS波的位置将ECG的时间序列分割成独立的心跳。许多方法可以用来定位出QRS波的位置并且检测出那些基准点,比如文献20,21中用到的方法以及文献22,23中用到的小波算法。本文的目的则是完善一种基于特征选取的心律分类器。为了方便也为了能在波形数据库(WFDB)中更好的操作,我们用包含在MIT-BIH-AR中的QRS的注释以及工具“ecgpuwave”(一种QRS探测器,波形限制定位器可以从生理网上下载得到。)来检测基准点,包括P波的起始点,P波尖峰,P波终点,QRS波群起点,QRS终点,T波起点,T波尖峰以及T波终点。当一个心跳节拍中没有P波时,该心跳节拍的起点和终点由下一个QRS波群的起点开始算起。因此,该心跳会有零个P波间期,被缩短的PR间期以及被缩短了的后一个的PP间期。同样的,当心跳中没有T波时,心跳节拍的起点和终点由下一个QRS波群的起点开始算起,导致该心跳节拍会有零个T波间期,以及被缩短了的QT间期。3.3.特征提取基于检测出的基准点,每个节拍以及每个导联的46个的特征都会被本文考虑到,这些特征被列在表2,其具体介绍在图2.表2.本文用到的特征。图2.ECG中基于区域和基于间隔的特征的图解:充满+和/符号的区域分别代表正负区。3.3.1.心搏间期五个心搏间期是指逐次心跳基准点之间的间隔。基于QRS尖峰点,一共有四个相关的RR间期。前一笔的RR间期是给定的心跳与前一笔心跳间的RR间期。后一笔的RR间期是给定的心跳与后一个心跳之间的RR间期。10笔局部的平均的RR间期由一个心跳节拍附近的10个RR间期取均值得到。RR间期的均值指的一笔记录中的RR间期值,并且该值与在一笔数据中的所有心跳的RR间期具相等。最后,基于P波的尖峰点,后一笔的RR间期被定义为给定的心跳的R波尖峰与后一笔心跳的R波尖峰。后一笔的RR间期表征心室周期,后一笔的PP间期表征心房周期。如图二所示,后一笔的RR间期,后一笔的PP间期以及心搏间期是相互依赖的。3.3.2内部节拍间期内部节拍间期被定义为一个在一个心跳上后一个基准点与前一个基准点间的间期。本篇论文采用了五个内部节拍间期,如图2所述,并且他们相关的基准点也被列在相应的行和图2的最后一栏。我们用这些间期来当做心脏特征,因为他们是众所周知的,并被广泛的用于临床实践中。3.3.3.形态学振幅本文采用了文献6中提到的形态振幅。为了描述ECG的形态,我们通过一个特定的窗口对信号振幅向下采样了一组数值。P波的形态定义为P波的起始点和P波的终点之间的10个采样点的物理振幅。同样地,QRS的形态和ST的形态分别定义为QRS的起始点和QRS的终点之间的
本文标题:Heartbeatclassificationusingdisease-specificfeatur
链接地址:https://www.777doc.com/doc-2876105 .html