您好,欢迎访问三七文档
经验模态分解(EMD)EmpiricalModeDecomposition算法背景•信号处理中,频率是信号最重要的表示,由于传统的傅立叶变换分析方法并不能分析出信号的某一频率在什么时刻出现,为此产生了能同时在时间和频率上表示信号密度和强度的时频分析,如短时傅立叶变换和小波分析等,但其基本思想都是根据傅立叶变换的理论得到的,因此也没有进一步的突破。•经验模态分解(EmpiricalModeDecomposition,简称EMD)是美国国家宇航局N.E.Huang等人在1998年提出Hilbert-Huang变换(希尔伯特黄变换,简称HHT)的基础上,提出的一种非常重要的信号处理的方法。它是一种新型的自适应信号时频处理方法,特别适用于非平稳、非线性信号的分析处理。EMD算法被认为是200年来以傅立叶变换为基础的线性和稳态频谱分析的一个重大突破,该方法从根本上摆脱了傅立叶变换的约束,它不仅不需要考虑选择小波基函数的难题,而且吸取了小波变换多分辨率的优点,局部自适应性强,是一种真正自适应性的时频分析方法,更适合分析非平稳、非线性信号。近些年来该方法已经在机械故障诊断检测、地震信号分析、生物医学信号特征提取、图像处理、电能质量分析以及非平稳时间序列预测等众多领域得到了广泛的应用。算法概述•EMD方法基于信号本身的局部特征时间尺度,把原始信号进行平稳化处理,将复杂的信号分解成有限个具有不同特征尺度的数据序列,每一个序列即为一个本征模态函数(IntrinsicModeFunction)分量,IMF反映了原始信号的本质和真实信息。信号经EMD分解之后,其瞬时频率也具有了物理意义,因此,EMD算法是一种非常适用于非平稳、非线性数据序列的复杂信号处理方法。•基于上述思想,分解的到的IMF的筛分过程可表述如下:特征时间尺度•时间和频率是描述信号的基本参数。频率定义了信号单位时间的周期重复次数,而特征尺度通过直接从时域观察信号的变化过程,同样可以获得类似频率的信号特征。信号的特征尺度是与频率密切相关的,一般大的特征尺度对应小的频率,小的特征尺度对应大的频率。•我们通过定义在特定要求点之间的时间尺度来获得信号的特征,在数学上,定义所有t时刻,函数过零点的时间位置间隔就是过零点的时间尺度;定义连续两个极值点的时间间隔就是极值点的时间尺度,在EMD分解中采用的是基于极值点的时间尺度方法。Huang等人分析认为时间尺度代表了信号的局部震荡尺度,并且仅表示一种震荡模式,这种震荡模式从一个极值点到另一个相反的极值点,因此时间尺度是震荡的内在隐含尺度,称为特征时间尺度。•EMD只需要根据信号的时间特征尺度自适应的对信号进行分解。信号经EMD分解所得到的本征模态函数均代表着信号不同尺度的特征。因为对于每个本征模态函数,连续两个极值点之间定义了信号局部波动特征,这就反映了信号在不同尺度的特性。本征模态函数(IntrinsicModeFunction)一般认为,一个本征模函数IMF必须满足以下两个条件:(1)在整个信号上,极值点的个数和过零点的个数相等或至多相差一个;(2)在任意时刻,由局部极大值点和局部极小值点分别形成的上、下包络线的均值为零,也即是说,上、下包络线相对于时间轴是局部对称的。通常情况下,实际信号都是复杂信号,并不满足上述条件,因此,Huang进行了以下假设:(1)任何信号都是由若干本征模态函数组成的;(2)各个本征模态函数既可是线性的,也可是非线性的,各本征模态函数的局部极值点和零点相同,同时上、下包络关于时间轴局部对称;(3)在任何时候一个信号都可以包含若干个本征模态函数,若各模态函数之间相互混叠,就组成了复合信号。•由于每一个IMF分量是代表一组特征尺度的数据序列,因此筛选的过程实际上将原始数据序列分解为各种不同特征波形的叠加。从物理学的意义上讲,通常信号的高频部分包括较多的噪声,而信号真正的有用信息大多包含在低频部分。本征模态函数的本质是数据内在的振动模态,在每一个周期内,只包括一种振动模态,不存在复杂的叠加波。•在实际的时间序列中,组成的信息往往是相当复杂的,有用的微弱信号甚至可能淹没在强信号或噪声中,然而这些小振幅信号可以相当突出的显示IMF成分。因此利用IMF分析原始数据的信息或许更加准确。EMD算法基本步骤•(1)假设原始信号为,找出所有的局部极大值点和局部极小值点,用三次样条函数连接所有局部极大值点作为上包络线;用三次样条函数连接所有局部极小值点作为下包络线,上包络线与下包络线应包含所有数据;•(2)求出上包络线与下包络线的均值:,信号与的差,如果是IMF,那么是的第一个分量;•(3)如果不是IMF,就将看成原始信号处理,在进行上述步骤;得到,是上下包络线的均值,经反复筛选k次,如果满足IMF的条件,就称为IMF,就有,是原始信号的第一个IMF成分,代表最高频率的分量;2/)(1nnLUm)(tx)(tx1m11)(mtxh1h1h1h1h11111mhh11m1hkh1kh1kkkmhh1)1(11khc11)(txEMD算法基本步骤(4)从中分离,得到,将视为原始信号重复上述过程,就得到信号的第二个IMF成分,一直重复上述过程n次,就得到n个IMF,,当是单调函数或是一个极小的常量时,就无法再提取IMF,停止分解过程,得到下面式子:残差是信号的集中趋势,IMFs()分别包含了信号不同时间特征尺度大小的成分,其尺度依次由小到大,因此,各分量也就相应地包含了从高到低的不同频率段的成分。每个频率段包含的频率成分是不同的,它们随的变化而变化。)(tx1c11)(ctxr1r)(tx2cnnncrrcrr1212,,nrnniirctx1)(nr)(txncc,,1)(txEMD算法的流程图EMD算法图解•原始信号找到局部极值点)602cos(2)202sin()(tttx拟合包络线得到11)(mtxhEMD算法的主要性质•EMD方法不仅直观、简单而且具有完备性、近似正交性,同时还具有良好的自适应性。•(1)完备性所谓的完备性是指通过分解得到的IMF分量和残余分量能够将原信号完全恢复。(2)近似正交性IMF的正交性可以通过后验的方法给出。原信号的重构信号可以表示为:其中,把残余分量可以看作第n+1个IMF分量,对上式两边平方得:①nr11)(niictxnr11111122)()(2)()(ninjjiniitctctctxEMD算法的主要性质•因此,对于原始信号的正交性指标,可以定义为:T是信号的总长度如果分解是正交的,那么①式中的交叉项应该等于0,Huang通过大量试验得出:对于一般信号其正交性指标通常不会超过1%,对于短信号在极端的情况下可能达到5%,也就是说通过EMD分解得到的IMF分量是近似正交的。•(3)自适应性EMD的自适应性主要表现在三个方面,一是基函数的选取,EMD分解的基函数完全由信号本身决定,在筛分过程中得到;二是自适应的分辨率,每一个IMF分量包含的频率各不相同,由原始信号在不同的频率下表现出来,这些频率因信号不同,频率成分也各不相同,所以说EMD的分辨率是自适应的;三是自适应的滤波过程,依据信号本身,将信号按频率由高到低,自动分解出各个IMF。)(tx))(/)()((011112TtninjjitxtctcIOEMD算法的主要问题及改进•(1)理论体系不完整目前为止,因为尚未构建适合EMD算法的数学建模,同时也就不会有严格的数学基础,如:正交性、收敛性、完备性、唯一性等EMD特性,试验方法求证一些特性,而不能进行数学上的证明,甚至于至今为止都无法很好的解释“什么信号能进行EMD分析,什么信号不能进行EMD分析”。然而对于本征模态函数,也仅仅只能通过窄带信号的过零点与过极值点的关系以及非常有限的可用例子的经验中获得IMF定义,其效果很难令人满意。尽管大部分的例子都表明了EMD结果的直观合理性,但是其理论框尚待改善。EMD算法的主要问题及改进•(2)端点效应求包络平均是通过对原始数据中上、下极值点分别进行三次样条插值拟合以后所取的平均值。三次样条插值常常产生过冲或下冲情况,由此产生的IMF不能严格保证包络的对称性。原信号的端点可能不是极值点,在一定程度上对其进行拟合时因为边界摆动会带来计算上的偏差,产生拟合误差,在信号两端出现发散现象,随着筛分过程的不断进行,这种发散现象逐渐传播至内,使分解结果严重失真,产生假频信号。右图中给出了一个有限长的信号,其真实包络线由黑色线给出,三次样条法构造的包络线以红色虚线给出,由于信号的不完整,三次样条插值算法基于给定时间内的信号极值构造包络曲线出现了失真,使包络曲线在边界处扭曲,令分解所得的IMF出现误差,失去了物理意义。端点延拓•为了抑制和消除端点效应的影响,人们提出在信号的两端进行端点延拓的方法,即在数据两端通过一定的方式增加极值点,这样新增的极值点也可作为插值点来构造样条曲线。•端点延拓的目的是要使延拓后的波形既能反映出原始信号在端点处的变化趋势,又能体现原始信号的已知信息,满足这两个条件的延拓才有意义。•一般的延拓方法有:镜像闭合端点延拓、斜率极值延拓、多项式拟合延拓等。镜像闭合端点延拓•镜像闭合端点延拓就是在信号的左右两侧具有对称性的极值点上各放一面镜子,这样就得到长度为2倍的镜内信号长度的周期信号。若取一周期信号将其首尾连接,就形成了一个封闭的环状,不存在端点,数据的上下包络线完全有数据的内部确定,从而从根本上避免了端点效应。原始信号延拓后的周期性信号用于分析处理的一个周期性信号镜像延拓法只考虑了信号端点附近的极值点变化特征,没有考虑端点外极值点对信号延拓的影响。由于信号的复杂性,仅以端点附近极值点的特性决定延拓极值显然不能准确反映信号的真是趋势,无法镜像延拓后的环形闭合曲线使延拓的效果达到最优。镜像延拓要求将镜面放在极值点处,当无法确定信号端点是否为极值点时,最好截去一部分数据以便把镜面放在极值点处,如果处理一个不适合截去的短数据时,处理效果就会欠佳。EMD算方法的主要问题及改进(3)IMF筛分准则在实际情况中,上下包络的均值无法为零,通常当满足下面式子(标准偏差系数)时,就认为包络的均值满足IMF的均值为零的条件:称为筛分门限,一般取值在0.2到0.3之间;•另一种判断准则由法国学者Rilling提出,其表达式为:以该函数作为判定是否终止筛选过程的依据。式中分别为上、下包络线。设定三个门限值,相应的满足以下两个条件,就认为分解得到的IMF满足要求。①规定中小于的比率不低于,即:D是信号持续的总时间,#A表示在集合A中元素的总个数;②对于在整个时间范围内的时刻t,要满足:以上两个条件的默认值为TtkTtkkthththSD02)1(1021)1(1)()]()([minmaxminmax)(eeeetaminmax,ee、、21)(ta1195.0,5.0,05.0211}{#})({#1DttaDt2)(ta、、21EMD算法的主要问题及改进•(4)模态混叠模态混叠主要是指同一个IMF分量当中出现了不同尺度或频率的信号,或者同一尺度或频率的信号被分解到多个不同的IMF分量当中。一般来说,信号经过EMD分解后可以得到较好的处理效果,但是有的时候效果并不如预期那样,如果信号中含间歇信号或者不可避免的噪声干扰,就可能造成一个基本分量里含有多个尺度成分的现象。只要模态混叠现象一经出现,将对后续分解的分量产生影响,导致EMD分解结果失去物理意义。集合经验模态分解(EEMD)•Huang在用EMD进行噪声辅助分析时发现,白噪声中均匀分布的各种频率成分被规律的分离开来,而当信号不是纯噪声时,会缺失一些尺度,这时混叠现象就会产生,由此Huang想到把白噪声加入到信号中来补充一些尺度,进而达到更好的分解结果。针对EMD中出现的模态混叠问题,吴朝华和黄锷等人提出了集合经验模态分解。EEM
本文标题:EMD
链接地址:https://www.777doc.com/doc-5093309 .html