您好,欢迎访问三七文档
盲分离研究背景与数学模型简介:盲信号分离是当前信号处理领域最热门的技术之一。由于其重要的理论价值和广泛的应用前景,盲信号分离在近20年引起了广泛的重视和研究。盲信号分离起源于鸡尾酒会议问题,即在很多人同时说话的情况下(通常包含噪声),怎样从多个声音采集设备(如麦克风)采集到的声音信号中分离出所需要的各个说话者的声音?在这个过程中,各个信号源未知,信号混叠参数即传输信道的先验知识也未知,因此我们称这个过程是“盲”的。目前,以盲信号分离为核心的盲信号处理技术已经成为重要的研究课题,并在许多领域,特别是在语音信号分离与识别、生物信号(如脑电图、心电图)处理、雷达、声纳、遥感、通信系统、噪声控制等领域,吸引了大量的研究和重视。盲信号分离:是指在不知道源信号和传输信道特性的情况下,从一个传感器阵列的输出信号(也叫观测信号,混叠信号)中分离或估计出源信号的波形。目标是如何最大化分离信号的独立性。观测数据:是一组传感器的输出,其中每个传感器接收到的是源信号的不同混合。源信号混合方式:有线性和非线性两种方式。当混叠模型为非线性时,一般很难从混叠数据中恢复源信号,除非对信号和混叠模型有进一步的先验知识。线性模型有三种:(1)线性瞬时混叠(2)延迟无回声混叠(3)回声混叠1,线性瞬时混叠模型:目前主要采用的工具是稀疏成分分析。2,延迟无回声混叠模型:即每个传感器仅接收到每个源一次。由于传输距离的远近及传输介质的影响,源信号到达每个传感器的时刻可能并不是同时的。3,回声混叠:各个传感器不仅直接接收到每个源信号,而且还接收到每个源信号的回声信号。根据混叠方式对盲信号分离进行分类:如果根据传感器个数M和源信号个数N来分类,则把MN称为超定模型,M=N为适定模型,MN称为欠定模型。欠定模型比适定模型和超定模型更难求解。对适定或者超定模型,只要能够估计出混叠矩阵,就能恢复源信号。按照未知信号源的混合形式,可以将盲处理分为线性混合和非线性混合两种类型,其中线性混合包括瞬时混合和卷积混合。按照传输信道中是否包含噪声,可以分为含噪声盲处理和无噪声盲处理两种类型。其中,噪声为有色噪声或白色高斯噪声等。此外,考虑混合通道为单路和多路,可以分为单通道和多通道两种类型。BSP解决的问题包括两个方面:盲辨识,得到未知混合信道的混合矩阵。盲源分离,得到未知多路源信号的波形估计。其中,独立分量分析(ICA)是代表分离算法各个分量互不相关的一种特例。当分量不是并行得到而是逐个提取时称为盲提取。BSP目前主要包含了以下几个研究方向:盲信号分离和盲信号抽取、盲辨识和盲均衡、盲多用户检测等等盲分离一般步骤:建立数学模型设定合适的分离准则推导一种学习算法来求解分离矩阵W根据分离矩阵W来估计源信号步骤一:为盲分离设计一个合适的数学模型;步骤二:设定一种分离准则,将分离准则用目标函数表示出来。根据输出向量间统计独立性的度量推导一个以分离矩阵w为变元的目标函数L(w),如果某个w’才能使目标函数L(w)达到极大或极小值,此时的各项参数为最优参数,此时的w’访即为所需的分离矩阵。依据设定的分离准则,即目标函数L(w)的不同将推导出不同的学习算法。步骤三:用一种有效地优化算法来求解w’。算法=目标函数+优化算法,可以采用任意的经典的最优化算法来优化目标函数。目标函数的选取决定了算法的统计特性,如一致性和稳健性等,最优化算法的选择决定了算法的特性,如收敛速度、存储器要求等。步骤四:根据步骤三所求取的分离矩阵W来进行源信号的估计,即混和信号的盲分离。将所接收到的观测信号经过预处理后,通过分离矩阵W,所得到的结果就是对源信号的有效估计,也就是达到了分离效果。数据的预处理:一般观测信号在进行算法的分离前都要进行数据的预处理。原因:盲分离的一般性假设要求,信号的独立性。一般接收到的观测信号都具有一定的相关性,因此在进行信号的盲分离前,通常都要对观测数据进行预处理,如白化预处理。目的:预处理后的信号去除了它们的相关性。这样不仅简化了后续的分离提取过程,并且通常情况下对数据进行过预处理后,算法的收敛性较好,能起到优化分离效果的作用。一,在适定的线性瞬时模型下的盲信号分离方法-------独立成分分析ICA条件:假定源信号是相互独立的,混叠方式为线性瞬时混叠,混叠矩阵列满秩。原理:通过最大化输出信号之间的统计独立性来估计源信号。只要能估计出混叠矩阵,就能恢复出源信号。方法:目标函数和优化算法。过程:第一步是建立目标函数来表征分离结果的独立程度;第二步是目标函数确定后,可通过各种不同的优化算法进行优化,进而确定分离矩阵W。缺点:对实际采样的信号,往往很难精确验证其是否满足独立性条件。ICA方法又分为:(1)最大化非高斯性(2)最小化互信息(3)最大似然估计(4)二阶统计量1,最大化非高斯性方法原理:非高斯性度量有两个:峭度和负熵。峭度:用于度量非高斯性,通过峭度的绝对值最大化可以提取独立的源信号。负熵:在具有相同方差的随机变量中,高斯随机变量具有最大的熵。通过最大化负熵可以提取独立的源。代表方法:快速独立元分析算法FastICA。;FastICA算法是一种快速而数值稳定的方法,采用拟牛顿算法实现寻优,具有超线性收敛速度,通常收敛速度较梯度下降寻优算法快得多。优点:收敛速度非常快,可以同时估计次高斯信号和超高斯信号。缺点:峭度由于使用了高阶统计量,对噪声比较敏感;而负熵则需要估计源信号的概率密度函数。2,最小化互信息原理:当随机变量的互信息=0时说明这几个随机变量是统计独立。通过最小化互信息熵来估计统计独立的源信号。3,最大似然估计原理:利用线性变换前后的概率密度函数之间的关系,立即可得到最大似然估计方法的目标函数。4,二阶统计量条件:信号具有不同的时序结构。原理:基于信号的时序结构的特性来分离源信号。方法:利用广义特征分解实现盲辨识,为了提高算法鲁棒性,广义特征分解通常用联合对角化算法代替。代表方法:SOBI,时间预测度方法。优点:不需要估计概率密度函数,不需要源信号的统计独立性,不需要计算高阶统计量,因此计算方便,效率高。优化算法:普通梯度下降算法,相对梯度,自然梯度。1,普通梯度下降算法缺点:不能得到理想的收敛速度。因为普通梯度都是把矩阵拉成一维向量来求导。并不是目标函数在该变量空间下降最快的方向。2,相对梯度:是在黎曼空间下降最快的方向。缺点:只能保证目标函数是局部收敛的,不能确定输出的信号是不是源信号。二,在欠定的线性瞬时模型下的盲信号分离方法--------稀疏成分分析SCA条件:如果观测器个数少于源信号个数,假设是源信号具有很好的稀疏性。原理:虽然总体上源信号个数多于观测器个数,但是在任意时刻同时活动的源的个数不超过观测器个数,从而原问题仍然是适定的。分析方法:一类是同时估计混叠矩阵与源信号;一类是采用两步法:首先估计混叠矩阵,再重构具有稀疏特性的源信号。优点:不依赖于信号的统计特性,而且能够处理欠定混叠模型。稀疏变换:为了使得信号具有更好的稀疏特性,往往需要在信号的具有显著稀疏特性的变换域处理。这些变换统称为稀疏变换,常见的有小波变换、短时傅里叶变换等。1,估计混叠矩阵的方法:基于k-均值聚类的直线聚类算法、自适应估计源个数的算法、LOST算法、在URCP算法基础上提出了未知源个数的统一分离算法。基于k-均值聚类的直线聚类算法的缺点:要预先指定聚类个数(即源信号个数),不太现实。URCP算法的基本思想是:首先对聚类个数作过估计,聚类之后通过适定的合并规则来缩小聚类个数。虽然不需要预先知道源信号个数,但是需要知道源信号个数的上界。LOST算法:粗略的估计源信号的个数。2,估计源信号的方法:最小化L0算法,最小化L1范数的算法,线性规划方法、内点牛顿法。过程:根据源信号的稀疏性,从混叠矩阵中选择至多M列(M为观测器个数),然后根据观测信号和选出的列重构源信号。三,卷积模型下的卷积盲源分离原理:由于卷积模型在时域实施分离时涉及太多的参数,因此采用频域方法。考虑到傅里叶变换的特性,时域的卷积模型转换到频域就成了线性瞬时模型,也就是说卷积模型可以转化成频域的线性瞬时模型,因此可以通过发展频域的独立成分分析ICA来求解卷积模型。方法:时频掩码方法。该方法利用语音信号在短时傅里叶变换域的稀疏性来估计混叠参数和重构源信号。缺点:由于语音信号的短时平稳性,这些方法需要对观测信号做加窗傅里叶变换,然后在每个频率箱运行复数ICA算法。因为ICA算法固有的顺序不确定性导致了难以解决的排序问题。因此通常存在所谓的排序问题。盲分离的几何算法研究条件:线性瞬时混叠模型在适定或超定的情况下。原理:利用各个源信号的某种“独有特征”——比如非高斯性、时序结构等——把它从其它信号中分离开来。分离过程:第一步:白化观测信号(去二阶相关性),目的是去相关性获得主成分;第二步:旋转观测信号,寻找一正交阵,任意正交阵U可以表示成一系列旋转矩阵的乘积。关键:确定一系列的旋转,即确定第(2)步中的正交阵U。优点:几何算法能够比较直观的显示盲分离混合过程和分离过程的几何含义;并且为盲分离提供可视化的分离过程和解释,从而丰富了盲分离的内涵。简单直观,不需要估计概率密度函数,因此比较方便,而且收敛速度快。缺点:一方面大多只能工作在低维的情况(观测信号个数小于或等于3),另一方面算法的效率也有待提高。新的几何算法——最小值域方法MR几何解释:当一个信号与其它信号独立时,它的值域最小,亦即散点图在它对应的坐标轴上的投影长度最小。优点:该算法有比较严格的理论基础;另一方面,该算法不需要估计源信号概率密度函数,不需要使用任何阶的统计量,从而比较简单。缺点:即使目标函数局部收敛,也能保证分离的正确性。然而,作者给出的算法却不能保证局部收敛,从而分离的正确性得不到保证。算法的适用范围并没有作深入分析。算法效率不够高、收敛性存在问题。改进的最小值域算法iMRA与原算法相比,本算法的优越性:表现在两个方面:第一,优化结果更可靠;其次,由于每次本算法直接找到子问题的全局极小值,因此优化效率更高。批处理算法原理:当各信号独立时,它们在各坐标轴的投影之和达到最小值。记白化后的观测信号在两个坐标轴上的投影之和为l。当该正方形的各边与对应坐标轴平行时,l达到最小值。优点:把算法推广到可用于稀疏信号。改进的最小值域算法(批处理模式)BiMRA:语音信号识别基于盲源信号分离的实现盲信号分离:是指在传输信道特性和输入信息未知或者仅有少量先验知识的情况下,只由观测到的输出信号来辨识系统,以达到对多个信号分离的目的,从而恢复原始信号或信号源。盲分离问题的研究内容大体上可以划分为:瞬时线性混叠盲分离、卷积混叠盲分离,非线性混叠盲分离以及盲分离的应用四部分。盲源信号分离的DSP实现方法原理:基于负熵最大的FastICA算法。优点:FastICA算法的优点收敛速度快、无需选步长参数、能够通过选择适当的非线性函数g来最佳化、能减小计算量等。同时也有许多神经算法的优点,如并行、分布式且计算简单,内存要求很少等。中心极限定理:即:若一随机变量X由许多相互独立的随机变量Si(i=1,2,…,N)之和组成,那么,只要Si具有有限的均值和方差,则不论其为何种分布,随机变量X较Si更接近高斯分布。思路:在所有等方差的随机变量中,高斯变量的熵最大,因而可以利用熵来度量非高斯性,常用熵的修正形式,即负熵。因此,在分离过程中,可通过对分离结果的非高斯性度量来表示分离结果间的相互独立性,当非高斯性度量达到最大时,表明已完成对各独立分量的分离。盲信号处理技术在水下目标分离中的应用背景:水声信号非高斯、非线性及非平稳等特性较为复杂,时域FastICA算法:用于水下不同信号瞬时线性混合的分离频域FastICA算法:用于水下不同信号卷积混合模型的分离。盲信号分离的算法很多,每种算法都有其自身的特点,如不同的算法的目标函数或学习算法可能不同,并且它们的适用性也各不相同。依据不同的应用环境,需要对经典理论算法进行拓展研究以及相应改进,想要最终将盲分离应用于水下目标的分离,势必要由经典算法入手,依据水声
本文标题:盲信号总结
链接地址:https://www.777doc.com/doc-2170873 .html