您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 信息化管理 > 麦克风算法仿真及实验台搭建_V1
麦克风算法仿真及平台搭建1.基础知识1.1阵列信号系统模型图1.1:麦克风等间距线阵示意图我们考虑等间距摆放的麦克风线性阵列,其示意图见图1.1。考虑到语音信号为宽带信号,我们在窄带信号模型的基础上,引出宽带信号模型。1.1.1窄带信号模型在信号处理中,窄带信号与宽带信号是相对而言的。设信号()st的带宽为B,中心频率为0f,若信号()st满足相对带宽条件,即:01fB,一般取010fB(1)则信号()st为窄带信号,反之为宽带信号。其中0f定义为202|()||()|wSwdwfSwdw(2)B定义为123M-1Mddθdsinθ……d2202()|()||()|wfSwdwBSwdw(3)式中()Sw为()st的频谱。中心频率为0f的窄带信号()st,其实数形式的表达式为:0()()cos[2()]stutftt(4)为了推导方便写成复数形式,即0[2()]()()jfttstute(5)式中,()ut为基带信号,其最高频率hf远小于正弦信号的频率0f,0cos[2()]ftt为载波信号,其中()t是正弦信号的初相位,假定为一个常数。为了简化模型,通常我们做如下假设:(1)麦克风阵列位于信号源的远场,则接收到的信号为平面波;(2)传输介质是无损的、线性的、非扩散性的、均匀的且各向同性;(3)麦克风的孔径远小于入射波的波长,而且麦克风无指向性,可近似认为麦克风是点元;(4)麦克风阵列的间距远大于麦克风孔径,各麦克风之间的相互影响可以忽略不计。现在考虑当信号源为单个窄带信号时,对于间距为d的均匀线阵(如图1.1),窄带信号()st的入射角度为,麦克风数为M个,声速为340/cms。由于信号到达各个麦克风的时间不同,第m个麦克风接收到的信号为()()()0,1,...,1mmmxtstntmM(6)sinmdmc为信号到达第m个麦克风相对其到达参考麦克风的时间延迟,()mnt为加性噪声。由式(6)可知,信号到达第m个麦克风相对于到达参考麦克风只发生了一个相移02()mjfe,则式(6)可变为:02()()()()mjfmmxtestnt(7)将麦克风接收到的信号写成1M维的向量形式,则麦克风输出为:00012()02()1()()()()()MjfjfMxtetsttxtexn(8)设00012()2()0(,)[]MjfjfTfeea为方向矢量,则0()(,)()()tfsttxan(9)对于D个窄带入射信号,设入射角为d,1,2,,dD,则方向矢量为001020(,)[(,),(,),...,(,)]DffffAaaa(10)则麦克风输出可表示为:0()(,)()()tfttxAsn(11)其中,12()[(),(),...,()]TDtstststs为D个窄带入射信号。011()[(),(),...,()]TMtxtxtxtx为麦克风接收到的信号。011()[(),(),...,()]TMtntntntn为加性噪声向量。1.1.2宽带信号模型根据阵列信号处理理论,如果用窄带波束形成方法来处理宽带语音信号会导致信号畸变,且信号的带宽越大,畸变越严重。因此,需要用宽带波束形成方法来进行语音增强。假定宽带信号()st是由J个窄带信号叠加而成,即1()()mJfmtsts(12)式中()mfst是以mf为中心频率的窄带信号。假设收到的为单个宽带信源,对于由M个麦克风组成的麦克风阵列,其输出为1()(,)()()jJjfjtfsttxan(13)式中012()2()(,)[]jjMjfjfTjfeea,其中()m为宽带信号到达第m个麦克风相对其到达参考麦克风的时间延迟。当有(1)DMD个远场信号,分别来自12,,...,D方向,则第m麦克风阵列输出为1()(())()Dmimimixtstnt(14)式中,()mi是第i个信号到达第m个麦克风相对其到达参考麦克风的时间延迟,()mNt为加性噪声。对式(14)进行傅里叶变换,得到2(/)sin()(1)1()()()jiDjfdcmmjijmjixfesfnf(15)令12()[(),(),...,()]TjjjDjfsfsfsfs表示D个远场宽带信号的傅里叶变换,011()[(),(),...,()]TjjjMjnfNfNfNf表示加性噪声信号的傅里叶变换,12()[(,),(,),...,(,)]jjjjDffffAaaa表示D个远场信号的方向矢量。则麦克风阵列输出宽带频域模型的矩阵形式表示为:()()()()jjjjffffxAsn(16)1.2噪声场在麦克风阵列语音增强中,噪声来源取决于实际的应用环境,噪声场是一个很重要的概念,不同的方法可能适用于不同类型的噪声场。语音信号在封闭环境传输时,由于反射、衍射的影响,会使麦克风阵列接收的语音来自多个路径,这种现象称为混响。混响对语音的影响表现为两个方面:首先,混响使语音信号产生失真;其次,混响改变了噪声场的空间特性。混响对噪声场空间特性的改变体现为,单一的噪声源被扩展为多个不同方位的镜像源,噪声空间接近于散射噪声场。这一特性借助模平方相干函数来界定。设位于ir和jr的两麦克风接收到的噪声分别为in和jn,相应的自功率谱及互功率谱分别(,)irw、(,)jrw和(,)ijw。于是,定义噪声的空时域模平方相干函数为22|(,)|()|()|(,)(,)ijijijijwCwwrwrw(17)根据()ijCw的值把噪声场分为相干噪声场、非相干噪声场和散射噪声场。(1)相干噪声场相干噪声场是指噪声信号直接从噪声源传播到麦克风阵列,而没有经过任何因传播环境而产生的反射、散射和耗散。在相干噪声场中,阵列中的不同麦克风接收到的噪声信号具有强相干性,即2|()|1ijw。在实际环境中,相干噪声场存在于开放的空气环境中,在这种环境的周围没有主要的障碍物影响声音传播,而热湍流的影响也很小。(2)非相干噪声场非相干噪声场是指在给定的空间位置的噪声信号与其它所有位置的噪声信号都不相关,也就是说2|()|0ijw。这样理想的非相干噪声场在实际环境中不存在。而在麦克风阵列应用中,麦克风阵列中的电学噪声通常被认为是一种非相干噪声。非相干噪声也被叫做空间白噪声。(3)散射噪声场在散射噪声场,相同能量的噪声信号在各个方向同时进行传播。因此,散射噪声场中的麦克风接收到的噪声信号是弱相关的,并且具有近似相同的能量。许多实际的噪声环境都可以被看作是散射噪声场。在散射噪声场中,任何两点的噪声信号之间的相干性可以用麦克风之间的距离函数来表示2()|sin()ijijfdfcc(18)式(18)中ijd是麦克风i和j之间的距离。2.语音增强算法分析及仿真语音增强技术是信号处理领域中的主要研究内容,在现代多媒体通信体技术以及人工智能系统中应用广泛。语音增强方法自提出至今,经历了单麦克风语音增强技术到阵列语音增强技术的转化,因为麦克风阵列语音处理技术采用“电子瞄准”的方法,可以从声源位置获取较高品质的语音因而得到广泛应用。其中波束形成是麦克风阵列语音增强的典型算法,它主要分为三类[4]:固定波束形成、后置滤波波束形成和自适应波束形成。固定波束形成语音增强由于采用的滤波器的权值固定不变,因而方法简单,运算量低,容易实现,能够抑制背景噪声,但是不具备自适应抑制强干扰的能力。因此对于可变噪声场效果一般。后置滤波语音增强方法可以用来去除非相干噪声,但在相干噪声场情况下性能退化,甚至不能应用。自适应波束形成方法,例如Frost提出的线性约束自适应波束形成法[5],是在某种约束条件下,使输出信号能量达到最小。这是用优化手段实现语音增强的一种方法,这种算法在相干噪声场情况下,可以得到较高的信噪比改善,但在弱相干噪声场或在散射噪声场中,性能甚至不如传统的固定波束形成方法。2.1固定波束形成固定波束形成方法是麦克风阵列语音增强算法中最简单易于实现的一种方法,也是最经典的麦克风阵列语音增强的算法之一。固定波束形成的含义是,是其波束形成器的权值固定不变,与麦克风阵列的接收信号无关。固定波束形成算法通过延时控制来补偿从声源到每个麦克风的延时,对每个麦克风接收到的信号进行延迟补偿,然后使麦克风阵列波束指向有最大输出功率的方向,即波束对准相应空间位置的声源信号,其原理如图2.1所示。时延估计12M1'()xn'()Mxn2'()xn1w2wMw()yn时延补偿图2.1固定波束形成原理图该固定波束形成器是典型的延迟-求和波束形成器,它包含三个部分:时延估计部分,时延补偿部分和加权求和部分。通过麦克风接收到的数据来估计各个麦克风的时延,然后通过时延补偿使麦克风信号同步,再加权相加得到波束形成器的输出。设麦克风接收到的信号为'()ixt,权系数为()wi,则延迟-求和波束形成输出为:10()()'()Miiiytwixt(19)其中M为麦克风的数目,i表示由时延估计得到的时延。若转换成数字形式时延为sin(1)isdTifc,其中sf为采样频率。该方法适合用来消除非相干噪声或者弱相干噪声,对于相干噪声几乎没有消噪能力。如果用来消除非相干噪声或弱相干噪声,它的消噪能力主要取决于麦克风的数目,麦克风的数目越多,去噪效果越明显。因此,该方法获得去噪效果是以增加麦克风数目为代价的,在实际中较少单独使用。2.2后置滤波波束形成后置滤波可以用来去除声学环境中的非相干噪声,人们提出将波束形成器的输出信号通过后置滤波器以进一步提高输出信号信噪比。1977年Allen利用波束形成的方向性增益和维纳滤波器对非相干噪声抑制能力,提出将后置滤波用于语音增强。1988年Zelinski将其扩展到麦克风阵列中,对延时—求和波束形成的输出端使用自适应维纳滤波器,从而提出基于后置滤波的麦克风阵列语音增强方法,进一步改善了噪声抑制能力。鉴于实际声学环境下噪声类型和噪声场的复杂性,许多学者将性能互补的方法相结合,以改善语音增强方法的噪声抑制能力。1996年,Fischer和Simmer提出了GSC与Wiener滤波相结合的频域麦克风阵列语音增强方法,以抑制声学环境中的相干和非相干噪声。2003年Gannot和Cohen提出了基于传递函数GSC和后置滤波的频域麦克风阵列语音增强方法[7][8],以去除噪声场中可能存在的相干噪声、非相干噪声及非平稳噪声。下面具体介绍一下基本后置滤波算法的原理。后置维纳滤波是后置滤波和波束形成技术相结合的产物。滤波求和波束形成器的输出由维纳滤波器进行后置滤波处理,其目的是进一步减少己经由固定波束形成器去除不相干的噪声后的残余噪声成分。经典的后置滤波方法是R.Zelinski在1988年提出,其系统结构如图2.2所示。时延估计12N1'()x'()Nx2'()x1w2wNw()Y延时补偿维纳后置滤波估计1()x2()x()Nx()H()Z图2.2后置自适应滤波系统框图其中,固定波束形成器累加之前每个通道的输出为:()()()iiiynwnxn(20)因此,固定波束形成器的输出为10()()()Miiiynwnxn(21)其中M为麦克风的数目。信号经过固定波束形成器后,进行维纳滤波的后置处理。维纳滤波方法就是按照最小均方误差的准则对期望信号()st进行估计,即选取()st的估计值()st,使均方误差如式(22)最小。22{[()()]}{()}EststEet(22)也即要设计一个数字滤波器()ht,当输入为()xt时(()()()xtstnt),滤波器输出:()()()stxtht(23)满足式(22)。根据正交性原理,最佳()ht必须满足对所有k有下式成
本文标题:麦克风算法仿真及实验台搭建_V1
链接地址:https://www.777doc.com/doc-1956419 .html