您好,欢迎访问三七文档
当前位置:首页 > 财经/贸易 > 资产评估/会计 > 生产实习任务书2016
语音信号处理MATLAB实验1目录实验一语音信号预处理....................................................................................................................1实验二基于语音短时时域分析的应用............................................................................................2一、端点检测...............................................................................................................................2二、基音周期估计.......................................................................................................................6实验三语音信号频域特征分析......................................................................................................13实验四语音信号线性预测分析......................................................................................................17实验五谱减法语音增强方法研究..................................................................................................211实验一语音信号预处理1.实验目的掌握语音信号的预处理方法,包括对信号进行预加重,分帧、加窗、输入输出方法,语谱图等。熟悉语音信号处理中常用的MATLAB命令。2.实验原理由于语音信号从整体上来看是一个非平稳过程,但是在一个短的时间内,其特性保持相对不变,所以语音信号具有短时平稳性,对语音信号的分析和处理必须建立在“短时”的基础上,将信号分为一段来分析其特征参数。人发音时存在口唇的辐射效应,口唇的辐射模型相当于一阶高通滤波器,所以在对实际信号进行分析处理时,常用“预加重技术”,目的提升信号的高频部分,使信号的频谱更加平坦,方便信号的分析。3.实验过程(1)读语音数据wavread,load(2)听语音sound(3)写语音wavwrite(4)对语音进行预加重(filter)1()1Hzaz一阶FIR高通数字滤波器,a为预加重系数,0.9a1。(5)加噪声yxn(6)对语音信号进行分帧处理(7)加窗10()0kMwk其他0.420.5*cos(2/)0.08*cos(2/),0()0,kMkMkMwk其他0.54046*cos(2/(1)),0()0,kMkMwk其他(8)输出信号画图及存储方法(plot,subplot,axis,xlabel,title,wavwrite)(9)画频谱图specgram(signal,512,16000,hamming(512),256)4.实验结果2实验二基于语音短时时域分析的应用一、端点检测1.实验目的在理解语音信号短时能量和短时过零率的基础上掌握基于语音短时时域分析的端点检测方法。2.实验原理在复杂的应用背景下,从信号流中分辨出语音信号和非语音信号,是语音处理的一个基本问题。端点检测就是指从包含语音的一段信号中确定出语音的起始点和结束点。准确的端点检测对于语音识别和语音编码系统都有重要的意义,它可以使采集的数据真正是语音信号的数据,从而减少数据量和运算量并将少处理时间。判别语音段的起始点和终止点的问题主要归结为区别语音和噪声的问题。如果能够保证系统的输入信噪比很高,那么只要计算输入信号的短时能量就基本能够把语音段和噪声背景区别开来。但是,在实际应用中很难保证这么高的信噪比,仅仅根据能量来判断是比较粗糙的。因此,还需要进一步利用短时平均过零率进行判断,因为清音和噪声的短时平均过零率比背景噪声的平均过零率要高出好几倍,一般采用基音能量和过零率的语音端点检测方法——两级判决法。A.短时平均能量由于语音信号的能量随时间变化,清音和浊音之间的能量差别相当显著。因此对语音的短时能量进行分析,可以描述语音的这种特征变化情况。定义短时能量为:221[()()][()()]nnmmnNExmwnmxmwnm,其中N为窗长。可见,短时能量为一帧采样点值的加权平方和。特殊地,当采用矩形窗时,可简化为:2()nmExm窗函数的选择直接影响着短时能量的计算。如窗长N很大,这样的窗等效为很窄的低通滤波器,平滑作用非常显著,使得短时能量几乎没有多大变化,无法反映语音的时变特性。反之,若N过小,那么窗又不能提供足够的平滑,以至于语音振幅瞬时变化的许多细节仍然被保留了下来,从而看不出振幅包络的变化规律。通常N的选择与语音的基音周期相联系,一般要求窗长为几个基音周期的数量级。由于语音基音频率范围为50-500Hz,因此折中选择帧长为10-30ms。短时能量函数的应用:1)可用于区分清音段与浊音段。En值大对应于浊音段,En值小3对应于清音段。2)可用于区分浊音变为清音或清音变为浊音的时间(根据En值的变化趋势)。3)对高信噪比的语音信号,也可以用来区分有无语音(语音信号的开始点或终止点)。无信号(或仅有噪声能量)时,En值很小,有语音信号时,能量显著增大。B.短时平均过零率过零率可以反映信号的频谱特性。当离散时间信号相邻两个样点的正负号相异时,我们称之为“过零”,即此时信号的时间波形穿过了零电平的横轴。统计单位时间内样点值改变符号的次数具可以得到平均过零率。定义短时平均过零率:sgn[[]sgn[(1)]()nmZxmxmwnm其中sgn[]为符号函数,1,()0sgn()1,()0xnxnxn,在矩形窗条件下,可以简化为11sgn[()sgn[(1)]2nnmnNZxmxm短时过零率可以粗略估计语音的频谱特性。由语音的产生模型可知,发浊音时,声带振动,尽管声道有多个共振峰,但由于声门波引起了频谱的高频衰落,因此浊音能量集中于3KHz以下。而清音由于声带不振动,声道的某些部位阻塞气流产生类白噪声,多数能量集中在较高频率上。高频率对应着高过零率,低频率对应着低过零率,那么过零率与语音的清浊音就存在着对应关系。.短时平均过零率的应用:1)区别清音和浊音。例如,清音的过零率高,浊音的过零率低。2)从背景噪声中找出语音信号。语音处理领域中的一个基本问题是,如何将一串连续的语音信号进行适当的分割,以确定每个单词语音的信号,亦即找出每个单词的开始和终止位置。3)在孤立词的语音识别中,可利用能量和过零作为有话无话的鉴别。C.端点检测研究基于能量和过零率的语音端点检测方法——两级判决法及程序实现。1.第一级判决(1)先根据语音短时能量的轮廓选取一个较高的门限T1,进行一次粗判:语音起止点位于该门限与短时能量包络交点所对应的时间间隔之外。(2)根据背景噪声的平均能量确定一个较低的门限T2,并从A点往左、从B点往右搜索,分别找到短时能量包络与门限T2相交点C和D,于是CD段就是用双门限方法根据短时能量所判定的语音段。2.第二级判决以短时平均过零率为标准,从C点往左和从D点往右搜索,找到短时平均过零率低于某个门限T3的两点E和F,这便是语音段的起止点。4基于MATLAB程序实现能量与过零率的端点检测算法步骤如下:(1)语音信号进行分帧处理,N为帧长。(2)计算每一帧语音的短时能量,得到语音的短时帧能量(3)计算每一帧语音的过零率,得到短时帧过零率:11sgn[()sgn[(1)]2nnmnNZxmxm(4)考察语音的平均能量设置一个较高的门限T1,用以确定语音开始,然后再根据背景噪声的平均能量确定一个稍低的门限T2,用以确定第一级中的语音结束点。2NTE,EN为噪声段能量的平均值。完成第一级判决。第二级判决同样根据背景噪声的平均过零率ZN,设置一个门限T3,用于判断语音前端的清音和后端的尾音。3.实验过程(1)通过Matlab仿真确定窗长,也就是帧长。(在16kHz左右的采样频率下,N选为160~480比较合适。帧长一般取256)(2)计算不同矩形窗长的短时能量(3)计算不同汉明窗长的短时能量(4)计算一段语音的短时平均过零率(加矩形窗)(5)编写一个基于短时能量和过零率的端点检测程序。4.实验结果05001000150001234frameEngergy020040060002468frameEngergy0501001500102030frameEngergy020406080010203040frameEngergyN=50N=100N=400N=800图2.1不同矩形窗长的短时能量505001000150000.511.52frameEngergy02004006000123frameEngergy0501001500510frameEngergy02040608005101520frameEngergyN=50N=100N=400N=800图2.2不同hamming窗长的短时能量00.511.522.533.5x104-1-0.500.51原始信号样点数幅度020406080100120140050100150200过零率帧数过零次数图2.3短时平均过零率602000400060008000100001200014000-101取样点幅度020406080100204060帧数短时能量02040608010050100150帧数短时能量图2.4利用能量和过零率进行两级判决后得到的端点检测波形图二、基音周期估计1.实验目的在掌握短时自相关函数和平均幅度差函数的基础上,掌握基音周期的检测方法,从而对基音周期有深入的了解。2.实验原理人在发浊音时,气流通过声门使声带产生张驰振荡式振动,产生一股准周期脉冲气流,这一气流激励声道就产生浊音,又称有声语音,它携带着语音中的大部分能量。这种声带振动的频率称为基频,相应的周期就称为基音周期(Pitch),它由声带逐渐开启到面积最大(约占基音周期的50%)、逐渐关闭到完全闭合(约占基音周期的35%)、完全闭合(约占基音周期的15%)三部分组成。基音周期的估计称为基音检测(PitchDetection),基音检测的最终目标是画出和声带振动频率完全一致的基音周期变化轨迹曲线,如不可能则尽量找出相吻合的轨迹曲线。在语音信号处理中,语音信号参数提取的准确性非常重要。只有获得准确的参数,才能利用这些参数进行高效的处理,而在许多参数提取中,基音周期的提取尤为重要,广泛地应用于语音压缩编码、语音分析合成以及语音识别等方面,所以,准确可靠地估计并提取基音周期对语音信号处理至关重要。它直接影响到合成语音是否真实再现原始语音信号,影响到语音识别的识别率,影响到语音压缩编码的正确率。由于声道的易变性及声道特征因人而异,而基音的范围又很宽,即使是同一个人在不同情态下发音的基音周期也不同,加之基音周期还受到单词发音音调的影响,因而基音周期的精确检测实际上是一件比较困难的事情,基音提取的主要困难反映在:l)语音信号变化十分复杂,声门激励的波形并不是一个完全的周期序列。在语音的头尾部并不具有声带振动那样的周期性,对有些清浊音的过渡帧很难判定它属于周期7性还是非周期性,从而对估计基音周期带来一定的影响。2)从语音信号中去除声道的影响,直接取出仅与声带振动有
本文标题:生产实习任务书2016
链接地址:https://www.777doc.com/doc-3105693 .html