您好,欢迎访问三七文档
数字信号处理(DSP)综合设计性实验报告北京交通大学电工电子教学基地目录一、实验目的................................................................................................................3二、实验内容及要求....................................................................................................31、相关知识及背景.............................................................................................32、实验内容.........................................................................................................33、实验要求.........................................................................................................4三、实现方案设计........................................................................................................41、实验原理及其分析.........................................................................................42、算法实现.........................................................................................................53、方案流程设计.................................................................................................6四、软件仿真验证........................................................................................................61、MATLAB仿真...................................................................................................62、DSP5502仿真................................................................................................11五、实验结果总结......................................................................................................151、MATLAB..........................................................................................................152、DSP.................................................................................................................16六、过程个人体会......................................................................................................17七、参考文献..............................................................................................................18一、实验目的(1)加深学生对语音信号处理的基本方法的了解,加深对信号检测与去噪、信号相关的理解。(2)培养学生发现问题、分析问题、应用信号处理的基本原理解决实际问题的能力。(3)锻炼学生综合利用数字信号处理基本原理和BJTUDSP5502实验系统解决实际问题的能力,提高学生的工程素质和动手能力。二、实验内容及要求1、相关知识及背景语音信号处理是利用数字信号处理技术对语音信号进行处理的一门学科,其核心技术包括语音合成、语音识别、语音测评等,是现代人机交互的重要方式之一,具有广泛的应用前景。近年来随着互联网和通信的发展,信息检索也呈现多样化,如文字检索、语音检索和基于内容的图像检索,其中语音检索将成为跨领域资源整合的纽带,而语音检索的关键在于进行语音匹配与识别。(1)语音信号的波形和频谱特性分析;(2)信号检测、噪声去除、信号相关理论与算法;(3)语音钥匙的Matlab仿真验证;(4)BJTU-DSP5502实验系统的搭建与编程环境CCS的配置;(5)DSP系统软件编程、调试与实验结果的验证。2、实验内容本实验设计一个基于DSP处理系统的语音钥匙,实验内容如图1所示:图1实验内容设计13、实验要求利用Matlab将采集到的一段语音进行仿真处理,实现基于语音相关匹配的较为简单的语音钥匙的功能。在CCS编译环境下利用C语言编写语音钥匙程序,并在BJTUDSP5502实验系统平台上实现。若语音钥匙开启,将指示灯D1进行1Hz闪烁(慢闪),并进行相应的语音提示。未开启,将指示灯D1进行3Hz闪烁(快闪),并进行相应的语音提示。三、实现方案设计1、实验原理及其分析简单的语音钥匙就是对采集到的语音信号和已存入的语音信号进行相关运算,相关度较大时语音钥匙开启。(1)语音信号的特点○1在频域内,语音信号的频谱分量主要集中在300~3400Hz的范围内。利用这个特点,可以用一个防混迭的带通滤波器将此范围内的语音信号频率分量取出,然后按8kHz的采样率对语音信号进行采样,就可以得到离散的语音信号。○2在时域内,语音信号具有“短时性”的特点,即在总体上,语音信号的特征是随着时间而变化的,但在一段较短的时间间隔内,语音信号保持平稳。在浊音段表现出周期信号的特征,在清音段表现出随机噪声的特征。(2)语音信号的采集在将语音信号进行数字化前,必须先进行防混叠预滤波,预滤波的目的有两个:①抑制输入信导各领域分量中频率超出fs/2的所有分量(fs为采样频率),以防止混叠干扰。②抑制50Hz的电源工频干扰。这样,预滤波器必须是一个带通滤波器,设其上、下截止颜率分别是fH和fL,则对于绝大多数语音编译码器,fH=3400Hz、fL=60~100Hz、采样率为fs=8kHz;而对于语音识别而言,当用于电话用户时,指标与语音编译码器相同。当使用要求较高或很高的场合时fH=4500Hz或8000Hz、fL=60Hz、fs=10kHz或20kHz。(3)端点检测端点检测是从含噪声的环境中检测出说话人语音信号的起点和终点。系统采用短时能量和过零率来实现,前者描述了信号的能量,后者描述了1帧信号穿越0电平的次数。语音信号是非平稳的,是时变的,但由于人的发音器官的运动速度缓慢,所以可以认为语音信号是局部平稳的,或短时平稳的。因此,语音信号分析常通过分段或分帧来进行。语音短时能量与短时平均过零率为端点检测的两种常用方法。根据语音的统计特性,可以把语音段分为清音、浊音以及静音(包括背景噪声)三种。在本算法中,短时能量检测可以较好地区分出浊音和静音。对于清音,由于其能量较小,在短时能量检测中会因为低于能量门限而被误判为静音;短时过零率则可以从语音中区分出静音和清音。将两种检测结合起来,就可以检测出语音段(清音和浊音)及静音段。(4)提取特征参数在语音识别和说话人识别中,常用的语音特征是基于Mel频率的倒谱系数(melfrequencycepstrumcoefficient,MFCC).由于MFCC参数是将人耳的听觉感知特征和语音的产生机制相结合,因此目前大多数语音识别系统中广泛使用这种特征。人的耳朵具有一些特殊的功能,这些功能使得人耳能够从嘈杂的背景噪声中,以及各种变异情况下听到语音信号,这是因为人的内耳基础膜对外来信号会产生调节作用。对不同的频率,在相应的临界带宽内的信号会引起基础膜上不同位置的振动。由此可用带通滤波器组来模仿人耳听觉,从而减少噪声对语音的影响。耳蜗实质上相当于一个滤波器组,耳蜗的滤波作用是在对数频率尺度上进行的,在1000Hz以下为线性尺度,而1000Hz以上为对数尺度,这就使得人耳对低频信号比对高频信号更敏感。根据这一原则,研究者根据心理学实验得到了类似于耳蜗作用的一组滤波器组,就是Mel频率滤波器组。对频率轴的不均匀划分是MFCC特征的特点。(5)语音识别的方法动态时间规整DTW算法是一种运用动态规划原理计算时间矢量相似度的方法,在语音识别等领域有着广泛的应用。窗口法是针DTW对算法的特点,采用了动态高效的空间管理办法,解决了通常的DTW算法需要存储一个较大的矩阵,因而在存储空间有限的硬件系统中难以实现的问题,窗口法已经在实际系统中得到了应用。2、算法实现(1)端点检测算法算法流程:对输入信号先进行高通滤波,减弱以噪声为主的信号能量。接着进行分帧处理,然后计算各帧的平均能量和平均过零率。根据各帧的平均能量和平均过零率以及最大过零率,最小过零率,最大能量和最小能量,得出低过零率值,高过零率值,低能量值,高能量值,从而将整个采集的信号分为静音段,过渡段,语音段,结束段共四段,从而达到达到端点检测的目的。(2)MFCC算法设某语音信号为x(n),则算法处理流程为○1预加重'1nnnxxkx,其中k为预加重系数,一般取0.95;○2加窗(hamming窗),帧长为N;○3DFT变换;○4设计一个具有M个带通滤波器的滤波器组,采用三角滤波器,中心频率从0~F/2间按Mel频率分布;○5按式(2-1)计算每个滤波器组输出的对数能量;120()ln(|()|()),0NamkSmXkHkmM(2-1)○6按式(2-2)求得MFCC系数。10()()cos((0.5)/),0MmCnSmnmMnM(2-2)(3)DTW算法假设测试和参考模板分别用T和R表示,为了比较它们之间的相似度,可以计算它们之间的距离D[T,R],距离越小则相似度越高。为了计算这一失真距离,应从T和R中各个对应帧之间的距离算起。设n和m分别是T和R中任意选择的帧号,d[T(n),R(m)]表示这两帧特征矢量之间的距离。距离函数取决于实际采用的距离度量,在DTW算法中通常采用欧氏距离。如果把测试模板的各个帧号n=1~N在一个二维直角坐标系中的横轴上标出,把参考模板的各帧号m=1~M在纵轴上标出,通过这些表示帧号的整数坐标画出一些纵横线即可形成一个网络,网络中的每一个交叉点(n,m)表示测试模式中某一帧的交汇点。DP算法可以归结为寻找一条通过此网络中若干格点的路径,路径通过的格点即为测试和参考模板中进行计算的帧号。3、方案流程设计四、软件仿真验证1、MATLAB仿真代码见附录MATLAB(1)端点检测仿真图如图4-1-1,获取语音数据预处理预加重加汉明窗端点检测参考模板提取特征参数测试模板DTW算法阈值设置,判断是否开启图4-1-1说明:语音信号为“开门
本文标题:语音钥匙报告
链接地址:https://www.777doc.com/doc-2030195 .html