您好,欢迎访问三七文档
当前位置:首页 > IT计算机/网络 > 图形图像 > 语音性别识别课设报告
课程设计报告课程名称______语音信号处理课程设计题目_____基于语音的性别判别系统设计与开发指导教师________________________________________设计起止日期___2017-5-16至2017-6-4__系别_____通信工程学院___专业______电子信息工程_________学生姓名_________班级/学号_____成绩_______________________________________14级“语音信号处理课程设计”任务书......................................................................................3摘要..................................................................................................................................................4一、实验原理及步骤.......................................................................................................................41、语音信号进行分帧处理.....................................................................................................42、幅度差平方和函数.............................................................................................................43.归一化幅度差平方和函数....................................................................................................44、程序设计的基本思想.........................................................................................................55、基音频率的判断和语音信号的鉴别。.............................................................................5二、设计过程和波形.....................................................................................................................61.首先我们输入语音...............................................................................................................62.分帧对每一帧求幅度差平方和并归一化............................................................................73.选出候选基音周期................................................................................................................84.输出结果..............................................................................................................................10三、课设感想.................................................................................................................................12四、小组分工.................................................................................................................................12附录:............................................................................................................................................121.Main1...................................................................................................................................122.Main2...................................................................................................................................163.SMDSF(幅度差平方和函数)..........................................................................................194.nomSMDSF(归一化幅度差平方和函数).......................................................................205.behind(查找候选基音周期个数)..................................................................................21314级“语音信号处理课程设计”任务书题目2基于语音的性别判别系统设计与开发主要内容编程实现基于语音的性别判别系统,可以实时判别说话人是男生还是女生。设计要求1.编程实现语音的分帧。2.编程实现语音基音周期的计算。3.根据男女基音频率的不同,设计一种算法,分辨男女。4.编程实现基于语音的性别判别系统。5.对说话人实时进行判别6.准确率应不低于80%。主要仪器设备计算机1台,安装MATLAB软件及cooledit录音软件主要参考文献数字语音处理及MATLAB仿真[M].北京:电子工业出版社,2010.课程设计进度计划(起止时间、工作内容)本课程设计共安排3个题目,这是其中题目之一。具体进度如下:6学时复习题目相关知识,掌握实现的原理;16学时用MATLAB语言实现题目要求;6学时进一步完善功能,现场检查、答辩;4学时完成课程设计报告。课程设计开始日期2017.5.16课程设计完成日期2017.6.19课程设计实验室名称电子信息技术实验室地点实验楼3-501,507资料下载地址4摘要本文通过对男性和女性声音的语音特征的研究,发现男女声的基音频率存在较大的差异,并设计了基于基音频率分析的男女声识别系统。本题目要求设计一个系统,可以自动判断输入的语音信号源,是男性声音还是女性声音,其理论依据是男性和女性的基音频率存在着明显的差异,人类的基音频率范围约为60Hz~450Hz,男性的声音基音频率大约在60HZ-200HZ之间,女性声音基音频率大约在200HZ~450HZ之间,因此根据语音的基音频率可以判别说话人的性别。关键字:基音频率一、实验原理及步骤1、语音信号进行分帧处理语音信号具有短时平稳性(10--30ms内可以认为语音信号近似不变),、这样就可以把语音信号分为一些短段来来进行处理,这就是分帧,语音信号的分帧是采用可移动的有限长度的窗口进行加权的方法来实现的。一般每秒的帧数约为33~100帧,视情况而定。2、幅度差平方和函数SMDSF定义为D2(τ)=∑τ其中:sw1(j)=s(j)w1(j),sw2(j)=s(j)w2(j),τ=0,1,⋯,L-1。窗函数为w1(j)={其他.和w2(j)={其他利用SMDSF只能提取出时间短于窗长L的基音周期,即SMDSF的窗长L需要大于可能出现的最长基音周期的时间,一般取值大于25ms。注意当τ等于基音周期P时,函数值和信号中非周期成分的能量是成一定比例,如果信号是准确的周期信号,则D2(P)=0。SMDSF不同Σ处的函数值,都计算了L个差值的平方和,这一点与CAMDF是一致的对于最小周期为P的严格周期信号有D2(mP)=D2(nP),其中m、n是正整数。3.归一化幅度差平方和函数对SMDSF归一化是十分必要的,目标是使其函数取值能评价语音信号非周期性的程度,以便在后处理中使用。归一化SMDSF定义为D2norm(τ)=D2(τ)L/∑,τ=0,⋯,L-1.如果信号是准周期的,其基音周期是P,D2(τ)与信号中非周期性成分能量成比例,而∑)/L与信号总能量成比例。因此,D2norm(τ)的值体现信号中非周期成分能量与信号总能量的比例。信号周期性越差,D2norm(τ)越大;信号周期性越好,D2norm(τ)越小;严格5周期信号D2norm(τ)=0,因此D2norm(τ)可作为信号非周期性的度量。此外,可以通过D2norm(τ)进行清浊音判定,一般情况下小于0.5的是浊音,大于0.5的是清音或其他随机噪音。后面的实验均使用0.5作为阈值4、程序设计的基本思想:先进行分帧处理,然后对语音信号的每一帧求幅度差平方和函数,同时求出归一化的幅度差平方和函数。根据归一化幅度差平方和函数的数值进行清浊音的判定一般情况下小于0.5的是浊音,大于0.5的是清音或其他随机噪音。本次课设采用0.5作为阈值,将清音和噪音部分置零使其不影响后面波谷点的提取。然后提取波谷点,如果没有波谷点则将这一帧抛弃,有波谷点则将16(50Hz)——160(500Hz)之间的点作为基音周期的候选点。由于D2(mP)=D2(nP),所以将各个候选周期与后面的波谷点求商,取最靠近整数的点作为这一帧的候选基音周期,如果仅有两个候选点则看这两点是否为倍数关系,若是则选为这一帧的基音周期,若不是则抛弃。求出所有的基音周期后有两种判断方法一是求均值然后与判决门限进行比较,判断是男是女。二是求出大于200Hz所占的总比重然后与判决门限进行比较,判断是男是女。5、基音频率的判断和语音信号的鉴别。首先基因频率的判断可以利用时域分析(短时能量、短时自相关)方法的特征或某几个特征的结合,判定某一语音有效的清音和浊音段;其次,针对浊音段,可直接利用短时自相关函数估计基音频率,方法是:估算浊音段第一最大峰值的位置,再利用抽样率计算基音频率,例如:如果说某一语音浊音段的第一最大峰值约为35个抽样点,设抽样频率为8kHz,则基音频率为8000/35=228Hz。也可以用平均幅度差函数,方法是估算浊音段第一最低波谷的位置,再利用抽样率计算基音频率,例如:如果说某一语音浊音段的第一最低波谷值约为35个抽样点,设抽样频率为8kHz,则基音频率为8000/35=228Hz。然后语音信号的鉴别,基音频率与个人声带的长短、薄厚、韧性、劲度和发音习惯等有关系,在很大程度上反应了个人的特征。在生活中,由于男性
本文标题:语音性别识别课设报告
链接地址:https://www.777doc.com/doc-7413202 .html