您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 薪酬管理 > 基于HMM和代数神经网络的连续语音识别研究
西北大学硕士学位论文基于HMM和代数神经网络的连续语音识别研究姓名:薛蕾申请学位级别:硕士专业:计算机软件与理论指导教师:冯宏伟20100601基于HMM和代数神经网络的连续语音识别研究作者:薛蕾学位授予单位:西北大学相似文献(10条)1.学位论文俞东海人工神经网络语音识别和基于清/浊音分割的连续语音识别1997该文是作者在中国科学院自动化研究所攻读硕士学位期间所做工作的总结.主要包括两大部分内容.第一部分是人工神经网络用于语音识别,是对作者在1995年8月到1996年4月参加中科院的课题人机语音对话系统工程之子课题听觉模型与人工神经网络在语音识别中的应用所做工作的介绍.第二部分介绍的是基于清浊音分割的连续语音识别方法研究,这是作者自1996年5月至1997年的主要工作.2.学位论文齐爱学基于隐马尔可夫和人工神经网络混合模型的语音识别2007语音识别是一门内涵丰富,应用广泛的技术,它的实用性和趣味性使得人们对它有着迫切的应用需求。在语音识别系统中,隐马尔可夫模型是当前最为流行的语音识别模型,占据着主导地位。HMM模型之所以应用较为成功,主要是它具有较强的对时间序列结构的建模能力,尽管如此,HMM技术也存在一些缺点,如:决策分类能力弱,需要语音信号的先验统计知识等。人工神经网络方法作为模拟人脑思维机制的工程模型,它与HMM正好相反,其分类决策能力和对不确定事物的描述能力已得到举世公认,但它对动态时间信号的描述能力尚不尽如人意。本论文在介绍HMM模型和人工神经网络的基本原理的基础上,将两种方法有机结合,进一步提高语音识别的准确率。对于含噪语音信号的有效特征提取是语音识别至关重要的一步。本论文首先介绍了在语音识别中最常用的两种特征参数:基于发声系统模型导出的线性预测倒谱系数、基于听觉系统模型导出的Mel频率倒谱系数,而这两种特征参数在纯净语音下识别效果比较好,但是在噪声环境下识别效果不尽如人意。接着提出利用小波变换对含噪语音信号进行去噪的方法,再经Mel滤波器组转换为Mel频率下的倒谱系数,这种新的特征参数进一步反映了语音信号的动态特性、增强抗干扰能力,从而提高了识别率。提出了用隐马尔可夫和人工神经网络混合模型对语音信号进行识别的方法,即有效的运用了经典HMM模型对动态时间序列较强的建模能力,又充分利用了人工神经网络较强的分类决策能力。实验证明,该模型适合于对噪声背景下的语音进行识别,同经典的HMM模型相比较,具有更好的抗噪鲁棒性,在信噪比较低的情况下,识别率比经典的HMM模型有明显的提高。3.会议论文王志荣.刘晓星.李宗葛人工神经网络语音识别1998介绍人工神经网络在语音识别中的应用,实现了一个基于BP网络的与说话人无关的孤立数字识别器,实验表明这种识别器具有计算简单,识别精度高的特点。4.学位论文李全在隐马柯夫模型与人工神经网络相结合用于语音识别1998该文的工作主要集中于探索语音新的、更完善的高阶HMM模型,并试图借助于HMM/ANN混合方法把这些模型用于语音识别,以提高识别器性能.5.学位论文荣蓉基于人工神经网络的语音识别研究2005本文对语音信号的预处理、特征提取、以及神经网络模型的建立,都进行了较深入的研究。所作的主要工作如下:1.对国内外语音识别和神经网络技术发展状况作了较全面的总结分析,对语音识别技术的分类、语音识别系统的构成、语音信号的预处理、语音信号特征提取(文中主要研究了线性预测倒谱参数LPCC的提取和美尔频率倒谱系数MFCC的提取)等关键环节的技术问题进行了深入的理论分析。2.针对非特定人的英语元音识别问题,建立了一个概率神经网络模型。将对英语元音的识别转化为分类问题,采用概率神经网络模型作为分类器,并在Matlab环境下进行了相关的仿真实验。实验结果表明,概率神经网络在进行元音识别的时候具有不错的识别率。3.对国内外模糊神经网络的发展状况作了比较全面的总结分析,深入研究了多层前向神经网络及BP算法,以及它们与模糊逻辑理论的结合,在此基础上,对传统的Sugeno模型作出修正,并建立了一个模糊神经网络模型。4.针对非特定人英语元音识别的问题,推导了一种多输入多输出的既能学习数值数据,又能学习模糊规则的模糊神经网络。针对BP算法学习速度慢的特点,文中采用增加动量项和变学习因子,大大加快学习速度。6.期刊论文孙宁.孙劲光.孙宇.SunNing.SunJinguang.SunYu基于神经网络的语音识别技术研究-计算机与数字工程2006,34(3)对BP神经网络在特定人语音识别技术中的应用进行了探索性的研究,进而对非特定人语音识别做了一定的实验和研究.通过对比分析了传统的语音识别方法--模板匹配法和人工神经网络语音识别方法的优缺点.神经网络可以得到较高的识别准确度,但是训练速度慢是它的弱点,因此,针对经典的BP算法训练速度慢的缺点,对BP网络加以改进,提高网络训练速度,通过改进使神经网络用于语音识别的各种优越性充分发挥.7.学位论文王凯人工神经网络方法在汉字语音识别和数据仓库技术中的应用研究2000语音识别技术和数据仓库技术是当前计算机科学研究中最引人注目的两大前沿课题.论文对语音识别和数据仓库的理论分别作了阐述,并结合科研项目,完成了相应的实验工作.8.学位论文王忠文基于ARM-Linux的抗噪声语音识别技术研究2008语音识别技术是集声学、语音学、语言学、计算机、信息处理和人工智能等诸领域的一项综合技术,应用需求十分广阔,长期以来一直是人们研究的热点。到目前为止,语音识别研究大部分以线性系统理论为基础,主要应用隐马尔可夫模型(HiddenMarkovModel,HMM)与动态时间规整(DynamicTimeWarping,DTW)技术实现语音识别。随着研究的逐步深入,基于线性系统理论的语音识别方法的局限性越来越凸显。近年来,随着人工神经网络(ArtificialNeuralNetworks,ANN),混沌、分形等非线性理论研究和应用的日新月异,将这些理论应用于语音别成为可能。本文对现有的语音识别技术发展现状进行了分析,介绍了语音识别的基本理论,包括语音信号的预处理、计算听觉场景分析(ComputationalAuditorySceneAnalysis,CASA)和特征参数提取。根据计算听觉场景分析的基本原理,针对本文设计所应用的场合,改进了计算听觉场景的结构,优化了其算法,并详细讨论了计算听觉场景在语音识别的前端应用,很好的分离了语音采集前端的混叠语音,提高了算法的抗噪声能力。文中还阐述了语音特征参数的提取算法,比较了线性预测编码倒谱(LinerPredictionCepstrumCoefficient,LPCC)系数和Mel频率倒谱系数(MelFrequencyCepstrumCoefficient,MFCC)的优缺点,详细论述了Mel频率倒谱系数的提取方法和运算步骤。文中还研究了隐马尔可夫模型和自组织神经网络(SelfOrganizingNeuralNetworks,SONN)的原理及其在语音识别中的应用,详细讲述了HMM的原理与模型参数,分析了每个参数的提取方法,讨论解决了HMM的三个基本问题;讲述了人工神经网络的基本概念,BP网络和自组织神经网络的结构和算法,并且分析比较了它们的识别特性与应用特点,提出了基于CDHMM和SONN的混合模型原理及算法,并加入到SONN分类器进行语音识别。本文设计了语音识别系统的软硬件结构,并在ARM-LinUX环境下对基于CASA和HMM-ANN模型的算法进行了实验,测试了在各种场合下的语音识别率。分析测试结果表明,与以前的HMM模型方法相比,改进后的基于CASA的HMM-ANN模型提高了语音识别系统的准确率和识别系统的抗噪声能力,提升了系统的鲁棒性和自适应性,充分体现出改进模型的性能,证明了该系统的可行性和有效性,最后指出了需要进一步改进的问题和本课题未来的研究方向。9.期刊论文张震南人工神经网络技术在语音识别中的应用-甘肃科技纵横2008,37(4)本文对基于人工神经网络的语音识别技术进行了详细分析、讨论,阐述了人工神经网络对语音识别技术的推动作用.10.学位论文顾明亮语音识别鲁棒性研究的非线性方法1998系统的鲁棒性问题是语音识别实用化关键,它包括非特定人语音识别,混淆词语音识别和噪声环境下的语音识别三个基本问题.该文利用神经网络、混沌联想记忆等非线性方法对语音识别的鲁棒性问题进行了系统研究.主要包括以下五个部分:第一部分研究神经网络语音识别的时间规正问题;第二部分研究语音信号特征维数的压缩问题;第三部分研究HMM与人工神经网络(ANN)的混合识别问题;第四部分研究用混沌编码联想记忆模型解决噪声环境下的语音识问题;第五部分研究多分类器的集成问题.本文链接:授权使用:重庆邮电大学(cdyddx),授权号:ac6427a3-d762-437c-815e-9eab01559e88下载时间:2011年3月19日
本文标题:基于HMM和代数神经网络的连续语音识别研究
链接地址:https://www.777doc.com/doc-5934768 .html