您好,欢迎访问三七文档
当前位置:首页 > 电子/通信 > 综合/其它 > 基于DSP的语音门锁设计与实现
基于DSP的语音门锁设计与实现学生:xxx指导教师:xxx内容摘要:本文主要是关于SpeakerRecognition应用系统的研究,完成了基于DSP的嵌入式语音门锁的设计与实现。方案内,先由TLV320AIC23B芯片对语音信号进行采集、预处理,再将处理后的信号通过DMA送给核心运算器件DSP。最后由DSP提取人的特征,建立数学模型并进行匹配,最终完成识别。实验证明本语音门锁的设计合理,方案可行,市场应用前景甚是广阔。关键词:SpeakerRecognitionDSP嵌入式语音门锁DesignandImplementationofEmbeddedPhoneLockSystemBasedonDspAbstract:ThispaperisastudyonSpeakerRecognitionapplicationscompletedbasedonthedesignandimplementationoftheDSPembeddedspeechlocks.Withintheprogram,onthespeechsignal,firstTLV320AIC23Bchipcollection,pretreatment,andthentheprocessedsignalsaresentbyDMAtothecoreoperationdeviceDSP.ThefinalcharacteristicsextractedbytheDSP,mathematicalmodelandmatch,thefinalcompletionoftheidentification.Experimentsshowthatthedesignofthevoicelocksreasonablyfeasible,themarketprospectisverybroad.Keywords:SpeakerRecognitionDSPembeddedvoicelocks1生物识别技术1.1生物识别技术概述在今天这个计算机及网络技术飞速发展的时代,信息的安全显的尤为重要。而确保系统安全的重要前提则是身份的鉴定,在多种电子的领域里都需要准确的身份鉴定,如:国家安全、司法、电子商务、电子政务等。现如今,用于个人身份鉴别主要依靠各种证件和设置密码等手段,然而这些手段存在或多或少的缺点,譬如,携带不便、易折坏、易丢失遗忘等。所以在这种传统辨别身份的方法正面临着淘汰的趋势之际生物识别技术备受学术界的关注,并有以之取代传统身份识别方式之势。1.2生物识别技术的发展历史生物识别的起源可追溯到古埃及时候,当时人们通过测量身高尺寸来鉴别埃及人的身份,像这种通过测量人身体某一部份或者依据某一身体特征来识别身份的技术一直延续了几百年。而中国和古叙利亚则在公元前7000年到6000年之前,以指纹作为身份鉴别的依据已经开始应用。考古发现,在这个时代,一些陶艺匠人将指纹留在自己制作的粘土陶器上,这与古时诗人画家,在自己作品上盖章留名同性质,并且在中国的一些重要文件上多是用大拇指按朱砂印。原本是因为当时人读书者甚少,大多不能书写自己名字,则以这种方式来当做签名,当时称这种行为为画押。但在19世纪初,经科学研究发现指纹具有两个重要的特征,其一是指纹的唯一特性,即指意两个不同手指的指纹纹路的式样是不相同的,其二是指纹纹路的式样终生不因生长的因素而发生改变。这个研究成果使得1896年阿根廷首次将指纹识别在犯罪鉴别中得以正式应用,随后是苏格兰在1901年也采用这种方式,20世纪初其他国家也将之相继应用到了犯罪鉴别中。20世纪60年代,随着计算机的发展,人们开始着手研究利用计算机来处理指纹。从那时起,世界许多国家将自动指纹识别系统AutomaticFingerprintIdentificationSystem应用于法律中,一种自动识别指纹的设备在60年代末期在FBI得以应用,在70年代末期,已经有一定数量的设备开始在美国大范围使用。用于商业的高级生物测定设备最早开始于20世纪70年代,一种叫做Identimat的设备出现了,它通过手的形状和手指的长度来辨别身份。20世纪80年代,个人电脑和光学扫描这两项技术的改进,使得它们作为指纹取像的工具成为现实,从而促使了指纹识别在其他领域的广泛使用,譬如IC卡的替代。90年代末,精确的比对算法的发现以及低价位取像设备的引入及其飞速发展,为个人身份识别应用的增长提供了舞台。1.3生物识别的特点生物识别技术之所以能够作为个人身份鉴别的有效手段,并且在越来越多的领域广泛应用是由它自身的特点所决定的。生物识别技术具有唯一性、普遍性、稳定性和不可复制性。生物识别技术的普遍性即指生物识别所依赖的身体特征基本上是人人与生俱来的,不需要向相关部门申请或是制作。唯一性和稳定性是指经研究和经验表明,每个人的容貌、发音、虹膜、视网膜、骨架、指纹、掌纹等都与别人不同,并且一般情况下终生不会发生改变。不可复制性:随着计算机网络技术的发展,配制钥匙、copy密码卡以及盗取密码、口令等都变得越发容易,然而要复制人的活体指纹、掌纹、面部、虹膜等生物特征就困难得多。生物识别技术所具有的这些特性使得生物识别身份验证方法不依赖各种人造的和附加的物品来证明人的自身,而只要个体存在那么自己就是身份的最好证明物,所以,它不用担心丢失,更加不会遗忘,和配置钥匙和盗用密码等相比复制生物体所具备的生物特征就显得尤为困难,生物识别技术是一种方便安全的只认人不认物的保安手段2数字信号处理器DSP2.1数字信号处理器DSP的概述数字信号处理是指将模拟信号通过采样进行数字化后的信号进行分析、处理、它侧重于理论、算法及软件实现。它是围绕着数字信号处理的理论、实现、应用等几个方面发展起来的。数字信号处理的应用促进了数字信号处理理论的发展和提高。反过来,数字信号处理在理论上的发展又推动了数字信号处理应用的发展。而数字信号处理的理论和应用则是通过数字信号的实现而连接的。数字信号处理所涉及的范围极其广泛,以众多的学科为理论基础。它与网络理论、信号与系统、控制论、通信理论、故障诊断等密切相关。一些新兴的学科,如人工智能、模式识别、神经网络等,都与数字信号处理密不可分。它是把许多经典的理论体系作为自身的理论基础,同时又使自己成为一系列新兴学科的理论基础。DSP(DigitalSingnalProcessor)是一种独特的微处理器,是以数字信号来处理大量信息的器件。其工作原理是将接受的模拟信号转换为0或者1的数字信号,再对转换后的信号进行修改、删除、强化,并在其他系统芯片中把数字数据转译回模拟数据或实际环境格式。它不仅具有可编程性,而且其实时运行速度可达每秒数以千万条复杂指令程序,远远超过通用微处理器,在数字化电子世界中越发重要的电脑芯片。它的强大数据处理能力和高运行速度,是最值得称道的两大特色。自DSP芯片问世以来,在20年的时间里,它得到了极为迅速的发展。世界上生产DSP芯片的厂家主要有:美国的德克萨斯仪器公司(TexasInstruments,简称TI)、模拟仪器公司(AnalogDevices,简称AD)和Motorola公司等,其中应用最为广泛的是TI公司生产的系列DSP芯片。自80年代初TI公司推出第一代产品TMS32010以来,相继推出了定点和浮点两大类别多代产品,现已形成了TMS320C2000、TMS320C5000和TMS320C6000三大DSP芯片系列。TI公司的DSP芯片市场大约占全世界份额的50%,IT公司已是世界上最大的DSP芯片供应商,它的一系列DSP产品已经成为当今世界上最有影响的DSP芯片。通过DSP实现语音门锁的设计,在芯片的选择上将采用TI公司的TMS320C5402芯片,因为该芯片在各种语音应用领域被广泛应用,而且它比该系列的其他芯片相比,具有更快的运算速度、更高的性能同时低功耗低价格和性价比高等特点。2.2DSP的特点DSP的结构是针对DSP算法模型进行构造的,所有的DSP都包含有DSP算法的特征。即是,单周期快速运算,能取两个以上操作数,允许任意计算次序,保证快速的乘累加运算(MAC);能产生循环寻址和位翻转寻址等信号处理算法需要的特殊寻址;有相应的硬件循环缓冲区,能执行零开销的循环和转移操作;具有串口、DMA控制器、定时器等丰富的外设资源。因此,数字信号处理的上述特点要求DSP必须是专门设计的,典型DSP的设计要满足,不论是语言信号,还是图像信号处理算法运算量大,要求速度快且实时;信号处理算法通常需要执行大量的乘法和累加运算,具有某些特定模式,要求专门的接口。大部分时间信号处理算法花在执行相对小循环的操作上。3基于DSP的语音门锁系统本章介绍了基于矢量量化的说话人识别原理,对于其中的几个方面的问题做了进一步的探索。编程实现了算法的各个子程序,在编程过程中做了相关的实验充分考虑程序运行时间、精度以及存储量等因素,对系统的识别效果也进行了实际测试。通过大量比较筛选,确定出最优的算法,应用于语音门锁中。3.1基于DSP的语音门锁系统概述语音门锁系统采用一种高效的数据压缩技术,这种技术被称作矢量量化技术,下面对该技术做详细介绍。矢量量化(VQ—VectorQuantization)是将若干个标量数据组构成一个矢量,然后在矢量空间内将其整体量化,这样既压缩了数据又不会损失多少信息。矢量量化将N维空间RN中的矢量x按某种准则用N维空间中的矢量{yi|i=1,2,...,K}表示。x:输入矢量yi:量化矢量{yi|i=1,2,...,K}:码书或码本K:码书容量i:码字对语音信号,在已知训练数据的情况下,VQ的准则是:给定的码本容量为K时,使量化最小失真。图3-1给出了基于VQ的说话人识别系统框图。对于基于VQ的说话人识别技术来说,码本的产生会直接影响到识别的效果。码本形成过程是将所提取出的各个特征矢量集合,按照某种准将具有相似特征的矢量归到一个集合里,用一个具有代表性的矢量来表示。VQ码本形成的基础是初始码本的选择,目前在算法的DSP实现过程中,初始码本的选择采用了一种在训练数据中找到距离最远的K个矢量,这种方法便于DSP实现。码本设计采用LBG算法,LBG算法是Y.Linde、A.Buzo、R.M.Gray三人在1980提出的,LBG是基于最近邻法则把训练序列分配到与它欧式距离最小的码字的簇中,从而形成很多个子集,计算各子集的形心和平均失真,一直迭代计算,并不停地对码本进行修改直到性能满足要求或不能再改进为止。图3-1基于矢量量化的说话系统框图识别结果识别训练语音信号预处理特征提取产生码书码书存储相识度匹配判别逻辑3.2空胞腔处理在此主要讨论基于VQ说话人识别模型的LBG(Linde、Buzo、Gray)算法中的空包腔处理问题。所给方法的优点首先是在分裂大包腔时选择子包腔码字更具有代表性,从而使得系统在重新聚类中避免再次出现空包腔的可能性;其次,该方法对于系统没有信息冗余的情况下,可避免信息的损失,对保持矢量在空间分布的完备性有一定的意义为了对空包腔处理作出更清楚地说明,图3-2中给出加入空包腔的LBG算法流程。图中pow(10,n)和delta(m)可以分别表示为10n,(d(m)-d(m-1))/d(m)。首先为了让每个码字矢量都能对话者特征具有代表性,将所含矢量数目符合下式的胞腔定义为空胞腔。M*码本长度驯良矢量总的个数Knum(3.3.1)式中,K为比例因子,一般取为0.2,用于调整空胞腔中所含矢量的个数。通常空包腔的处理并不认为是绝对空(矢量数为0),实际上这种情况是不可能的。设空包腔限为num,聚类过程中一次出现v个空包腔,若视空包腔为绝对空,则迭代n次损失的矢量数最坏情况为0(n×v×num)级。在确定了空包腔限后,对码本中的空包腔进行逐个处理,其步骤为:(1)对任一空包腔码字,找到码本中与其最临近的码字,将该空包腔与其最临近码字胞腔合并;(2)找到码本中得分最大的包腔,设第j个包腔内的矢量数为n,码字为Cj,得分score遵循的准则ngthcodebooklej1c(*nsc
本文标题:基于DSP的语音门锁设计与实现
链接地址:https://www.777doc.com/doc-2569327 .html