您好,欢迎访问三七文档
当前位置:首页 > 机械/制造/汽车 > 汽车理论 > 基于凌阳单片机的嵌入式声控门锁的设计_徐春辉pdf
科技广场2007.5基于凌阳单片机的嵌入式声控门锁的设计DesignofEmbeddedSpeechRecognitionLockBasedonSunplusMicrocontroller徐春辉XuChunhui(华东交通大学电气与电子工程学院,南昌330013)(SchoolofElectricandElectronicEng.,EastChinaJiaotongUni.,Nanchang330013)摘要:通过分析语音特征参数的特点和说话人识别的基本方法,以线性预测倒谱系数为特征参数提取算法以及隐马尔可夫模型为建模算法,利用凌阳单片机作硬件平台,实现了声控锁的语音控制功能。实验结果表明,系统性能稳定,识别效果良好。关键词:凌阳单片机;声控锁;声纹识别;线性预测倒谱系数;隐马尔可夫模型中图分类号:TN602文献标识码:B文章编号:1671-4792-(2007)5-0147-03Abstract:Thefeaturesofvoice-characterparametersandfundamentalspeakerrecognitionmethodsareanalyzedbyusinglinearpredictioncepstrumcoefficientandhiddenMarkovmodelasmodelingalgorithms.ThespeechrecognitioncontrolfunctionisimplementedbythehardwareplatformSunplusMCU.Theexperimentalresultsshowthatthedesignedsystemhashighidentityprecisioncanachievetherequestofsafety-secrecy.Keywords:SunplusMicrocontroller;SpeechRecognitionLock;VoiceprintRecognition;LinearPredictionCepstrumCoefficient(LPCC);HiddenMarkovModel0引言随着人们生活水平的提高和安全意识的加强,锁具系统的可靠性变得越来越重要。传统的用钥匙开启的锁具已经不能满足人们的安全需求,各种新型锁具如磁性锁、密码锁、指纹锁、IC卡锁、激光锁、声控锁等相继出现,其中采用生物识别技术的声控锁,由于其安全可靠使用方便受到了特别的关注。生物识别技术是利用人体生物特征进行身份认证的一种技术,是目前公认的最为方便与安全的识别技术。由于每个人的生物特征具有与其他人不同的惟一性和在一定时期内不变的稳定性,不易伪造和假冒,所以利用生物识别技术进行身份认定,安全、准确、可靠。在生物识别领域中,声纹识别,也称为说话人识别,以其独特的方便性、经济性和准确性等优势受到世人瞩目,并日益成为人们日常生活和工作中重要且普遍的安全认证方式。声纹识别是一种根据说话人语音波形中反映说话人生理和行为特征的语音参数,自动识别说话人身份的技术。本文介绍的声控门锁是一种在凌阳16位单片机SPCE061A上实现的与文本有关的说话人确认系统。该系统主要由:说话人识别模块、门锁控制电磁执行机构以及门锁等部分组成。在训练时,说话人的声音通过麦克风进入说话人语音信号采集前端电路,由语音信号处理电路对采集的语音信号进行特征化和语音处理,提取说话人的个性特征参数并进行存储,形成说话人特征参数数据库。在识别时,将待识别语音与说话人特征参数数据库进行匹配,通过输出电路控制门锁电机,最终实现对门锁的控制。1算法设计声控锁设计的难点是对算法的研究和算法的选择。说话人识别力求挖掘出包含在语音信号中的说话人的个性因素,强调不同人之间的个性差异。说话人识别的特征提取就是要舍去语义内容而保留个人特征信息。声音中所包含的个人特征信息有两种:一种是由声道长度、声带等先天性发音器官的个人差别所产生的;另一种是由方言、语调等后天性讲话习惯产生的。前者是以共振峰频率的高低、带宽的大小、平均基频、频谱基本形状的频率等所表现的;后者是以基频、共振峰频率的时间波形、单词的时间长短所表现的。两种特征分离并提取是困难的,多采用同时兼有两者特征的特征参数。1.1算法选择的前提应用声控锁的条件是:①声控锁针对小型公司或家庭,在人数较少的系统中使用;②外部环境较好;③针对的是文本有关的说话人识别;④说话人声音时延性较差。其中条208件①~③对声控锁的设计是有利的,可提高系统设计的效率。而条件④将是系统识别和测试遇到的较大困难,可通过调整算法以及系统更新的方式解决。说话人识别包括两个阶段,即训练和识别阶段,如图一所示。在训练阶段建立说话人的特征参数模型同时保存相应的参数,声控锁采用隐马尔可夫模型(HiddenMarkovModel,HMM)建立模型。在系统识别阶段是判断测试音是否与系统内某个说话人的模型相匹配。系统的特征提取阶段所采用的算法为线性预测倒谱系数(LinearPredictionCepstrumCoefficient,LPCC)。图一说话人识别系统框图1.2特征参数提取声控锁中特征参数提取采用的是LPCC,LPCC去掉了语音产生过程中激励信息,主要反映声道响应,而且只需少量的倒谱系数就能够较好地描述语音的共振峰特性。线性预测系数(LinearPredictionCoefficient,LPC)是识别特征的重要来源,但是在语音识别系统中,很少直接使用LPC,而是由它推导出另一种参数即LPCC,倒谱实际上是一种同态信号处理方法。(1)线性预测系数对于一个LPC系统,采样点的输出s(n)可以用前面p个样本的线性组合来表示,即:s(n)≈a1s(n-1)+a2s(n-2)++aps(n-p)(1)其中a1,a2,,ap为常数,即LPC。若一个随机过程用一个p阶的全极点系统受白噪声u(n)激励产生的输出来模拟,则该系统的传递函数为(2)声道模型和辐射模型的级联就是H(z),实际上是一个短时稳定的时变滤波器,但也是随着时间缓慢变化的,因此预测的误差为:(3)使式(3)中En达到最小值,{ak}必定满足En/ai=0(i=1,2,,p),由此得到以{ak}为变量的线性方程组(4)其中i=1,2,,P。由此可解出其中的变量{ak}。(2)线性预测倒谱系数将一帧中的语音信号s(n)=h(n)*i(n)处理为其倒谱c(n)的过程如图二所示。可以先用DFT,采用FFT计算s(n)的短时傅里叶变换,变换的结构使得在B点得到了声道冲激响应和音源激励的傅里叶变换的乘积。再取这一乘积的幅度对数,在C点就得到声道冲激响应和音源激励的傅里叶变换的对数之和。最后对其进行逆傅里叶变换,将在D点得到的信号称为是s(n)的倒谱c(n),也称之为倒谱系数,它是声道分量的倒谱h(n)和音源激励分量的倒谱i(n)之和。图二倒谱系数实现框图联合LPC和LPCC的算法,可以得到LPCC的直接递推关系(5)这里c0实际上是直流分量,反映频谱的能量,其值大小不影响频谱,在系统中不使用,不用计算其结果。cm为LPCC的待定系数,am为所求得的LPC。该系统的线性预测模型选择的阶数p为10,LPCC的阶数m为16,根据式(5)可计算每帧声音信号的LPCC参数。1.3模型匹配方法HMM是一种基于转移概率和输出概率的随机模型,它把语音看成由可观察到的符号序列组成的随机过程,符号序列则是发声系统状态序列的输出。在使用HMM识别时,为每个说话人建立发声模型,通过训练得到状态转移概率矩阵和符号输出概率矩阵。识别时,计算未知语音在状态转移过程中的最大概率,根据最大概率对应的模型进行判决。对于与文本有关的说话人识别采用从左到右型HMM,HMM不需要时间归整,可节省判决时的计算时间和存储量。在语音识别时,若记模型λij表示第i个人的第j个模型(i=1,2,,n;j=1,2,,m),观测序列是O,在训练阶段,不断地修正λij的3个参数矢量,使P(O|λij)最大;在测试时,对测试样本序列O,计算所有使P(O|λij)(i=1,2,,n;j=1,2,,m)。那么,i=argMAXP(O|λij)就是测试结果。2软硬件设计及系统实现语音电子门锁系统的核心是说话人识别模块,包括按键输入、语音信号采集、语音信号处理、FLASH存储扩展、扬声器输出、驱动电路以及LCD模块等。说话人识别模块的原理框图如图三所示,其核心为语音信号处理。本系统选用特别适用于数字语音识别领域且具很高性价比的凌阳16位单片209基于凌阳单片机的嵌入式声控门锁的设计科技广场2007.5机SPCE061A作为数字信号处理器,并通过SPCE061A实现对误,后者是接受假冒者而造成的错误,二者与匹配阈值的设其他各组成部分的控制。定相关。匹配阈值的设定与语音锁系统的应用场合、功能侧重有关,对于家庭、宾馆等门锁用户,要求误识率尽可能低,甚至为零;若用于公司员工考勤等同类功能,就不能有太高的拒识率。表一是对以下每种情况各进行100次实时匹配的结果,其中设定的阈值适合门锁用户。表一100次实时匹配结果图三系统硬件结构框图软件设计是设计过程的关键,系统软件由驱动程序和算法程序两部分组成。其中驱动程序较为简单,主要是利用识别的结果驱动机电装置开启锁具。而算法程序也包括两个部分:建模程序和识别程序,程序流程如图四、图五所示。图四建模程序流程图图五识别程序流程图3实验结果分析对于说话人确认系统,表征其性能的最重要的两个参量是拒识率和误识率。前者是拒绝真实的说话人而造成的错由以上实验结果可知,对于同一个人相同发音的拒识率为8%;对于同一个人相似发音情况,因为系统是对说话的人进行判别,对于这种情况,无论拒绝或接受都是合理的;对于同一个人不同发音和不同人发音的情况,误识率为零。使用录音机录音进行多次实验,通过认证的次数为零。对于门锁用户,这个结果是十分理想的。4结束语基于SPCE061A构建的语音电子门锁系统具有成本低、使用方便、保密性好等优点。经大量实验测试表明,该系统性能稳定,识别效果好。但是,在环境噪声或干扰信号高于语音信号时,该系统将无法进行正确的语音识别,在背景噪声处理及其工程实现上还需进一步改进。参考文献[1]曾海涛.说话人识别的研究与DSP实现[D].西南交通大学,2006.[2]刘永红.说话人识别系统的研究[D].西安交通大学,2003.[3]周星,王成友.基于矢量量化的说话人识别研究[J].计算机工程与设计,2002(11).[4]赵力.语音信号处理[M].北京:机械工业出版社,2003.[5]易克初.语音信号处理[M].北京:国防工业出版社,2000.[6]李晶皎.嵌入式语音技术及凌阳l6位单片机应用[M].北京:北京航空航天大学出版社,2003.[7]余华,赵力.基于FVQ的说话人识别系统的DSP实现[J].电声技术,2004(8).作者简介徐春辉,男,汉族,江西南昌人,华东交通大学电气与电子工程学院副教授,主要从事数字信号处理及计算机测控方面的教学与研究。210
本文标题:基于凌阳单片机的嵌入式声控门锁的设计_徐春辉pdf
链接地址:https://www.777doc.com/doc-2535712 .html