您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 企业文化 > 一种基于网格方法控制鼠标定位的语音识别解决方案
1、语音识别技术介绍2、语音鼠标光标控制3、网格法提出与实现4、研究展望计算机语音人机交互研究—一种基于网格方法控制鼠标光标定位的解决方案计算机学院王军2010年5月1、语音识别技术介绍•1.1语音识别是让机器听懂人的说话,并准确地识别出语音的内容和执行相应操作的技术.使用针对应用程序输入的语音识别1.2SAPI5.1的工作原理•语音识别引擎:语音识别引擎的内部驱动程序可以识别语音并将其转换为文字。•API使得应用程序和语音引擎之间高度紧密的结合。SAPI可以实时处理各种语音引擎在底层工作中的细节。•SAPI的两种基本类型是文本合成语音(TTS)引擎和语音识别(SR)引擎。TTS可以将文本中的字符或文档合成为语音并“说”出来。而SR则可以把人说话的语音转换为易读的字符或文档。微软SpeechSDK结构图2、语音鼠标光标控制•2.1基于语音识别的光标控制类型目前有两种语音控制鼠标的模式:目标导向光标控制和方向导向光标控制。•1)目标导向光标控制中,用户需要用语音给出具体目标名称或者位置,比如图标、菜单、或者屏幕区域名称,然后给出执行的命令如“单击”等。•2)方向导向光标控制又分为非连续控制的和连续控制的两种,对于非连续的情况用户要同时说明方向和距离,如命令“左8厘米”那么光标就向左移动8厘米。而对于连续的情况用户先说明方向如“向左”,光标就向左移动,直到用户再说“停止”,光标就停止运动。2.2目前语音控制鼠标的缺陷对于大的目标而言,这种语音控制鼠标控制没有什么问题,如果目标区域比较小,将会增加使用者的难度,比如当光标移动到矩形时喊“停”,光标会继续移动一小段才停,这时光标可能已经越过了目标矩形。这种情况和语音识控制中存在的延时有关,每次用户发出语音命令到命令被执行都有一个过程,首先使用者说出语音命令是需要时间的,而且语速快的人和语速慢的人说同样的命令花的时间不同;另外语音识别引擎成功识别一个语音命令也需要一个时间。所以语音控制鼠标在控制过程中必然存在延时。3、网格法提出与实现•3.1网格法原理3.2网格法实现关键算法实现思想(网格识别)•通过观察总结可知,网格序号和Top值、Left值之间有一定逻辑关系。用语法表示为:bleft=Form1.Width/3btop=Form1.Height/3m=(n-1)\3//m为(n-1)与3的商取整,其中n为网格序号k=((n-1)Mod3)//k为(n-1)与3求模后的余数部分,其中n为网格序号Form1.Left=k*bleft//网格识别后窗体Left的值Form1.Top=m*btop//网格识别后窗体Top值4、研究展望•网格法控制鼠标光标定位的实现不光在语音控制计算机这一方面有很好的使用价值,也可在其他领域推广,如在军事应用方面,在战斗机作战时飞行员的双手可能都处于忙碌状态,当要在屏幕上定位射击目标时可通过网格法语音识别来精确定位。在生活领域,在汽车驾驶时,人在驾驶过程中使用GPS导航仪时也可通过网格法来定位导航目标。这些都是由于网格法在定位的准确性和快速性来决定的,在未来的研究中,网格法必定会越来越多的应用于人们的生活中来为我们服务。•Thankyou!
本文标题:一种基于网格方法控制鼠标定位的语音识别解决方案
链接地址:https://www.777doc.com/doc-5013298 .html