您好,欢迎访问三七文档
当前位置:首页 > IT计算机/网络 > AI人工智能 > 远场语音识别技术方案
语音技术部李超20170902百度远场ASR技术自我介绍内容要展开了讲百度的远场识别方案,方案有什么效果多方几遍?举例子,(1)听出来音频,我们的识别结果(2)聪姐的视频工程实例(1)联想的(2)车载远场的开放进度,暂时不支持,有计划互联网时代移动互联网时代物联网时代GMM-HMMDNN-CTCJOINToptimization近场远场噪声:由目标声源之外声源发出的声信号混响:目标语音信号经过墙壁等再次或者多次发射信号回声:智能终端接收目标信号的同时,也发出声音所造成的干扰干扰语音信号降低可懂度语音交互语音感知语音增强语音分离•聪姐的演示视频AECSourceLocation后处理语音唤醒Beamformer后处理ASR多路信号参考信号取单路信号Near-fieldspeechAugmentedfar-fieldspeechrealfar-fieldspeech*=pTransferlearning1.使用已经充分训练的进场模型做初始化2.几万小时的远场增强数据做训练3.加入一定比例的近场数据进行正则化我要听90年代的音乐帮我放1下有关娱乐的直播电台播放硅谷的新闻pMask&JointTraining1.前端信号处理网络和后端声学模型组成一个网络2.先训练前端,然后在一起训练pend-to-endFairfieldacousticmodel1.Googlehome2.2Mic媲美6Mic3.更低的硬件成本,广泛的适用性
本文标题:远场语音识别技术方案
链接地址:https://www.777doc.com/doc-5727453 .html