您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 经营企划 > 电话拨号音的合成与识别
武汉大学教学实验报告电子信息学院专业通信工程2015年10月15日实验名称电话拨号音的合成与识别姓名郝玉洁学号2013301200076成绩一、实验目的本实验基于对电话通信系统中拨号音合成与识别的仿真实现,主要涉及到电话拨号音合成的基本原理及识别的主要方法,利用MATLAB软件以及FFT算法实现对电话通信系统中拨号音的合成与识别。并进一步利用MATLAB中的图形用户界面GUI制作简单直观的模拟界面。使其对电话通信系统拨号音的合成与识别有个基本的了解。能够利用矩阵不同的基频合成0-9不同按键的拨号音,并能够对不同的拨号音加以正确的识别,实现由拨号音解析出电话号码的过程。进一步利用GUI做出简单的图形操作界面。要求界面清楚,画面简洁,易于理解,操作简单。从而实现对电话拨号音系统的简单的实验仿真。二、实验基本原理(1)双音多频DTMF(DualToneMulti-Frequency)信号,是用两个特定的单音频率信号的组合来代表数字或功能。在DTMF电话机中有16个按键,其中10个数字键0—9,6个功能键*、#、A、B、C、D。其中12个按键是我们比较熟悉的按键,另外由第4列确定的按键作为保留,作为功能键留为今后他用。根据CCITT建议,国际上采用697Hz、770Hz、852Hz、94lHz低频群及1209Hz、1336Hz、1477Hz、1633Hz高频群。从低频群和高频群任意各抽出一种频率进行组合,共有16种组合,代表16种不同的数字键或功能,每个按键唯一地由一组行频和列频组成,如表1所示。表1:DTMF的组合功能(2)涉及的MATLAB函数1.Set功能:设置对象属性。基本调用格式:set(H,'PropertyName',PropertyValue,...)用属性值'PropertyValue'设置关于用参量H标志的对象(一个或多个)的属性名'PropertyName'(一个或多个)。H可以为一句柄的向量。在这种情形下,命令set可以设置所有对象的属性值。2.find功能:找出矩阵X中非0项的坐标和取值。基本调用格式:[row,col]=find(X,...)常与逻辑运算法一起使用,可进一步明确搜索数值的范围。3.disp功能:显示文本或数组。基本调用格式:disp(X)4.struct功能:创建一个结构体数组。基本调用格式:s=struct('field1',values1,'field2',values2,...)给每一个域名赋值,赋值可以为矢量也可以为标量,但是矢量必须有相同的维数。三、实验内容与方法1.图形电话拨号面板的制作利用GUI图形用户界面设计工具制作电话拨号面板,把DTMF信号和电话机的键盘矩阵对应起来。其中选用我们熟悉的10个数字键0—9,2个功能键“*”、“#”,另四个键省略。按照图1电话机键盘矩阵的排列方式制作四行三列的按键控件。每个按键可用(PushButton)添加。然后,为了更直观的反映对应的按键号码,可以设置一个编辑框,用于动态的显示拨号号码,模拟实际电话的拨号显示窗口。编辑框可用(EditText)添加。另外,为了图形电话拨号面板的简洁美观,可以添加空白区域作为背景,并用静态文本框制作文字信息。背景可用(Frame)添加,静态文本框可用(StaticText)添加。最终利用GUI图形用户界面设计工具生成的图形电话拨号面板用于拨号音的合成产生部分,如下图所示。这里将其保存为tu1.fig文件。2.DTMF信号的产生合成现在将对上节制作的图形电话拨号面板上的各控件单位的动作和变化进行设置,即对tu1.m文件进行编辑。其主要的功能是使对应的按键,按照表1的对应关系产生相应的拨号音,完成对应行频及列频的叠加输出。此外,对于图形界面的需要,还要使按键的号码数字显示在拨号显示窗口中。鉴于CCITT对DTMF信号规定的指标,这里每个数字信号取1000个采样点模拟按键信号,并且每两个数字之间用100个0来表示间隔来模拟静音。以便区别连续的两个按键信号。间隔的静音信号也是在按键时产生的。以按键0为例,简单介绍拨号音产生的过程:%按键0的响应函数functionvarargout=pushbutton0_Callback(h,eventdata,handles,varargin)n=[1:1000];%每个数字1000个采样点表示d0=sin(0.7217*n)+sin(1.0247*n);%对应行频列频叠加n0=strcat(get(handles.edit1,'string'),'0');%获取数字号码set(handles.edit1,'string',n0);%显示号码space=zeros(1,100);%100个0模拟静音信号globalNUMphone=[NUM,d0];NUM=[phone,space];%存储连续的拨号音信号wavplay(d0,8192);%产生拨号音程序解释:NUM为定义的全局变量,用于存储连续的拨号音(DTMF)信号,包括数字信号音以及静音信号。d0=sin(0.7217*n)+sin(1.0247*n)中的行频与列频是由表1中0键对应的fHzL=941,fHzH=1336计算得出,已知声音取样频率fHzs=8192,则取样后=2/=0.7217LLsωπff,=2/=1.0247HHsωπff。对于保留的两个功能键“*”“#”,按照现行键盘式拨号电话的习惯,将“*”作为删除键,“#”作为确认键。“*”删除键的作用是将前面拨错的号码删除退回,表现为将显示窗口已经显示的错误号码退回一位数字,并且将连续拨号音信号的存储单元NUM中退回一位拨号音信号和静音信号。删除可以进行连续的操作。“#”确认键的作用是将前面拨过的号码进行确认保留,意味着此时连续拨号音信号的存储单元NUM中的信号即为最后用于识别的连续拨号音DTMF信号,并在显示窗口中显示“#”号作为标记。%删除键的响应函数functionvarargout=pushbuttonback_Callback(h,eventdata,handles,varargin)n=[1:1000];num=get(handles.edit1,'string');l=length(num);n11=strrep(num,num,num(1:l-1));%去掉末尾号码在面板上的显示d11=sin(0.7217*n)+sin(0.9273*n);set(handles.edit1,'string',n11);globalNUML=length(NUM);NUM=NUM(1:L-1100);%删除末尾号码在拨号音信号中的存储wavplay(d11,8192);3.DTMF信号的检测识别要实现电话拨号音(DTMF)信号的检测识别,可以通过直接计算付里叶变换得到输入信号的组成频率。这里采用FFT算法对信号进行解码分析。首先对接收到的数字信号作FFT分析,计算出其幅度谱,进而得到功率谱,组成输入信号的频率必定对应功率谱的峰值。对于连续的双音多频(DTMF)信号,需要把有效的数字拨号信号从静音间隔信号63中分割提取出来,然后再用FFT算法对信号进行解码分析。MATLAB实现信号音的识别如下:%信号音识别----------------------------------------------------------------functionvarargout=pushbuttonNUM_Callback(h,eventdata,handles,varargin)globalNUMwavplay(NUM,8192);L=length(NUM);n=L/1100;number='';fori=1:nj=(i-1)*1100+1;d=NUM(j:j+999);%截取出每个数字f=fft(d,2048);%以N=2048作FFT变换a=abs(f);p=a.*a/10000;%计算功率谱num(1)=find(p(1:250)==max(p(1:250)));%找行频num(2)=300+find(p(300:380)==max(p(300:380)));%找列频if(num(1)180)row=1;%确定行数elseif(num(1)200)row=2;64elseif(num(1)220)row=3;elserow=4;endif(num(2)320)column=1;%确定列数elseif(num(2)340)column=2;elsecolumn=3;endz=[row,column];%确定数字ifz==[4,2]tel=0;elseifz==[1,1]tel=1;elseifz==[1,2]tel=2;elseifz==[1,3]tel=3;elseifz==[2,1]tel=4;elseifz==[2,2]tel=5;elseifz==[2,3]tel=6;elseifz==[3,1]tel=7;elseifz==[3,2]tel=8;elseifz==[3,3]tel=9;end65t(i)=tel;c=strcat(number,int2str(tel));number=c;i=i+1;endset(handles.edit3,'string',number);程序解释:确定行频和列频的数值范围是通过计算得出的:已知输入信号的取样频率fs=8192Hz,而做FFT的N=2048,则频谱分辨率为F=fs/N=8192/2048=4Hz,由此可算出频谱图上任意点对应的频率K=f/F。例如,数字8的高、低端频率为fl=852,fh=1336,则在谱图上对应的点Kl=213,Kh=334.4.复位实验中发现每次输入号码后按“#”会将前几次输入的号码也显示出来,因为程序所用NUM为全局变量,所以即使关闭拨号盘重新运行,数据仍会在其中保留。于是设置复位函数,每次显示一组数字后按复位键,使得下一次显示数据只和当次输入有关。functionpushbutton13_Callback(hObject,eventdata,handles)set(handles.edit1,'string','');globalNUM;NUM=[];globalstring;string='';5.显示每个数字的频谱图globalNUML=length(NUM);n=L/1100;number='';fori=1:nj=(i-1)*1100+1;d=NUM(j:j+999);f=fft(d,2048);a=abs(f);p=(0:2047)*4;axes(handles.axesl);plot(p,a,'b');axis([1,300,1,800]);xlabel('频率','fontsize',12);ylabel('幅度');num=get(handles.edit3,'string');end四.实验结果(1)拨号盘界面(2)各数字信号幅度谱0/1/23/4/56/78/9五.实验分析1、分别从高频群和低频群取一种频率合成就可得到一个数字拨号音。2、要实现电话拨号音的检测识别,可以通过直接计算傅里叶变换得到输入信号的组成频率。这里采用fft算法对信号进行变换,计算出其幅度谱,进而得到功率谱,组成输入信号的频率必定对应功率谱的峰值。根据频谱最大值的不同识别数字播音信号。3、由于matlab软件版本不同,声音函数在有两种:wavplay()与sound()4、“*”号删除键只是实现每次仅删除一位,在不小心输错后便于修改;添加“reset”键后可以实现对编辑框和全局变量NUM的清零,便于进行再次输入新号码,进行存储和查询。
本文标题:电话拨号音的合成与识别
链接地址:https://www.777doc.com/doc-4794451 .html