您好,欢迎访问三七文档
第二章第二章第二章第二章····声波声波声波声波不同颜色是光谱中波长不同的光波,不同音色是声谱中波长不同的声波。物不得其平则鸣。(韩愈)1.波的波的波的波的性质性质性质性质和分析和分析和分析和分析5.语音信号分析语音信号分析语音信号分析语音信号分析前文介绍了语音有音高、音长、响度、音色四大要素及其波形特征。本节内介绍如何从语图上确定相应的基频、时长、音强、共振峰。‘语图’是个专门用语,指三维声谱图,横轴表示时间,纵轴表示频率,颜色深浅表示能量高低。制作语图过去是用模拟式的语图仪,昂贵而笨重。现在已经全面换用方便、灵巧、高效的电脑软件。下面介绍一种目前非常流行的语音分析软件Praat。这个软件由荷兰阿姆斯特丹大学的PaulBoersma和DavidWeenink编写,功能强大而使用方便,可以从网上免费下载:。5.1.文件操作文件操作文件操作文件操作启动Praat,会出现两个界面(见图18)。左面是操作语音分析用的Praatobjects(对象窗口),这是Praat的主界面。右面是编辑和制作语音视图用的Praatpicture(图像窗口)。2图18.Praat软件的[左]对象窗口,[右]图像窗口.输入待分析的语音文件有三种办法,也即Praat软件提供三种输入语音文件的功能。第一是利用Praat来制作一个声音。第二是打开已有的声音文件,可以从主界面即对象窗口的主菜单中选择Read(读取),然后点击Readfromfile…(文件读取),就能搜寻并打开已有的音档。第三是新录音,可以在菜单中选择New(新文件),见下图19左。点击RecordmonoSound…(单声道录音),就有一个SoundRecorder(录音机)的窗口弹出(见图19右)。录音采样率(Samplingfrequency)预设在22,050Hz。这对于一般的语音分析来说是很合适的。设定过高,占内存太多;设定过低,高频段的信号就测不到。图19.[左]在对象窗口的菜单中选取NewRecordmonoSound…,[右]录音机窗口在SoundRecorder窗口内点击Record,即开始录音。录音时注意音量(响度)控制,音量由Meter(音量仪)中的三种颜色显示。绿色表示正好,黄色警告,红色表示音量过大(见图20第二章·声波3左),此时录下的语音的声波会出现‘削波’现象。录音结束,按Stop(结束),然后点击Savetolist(存取至对象单)。此时在Praatobjects窗口内就出现一个预设名为sound的文件(见图20右)。如果想自取文件名,可以在录音机窗口左下方的方框中(图20左),删去sound,键入自取的文件名。图20.录音和存取.在主界面的菜单中拉下Write(存写),点击WritetoWAVfile…(存储为WAV文件),储存这个声音文件(图21左)。图21.[左]储存文件,[右]编辑文件.5.2.语音分析语音分析语音分析语音分析使用Praat软件,可以进行多种语音分析工作,如共振峰分析、基频分析、音强分析、时长分析、频谱分析、波形编辑等等。这些都可以通过一个SoundEditor(语音编辑器)的窗口来进行。点亮对象窗口中的目标声音文件,然后点击右面的Edit(编辑)键(图21右),就有一个显示波形的窗口出现(图32),可以播放、测量、编辑声波信号等。图22上半部是声压波形图,简称波形图,纵轴为振幅,单位是任意的,或者说相对的,已4被规整到+1范围之间。下半是宽带语图。如果宽带图没有在窗口中显示出来,则可在菜单中选取Spectrum(频谱),点击ShowSpectrogram(显示声谱)。宽带图的纵轴是频率,单位是赫兹Hz。横轴是时间,单位是秒s。并通过灰度的深浅表示能量的强弱。点击下面的时间杠,可以播放相应段的声音。图22.声波图和宽带频谱图.语图的左下角有四个小按钮:all,in,out,sel,其功能分别为显示整个音档、放大、缩小、显示所选中点亮的语音段。图23左图中元音有一段134毫秒的点亮部分。点击左下角sel(显示选择部分),就把这134毫秒放大至右图的形式。下面宽带图中一条一条的竖条表示喉门脉冲,即由声门开闭引起的快速声压变化。图4上面声波图中两条小竖线指向两个相邻的正值波峰,表示一个与喉门脉冲相对应的声波周期。图23.【左】jī的声波图和宽带图.【右】放大图.5.2.1.宽带图和共振峰共振峰指的是在声道的共振频率附近,一些谐波的能量因声道共振作用而得到加强提升,共同构成的一个强频区。图24宽带图中的那些黑色横条状是共振峰的走向。在5,000赫兹范围内,共有四条黑带,表示第一到第四个共振峰(即F1,F2,F3,F4)。那条红色的横虚线经过第二共振峰的中心,表示F2的频率目测大致为2,462Hz。在以前模拟式语图时代,获得共振峰数据的方法,就是用手工在黑带中心画条线,然后估算其共振频率。现在只需在菜单中选择Formant(共振峰),点击Showformant(显示共振峰),就能得到如下图24。图中有四条红色点状线,显示第二章·声波5了头四个共振峰。其中F2在游标竖线处的频率,可以从左面的纵轴上可以读出:2,475赫兹。有关共振峰的测量,后文‘元音’章再详谈。图24.共振峰走向显示5.2.2.窄带图、谐波、基频上文所述的宽带图是Praat软件的预设图。如果想要窄带图,可以选择菜单中的Spectrum(频谱),点击Spectrogramsettings…(声谱设置)(见图25左),就会弹出一个窗口(图25右)。其预设的宽带图的频率可视范围(Viewrange)为0到5,000赫兹,窗口长度(Windowlength)0.005秒。如果把窗口长度改为0.04秒,可视范围改为0~3,000赫兹,就能得到如图25那样的窄带图。图25.频谱图设置图26.窄带图6窄带图中有很多根横向细条,表示基频和谐波。最下面的一条是基频,用F0或F0表示。现在的习惯是把基频也叫做第一谐波H1。图26中有条红色横虚线经过第一根细条的中心,从左面的纵轴可以读得基频为229赫兹。基频上面的细条,即从下往上数第二根细条是第二谐波H2,再往上是H3,H4,以此类推。在以前模拟式语图仪时代,这些谐波被用来测量估算基频。不过,现在已经能直接从软件上获得数据。在主界面菜单上选择Pitch(音高),点击Showpitch(显示音高),就出现图27。图中的蓝线就是基频曲线,竖的游标线通过处的基频可以从右面的纵轴上读出:234赫兹,与图26中测得的F0229Hz相比,误差2%左右,不算太大。如果测量图26中的H10或H11,误差会有实质性的减小。有关基频测量作图我们到后面‘声调’章详谈。图27.基频曲线显示5.2.3.音强曲线不同的音强表现在传统的模拟式语图上即为颜色深浅不同,而在现在的数字语图上就像基频曲线一样能显示出音强曲线。在菜单中选择Intensity(音强),点击Showintensity(显示音强),就得到图28。图中黄色细线即为音强曲线。竖的游标线通过处的音强在右面的纵轴上可以读出:81dB分贝。这是这个音节的音强最大处,与上面波形图中的振幅最大处相吻合。注意:分贝是一个信号强度相比于噪声强度的相对的量度。第二章·声波7图28.音强曲线显示5.2.4.音强声谱图我们知道,语图实际上是三维的,横轴时间,竖轴频率,音强是用颜色深浅显示的。音强能量的截面声谱图FFTSpectralSlice就是在某个时间点上的频率声谱图的切面,显示的是频率Hz(横轴)和音强dB(竖轴)的二维关系,即在某个频率段上的音强能量。制作截面图有几种办法,最简单的一种如下。先制作一个窄带图,即把windowlength设成0.04s,见图29左小图。然后把游标放在元音起始后三五十毫秒处,大约是音节短就稍往前点,音节长就稍往后点。图中的红竖虚线在36毫秒处。然后从菜单上拉下spectrum(强谱),选取viewspectralslice(看强谱截面图),见右小图。图29.制作强谱截面图过程,【左】吴江松陵女发音人PMF‘刀’tç的窄带图,【右】选取viewspectralslice图30.强谱截面图于是得到图30的强谱截面图。横轴为频率,单位赫兹Hz;右面竖轴为音强,单位分贝dB,标度从-11.4到48.6dB。图中一根根竖窄条即为谐波。第一条是第一谐波H1,也就是基频F0,音强可从左面的标尺上读出:31.6dB。第二条是第二谐波H2,第三条是H3等等。同时可以估算共振峰,例如在H2和H3之间靠近H3处,即竖虚线处估得F1为689Hz。
本文标题:praat操作
链接地址:https://www.777doc.com/doc-1913380 .html