您好,欢迎访问三七文档
中文說明--PRAAT软件的使用方法Praat-1401使用說明(2004/01/020)一.錄音、存語音信號文件(New)(1)錄音:主功能表(Objects)上選擇“New”;----“Recordsound”此時選擇“Sample-rate”,擊Record開始發音,然後擊stop去停止錄音;選擇Play聽已錄語音,不滿意,重錄;選擇LefttoList,在主功能表的空白處就出現一個文件SoundLeft,你可選擇Rename去修改語音檔案名,但Sound是文件格式標記,不能改;注意:當你不能利用New來錄音時,可選用你Windows中的“錄音機”功能來錄音並保存爲WAV格式:開始——程式——附件——娛樂——錄音機;錄音機文件——屬性:11K16位單聲道OK!按紅色鈕開始錄音,按黑色鈕停止錄音;文件——保存(指定路徑和檔案名)(2)在Praat中保存語音文件:左框主功能表中(Objects),選擇write中任意中格式,但通用格式爲WAV;指定路徑和檔案名。二.語音標注(Label&segment-analysis)(1)用左框主功能表中的read來調出信號文件;(2)左框主功能表中右手邊功能表,選擇Edit,就會出現一個图形窗(1),上部爲波形,下部爲语图,在此窗中的主功能表View,可加選pitch,formant,energy;(3)图形窗(1)中的Edit,可以編輯選擇部分信號並存文件;(4)左框主功能表中右手邊功能表,選擇Label&segment-analyse,(5)出現一個需要選擇的文字框,選擇toTextGrid,填入tiername,pointtier;就會産生一個TextGrid的新文件,擊右手邊的Edit,就會出現一個文本框,然後與波形窗對齊,在文本框内,用滑鼠選擇音節段,或聲母,韻母就可用音標符號標注。(6)標注完成後,在此框中的主功能表file—writetextgridtotextfile,選擇你存入的地址和名字,就完成了。此textfile可以在Praat環境中,using“edit”todisplayplotter出來,andopenthisfileonMicrosoftWordtodisplaydigitaltext.三.音高(Pitch)分析(包括三維语图和共振峰歷程分析):(1)調出已保存語音文件:Read---Readfromfile(Soundxxx),使用edit去畫出三維语图(showspectrogram)和音高曲線(showpitch),記錄下要取消的部分(在後面的excel中)的起點和終點時間;(2)第一種比較複雜然而比較多用途的方法如下:修正基音標記:先用praat標記周期(periodicity---topointprocess),此時出現一個PointProcess文件[1],使用Edit,出現一個基音周期調整框。若需要的話,可人工檢查修正這些標記,方法是:用滑鼠去框住不要(亂的)部分,在子功能表上選擇Point---Removepoint;完成以後用praat把周期文件轉化成音高文件(topitchtier)(,此時在object列表框空白處出現一個PitchTier的文件。這個文件可使用Edit命令畫出一個音高(Pitch)隨時間變化的图形,F0(t)。也能用滑鼠去圈定一段不要的基頻,Point—remove就能取消這些點;可滑動滑鼠去讀出每個样点上的音高數值;然後返回到功能表(object)去保存一個文字檔案:Write---toheadlessspreadsheetfile。音高文件本身是一個文字檔案(F0資料),可以用Excel打開這個文件,首先按照先前記錄下的待取消部分的時間,將其時間和數據”清除”,這樣就能使音節之間有效的音高曲綫得到分離;然後把基頻(F0)數據全部換算成半音或五度制。最後用Excel作成图表;辦法是:[1]五度制转换:激活C1(EXCEL表中第C列,第一行,這是假定在B列中存放了F0数据,計算結果將放在C列的第一行),調出函數log10,在下面空白處打入B1/f1,f1可設為當前F0的最低值;按一下enter,將鼠標放到公式結尾處,打入*16.61,按一下鍵盤上的enter鍵,在C1格内就出現五度值;*B1是存放音高數據的列的第一行數據[2]copyC1,再激活全部C列,點paste,C列就全部置換成五度值了。[3]激活C列,點“制图”,選“折线”,“下一步”,到“4步驟3”,點“數據表”,再選中“顯示數據表”,點一下“完成”。主表object中選擇Downtotableofreal,主表中出現一個同名的文件,然後,Draw,在副表中會顯示全部音高值(爲此,先在副表中用鼠標畫出一個窗,以便容納全部音高數據),使用copytoclipboard,將數據貼到word文當中去.(3)另一種是分析音高的簡單方法:在調出語音文件後,Praat使用Edit畫出既有語音波形,又有三維语图、音高曲線、共振峰和音強等,這些語音聲學特性是否需要顯示在图上,可有自己選擇:啟動Show,就可選中或關閉某項聲學特性。爲了突出語音部分,可以先整理波形,剪切掉無用部分;只显示語圖和音高曲線(showspectrogram;showpitch);選擇语图中音高曲線與母音重叠部分,用滑鼠測量曲線的起始點音高值、拐點(如有必要的話)和終點;將每個音節的音高值填入EXCEL表,每個音節兩個或三個F0,從上而下排列,音節之間空一格;(建議測量三點)如需要的話,在EXCEL表上將F0轉換成半音或五度值;然後就可以作图。辦法如下:[1]五度制轉換:激活C1(EXCEL表中第C列,第一行)(假定將計算結果放入C1),調出函數log10(插入—函數—三角函數—log10),在下面空白處打入B1/f1,f1可設為當前F0的最低值(或任意值);按一下enter,將鼠標放到公式結尾處,打入*16.61,按一下鍵盤上的enter鍵,在C1格内就出現五度值;*B1是存放音高數據的列的第一行[2]copyC1,激活全部C列,點paste,C列就全部置換成五度值了。[3]激活C列,點“製圖”,選“折線”,“下一步”,到“4步驟3”,點“數據表”,再選中“顯示數據表”,點一下“完成”。請你分析声调:專麻古五對大第百白四.语图分析和元音共振峰數據提取:1.在主表(objective)中讀出(read)一個聲音文件(soundfile);並聽語音回放play;2.在主表中選擇formant,副表設置一View,主表選擇Draw—Speckle;3.在主表中選擇”Downtoformanttier”;nextto“DowntoTableofreal”.此時主表中顯示一”Tableofreal……(filename)”,接著在副表中設一View;4.在主表中選擇Draw---Drawasnumber---free,此時在View中列出全部有效的共振峰數據;5.可以在Excel中打開Tableofreal作爲一個被儲存的PostScript文件;6.副表中的共振峰數據即可以WritetoClipboad,也可以打印(Print)出數據;7.讀出光標點四個共振峰數據:在子表的三維語圖上選擇一個時刻(TargetPoint),然後選擇Formant—Formantreport,即可得到所要的共振峰讀數;8.二維功率譜:在子表的三維語圖上選擇一個時刻(TargetPoint),然後選擇spectrum---viewspectralslice.请问,为什么要*16.61?5/LOG(2)=16.6096404744368那是把每倍频程看成是5度的算法。12/LOG(2)=39.8631371386483那是把每倍频程看成是12半音的算法。建议使用半音的算法。D=5lg(f/fr)/lg2st=12lg(f/fr)/lg2式中fr是参考频率。那个D式,包括16.61的始作俑者是本人。那是1970-1980年代的需要。北大80周年校庆中文系学术论坛上我首次提出D式(1979)。对于国际交流来说,还是用st(半音,semitone)更好。如何求得基音同步标记在PSOLA中基音同步标记的求取是很重要的步骤,我想请问各位高手:应该如何求取基音同步标记。能否提供一些可行的算法。哪里能够下载可参考的程序。谢谢!ThefollowingisasummaryIwroteinanotherplace.Justcopyithere,hopeit'shelpful.QUOTE:Youarerightabouttheimportanceofpitchmarks.WhenIbuildaTTScorpus,Ididthefollowing:1)Preparetextsforrecording.Youhavetotranscribethetextintophoneticsymbols(suchaspinyin),consideringthephonemecoverageandbalance,theprosodiccoverage,2)Recordsoundpressureandlaryngographsignalssimultaneouslyforthetexts.Thelaryngographsignalisoptional,butithelpstodeterminetheGCI(glottalclosureinstant)ofthespeech.3)Forcethespeechsignaltobealignedwithphonetictranscriptions.Alignmenterrorshavetobecheckedandcorrected.Maybesomesentenceshavetobere-recorded.4)Generatepitchmarks.PitchmarksareusuallyassignedateachGCIdetectedfromthesignalbycertainalgrithm.ThemarksmightneedtobemannuallycheckedandcorrectedincasetheGCIdetectionalgrithmdoesn'tworkwell.TheunvoicesegementsinthespeechalsoneedfalsepitchmarksinordertomakePSOLAwork.5)GeneratetheTTSinventory.Thespeechsignals,pitchmarks,andphonetictranscriptionsareindexedandstoredinsomedatabase.Thesynthesizerwillretrievethedatabaseandconcatenatesegmentsintosentences.**Note:PSOLAisapatentofFranceTélécom.YoucouldmakeaPSOLA-likesynthesizer,butcouldn'tusethePSOLAalgrithmforfree.用PRAATSCRIPT语言实现等时间比例提取基频值(../index.htm../index.htmdispbbs.asp?boardid=1&rootid=41975&id=41975)--作者:清凉山人--发布时间:2005-12-2020:32:53--[讨论]用PRAATSCRIPT语言实现等时间比例提取基频值用PRAATSCRIPT语言实现等时间比例提取基频值看到有人问起如何用Praat软件实现等时间比例来提取不定时长音节的基频值,如将不同时长的每个音节都提取出10个等距离的基频值来。我特写下如下Script语言以供参考:--------------------------------------------------------------#name$表示声音文件名,请首先选择您要
本文标题:praat中文说明
链接地址:https://www.777doc.com/doc-4290543 .html