您好,欢迎访问三七文档
数字音频处理技术第3章3.1概述■声音基本特征■声音三要素■音质与数据量3.2声音的数字化过程■音频数字化过程■技术指标■数字音频分类■编码3.3音频合成与MIDI■MIDI■音频合成3.4音频文件■WAV■MIDI■MP3■其他文件格式3.5音频处理软件3.1.1声音概念3.1基本概念●声音定义声音是振动波,具有振幅、周期和频率教学进程振幅周期基线声波的振幅(Amplitude)描述的是声波的高低幅度,即声音信号的强弱程度;声波的频率(Frequency)描述的是每秒钟振动的次数,反映出声音的音调,如声音尖细表示频率高,声音低粗表示频率低。3.1.2声音三要素3.1基本概念●声音三要素(1)音调—(高低)(2)音强—(强弱)(3)音色—(特质)教学进程音强,又称响度或音量,它表示声音能量的强弱程度,主要取决于声波振幅的大小。音强与声波的振幅成正比,振幅越大,强度越大。音调,也称音高,表示人耳对声音调子高低的主观感受。客观上音高大小主要取决于声波基频的高低,频率高则音调高,反之则低。音色,又称为音品,主要由声音波形的谐波频谱和包络决定。3.1.2声音三要素3.1基本概念●声音的质量简称音质。音质与频率范围成正比,频率范围越宽音质越好声音具有连续性和过程性,数据前后相关,数据量大,具有实时性●声音的连续时基性教学进程声音波形的基频所产生的听的最清楚的音称为基音,各次谐波的微小振动产生的声音称为泛音。所谓纯音或单音,是指单一频率、或振幅和频率不变的声音信号,单音一般只能由专用电子设备产生;在日常生活中,我们听到的自然界的声音一般都属于复音,其声音信号由不同的振幅与频率合成而得到。声音频率分布次声波人耳可听域超声波20Hz20~20,000Hz20,000Hz3.1.2教学进程次声主要来自大自然,如地震、火山、台风、海啸、大气湍流等自然现象;超声既可以来自大自然的风声、水浪,又可以来自一些动物的发声器官,还可以来自各种人造超声源;次声波长最小也大于17米,可以走曲线,绕过高山;超声波长最大也不过17毫米;波长很短,可以走直线,还能穿透障碍;①②声音频率分布3.1.2教学进程次声可以引起人体内脏器官的共振,造成眩晕,甚至内脏出血,使人丧命;超声可以为病人透视、按摩、治疗疾病,使人健康;还可以清洗、除尘,乳化、粉碎,割焊、钻孔、消毒、杀菌,促进化学反应,影响生物生存。次声1883年我从印尼一个火山口出发,绕地球一直转了三圈多,历经108个小时。超声从超声波发生器发出来,可以穿过5米厚的钢块,只要千分之一秒的时间;④③声音频率分布女性语音150Hz~10,000Hz电话语音200Hz~3,400Hz调幅广播(AM)50Hz~7,000Hz调频广播(FM)20Hz~15,000Hz高级音响10Hz~40,000Hz男性语音100Hz~9,000Hz声源种类频带宽度3.1.2教学进程3.2数字化声音●声音采样——声音数字化(模/数转换)声音采样1101110011001101把声音(模拟量)按照固定时间间隔,转换成有限个数字表示的离散序列教学进程每隔一定时间间隔不停地间断性地在模拟音频的波形上采取一个幅度值,这一过程我们称之为采样;为了把采样得到的离散序列信号存入计算机,必须将其转换为二进制数字表示,我们称这一过程为量化编码。3.2.1数字化声音●声音采样——声音数字化(模/数转换)教学进程采样频率是指计算机每秒钟对声波幅度值样本采样的次数,是描述声音文件的音质、音调,衡量声卡、声音文件的质量标准,计量单位为Hz(赫兹);采样通常采用三种频率:11.025KHz、22.05KHz、44.1KHz。语音效果,称为电话音质音乐效果,称为广播音质高保真效果,CD唱盘3.2.1数字化声音●声音采样——声音数字化(模/数转换)教学进程采样得到的样本需要量化,所谓的量化位数也称“量化精度”,是描述每个采样点样本值的二进制位数。常用的量化位数为8位、12位、16位。量化级大小决定了声音的动态范围,即被记录和重放的声音最高与最低之间的差值。量化位数越高音质越好,数据量也越大。声音通道的个数称为声道数,是指一次采样所记录产生的声音波形个数。记录声音时,如果每次生成一个声波数据,称为单声道;每次生成两个声波数据,称为双声道(立体声)。随着声道数的增加,音频文件所占用的存储容量也成倍增加,同时声音质量也会提高。3.2.1数字化声音●声音重放——声音模拟化(数/模转换)声音重放11011100把数字化声音转换成模拟量,经过音响单元重放出来●设备和软件(1)声音适配器(声卡)8bit、16bit、…128bit¥80.00~3800.00(2)声卡驱动软件以及各种声音处理软件教学进程采样频率Hz数据长度bit数据量/分钟11,02580.66MB22,05081.32MB44,10082.64MB11,025161.32MB22,050162.64MB44,100165.29MB音质评价低一般良好中良好优秀音质与数据量●重放频率(模拟量)与采样频率(数字量)的关系重放频率=采样频率÷2[例]采样频率为44,100Hz的数字音频信号还原成声音后,为22,050Hz3.2.2数字音频的教学进程3.2.3●音效是指有特殊效果的声音,例如,汽车声、鼓掌声、打碎碗、玻璃声音等。●音乐是指有旋律的乐曲,一般采用MID文件。●语音是人类发音器官发出的具有区别意义功能的声音。语音的物理基础主要有音高、音强、音长、音色●文件种类及特点(按用途分类)数字音频文件的种类教学进程3.2.4●MIDI合成。利用连接电脑的MIDI(乐器数字化接口),弹奏出曲子,或合成音效录入计算机,再用声音软件编辑。●来源于声音素材库。将录音带或CD唱盘等声音素材库中的曲子,用放音设备通过转接线转录到计算机,再用声音软件加以编辑,存成多媒体著作软件可以读取的文件格式。●数字化声波。即将麦克风插在计算机的声卡上,利用录音软件,将语音、音乐等波形信息经模/数转换,得到数字化形式进行存储、编辑,需要时再经过数/模转换还原成原来的波形。●文件种类及特点(按来源分类)数字音频文件的种类教学进程3.2.4.wav●WAVE(WaveformAudio)波形音频文件多媒体系统、音乐光盘制作,记录物理波形,数据量大.cda●CDA(CDAudio)激光音频文件准确记录声波,数据量大,经过采样,生成wav和mp3音频文件.mid●MIDI(MusicalInstrumentDigitalInterface)乐器接口文件用于合成、游戏,记录音符时值、频率、音色特征,数据量小.mp3●mp3(MPEG音频压缩标准)压缩音频文件必须经过解压缩,数据量小●文件种类及特点(按格式分类)数字音频文件的种类教学进程3.2.4声音文件分类3.2声音文件●WAV——Wave,波形音频文件(.wav)WAV文件特点:[1]真实记录自然声波形[2]基本无数据压缩[3]数据量大●MIDI——MusicalInstrumentDigitalInterface,乐器数字化接口文件(.mid)MIDI文件特点:[1]纪录音符、时值、通道[2]使用电子键盘乐器[3]数据量小教学进程STOPSTOP3.3.13.3MIDI与音频合成MIDI●MIDI是MusicalInstrumentDigitalInterface的缩写,意为“乐器数字化接口”,是计算机和MIDI设备之间进行信息交换的一整套规则,包括各种电子乐器之间传送数据的通信协议。在演奏与MIDI相连接的乐器时,键盘的按键、用力大小、时间长短等信息被传送到MIDI设备中,形成与乐器键盘相对应的数字键盘信息。当需要播放时,只需从相应的MIDI文件中读出MIDI消息,生成所需要的声音波形,经放大后由扬声器输出。●MIDI形成过程教学进程3.3.13.3MIDI与音频合成MIDI教学进程●MIDI键盘是用于MIDI乐曲演奏的,MIDI键盘本身并不发出声音,当作曲人员触动键盘上的按键时,就发出按键信息(包括按键力度、时长等),这些按键信息组成了MIDI音乐消息,通过MIDI接口后,传给音序器,从而录制生成MIDI文件。3.3.13.3MIDI与音频合成MIDI教学进程●根据标准,MIDI乐器之间的连接依靠三种连接器,分别称为MIDIIn、MIDIOut、MIDIThru,利用这三个连接器,可与外部的乐器,如电子琴等乐器相连接。输入接口,负责接收其他MIDI设备发出的信息输出端口,负责把乐器的MIDI信息传送出去。扩展端口,通过该端口,把乐器从输入端口得到的信息直接传递到其他MIDI乐器的输入端上,起到乐器串联的作用。3.3.13.3MIDI与音频合成MIDI教学进程●音序器由计算机程序或电子设备组成,主要用于MIDI作曲,可记录、编辑、播放MIDI的声音文件.●MIDI文件的播放是通过MIDI合成器来完成的。合成器解释MIDI文件中的指令符号,生成所需要的声音波形,经放大后由扬声器输出。3.3.23.3MIDI与音频合成音频合成教学进程●模拟式电子合成器是通过对震荡器的控制来实现音乐合成的,主要有减法合成和加法合成两种。●数字式合成器不是由电子元器件制成的信号发生器来产生声音中的各种频率成分,而是直接通过数字的方法来造出波形,然后转换为声音信息。其实数字式合成器就是一台特殊的计算机,也是软硬件的综合体。数字合成法主要有FM(FrequencyModulation)频率调制合成和音乐样本合成两种。使用电子元器件(或计算机)生成音乐的技术称为电子音乐合成3.3.23.3MIDI与音频合成音频合成教学进程●用复杂的波形作为样本,然后按照要产生声音的波形的频率情况,即目标波形的要求,把样本波形中的一些频率滤除,从而产生不同的目标波形。●首先由基本波形出发,然后按照目标波形的要求把不同频率的泛音加入基本波形,产生声波的和谐共振,从而产生不同的音色。减法合成器加法合成器3.3.23.3MIDI与音频合成音频合成教学进程●用数字信号来表示不同乐音的波形,然后把它们组合起来,再通过数模转换器(DAC)生成乐音播放。FM频率调制合成特点:它的结构简单,成本低,但它的模仿能力很差使用FM合成法来产生各种逼真的乐音是相当困难的,有些乐音几乎不能产生,目前只有低档次的声卡采用FM合成法。中高档的声音卡一般采用乐音样本合成法,即波表(WaveTable)合成法。3.3.23.3MIDI与音频合成音频合成教学进程●波表合成采用一种称之为“波表查找”技术来产生MIDI音乐,其实它是将各种真实乐器(如大提琴、小提琴、钢琴、鼓等)所能发出的所有声音(包括各个音域、声调)录制下来,存贮为一个波表文件。播放时,根据MIDI文件记录的乐曲信息向波表发出指令,从波表库逐一找出对应的声音信息,经过合成、加工后回放出来。波表合成3.4.13.4音频文件WAV文件教学进程●利用麦克风直接录音,获取数字化的语音和音乐素材;●将音响设备、录音机、收音机、电视机以及所有声源的音频输出信号接入声卡的线路输入端,利用音频处理软件对其进行录音,以此获得数字音频信号;●直接获取存储介质上的波形音频文件;1.获取方法3.4.13.4音频文件WAV文件教学进程1.获取方法●利用专用软件,将mp3格式的压缩音频文件格式转换成波形音频文件;●将音乐光盘放入CD-ROM驱动器中,对CD音轨进行声音采样,转化为数字音频信号。3.4.13.4音频文件WAV文件教学进程2.信号指标●采样频率、采样精度、声道形式是评价波形音频信号的重要指标;●在音质评价上,有三个质量等级,即电话质量、收音机质量和CD质量,三个质量等级之间的音质评价遵循采样频率越高,音质越好的原则3.4.13.4音频文件WAV文件教学进程3.文件特点●采样频率越高,数字化声音与声源的声音效果越接近,音质越好;●采样精度越高,数据的表达越精确,音质越好;●采样频率和采样精度越高,音频信号数据量就越大;●可选择数字音频信号的立体声或单声道形式,立体声比单声
本文标题:第3章 音频处理
链接地址:https://www.777doc.com/doc-4125312 .html