您好,欢迎访问三七文档
多媒体技术第七章数字音频基础内容概要介绍了声音的基本原理与人类的听觉器官,并重点讨论了音调、响度和音色三个声音的基本特征;对模拟信号与数字信号的区别,声音信号数字化的基本过程进行了介绍,并介绍了声音质量与数据率的关系;介绍了MIDI音乐的形成、相关概念、信息处理过程和MIDI音乐合成的知识;介绍了常见数字音频文件格式,并对其中的部分典型格式进行了重点介绍。本章内容声音的基本常识声音信号数字化MIDI音乐基础知识数字音频文件格式简介声音与听觉器官声音是携带信息的极其重要的媒体,是多媒体技术研究中的一个重要内容。声音本质上是一种通过空气传播的连续波,它通过空气将机械振动传播到人耳,刺激神经后使大脑产生一种感觉。声音的三个基本特征视听心理学研究表明,人耳主要是通过音调、响度和音色这三个特征来区分不同声音的。音调音调是指一个声音在听觉感受上有多高,主要与它的频率有关。音调由声音所包含的成分音中最低频率的声音(基音)的频率来决定。基音的频率高时,音调高;基音的频率低时,音调低。一般来说,人的听觉器官能感知的声音频率大约在20Hz~20KHz之间。人们把频率小于20Hz的信号称为亚音信号;频率范围为20Hz~20KHz的信号称为音频信号;高于20KHz的信号称为超音频信号,或称为超声波信号。返回响度响度是指人耳所感觉到的声音的强弱程度。描述声音强弱的物理量为声强,在国际单位中声强的单位是W/m2(瓦特/米2)。声音的响度依赖于听者的主观听觉,一般说声强大的响度也大,但人耳的响度感觉和音调也有关。对于同一频率的声音,响度随声强的增加,并不呈线性关系。返回音色音色是声音的特色,根据不同的音色,即使在同一音高和同一声音强度的情况下,也能区分出是不同乐器或人声发出的。音色就是人对声音的感觉如同对同样色度和明度的不同颜色的感觉一样。音色的不同取决于不同的泛音,每一种乐器、不同的人以及所有能发声的物体发出的声音,除了一个基音外,还有许多不同频率的泛音伴随,正是这些泛音决定了其不同的音色。返回模拟信号与数字信号模拟信号是指在时间和幅度上都是连续的信号。声音信号是典型的模拟信号,它不仅在时间上是连续的,而且在幅度上也是连续的。数字信号是把时间和幅度都用离散的数字表示的信号。声音信号数字化的基本原理声音信号的数字化,就是把时间和幅度上都是连续的模拟信号,转化为时间和幅度上都是离散的数字信号。声音信号的数字化应包以下两个步骤:第一步是采样,就是每隔一段时间间隔读一次声音的幅度;第二步是量化,就是把采样得到的声音信号转换成的数值。声音质量与数据率采样频率的高低是根据奈奎斯特理论(Nyquisttheory)和声音信号本身的最高频率决定的。奈奎斯特理论指出,采样频率不应低于声音信号最高频率的两倍。采样精度的样本大小是用每个声音样本的位数bit/s(即bps)表示的,它反映度量声音波形幅度的精度。质量采样频率(kHz)样本精度(bit/s)单声道/立体声数据率(kB/s)(未压缩)频率范围电话88单声道8200~3400HzAM11.0258单声道11.020~15000HzFM22.05016立体声88.250~7000HzCD44.116立体声176.420~20000HzDAT4816立体声192.020~20000Hz波形音频与MIDI音乐通过采集各种声波(声源)的机械振动而得的数字音频,其数字信息中记录的是声波波形,当播放这类数字音频时,计算机再根据数字信息的记录还原出真实的声波。波形音频可用于记录自然界中的各种声音,如对话、歌声、乐器演奏、自然声效等,其所采集得到的数据率较高,生成的文件体积也较大。波形音频STOP波形音频特点:1真实记录自然声音波形2基本无数据压缩3数据量大●影响数据量的因素1)采样频率。2)采样精度。3)声道形式。●WAV音频试听若数字信息中记录是一系列指令(可理解为生活中的乐谱),当播放这类数字音频时,计算机再根据指令合成(演奏)出声波,此类数字音频又称为MIDI音频或MIDI音乐。MIDI音频生成的文件比较小,因为MIDI文件存储的是命令,而不是声音波形;容易编辑,可以作背景音乐,和波形音频一起播放。MIDI音乐由于受合成技术的限制,所合成的声音比较呆板,真实感较差。MIDI音乐STOPMIDI音乐特点:[1]记录音符、时值、通道。[2]使用电子键盘乐器。[3]数据量小。MIDI适配器输出●MIDI音频试听返回MIDI定义及其形成MIDI全称的意思是音乐设备数字接口。这种接口技术的作用就是在音乐合成器、电子乐器、计算机之间交换音乐信息,它使用通用的通讯协议进行通讯,这种协议就是MIDI协议。严格来讲,MIDI只是一个音乐接口技术,但随着MIDI技术的普及应用,人们已把这种接口技术当作了电脑音乐的代名词。MIDI相关概念MIDI规范:是对音乐合成器、电子乐器和计算机之间互相连接的电缆和端口所定义的一套标准,也是这类设备音进行音乐信息交换的协议。MIDI设备:处理MIDI信息的软硬件设备,包括MIDI端口、MIDI文件、MIDI音序器、MIDI合成器、MIDI键盘等。MIDI信息:电子乐器大演奏乐曲时,本身并不发出声音,它通过MIDI端口传送一组数字化的编码,这组数字化编码称为MIDI信息。MIDI信息记录了演奏过程中按键的位置、力度、持续时间等参数。MIDI文件:MIDI文件是记录、存储MIDI信息的标准格式文件,它能同时记录多个MIDI设备产生的MIDI信息。MIDI文件中包括有音符、定时、通道选择指示等二进制编码数据。MIDI音序器:MIDI音序器的作用是记录、编辑、播放由MIDI信息构成的MIDI文件。音序器还可以输出MIDI文件到合成器中。MIDI合成器:合成器是一种电子设备,可将数字声音文件转换成为模拟信号的波形,再传送到扬声器上发出声音。乐器和音色:合成器可产生不同的声音,代表不同的乐器。不同的合成器还可能有不同音色效果的乐器。通道:MIDI文件常包含几种乐器的组合音,各乐器有自己的波形,波形经各自的信息传输路线送到合成器,合成器按音色要求完成最终的声音组合。合成器的通道就是一个独立的信息传输路线,根据MIDI规范每条MIDI电缆最多可提供16个通道,每处通道相当于一个逻辑合成器,可以充当一种乐器。复音:合成器可按所支持的乐器数或同时能奏出的音符数的不同来区分,复音数就是指合成器能同时奏出的音符数。通道映射:MIDI文件记录的每种乐器都分配有一个特定的通道。作为一种程序,通道映射的功能之一就是把特定输入通道映射到特定输出通道上去。通道映射还控制声音的搭配,引导合成器为每一种MIDI输入设备指定输出音色。MIDI信息处理过程MIDI端口音序器合成器音序器音序器音序器MIDI音乐合成要使用MIDI信息回放出声音,就必须把MIDI信息中所记录指令转换为可推动喇叭发声的模拟音频信号。在MIDI信息处理过程中,把MIDI信息转换为模拟音频信号的步骤,称为音乐合成。MIDI音乐合成可分为FM合成与波表合成两种。FM合成FM合成音乐时,是把几种乐音的波形用数字来表达,并且用计算机而不是用模拟电子器件把它们组合起来,通过数模转换器来生成乐音。FM合成器利用这些数据产生的乐音是否真实,它的真实程度有多高,这就取决于可用的波形源的数目、算法和波形的类型。FM合成的MIDI音乐时,往往有不真实的感觉。返回波表合成也称采样回放合成,它的原理是把一小段真实的乐器声音或效果音响用数字采样的方式“录”下来,然后在播放MIDI时再对它进行修饰、放大和输出。由于波表合成采用的是真实的乐器声音,所以比FM合成效果要真实的多。按波表的存储和合成方法的不同,可以把波表合成技术分为,硬波表合成技术、软波表合成技术和DLS合成技术。返回文件扩展名说明auSun和NeXT公司的声音文件存储格式(8位m律编码或者16位线性编码)aif(AudioInterchange)Apple计算机上的声音文件存储格式cmf声霸(SB)卡带的MIDI文件存储格式mctMIDI文件存储格式mff(MIDIFilesFormat)MIDI文件存储格式mid(MIDI)Windows的MIDI文件存储格式mp1MPEGlayerⅠ存储格式mp2MPEGlayerⅡ存储格式mp3MPEGlayerⅢ存储格式mp4MPEG-2AAC技术存储格式mod(Module)MIDI文件存储格式rm(RealMedia)RealNetworks公司的流式声音文件格式ra/rm/ram(RealAudio)RealNetworks公司的流式声音文件格式rolAdilb声卡文件存储格式snd(sound)Apple计算机上的声音文件存储格式seqMIDI文件存储格式sngMIDI文件存储格式swa(ShockWaveAudio)Macromedia公司针对网络传播的文件格式voc(CreativeVoice)声霸卡存储的声音文件存储格式vox(Voxwave)Macromedia公司针对语音进行压缩的存储格式wav(Waveform)Windows采用的波形声音文件存储格式wrkCakewalkPro软件采用的MIDI文件存储格式wmaMicrosoft公司的流式声音文件格式WAV格式WAV格式由Microsoft公司开发的一种声音文件格式,是如今电脑上最为常见的声音文件,他符合RIFF(ResourceInterchangeFileFormat)文件规范,用于保存WINDOWS操作系统的音频信息资源,被WINDOWS操作系统应用程序广泛支持。基于PCM编码的WAV格式文件,其缺点就是数据压缩率较低,文件体积较大。MP3格式MP3格式是世界上第一个高保真声音数据压缩国际标准,是MPEG-1标准的一部分,但它可以独立应用。MP3音频文件在采用传统的频谱分析和编码技术的基础上还应用了心理噪声感知模型理论进行数据压缩。MP4格式AT&T(美国电话电报公司)公司对MPEG-2AAC技术进行了一些改良,增加了最关键的音乐传播认证技术(这一技术又被称为A2B技术),这样就形成了MP4。MP4有其独特的优越性,其压缩技术优于MP3,音质好于MP3;从维护版权的角度看,会得到出版界的欢迎。RA/RM/RAM格式RealAudio格式主要用于在低速率的网络环境下实时传输音频信息。RealAudio是以牺牲声音质量的方法,达到降低数据传输率,保证声音流畅目的。但由于RealAudio独树一帜地提出了音频流的概念,所以成为现在大多数在线音乐网站、实时网络广播网站普遍使用的格式。也成了在线音乐和在线广播事实上的标准格式。WMA格式WMA的全称是WindowsMediaAudio,是微软力推的一种流式音频格式。WMA格式是以减少数据流量但保持音质的方法来达到更高的压缩率目的,其压缩率一般可以达到1:18。
本文标题:计算机网络 课件
链接地址:https://www.777doc.com/doc-3970844 .html