您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 广告经营 > 多媒体技术ppt好资源-第04讲数字声音基础
数字声音基础第4章4.1基本概念■声音概念■声音频率分布■音质与数据量■数字音频文件的种类4.2声音编码方法■声音编码分类■LPC■MP34.3音频编辑工具Audition■单音轨形式录音■音频编辑与处理■多音轨混合■多音轨录音4.1基本概念●声音定义声音是通过空气传播的一种连续的振动波,具有振幅、周期和频率。声音用电表示时,声音信号在时间和幅度上都是连续的模拟信号,如图所示。教学进程4.1.1声音的基本特点●声音的质量简称音质。音质与频率范围成正比,频率范围越宽音质越好声音具有连续性和过程性,数据前后相关,数据量大,具有实时性●声音的连续时基性●声音三要素(1)音调—(高低)频率(2)音强—(强弱)音高(3)音色—(特质)泛音教学进程●声音的频谱分为线性频谱和连续频谱。声音频率分布次声波人耳可听域超声波20Hz20~20,000Hz20,000Hz女性语音150Hz~3,000Hz电话语音200Hz~3,400Hz调幅广播(AM)50Hz~7,000Hz调频广播(FM)20Hz~15,000Hz高级音响3Hz~40,000Hz男性语音30Hz~9,000Hz声源种类频带宽度4.1.2教学进程(1)人耳对不同频段的声音的敏感程度不同如:对低频敏感一些,3-5K最敏感。(2)不同频率有不同的听觉阈值。(3)人的听觉具有掩蔽效应。和环境有关。同样大小声音在嘈杂环境就会听不清。听觉特性4.1.24.1.3数字化声音教学进程●数字信号处理器(digitalsignalprocessor,DSP)DSP与通用微处理器相比,除了它们的结构不同外,其基本差别是,DSP有能力响应和处理采样模拟信号得到的数据流,如做乘法和累加求和运算。在数字域而不在模拟域中做信号处理的主要优点是:首先,数字信号计算是一种精确的运算方法,它不受时间和环境变化的影响;其次,表示部件功能的数学运算不是物理上实现的功能部件,而是仅用数学运算去模拟,其中的数学运算也相对容易实现;此外,可以对数字运算部件进行编程,如欲改变算法或改变某些功能,还可对数字部件进行再编程。4.1.3数字化声音●模拟信号与数字信号教学进程话音信号是典型的连续信号,不仅在时间上是连续的,而且在幅度上也是连续的。在时间上“连续”是指在一个指定的时间范围里声音信号的幅值有无穷多个,在幅度上“连续”是指幅度的数值有无穷多个。我们把在时间和幅度上都是连续的信号称为模拟信号。在某些特定的时刻对这种模拟信号进行测量叫做采样(sampling),由这些特定时刻采样得到的信号称为离散时间信号。采样得到的幅值是无穷多个实数值中的一个,因此幅度还是连续的。如果把信号幅度取值的数目加以限定,这种由有限个数值组成的信号就称为离散幅度信号。例如,假设输入电压的范围是0.0V~0.7V,并假设它的取值只限定在0、0.1、0.2,…,0.7共8个值。如果采样得到的幅度值是0.123V,它的取值就应算作0.1V,如果采样得到的幅度值是0.26V,它的取值就算作0.3,这种数值就称为离散数值。我们把时间和幅度都用离散的数字表示的信号就称为数字信号。4.1.3数字化声音●声音采样——声音数字化(模/数转换)声音采样131130130131把声音(模拟量)按照固定时间间隔,转换成有限个数字表示的离散序列教学进程4.1.3数字化声音●声音量化——声音数字化(模/数转换)教学进程连续幅度的离散化通过量化(quantization)来实现,就是把信号的强度划分成一小段一小段,如果幅度的划分是等间隔的,就称为线性量化。4.1.3数字化声音教学进程●声音数字化需要回答两个问题①每秒钟需要采集多少个声音样本,也就是采样频率(fs)是多少,②每个声音样本的位数(bitpersample,bps)应该是多少,也就是量化精度。4.1.3数字化声音教学进程●采样频率采样频率的高低是根据奈奎斯特理论(Nyquisttheory)和声音信号本身的最高频率决定的。奈奎斯特理论指出,采样频率不应低于声音信号最高频率的两倍,这样就能把以数字表达的声音还原成原来的声音,这叫做无损数字化(losslessdigitization)。采样定律用公式表示为fs≥2f或者Ts≤T/2其中f为被采样信号的最高频率。你可以这样来理解奈奎斯特理论:声音信号可以看成由许许多多正弦波组成的,一个振幅为A、频率为f的正弦波至少需要两个采样样本表示,因此,如果一个信号中的最高频率为,采样频率最低要选择2。例如,电话话音的信号频率约为3.4kHz,采样频率就选为8kHz。样本大小是用每个声音样本的位数bit/s(即bps)表示的,它反映度量声音波形幅度的精度。例如,每个声音样本用16位(2字节)表示,测得的声音样本值是在0~65536的范围里,它的精度就是输入信号的1/65536。样本位数的大小影响到声音的质量,位数越多,声音的质量越高,而需要的存储空间也越多;位数越少,声音的质量越低,需要的存储空间越少。采样精度的另一种表示方法是信号噪声比,简称为信噪比(signal-to-noiseratio,SNR),并用下式计算:SNR=10log[(Vsignal)2/(Vnoise)2]=20log(Vsignal/Vnoise)其中,Vsignal表示信号电压,Vnoise表示噪声电压;SNR的单位为分贝(db)例1:假设Vnoise=1,采样精度为1位表示Vsignal=21,它的信噪比SNR=6分贝。假设Vnoise=1,采样精度为16位表示Vsignal=216,它的信噪比SNR=96分贝。4.1.3数字化声音●采样精度4.1.3数字化声音●声音重放——声音模拟化(数/模转换)声音重放131130把数字化声音转换成模拟量,经过音响单元重放出来教学进程●重放频率(模拟量)与采样频率(数字量)的关系重放频率=采样频率÷2[例]采样频率为44,100Hz的数字音频信号还原成声音后,为22,050Hz教学进程●设备和软件(1)声音适配器(声卡)8bit、16bit、…128bit(2)声卡驱动软件以及各种声音处理软件4.1.3数字化声音采样频率Hz数据长度bit数据量/分钟11,02580.66MB22,05081.32MB44,10082.64MB11,025161.32MB22,050162.64MB44,100165.29MB音质评价低一般良好中良好优秀音质与数据量4.1.4数字音频的教学进程质量采样频率(kHz)样本精度(bit/s)单道声/立体声数据率(kB/s)(未压缩)频率范围电话*88单道声8200~3400HzAM11.0258单道声11.050~7000HzFM22.05016立体声88.2CD44.116立体声176.420~20000HzDAT4816立体声192.020~20000Hz音质与数据量4.1.4数字音频的20~15000Hz4.1.5.wav●WAVE(WaveformAudio)波形音频文件多媒体系统、音乐光盘制作,记录物理波形,数据量大.cda●CDA(CDAudio)激光音频文件准确记录声波,数据量大,经过采样,生成wav和mp3音频文件.mid●MIDI(MusicalInstrumentDigitalInterface)乐器接口文件用于合成、游戏,记录音符时值、频率、音色特征,数据量小.mp3●mp3(MPEG音频压缩标准)压缩音频文件必须经过解压缩,数据量小●文件种类及特点数字音频文件的种类教学进程文件的扩展名说明auSun和NeXT公司的声音文件存储格式(8位m律编码或者16位线性编码)aif(AudioInterchange)Apple计算机上的声音文件存储格式cmf(CreativeMusicFormat)声霸(SB)卡带的MIDI文件存储格式mctMIDI文件存储格式mff(MIDIFilesFormat)MIDI文件存储格式mid(MIDI)Windows的MIDI文件存储格式mp2MPEGLayerI,IImp3MPEGLayerIIImod(Module)MIDI文件存储格式rm(RealMedia)RealNetworks公司的流放式声音文件格式ra(RealAudio)RealNetworks公司的流放式声音文件格式rolAdlib声音卡文件存储格式snd(sound)Apple计算机上的声音文件存储格式seqMIDI文件存储格式sngMIDI文件存储格式voc(CreativeVoice)声霸卡存储的声音文件存储格式wav(Waveform)*Windows采用的波形声音文件存储格式wrkCakewalkPro软件采用的MIDI文件存储格式用.wav为扩展名的文件格式称为波形文件格式(WAVEFileFormat),它在多媒体编程接口和数据规范1.0(MultimediaProgrammingInterfaceandDataSpecifications1.0)文档中有详细的描述。该文档是由IBM和微软公司于1991年8月联合开发的,它是一种为交换多媒体资源而开发的资源交换文件格式(ResourceInterchangeFileFormat,RIFF)。波形文件格式支持存储各种采样频率和样本精度的声音数据,并支持声音数据的压缩。●.WAV声音文件4.1.5数字音频文件的种类波形文件有许多不同类型的文件构造块组成,其中最主要的两个文件构造块是FormatChunk(格式块)和SoundDataChunk(声音数据块)。格式块包含有描述波形的重要参数,例如采样频率和样本精度等,声音数据块则包含有实际的波形声音数据。RIFF中的其他文件块是可选择的。它的简化结构如图所示。●.WAV声音文件4.1.5数字音频文件的种类MIDI是MusicalInstrumentDigitalInterface的首写字母组合词,可译成“电子乐器数字接口”。用于在音乐合成器(musicsynthesizers)、乐器(musicalinstruments)和计算机之间交换音乐信息的一种标准协议。从20世纪80年代初期开始,MIDI已经逐步被音乐家和作曲家广泛接受和使用。MIDI是乐器和计算机使用的标准语言,是一套指令(即命令的约定),它指示乐器即MIDI设备要做什么,怎么做,如演奏音符、加大音量、生成音响效果等。MIDI不是声音信号,在MIDI电缆上传送的不是声音,而是发给MIDI设备或其它装置让它产生声音或执行某个动作的指令。●MIDI简介4.1.6电子乐器数字接口(MIDI)系统可以同时播放WAVE文件和MIDI文件来一起播放语音和音乐;不能同时播放两个波形文件,因为播放采样声音时要求准确的同步。MIDI标准之所以受到欢迎,主要是它有下列几个优点:生成的文件比较小,因为MIDI文件存储的是命令,而不是声音波形;容易编辑,因为编辑命令比编辑声音波形要容易得多;可以作背景音乐,因为MIDI音乐可以和其它的媒体,如数字电视、图形、动画、话音等一起播放,这样可以加强演示效果。●MIDI文件的优点4.1.6电子乐器数字接口(MIDI)系统产生MIDI乐音的方法很多,现在用得较多的方法有两种:一种是(frequencymodulation,FM)合成法,另一种是乐音样本合成法,也称为波形表(Wavetable)合成法。这两种方法目前主要用来生成音乐。●MIDI的合成方法4.1.6电子乐器数字接口(MIDI)系统●频率调制(FM)合成法4.1.6电子乐器数字接口(MIDI)系统20世纪80年代初,美国斯坦福大学(StanfordUniversity)的一名叫JohnChowning的研究生发明了一种产生乐音的新方法,这种方法称为数字式频率调制合成法(digitalfrequencymodulationsynthesis),简称为FM合成器。他把几种乐音的波形用数字来表达,并且用数字计算机而不是用模拟电子器件把它们组合起来,通过数模转换器(digitaltoanalogconvertor,DAC)来生成乐音。●频率调制(FM)合成法的原理4.1
本文标题:多媒体技术ppt好资源-第04讲数字声音基础
链接地址:https://www.777doc.com/doc-1473726 .html