多媒体技术ppt好资源-第04讲数字声音基础

数字声音基础第4章4.1基本概念■声音概念■声音频率分布■音质与数据量■数字音频文件的种类4.2声音编码方法■声音编码分类■LPC■MP34.3音频编辑工具Audition■单音轨形式录音■音频编辑与处理■多音轨混合■多音轨录音4.1基本概念●声音定义声音是通过空气传播的一种连续的振动波，具有振幅、周期和频率。声音用电表示时，声音信号在时间和幅度上都是连续的模拟信号，如图所示。教学进程4.1.1声音的基本特点●声音的质量简称音质。音质与频率范围成正比，频率范围越宽音质越好声音具有连续性和过程性，数据前后相关，数据量大，具有实时性●声音的连续时基性●声音三要素(1)音调—(高低)频率(2)音强—(强弱)音高(3)音色—(特质)泛音教学进程●声音的频谱分为线性频谱和连续频谱。声音频率分布次声波人耳可听域超声波20Hz20～20,000Hz20,000Hz女性语音150Hz～3,000Hz电话语音200Hz～3,400Hz调幅广播(AM)50Hz～7,000Hz调频广播(FM)20Hz～15,000Hz高级音响3Hz～40,000Hz男性语音30Hz～9,000Hz声源种类频带宽度4.1.2教学进程（1）人耳对不同频段的声音的敏感程度不同如：对低频敏感一些，3-5K最敏感。（2）不同频率有不同的听觉阈值。（3）人的听觉具有掩蔽效应。和环境有关。同样大小声音在嘈杂环境就会听不清。听觉特性4.1.24.1.3数字化声音教学进程●数字信号处理器(digitalsignalprocessor，DSP)DSP与通用微处理器相比，除了它们的结构不同外，其基本差别是，DSP有能力响应和处理采样模拟信号得到的数据流，如做乘法和累加求和运算。在数字域而不在模拟域中做信号处理的主要优点是：首先，数字信号计算是一种精确的运算方法，它不受时间和环境变化的影响；其次，表示部件功能的数学运算不是物理上实现的功能部件，而是仅用数学运算去模拟，其中的数学运算也相对容易实现；此外，可以对数字运算部件进行编程，如欲改变算法或改变某些功能，还可对数字部件进行再编程。4.1.3数字化声音●模拟信号与数字信号教学进程话音信号是典型的连续信号，不仅在时间上是连续的，而且在幅度上也是连续的。在时间上“连续”是指在一个指定的时间范围里声音信号的幅值有无穷多个，在幅度上“连续”是指幅度的数值有无穷多个。我们把在时间和幅度上都是连续的信号称为模拟信号。在某些特定的时刻对这种模拟信号进行测量叫做采样(sampling)，由这些特定时刻采样得到的信号称为离散时间信号。采样得到的幅值是无穷多个实数值中的一个，因此幅度还是连续的。如果把信号幅度取值的数目加以限定，这种由有限个数值组成的信号就称为离散幅度信号。例如，假设输入电压的范围是0.0V～0.7V，并假设它的取值只限定在0、0.1、0.2，…，0.7共8个值。如果采样得到的幅度值是0.123V，它的取值就应算作0.1V，如果采样得到的幅度值是0.26V，它的取值就算作0.3，这种数值就称为离散数值。我们把时间和幅度都用离散的数字表示的信号就称为数字信号。4.1.3数字化声音●声音采样——声音数字化(模/数转换)声音采样131130130131把声音(模拟量)按照固定时间间隔，转换成有限个数字表示的离散序列教学进程4.1.3数字化声音●声音量化——声音数字化(模/数转换)教学进程连续幅度的离散化通过量化(quantization)来实现，就是把信号的强度划分成一小段一小段，如果幅度的划分是等间隔的，就称为线性量化。4.1.3数字化声音教学进程●声音数字化需要回答两个问题①每秒钟需要采集多少个声音样本，也就是采样频率(fs)是多少，②每个声音样本的位数(bitpersample，bps)应该是多少，也就是量化精度。4.1.3数字化声音教学进程●采样频率采样频率的高低是根据奈奎斯特理论(Nyquisttheory)和声音信号本身的最高频率决定的。奈奎斯特理论指出，采样频率不应低于声音信号最高频率的两倍，这样就能把以数字表达的声音还原成原来的声音，这叫做无损数字化(losslessdigitization)。采样定律用公式表示为fs≥2f或者Ts≤T/2其中f为被采样信号的最高频率。你可以这样来理解奈奎斯特理论：声音信号可以看成由许许多多正弦波组成的，一个振幅为A、频率为f的正弦波至少需要两个采样样本表示，因此，如果一个信号中的最高频率为,采样频率最低要选择2。例如，电话话音的信号频率约为3.4kHz，采样频率就选为8kHz。样本大小是用每个声音样本的位数bit/s(即bps)表示的，它反映度量声音波形幅度的精度。例如，每个声音样本用16位(2字节)表示，测得的声音样本值是在0～65536的范围里，它的精度就是输入信号的1/65536。样本位数的大小影响到声音的质量，位数越多，声音的质量越高，而需要的存储空间也越多；位数越少，声音的质量越低，需要的存储空间越少。采样精度的另一种表示方法是信号噪声比，简称为信噪比(signal-to-noiseratio，SNR)，并用下式计算：SNR＝10log[(Vsignal)2/(Vnoise)2]＝20log(Vsignal/Vnoise)其中，Vsignal表示信号电压，Vnoise表示噪声电压；SNR的单位为分贝(db)例1：假设Vnoise＝1，采样精度为1位表示Vsignal＝21，它的信噪比SNR＝6分贝。假设Vnoise＝1，采样精度为16位表示Vsignal＝216，它的信噪比SNR＝96分贝。4.1.3数字化声音●采样精度4.1.3数字化声音●声音重放——声音模拟化(数/模转换)声音重放131130把数字化声音转换成模拟量，经过音响单元重放出来教学进程●重放频率(模拟量)与采样频率(数字量)的关系重放频率＝采样频率÷2[例]采样频率为44,100Hz的数字音频信号还原成声音后，为22,050Hz教学进程●设备和软件(1)声音适配器(声卡)8bit、16bit、…128bit(2)声卡驱动软件以及各种声音处理软件4.1.3数字化声音采样频率Hz数据长度bit数据量／分钟11,02580.66MB22,05081.32MB44,10082.64MB11,025161.32MB22,050162.64MB44,100165.29MB音质评价低一般良好中良好优秀音质与数据量4.1.4数字音频的教学进程质量采样频率(kHz)样本精度(bit/s)单道声/立体声数据率(kB/s)(未压缩)频率范围电话*88单道声8200～3400HzAM11.0258单道声11.050～7000HzFM22.05016立体声88.2CD44.116立体声176.420～20000HzDAT4816立体声192.020～20000Hz音质与数据量4.1.4数字音频的20～15000Hz4.1.5.wav●WAVE(WaveformAudio)波形音频文件多媒体系统、音乐光盘制作，记录物理波形，数据量大.cda●CDA(CDAudio)激光音频文件准确记录声波，数据量大，经过采样，生成wav和mp3音频文件.mid●MIDI(MusicalInstrumentDigitalInterface)乐器接口文件用于合成、游戏，记录音符时值、频率、音色特征，数据量小.mp3●mp3(MPEG音频压缩标准)压缩音频文件必须经过解压缩，数据量小●文件种类及特点数字音频文件的种类教学进程文件的扩展名说明auSun和NeXT公司的声音文件存储格式(8位m律编码或者16位线性编码)aif(AudioInterchange)Apple计算机上的声音文件存储格式cmf(CreativeMusicFormat)声霸(SB)卡带的MIDI文件存储格式mctMIDI文件存储格式mff(MIDIFilesFormat)MIDI文件存储格式mid(MIDI)Windows的MIDI文件存储格式mp2MPEGLayerI,IImp3MPEGLayerIIImod(Module)MIDI文件存储格式rm(RealMedia)RealNetworks公司的流放式声音文件格式ra(RealAudio)RealNetworks公司的流放式声音文件格式rolAdlib声音卡文件存储格式snd(sound)Apple计算机上的声音文件存储格式seqMIDI文件存储格式sngMIDI文件存储格式voc(CreativeVoice)声霸卡存储的声音文件存储格式wav(Waveform)*Windows采用的波形声音文件存储格式wrkCakewalkPro软件采用的MIDI文件存储格式用.wav为扩展名的文件格式称为波形文件格式(WAVEFileFormat)，它在多媒体编程接口和数据规范1.0(MultimediaProgrammingInterfaceandDataSpecifications1.0)文档中有详细的描述。该文档是由IBM和微软公司于1991年8月联合开发的，它是一种为交换多媒体资源而开发的资源交换文件格式(ResourceInterchangeFileFormat，RIFF)。波形文件格式支持存储各种采样频率和样本精度的声音数据，并支持声音数据的压缩。●.WAV声音文件4.1.5数字音频文件的种类波形文件有许多不同类型的文件构造块组成，其中最主要的两个文件构造块是FormatChunk(格式块)和SoundDataChunk(声音数据块)。格式块包含有描述波形的重要参数，例如采样频率和样本精度等，声音数据块则包含有实际的波形声音数据。RIFF中的其他文件块是可选择的。它的简化结构如图所示。●.WAV声音文件4.1.5数字音频文件的种类MIDI是MusicalInstrumentDigitalInterface的首写字母组合词，可译成“电子乐器数字接口”。用于在音乐合成器(musicsynthesizers)、乐器(musicalinstruments)和计算机之间交换音乐信息的一种标准协议。从20世纪80年代初期开始，MIDI已经逐步被音乐家和作曲家广泛接受和使用。MIDI是乐器和计算机使用的标准语言，是一套指令(即命令的约定)，它指示乐器即MIDI设备要做什么，怎么做，如演奏音符、加大音量、生成音响效果等。MIDI不是声音信号，在MIDI电缆上传送的不是声音，而是发给MIDI设备或其它装置让它产生声音或执行某个动作的指令。●MIDI简介4.1.6电子乐器数字接口(MIDI)系统可以同时播放WAVE文件和MIDI文件来一起播放语音和音乐；不能同时播放两个波形文件，因为播放采样声音时要求准确的同步。MIDI标准之所以受到欢迎，主要是它有下列几个优点：生成的文件比较小，因为MIDI文件存储的是命令，而不是声音波形；容易编辑，因为编辑命令比编辑声音波形要容易得多；可以作背景音乐，因为MIDI音乐可以和其它的媒体，如数字电视、图形、动画、话音等一起播放，这样可以加强演示效果。●MIDI文件的优点4.1.6电子乐器数字接口(MIDI)系统产生MIDI乐音的方法很多，现在用得较多的方法有两种：一种是(frequencymodulation，FM)合成法，另一种是乐音样本合成法，也称为波形表(Wavetable)合成法。这两种方法目前主要用来生成音乐。●MIDI的合成方法4.1.6电子乐器数字接口(MIDI)系统●频率调制（FM）合成法4.1.6电子乐器数字接口(MIDI)系统20世纪80年代初，美国斯坦福大学(StanfordUniversity)的一名叫JohnChowning的研究生发明了一种产生乐音的新方法，这种方法称为数字式频率调制合成法(digitalfrequencymodulationsynthesis)，简称为FM合成器。他把几种乐音的波形用数字来表达，并且用数字计算机而不是用模拟电子器件把它们组合起来，通过数模转换器(digitaltoanalogconvertor，DAC)来生成乐音。●频率调制（FM）合成法的原理4.1

多媒体技术ppt好资源-第04讲数字声音基础

免费阅读已结束，点击付费阅读剩下 ... 页

阅读已结束，您可以下载文档离线阅读

虚拟现实技术第2章(作业)49

专业电子邮件系统-Coremail

F0803_分部（子分部）工程质量验收记录

农业的区位因素分析

如何成为优秀的策划人

社联之星策划30

委外加工业务管理办法

施工项目安全生产管理制度---可以参考

知名物业公司管理制度

大学生生活状况调查报告

相关文档

相关搜索