您好,欢迎访问三七文档
上午11时48分1多媒体基础知识课程内容:06版第3章多媒体技术应用上午11时48分2主要内容第一节音频信号的处理第二节图像处理软件应用第三节动画制作基础第四节视频信息的处理上午11时48分3第一节音频信号的处理1.Wave音频文件2.MIDI合成音乐3.音频处理4.音频数据压缩5.语音合成与识别上午11时48分4多媒体计算机中产生声音的方式外部声音源录制和重放:Wave音频MIDI音乐:MIDI音频CD-Audio:CD音频音频信号的处理上午11时48分5Wave音频文件一、波形音频特征(三个参数)麦克风/录音机/CD激光唱盘声卡A/D转换(采样、量化)声卡D/A转换混音器混合后由扬声器输出计算机存储采样频率量化位数声道数上午11时48分6采样频率:每秒从模拟声波中采集声音样本的个数。频率越高,采集的样本数越多,声音质量越好,占用存储空间越大。人耳感受范围:0~20kHz一般采用:11.025kHz、22.05kHz、44.1kHz波形音频三个参数对原始声波采样采样后得到的数据上午11时48分7量化位数:将采样数据按大小存储的过程。一般有8、16、32位等,量化位数越大,声音的幅度分辨率越高,还原时声音的品质越好,声音数据占用的存储空间越大波形音频三个参数上午11时48分8声道数:数字音频声音质量的另一个因素。一般有单声道、双声道、多声道存储量计算:采样频率×量化位数×声道数×时间/8(字节)举例:采样频率44.1kHz,16位量化,双声道,一分钟的音频所需要的存储量为:44.1×1000×16×2×60/8=10584000(字节)波形音频三个参数上午11时48分9二、Wave音频文件标准数字音频,扩展名是.WAV多数声卡能以16位、44.1kHz采样率录制和播放主要缺点:产生的文件太大,不适合长时间记录压缩方法:从PCM(均匀量化)到ADPCM(自适应差分量化)上午11时48分10三、Wave音频文件的制作工具——录音机Wave文件录制、播放和进行一些简单处理的基本工具播放音频文件时显示正在播放的声音波形从“效果”菜单可进行加快、放慢声音速度,加入回声等特殊效果,反向播放,将声音重新组合等处理“文件/属性”命令打开“声音属性”对话框可以了解Wave文件数字声音指标上午11时48分11MIDI合成音乐MIDI(MusicalInstrumentDigitalInterface)MIDI是乐器数字接口的缩写,文件扩展名是.MIDMIDI文件的内容是能使合成音乐芯片演奏乐曲的代码多媒体PC平台能够通过内部合成器或连接到计算机MIDI端口的外部合成器播放MIDI文件上午11时48分12MIDI合成音乐产生:合成器:电子乐器演奏时的指令信息声卡Midi控制器声卡合成器混音器混合后由扬声器输出计算机存储FM合成器波表合成器上午11时48分13一、合成器利用DSP或其他芯片产生音乐或声音的电子装置FM合成器采用频率调制的原理产生声音FM合成器能发出128种乐器的声音波表合成器对真实乐器声采样,制波表保存,由DSP查表调用处理声音效果与真实的乐器声几乎无差别声卡带有波形表ROM的接口或本身带有波形表ROMROM的容量越大,可存储的乐器音就越多上午11时48分14二、MIDI音乐产生原理MIDI标准:规定了电子乐器与计算机连接的电缆、硬件标准和通信协议乐谱的数字描述(MIDI指令信息)由音符序列、定时和多达16个通道的演奏音符定义组成演奏音符定义由键号、通道号、音长、音量和力度组成建立MIDI文件:设备演奏时输入或软件编辑产生MIDI文件特点:是一系列指令不是波形,文件小MIDI设备端口:MIDIIn、MIDIOut、MIDIThru媒体播放器可直接播放上午11时48分15音频处理声音处理软件Windows录音机UleadAudioEditorCreative的录音大师CakeWalk等声音处理内容录音与保存剪辑去除杂音混音合成等上午11时48分16一、使用Windows录音机录音与保存录音设置录音状态:“音量控制|选项|属性”录音:Record按钮→录制[默认录音长度不超过60秒]录音结束:Stop按钮保存“文件|另存为”命令“更改”:设置声音文件格式和属性上午11时48分17二、使用Windows录音机处理音频1、定位编辑点打开需要处理的波形文件移动滑块到要编辑的位置将滑块移到要编辑信息的位置上午11时48分18二、使用Windows录音机处理音频2.更改声音效果效果:音量:加大音量、降低音量放音速度:加速、减速特殊效果:添加回音、反转上午11时48分19二、使用Windows录音机处理音频3.编辑插入文件与文件混音删除上午11时48分20音频数据压缩在数据压缩时,要综合考虑声音质量、数据率、计算量三个方面上午11时48分21一、基本压缩原理(CCITT提出的语音压缩编码建议)音频编码方法波形编码:基于音频数据的统计特性参数编码:基于音频的声学参数混合编码:上述两种结合MPEG编码:基于人的听觉特性压缩方法无损压缩:霍夫曼编码、游程长度编码有损压缩:CCITT编码、MPEG编码上午11时48分22二、MP3音乐——MPEGlayer3的应用MPEG音频压缩标准:三层、算法复杂性随层增大、分级兼容MPEG音频标准压缩比数据质量KbpsMPEGlayer14:1384MPEGlayer26:1~8:1192~256MPEGlayer310:1~12:1112~128MPEG音频的压缩比与数据质量上午11时48分23二、MP3音乐——MPEGlayer3的应用特征:音质接近CD、文件大小仅1/12MP3的音质取决于还原技术、音响系统以及听者的主观感觉原理:-先进的编码技术-利用人耳特点缩减数据(删除高于15KHz的高频声音)上午11时48分24声音文件的格式1.WAV格式:Windows标准波形文件,多数音频编辑软件支持,文件较大。2.MP3格式:高压缩比,文件较小,音质接近CD。3.MIDI文件:存储指令,文件短小,播放效果因软硬件而异。上午11时48分25声音文件的格式4.CD格式:音质最好的数字音频格式,CDA文件只含索引信息。5.RealAudio格式:适用网上在线音乐欣赏,可随带宽不同改变音质。6.WMA格式:音质强于MP3,内置版权保护技术,支持音频流技术。上午11时48分26语音合成与识别语音合成技术-赋计算机“讲话”能力-用语音输出结果语音识别技术使计算机具有“听懂”语音的能力用语音替代键盘输入上午11时48分27语音合成与识别一、语音合成技术方法:语音合成方法、参数合成方法目标:可懂、清晰、自然、具有表现力应用:文语转换(TTS)二、语音识别技术ViaVoice中文连续语音识别系统输入速度:150汉字/分识别率:95%发展方向:自然话语识别与理解解决语音识别中的一系列难题上午11时48分28一、06版实验指导实验七二、录音机操作(补充)1、打开声音文件ringin.wav,在0.32秒处插入文件tada.wav,并加速。将文件以格式“PCM22,050KHZ,8位,立体声,43kb/s”保存为M4.WAV。2、打开声音文件tada.wav,将0.32秒以前的内容删除,并混入ringout.wav,再添加回音效果,将文件以格式“MicrosoftADPCM11,025KHZ,4位,立体声,11kb/s”保存为M8.WAV。(在C盘查找所需文件)上机实践实验内容:
本文标题:多媒体基础知识
链接地址:https://www.777doc.com/doc-3369137 .html