您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 广告经营 > 第6章多媒体技术基础
1第6章多媒体技术基础26.1多媒体技术概述6.1.1媒体(medium)是信息表示和传输的载体,如数字、文字、声音、图形、图像和视频等。分类感觉媒体—人的直观感觉表示媒体—各种编码,如图像编码,声音编码表现媒体—如键盘、显示器、扬声器存储媒体—保存表示媒体的介质,U盘、光盘传输媒体—传输的物理载体,如光纤、电缆3多媒体多媒体(Multimedia)是指能够同时获取、处理、编辑、存储和展示两个以上不同类型信息媒体的技术。这些信息媒体包括文字、声音、图形、图像、动画与视频等。多媒体不仅是指多种媒体本身,而且包含处理和应用它的一整套技术。“多媒体”与“多媒体技术”是同义词。46.1.2多媒体计算机系统的组成1.多媒体硬件(1)外部设备光驱、麦克风、MIDI合成器、扫描仪、VCD/DVD、数码照相机、摄像机、音箱、投影仪、刻录机、声卡、打印机等(2)功能卡作用:连接各种外部设备,完成音频、视频信息的数字化输入、编辑和输出种类:声卡、视频输出卡、VGA/TV转换卡等52.多媒体软件音频处理:AdobeAudition、SoundForge、Goldwave等图像处理:Windows的画图、Photoshop、CorelDraw动画制作:Gifanimator、Cool3D、Flash、3DMax视频处理:AdobePremiere、DirectorVCD制作与光盘刻录Authorware、Director等66.1.3多媒体技术的特点1.集成性多种媒体信息有机的组织在一起,共同表达一个完整的多媒体信息,成为一体化系统。2.交互性从单向的被动接收到双向有选择的交互方式转变3.实时性要求系统有较高的传输速率。76.1.4多媒体技术的应用1.教育2.办公自动化3.电子出版物4.通信5.商业广告6.影视娱乐7.医疗8.旅游86.2多媒体信息的数字化6.2.1声音数字化计算机处理声音的硬件要求安装声卡麦克风连接到声卡的MIC插孔音箱连接到声卡的SPEAKER插孔处理过程:数字化、保存和处理、还原91.声音的基本参数振幅音量,声波波形的幅度,表示声音信号的强弱。频率声音信号每秒钟变化的次数带宽声音信号的频率范围,带宽越宽音质越好DAT(DigitalAudioTape)——20Hz~20kHzCD(CompactDisc)——20Hz~20kHzFM(FrequencyModulation)——20Hz~15kHzAM(AmplitudeModulation)——50Hz~7kHz数字电话——200Hz~3.4kHz102.声音信号的数字化过程模拟音频信号时间上和幅度上都是连续变化的数字化将模拟的声音信号转变为数字音频的过程三个阶段采样、量化和编码模拟信号采样量化编码数字音频11(1)采样采样每隔一段时间间隔读取一次声音波形的幅度值采样频率单位时间内进行采样的次数,通常用赫兹(Hz)表示。采样频率越高,经过离散的波形越接近原始波形,声音还原质量越好奈奎斯特采样定理12奈奎斯特采样定理奈奎斯特采样定理采样频率高于输入信号中最高频率的两倍时,可以从采样信号中无失真地重构原始信号示例:(1)话音信号最高频率为3400Hz,采样频率为8000Hz,能以数字声音还原原来的声音(2)一般音频信号最高频率为20kHz,采样频率为40kHz以上时,就能无失真地还原13(2)量化量化对采样后得到的幅度值取值数量加以限定离散值的个数与采用的编码的二进制位数有关14模拟音频信号分30次测量幅度值第20次测量幅度值结果为15515(3)编码将量化后的幅度值用二进制编码进行表示采样精度用来表示量化级别的二进制数据的位数,也叫样本位数、位深度。例如:采样精度为8位,可以表示256种幅值;采样精度为16位,可以表示65536种不同的幅值。采样精度越高,声音质量越高,需要存储空间越大16173.数据率和未压缩数据量的计算数据率还原1秒钟的声音所需传输的数据位数,未经压缩的数字声音的数据率为:数据率(b/s)=采样频率(*Hz)*样本精度(bit)*声道数未压缩声音数据的容量计算存储空量(字节)=采样频率×样本精度×声道数×采样时间/818示例(1)采样频率为8kHz,样本精度为8位:数据率=8(bit)*8kHz=64.0kb/s(2)采样频率8kHz,样本精度8位,双声道:数据率=8(bit)*8kHz*2(声道数)=128kb/s(3)1分钟的双声道声音文件的数据量:8(bit)*8000Hz*2(声道数)*60(秒)/8=960000/1024=937.5KB19示例(4)采样频率44.1kHz,采样精度16位的立体声声音,采样1秒钟声音的数据量大小为:16×44.1kHz×2×1/8=176400Byte=172.27KB(5)某个立体声音频文件大小为2100000KB,采样频率为32000Hz,可以播放70分钟,则该音频文件的采样深度为bit。解答:2100000*1024*8/(2*32000*4200)=64206.2.2图像数字化1.图像的数字化(1)采样将连续图像在二维空间上进行离散化处理采样方式:逐行顺序进行,假设在水平、垂直两个方向上分别取M和N个相等的间隔,可以得到M×N个点每个点称为一个图像元素,简称像素(Pixel)或像元21(2)量化采样后每个像素点的处理:单色图像:将每个点量化为两个级别,分别是0和1灰度图像:将每个点的灰度进行离散化,划分纯白色、纯黑色和介于这两者之间的不同程度的灰色彩色图像:要将每个点的颜色的值进行离散化,也就是使用不同的颜色模型进行颜色编码量化的等级和像素的颜色编码位数有关2223(3)编码将量化后的每个点的灰度级别或颜色用不同的二进制编码表示,用这种编码表示的图像就称为数字图像。像素深度(位深度)为每个像素点的颜色或灰度进行编码所使用的二进制数的位数。像素深度的值越大表示的颜色数越多,色彩也越丰富逼真,占用的存储空间越大。242.颜色模型1.RGB模型:相加混色有源物体:能发出光波的物体2.CMY模型:相减混色无源物体:不发出光波的物体3.HSB模型25RGB颜色模型1)国际照明委员会(CIE)规定以700nm(红)、546.1nm(绿)、435.8nm(蓝)三个色光为三基色。又称为物理三基色。2)自然界的所有颜色都可以通过这三基色按不同比例混合而成。26RGB颜色模型R:200G:50B:120黄(255,255,0)黑(0,0,0)绿(0,255,0)青(0,255,255)蓝(0,0,255)品红(255,0,255)白(255,255,255)红(255,0,0)27CMYK颜色模型在理论上说,任何一种颜色都可以用青色(Cyan)、品红(Magenta)和黄色(Yellow)三种基本颜料按一定比例混合得到,通常写成CMY,称为CMY模型由于彩色墨水和颜料的化学特性,用等量的三种基本颜色得到的黑色不是真正的黑色,因此在印刷术中常加一种真正的黑色(Blackink),所以CMY又写成CMYK28HSB颜色模型1)色调颜色的外观2)饱和度颜色明暗的程度3)明度对可见物体辐射或发光多少的感知属性29HSB颜色模型30图像分辨率图像采样的点数,称为图像分辨率,用点的“行数×列数”表示如数码像机常用的图像分辨率为640×480、1024×786、1128×764等。对相同尺幅的图像,如果组成该图的像素数目越多,则说明图像的分辨率越高,看起来就越逼真。相反,图像显得越粗糙。31扫描分辨率用每英寸多少点(dotsperinch,DPI)表示。如果用300DPI来扫描一幅8′×10′的图像,就得到一幅2400×3000个像素的数字图像。分辨率越高,像素就越多,获得的图像越细腻扫描分辨率是采样时,单位尺寸内采样的点数,而图像分辨率是组成数字图像的像素数32像素深度数字图像中表示每个像素的颜色使用的二进制位数称为像素深度或位深度。像素深度值越大,图像能表示颜色数越多,色彩越丰富逼真,占用的存储空间越大。常见的像素深度有1位、4位、8位和24位,分别用来表示黑白图像、16色或16级灰度图像、256色或256级灰度图像和真彩色(224—16777216种颜色)图像33数字图像数据大小的计算计算用位图文件存储一幅分辨率为352×288的静态真彩色图像需要的存储空间。解:图像文件大小的计算公式:文件字节数=每行列数×图像行数×颜色深度÷8真彩色图像的每一个像素点用24位来记录:352×288×24/8B=304128B(字节)346.2.3视频的数字化视频数字化是将视频信号经过视频采集卡转换成数字视频文件存储在硬盘中。在使用时,将数字视频文件从硬盘中读出,再还原成为电视图像加以输出。一般的视频采集卡采用帧内压缩的算法把数字化的视频存储成AVI格式文件,高档一些的视频采集卡还能直接把采集到的数字视频数据实时压缩成MPEG格式的文件。35视频的压缩数字视频标准主要由MPEG(MovingPictureExpertGroup)即运动图像联合专家组制定,这是由国际标准化组织(ISO)和国际电工委员会(IEC)联合成立的专家组,负责制定关于运动图像在不同速率的传输介质上传输的一系列压缩标准,目前,已出台的标准有MPEG1、MPEG2、MPEG4、MPEG7等。368.4数据编码及压缩一.编码1.编码:将模拟信号转换成数字信号的过程2.解码:将数字信号还原成模拟信号的过程3.编解码器:完成编码、解码功能的装置。二.数据压缩1。必要性:数据量庞大2。压缩目的:便于存储和传输37例1:存储3分30秒的CD音质立体声歌曲44.1kHz×2B×2×210秒=37044KB=35.33M例2:存储一幅352×288的静态真彩色图像352×288×3B=297kB例3:存储1分钟视频所用的空间304.13kB×25×60=456195kB=435.06M383.数据压缩的可能性1)信息冗余2)数据量不等于它所包含的信息量3)静态图像中存在的空间冗余4)动态视频中存在的时间冗余394.压缩的方法1)无损压缩一种可逆压缩方式,经过压缩后可将原文件包含的信息完全保留利用原始信息中的相关性进行的数据压缩不损失原信息的内容,可实现无损压缩40例题:无损压缩的RLE编码RLE编码后得到的代码为:50(200,30,100)2(255,255,255)1(0,5,5)9(0,0,0)72(200,30,100)2)有损压缩各种不同的压缩标准41文件格式AVI(AudioVideoInterleave)是一种音频和视频交叉记录的数字视频文件格式。在AVI文件中,运动图像和伴音数据是以交织的方式存储,并独立于硬件设备。按交替方式组织音频和视像数据可使得读取视频数据流时能更有效地从存储媒介得到连续的信息。426.3数据压缩在多媒体计算机系统中要表示、传输和处理声文图信息,特别是数字化图像和视频要占用大量的存储空间,因此高效的压缩和解压缩算法是多媒体系统运行的关键。数据压缩是一种对原始数据进行重新编码、去除原始数据中的冗余,以较小的数据量来表示原始数据的技术,它是实现在计算机上处理音频和视频等多媒体信息的前提。43基本原理数据压缩的对象是数据。数据是信息的载体,用来记录和传送信息。真正有用的不是数据本身,而是数据所携带的信息,大的数据量并不代表含有大的信息量。例:食品包装44信息冗余多媒体数据中大的数据量并不完全等于它们所携带的信息量。在信息论中,称为冗余。冗余是指信息存在的各种性质的多余度。减少数据冗余可以节省存储空间,有效利用网络带宽。45可逆编码可逆编码也叫无失真编码、冗余度压缩、熵编码等。其原理是减少数据中的冗余度,而不损失任何信息。解压时可以完全恢复出原来的数据,亦称无损压缩。典型的无损压缩有Huffman编码、算术编码和行程编码等。可逆编码由于不会产生失真,因此在多媒体技术中常用于文本、数据的压缩,它能保证完全地恢复原始数据。但这种方法的压缩比较低,一般在2:1~5:1之间。46不可逆编码不可逆编码是有失真压缩,信息论中叫熵压缩。由于压缩了熵,会减少信息而不能
本文标题:第6章多媒体技术基础
链接地址:https://www.777doc.com/doc-1482968 .html