您好,欢迎访问三七文档
上一页下一页返回首页第二章多媒体数据基础2.1图像信息处理基础2.2视频和动画信息处理基础2.3声音信息处理基础2.4多媒体数据的压缩技术上一页下一页返回首页2.1.1图像的基本概念1、图像。图像一般是指自然界中的客观景物通过某种系统的映射,使人们产生视觉感受。例如:照片、图片等。在计算机中图像是用像素点进行描述,是一组数据的集合。有序排列的像素点表达了自然景物的形象和色彩,图像的每个像点采用若干个二进制位进行描述,因此,图像又叫做“位图”,其形式如图2-1所示。上一页下一页返回首页2.1.1图像的基本概念2、图形。图形是计算机在平面直角坐标系和空间坐标系中,通过对运算表达式进行矢量运算和对坐标数据进行描述而形成的运算结果,由具有方向和长度的矢量线段构成。图形的描述是使用坐标数据、运算关系以及颜色描述数据。因此,图形又叫做“矢量图”,如图2-2所示。上一页下一页返回首页2.1.1图像的基本概念3、图像的描述。描述一幅图像主要有分辨率、像素深度、真/伪彩色等。图像分辨率是指组成一幅图像的像素密度的度量方法。度是指存储每个像素所用的位数,它也是用来度量图像的分辨率。彩色是指在组成一幅彩色图像的每个像素值中,有R,G,B三个基色分量,每个基色分量直接决定显示设备的基色强度,这样产生的彩色称为真彩色。上一页下一页返回首页2.1.2图像文件格式1、BMP格式BMP是标准的Windows和OS/2的图形图像的基本位图格式,是一种与设备无关的图形文件格式,是Windows软件推荐使用的一种格式。随着Windows的普及,BMP已使用得相当广泛,Windows应用程序PaintBrush便以此格式存取图形文件。BMP文件有压缩和非压缩之分,压缩方法采用行程长度编码(run-lengthencoding,RLE),一般作为图像资源使用的BMP文件都是不压缩的。BMP支持黑白图像、16色和256色的彩色图像以及RGB真彩色图像。上一页下一页返回首页2.1.2图像文件格式2、GIF文件格式GIF文件格式的全称是图形交换文件格式,GIF图像最大不能超过64MB,颜色最多为256色(8位)。GIF格式是目前唯一仅使用LZW压缩方法的主要图像文件格式。GIF文件压缩比较高,文件长度较小。GIF图像有两个主要的规范,即GIF87a和GIF89a,后者支持图像内的多画面循环显示,可以用来制作小型的动画,现在上的许多微小动画就是用这种方法做成的。GIF格式已成为网络上最流行的图像文件格式之一。上一页下一页返回首页2.1.2图像文件格式3、JPG文件格式JPG文件格式是AppleMac机器上使用的一种图像格式,这种格式的最大特点是文件非常小,而且可以调整压缩比。由于JPG文件的压缩比很高,非常适用于处理大量图像的场合,也是现在上最流行的图像格式之一。但它是一种有损压缩的编码格式,是以牺牲图像中某些信息为代价以换取较高的图像压缩比,一般不适合用来存储原始图像素材。上一页下一页返回首页2.1.2图像文件格式4、PCX文件格式PCX文件可以分为3类:各种单色PCX文件、不超过16种颜色的PCX文件和具有256色的PCX图像文件。PCX格式是微机上使用最广泛的图像文件格式之一,绝大多数图像编辑软件,如:PhotoStyle,CorelDRAW和Windows中的画笔等均能处理这种格式。而且各种扫描仪得到的图像均能存储为PCX格式的文件。PCX文件格式使用行程长度编码(RLE/RLC)方法进行压缩,压缩比适中,压缩和解压缩速度快,适用于一般软件的使用。上一页下一页返回首页2.1.2图像文件格式5、TIF文件格式TIF格式图像的颜色可以从单色到RGB真彩色,其格式非常灵活,适合于所有图像应用领域。TIF文件分成压缩和非压缩两大类,非压缩的TIF文件独立于软硬件,使用较广泛,但压缩文件要复杂得多。由于非压缩的TIF文件具有良好的兼容性,压缩的TIF文件在存储时又有很大的选择余地,所有这种格式是许多图像应用软件所支持的主要文件格式之一。上一页下一页返回首页2.1.2图像文件格式6、PCD格式PCD格式是Kodak公司的PhotoCD专用存储格式,一般都存在CD-ROM上,读取PCD文件要用Kodak公司的专门软件。PCD文件中含有从专业摄影照片到普通显示使用的多种分辨率的图像,所以都非常大。由于PhotoCD的应用非常广,许多图像处理软件都可以将PCD文件转换成其他标准图像文件。上一页下一页返回首页2.1.2图像文件格式7、WMF文件格式WMF文件格式是一种比较特殊的文件格式,可以说是位图和矢量图的一种混合体,在桌面出版领域应用十分广泛,许多剪贴图片集中的图像就是以这种格式存储的。上一页下一页返回首页2.1.3图像文件的存储1、图像文件的数据表示在计算机中,有矢量图和点位图两种类型的图。矢量图是用数学方法描述的一系列点、线、弧和其他几何形状,因此存放这种图使用的格式称为矢量图格式,存储的数据主要是绘制图形的数学描述;点位图也称光栅图(rastergraphics),这种图是由像素点组成的,如图2-4(b),因此存放这种图使用的格式称为点位图格式,存储的数据是描述像素的数值。上一页下一页返回首页2.1.3图像文件的存储2、图像文件的长度图像文件的长度是指存储整幅图像所需要的磁盘字节数,计算公式是:图像文件长度尺寸(字节数)=图像分辨率×颜色深度÷8例如:有一幅未经压缩的图像,它的图像分辨率是400×300,其颜色深度是24,则这个文件的长度400×300×24÷8=360000(字节),这就是图像文件的存储长度。如果对图像文件进行压缩处理,可以大幅度地减少图像文件所占用的存储空间。上一页下一页返回首页2.2.1视频和动画的基本概念1、动画动画就是利用具有连续性内容的静止画面,一幅接着一幅高速地呈现在人们的视野之中。动画利用了人类眼睛的“视觉暂留效应”,人在看物体时,物体在大脑视觉神经中的滞留时间约为(1/24)秒。如果每秒更换24或更多的画面,那么,前一个画面在人脑中消失之前,下一个画面就进入人脑,使人们感觉到动态的变化效果。传统的动画制作过程相当复杂,随着计算机技术的发展,人们开始用计算机进行动画的创作,并称其为计算机动画。上一页下一页返回首页2.2.1视频和动画的基本概念2、视频视频也是将一幅幅独立图像组成的序列按照一定的速率连续播放,利用视觉暂留现象在人的眼前呈现出连续运动的画面。因此,动画与视频从视觉角度看应该是一样的。其实,划分动画与视频的依据应该是生成它们的手段,如果利用摄像机进行现场拍摄而获得的信息为视频文件,利用工具软件人为创造出来的动作序列组成的文件称为动画。与静止图像相比,视频媒体是一组运行图像,其速率为25帧/秒或30帧/秒。帧是构成视频信息的基本单元。上一页下一页返回首页2.2.2视频和动画文件格式1、AVI文件格式AVI文件格式是VideoforWindows所使用的文件格式,其扩展名为AVI。它采用了Intel公司的Indeo视频有损压缩技术把视频和音频信号混合交错地存放在一个文件中,较好地解决了音频信息与视频信息的同步问题,是目前较为流行的视频文件格式。AVI文件使用的压缩方法有多种,主要使用有损压缩方法。通常采用纯软件的压缩和还原手段。上一页下一页返回首页2.2.2视频和动画文件格式2、MOV文件格式MOV文件格式是QuickTimeforWindows所使用的视频文件格式。和AVI文件相同,MOV文件也使用了Intel公司的Indeo视频压缩技术把视频和音频信号混合交错在一起,但具体实现不同。一般认为MOV文件图像较AVI好,但这只是相对而言,因为不同版本的AVI和MOV文件的画面质量是很难进行比较的。上一页下一页返回首页2.2.2视频和动画文件格式3、MPG格式MPG文件是最新的数字视频标准文件,也称为系统文件或隔行数据流,是采用MPEG方法进行压缩的全运动视频图像。许多视频处理软件都支持该文件格式。在一定条件下,可在1024*768的分辨率下以每秒24,25或30帧的速度播放128000种颜色的全运动视频图像和同步CD音质的伴音。上一页下一页返回首页2.2.2视频和动画文件格式4、DAT格式DAT是VideoCD或KaraokeCD(即卡拉OKCD,为面向大众化消费的另一种CD标准),DAT文件是VCD专用的视频文件格式,也是基于MPEG压缩/解压缩技术的视频文件格式。当计算机配备视霸卡或软解压程序后,可利用计算机对该格式的文件进行播放。上一页下一页返回首页2.2.3视频和动画文件的存储多媒体中的一幅640×480的256色彩图像所占的数据量为300kB;动态视频要求每秒播放25~30帧图像,因而以640×480的窗口播放256色彩色视频图像、具CD音质的立体声,就要求每秒处理约9MB的数据,即使采用一片容量为650MB的CD-ROM盘也仅能存储约75.6秒的视频图像,因此,动画和视频文件的压缩是十分必要的。上一页下一页返回首页2.3.1声音的基本概念声音是通过空气传播的一种连续的波,叫声波。声音信号的三个基本参数是频率、幅度和音色。信号的频率是指信号每秒钟变化的次数,用Hz表示。人的听觉能够听到的声音频率范围是20Hz~20KHz,因此,在多媒体技术中,处理的信号主要是音频信号,它的频率范围为20Hz~20KHz。幅度又称为响度,即声音的大小,它取决于声波振幅的大小。音色是由混入基音的泛音所决定的,每个基音又都有其固有的频率和不同音强的泛音,从而使得每个声音具有特殊的音色效果。上一页下一页返回首页2.3.2声音文件的格式和分类1、WAV文件WAV文件也称为波形文件,是Windows所使用的标准数字音频,文件的扩展名是WAV。它是对实际声音进行采样所得到的数据。波形文件最大的缺点就是文件太大,不适合长时间记录声音。例如,同样半小时的立体声音乐,MIDI文件只有200KB左右,而WAV文件则要差不多300MB。由于波形文件记录的是声音的数字化数据,所以可用一些声音工具软件对其进行处理,如加快或放慢放音速度,对声音进行重新组合等。上一页下一页返回首页2.3.2声音文件的格式和分类2、MIDI音乐MIDI音乐是(乐器数字接口)的缩写,MIDI文件的扩展名为MID。与波形文件不同,MIDI文件不对音乐进行采样,而是对音乐的每个音符记录为一个数字,所以与波形文件相比文件要小得多,可以满足长时间音乐的需要。此外,MIDI只能记录标准所规定的有限种乐器的组合,而且回放质量受到声音卡的合成芯片的限制。近年来,国外流行的声卡普遍采用波表法进行音乐合成,使MIDI的音乐质量大大提高。上一页下一页返回首页2.3.2声音文件的格式和分类3、CD-DA是数字音频(CcmpactDiscDigitalAudio)的英文缩写,即大家日常使用的CD唱片,专业术语把它称为红皮书标准音频,它是一种数字化的声音。以16位,44.1kHz频率进行采样,几乎可以达到完全再现原始声音的效果。在每一张CD唱片上能存放长达72min的高质量的音乐。利用Windows98的“CD播放器”和“媒体播放机”都可以播放CD音乐。CD音乐不是以磁盘文件方式保存的,因此不能随便将其中一段音乐复制到其他地方,这样,使得CD音乐的使用范围变得比较狭窄。上一页下一页返回首页2.3.2声音文件的格式和分类4、MP3音乐随着计算机网络的普及和发展,MP3格式的音乐越来越受到人们的欢迎。因为这是一种压缩格式的声音文件,音质好,数据量小是它的最大优点。MP3是一种数据音频压缩标准方法,它的全称是MPEG-Layer3,是VCD影像压缩标准MPEG的一个组成部分。用该标准制作储存的音乐就是MP3音乐。因为MP3是经过压缩产生的文件,因此需要一套MP3播放软件进行还原。上一页下一页返回首页2.3.3声音文件的存储声音文件的存储量可用下式计算:存储量(KB)=(采样频率KHZ×采样位数bit×声道数×时间秒)/8上一页下一页返回首页2.4.1多媒体数据冗余的产生1、冗余的基本概念冗余是指信息
本文标题:多媒体数据基础
链接地址:https://www.777doc.com/doc-1473968 .html