您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 广告经营 > 第七章多媒体数据压缩和音视频处理技术
第七章多媒体数据压缩和音视频处理技术7.3多媒体数据压缩编码技术.................................................................................17.3.1概述................................................................................................................................17.3.2数据压缩的理论及主要技术........................................................................................27.3.3静态图像压缩编码标准—JPEG.....................................................................................47.3.4运动图像(视频)压缩编码标准—MPEG...................................................................77.3.5常见图像压缩格式评价..............................................................................................127.4多媒体音频/视频数据的处理.........................................................................157.4.1数字音频的编辑处理...........................................................................................157.4.2.数字视频制作和处理...........................................................................................247.6常用多媒体工具软件......................................................................................347.6.1图像图形制作和图像浏览工具..................................................................................347.6.2音视频播放工具..........................................................................................................367.3多媒体数据压缩编码技术7.3.1概述多媒体技术的出现大大的改善了人们传递信息的方式,使得信息能够以人类更容易接受和学习的方式进行传递,增强信息传递的效率。但是同时由于多媒体数据中蕴含了多种媒体的信息(通常表现为大量数字化了的声音、图片和视频信息等),需要传递或者处理的数据量非常大。举例来说,假设有一帧分辨率为800×600的24位真彩色数字图像,如果没有经过压缩处理,则其存储数据量约为每帧11.52Mb(这里只计算了纯数据的容量,实际中会有一些控制数据会产生额外开销)。如果把这样的图片制作成动画来显示,按照每秒24帧的动态显示要求,每秒所需传输和处理的数据量为276.48Mb,这样的传输速率当前大多数网络环境都很难胜任。如果再加上声音数据,需要传输和处理的数据量将会变得更大。如果不进行处理,现有多数的计算机系统和网络环境要实现动画和声音多媒体数据的实时传输就比较困难。为了节约数据的存储空间,获得连贯的高质量视频播放效果和听觉效果,实现多媒体数据的实时交换,除了不断提高计算机本身的性能及通信信道的带宽外,目前更有效的的方法是对多媒体数据进行有效的压缩。由于可以帮助减少如硬盘空间与连接带宽这样的昂贵资源的消耗,所以压缩非常重要,然而压缩需要消耗信息处理资源,这也可能是非常昂贵的。所以数据压缩机制的设计需要在压缩能力、失真度、所需计算资源以及其它需要考虑的不同因素之间进行折中。多媒体数据特别适合压缩,这个是由多媒体数据的特点和应用对象决定的。多媒体数据的特点是整体上数据的冗余度很大,这就决定了多媒体可以被大幅度压缩。例如,一幅风景图像中的背景是蓝天和绿地,而这部分数据中许多像素值是相同的,如果逐点存储就会浪费许多空间,这种冗余方式称为空间冗余。又例如,在电视和动画的相邻序列中,只有运动物体有少许变化,仅存储差异部分即可,这称为时间冗余。此外还有结构冗余、视觉冗余等,这些都为多媒体数据的压缩提供了条件。另一方面,多媒体数据的最终应用对象是人,即要把数据以视听的方式呈现给人,实现人机信息交流,而我们人类具有模糊识别的能力,这便意味着即使在压缩过程中损失了一些细节数据(一定程度上),将不会影响人类从多媒体数据中获取信息。因此,采用合适的压缩技术,可以对多媒体数据的数据量进行大幅度压缩而基本不影响人们从多媒体数据中获取信息。数据压缩的定义是在不丢失信息的前提下,缩减数据量以减少存储空间,提高其传输、存储和处理效率的一种技术方法。或按照一定的算法对数据进行重新组织,减少数据的冗余和存储的空间。下面对压缩理论和数据压缩技术做简要介绍。7.3.2数据压缩的理论及主要技术数据压缩的主要理论基础是信息论,这个领域的研究工作是由信息论的创始人克劳德·艾尔伍德·香农(ClaudeElwoodShannon)奠定的,他在二十世纪40年代末期到50年代早期发表了这方面的基础性的论文。另外密码学、统计学和编码理论也是和数据压缩关系密切的学科。从数学上讲,可以将压缩看做是一种变换。具体操作时,数据的压缩实际上是一个编码过程,即把原始的数据进行编码压缩。数据的解压缩是数据压缩的逆过程,即把压缩的编码还原为原始数据。因此数据压缩方法也称为编码方法。随着基础学科理论的不断发展,目前数据压缩技术也日新月异,适应各种应用场合的编码方法不断产生。针对多媒体数据冗余类型的不同,相应地有不同的压缩方法。根据解码后数据与原始数据是否完全一致可将压缩方法分为无损压缩算法(lossycompression)和有损压缩算法(lossnesscompression)两大类。无损压缩算法是指去掉或减少数据中的冗余,但这些冗余值是可以重新插入到数据中的,因此冗余压缩是可逆的过程。例如在一幅图像中,有一部分数据排列为“蓝色的点,蓝色的点……蓝色的点”共计300个,压缩后的图像可以记录为“300个蓝色的点”,这样就节省了大量的存储空间。在多媒体技术中,无损压缩经常用于一般文本、数据的压缩,它能保证百分之百地恢复原始数据。但这种方法压缩比较低。统计编码就是一种无失真编码。它是根据信息出现概率的分布而进行的压缩编码。编码时某种比特或字节模式的出现概率大,用较短的码字表示;出现概率小,用较长的码字表示。这样,可以保证总的平均码长最短。无损压缩使用最广泛的是LZ(Lempel–Ziv)压缩算法。常用的无损压缩算法基本都是从LZ压缩算法演化而来,例如GIF图像中用到的LZW(Lenpel-Ziv&Welch)压缩算法,PNG图像中用到的DEFLATE压缩算法和Zip格式压缩文件中用到的LZR(Lepel-Ziv-Renau)压缩算法。无损压缩常用的技术如下:RLE(Run-lengthencoding)被称为行程长度编码,是一种非常简单的无损压缩方法,这种方法使用数据及数据长度这样简单的编码代替重复出现的连续数据。例如有一幅简单图像是白色背景上面有一些黑点,这样就会有很多白点为重复数据。如果用W表示白色的点,用B来表示黑色的点,图像中的一行就可以简单表示如下:压缩后变为:12W1B12W3B24W1B14WLempel-Ziv(LZ)压缩方法是最流行的无损存储算法之一。LZ方法使用基于表格的压缩模型,其中表格中的条目用重复的数据串替换。对于大多数的LZ方法来说,这个表格是从最初的输入数据动态生成的。微软公司的CAB格式采用的压缩方式LZX就是基于LZ编码机制的。DEFLATE是另外一种LZ算法的变体,它针对解压速度与压缩率进行了优化,可以获得比较高的压缩率,但是有时候压缩速度可能会比较缓慢,PNG格式图像就使用的是DEFLATE压缩算法。LZW(Lempel-Ziv-Welch)也是从LZ压缩算法演化而来,这种方法用于GIF图像。由于这个算法曾经是Unisys公司的专利(2003年6月专利到期限),因此在很长一段时间内影响了GIF图像的应用。另外还有Zip压缩文件采用的LZR(LZ-Renau)方法。有损压缩法是指在不影响人类理解的情况下,丢弃一些细节信息来获得更高的压缩比,这些丢弃的信息是不能再恢复的,因此这种压缩法是不可逆的(即解压后的数据和压缩前的数据不完全一样)。有损压缩多用于由人的视觉或者听觉对解压缩后的数据进行识别的场合。这些压缩算法利用了人在识别信息时的一些生理特点。例如,人的视觉对于亮度的变化特别敏感而对颜色的变化不敏感;人的耳朵能够识别的声波频段范围非常有限等。因此很多最终由人类的视觉系统和听觉系统接收的图像、音视频数据就可以采用有损压缩,在压缩时可以丢掉一不敏感或者无法感知些数据,不会对数据所表达的意思产生误解,但却可以大大提高压缩比。有损压缩算法经常需要处理的一个问题就是在压缩解压时间、保留信息量和减小数据存储空间之间寻找一个折中。需要注意的是在某些特殊情况下,例如医学诊断或者刑侦等场合,为了不遗漏任何信息细节,一般不采用有损压缩算法。有损图像压缩技术应用最广泛的的是JEPG图像压缩技术,大量的用于数码相机和互联网上图像,可以大幅度地提高了存储能力,同时图像质量几乎没有降低。在有损音频压缩中,经常利用心理声学的原理来去除信号中听不见或者很难听见的成分。人类语音的压缩经常使用更加专业的技术,因此人们有时也将“语音压缩”或者“语音编码”作为一个独立的研究领域与“音频压缩”区分开来,其中语音压缩比较常见的应用是因特网电话。不同的音频和语音压缩标准都属于音频编解码范畴。视频压缩技术中绝大多数都是有损压缩,有损视频压缩的一个最常用技术就是可同时对音视频数据进行压缩的MPEG-x系列技术。无论是无损压缩还是有损压缩,其压缩算法是基于软件的,也就是其需要一定的处理时间,因此在很多实时性要求比较高的环境中,会对硬件的性能提出一些要求从而保证其实时性。而在文件备份、归档过程中的压缩一般不会有什么问题。另外需要注意,有些文件已经被压缩,进一步的外部压缩不会有任何好处,一些图形文件格式,如标签映象文件格式(TIFF),就已经包含了压缩。由于数据压缩在使用计算机存储、传输和处理数据的过程中非常常用,在数据压缩发展的早期出现了各种压缩算法,这些各具特色的压缩算法降低了文件的可移植性,除非在数据交换时把解压缩软件也与文件一起传送,否则将会出现一个用户的压缩数据传输给另一个用户时无法打开的现象。为了便于不同的用户之间能够更好的交流数据,有必要制定一些国际标准来规范压缩算法,以促进不同用户之间数据交流的效率。促进数据压缩算法标准产生的组织主要有国际标准化组织ISO、国际电工委员会IEC和国际电信联盟电信标准化部门ITU-T。其制定的通用压缩编码标准认可度比较高且应用比较广泛的大致有四种:H.261、JPEG、MPEG和DVI。其中H.261是1990年ITU-T制定的一个视频编码标准,属于视频编解码器。
本文标题:第七章多媒体数据压缩和音视频处理技术
链接地址:https://www.777doc.com/doc-2118347 .html