您好,欢迎访问三七文档
当前位置:首页 > 临时分类 > 多媒体数据的常用压缩编码方法常用压缩编码的基本原理和处理方法
学习和了解多媒体数据压缩的必要性和可能性、多媒体数据的常用压缩编码方法、常用压缩编码的基本原理和处理方法,以及图像、视频压缩的国际标准和流媒体基础知识。了解多媒体大容量存储技术的作用和应用,掌握数据光盘的刻录及光盘拷贝的方法。随着多媒体技术的发展和应用,人们从计算机上获得的信息不仅有文本、图像,也有视频、音频及各种动画媒体。相对于文字信息,音频、视频等信息媒体需要处理和传送的数据量大得惊人,制约了多媒体信息的存储和传输,阻碍了计算机信息的获取和传送。因此,数据压缩技术和大容量存储技术对于多媒体技术的发展极为重要。3.1多媒体压缩编码技术1948年,Oliver就提出了PCM编码理论(即“脉冲码调制”编码)。数据压缩是通过数学运算来实现,不同的数学运算方法有着不同的压缩结果。数据压缩和编码技术是一个非常重要的关键技术,因此需要一个全球统一的国际技术标准。各种信息媒体不压缩时的数据量媒体单位规格数据量文本满屏800×600像素14.6KB矢量图满屏800×600像素2.8KB位图满屏800×600像素(256色)1.37MB音频每小时CD音质604.7MB视频每小时5MHz的PAL制式108000MB只有对多媒体数据进行有效的压缩,才能使多媒体技术得到应用和发展。3.1.2多媒体数据常用压缩方法经研究发现,各种多媒体数据中存在着大量的冗余。图像数据压缩技术就是研究如何利用图像数据的空间冗余性和时间冗余性等来减少静止图像和活动图像的数据量。数据压缩的主要对象是数据而不是信息。压缩过程中,数据压缩的目的,是减少在存储、传输、处理信息时文件的数据量,尽可能不损失或少损失有效的信息数据。数据压缩编码类型无损压缩编码有损压缩编码熵编码游程编码霍夫曼编码算术编码LZW编码信源编码混合编码预测编码变换编码其它编码JPEGH.263MPEG3.1.2.1.熵编码熵编码也叫统计编码,是一种无损压缩编码方式,在压缩时不丢失数据,属于可逆编码(Reversiblecoding)。所谓可逆编码,是指解码后的数据和编码前的数据完全一样,没有信息丢失,也就是说压缩的数据可以不折不扣地被还原成原始数据。在熵编码中主要包括游程编码、霍夫曼编码、算术编码和LZW编码等。1、游程编码:由于数据中常常包含有相同字节的序列,通过利用发生的次数来取代这些重复的字节序列,可大大减少原始数据的长度,这就是游程编码的原理。例如:一个字符串为“666668888000000033333322222”时,其游程编码为:(6,5)(8,4)(0,7)(3,6)(2,5)。可以看出,给游程编码后字符串的位数远远少于原始字符串的位数。2、霍夫曼(Huffman)编码:其编码效率主要取决于需编码的符号出现的概率分布。它对于出现频率大的符号用较短的编码来表示,而对出现频率小的符号用较长的编码来表示。霍夫曼编码的码长是变化的。霍夫曼编码的实际过程10101001每个符号的霍夫曼码如下:w(A)=000w(S)=01、w(D)=10w(F)=11、w(G)=0013、算术编码:算术编码是将编码的信息表示成实数轴上0和1之间的间隔,信息越长,间隔越小,表示这一间隔所需的二进制位数就越多。算术编码的特点是可以根据当前接受的数据不断地更改概率模型。当信号源符号的出现概率比较接近时,算术编码的效率高于霍夫曼编码。4、LZW压缩编码:LZW压缩技术是把数据流中复杂的数据用简单的代码表示,并把代码和数据的对应关系建成一个转换表。该表只在进行压缩和解压缩的过程中做为码表说明,一旦压缩和解压缩过程结束,该表将不再起任何作用。LZW压缩技术具有较高的压缩和解压缩速度,它对于可预测性不大的数据具有较好的效果。3.1.2.2信源编码信源编码是一种有损压缩编码方法。在有损压缩的情况下,未压缩的数据和解压后的数据很相似,但是不等同。在压缩比可调制的情况下,通常压缩比越高,失真度越大。预测编码变换编码其它编码3.1.2.2信源编码信源编码主要有预测编码、变换编码、子带及矢量等其它编码。信源编码是一种有损压缩编码方法。在有损压缩的情况下,未压缩的数据和解压后的数据很相似,但是不等同。在压缩比可调制的情况下,通常压缩比越高,失真度越大。1、预测编码预测编码方法有线性预测编码方法和非线性预测编码方法。线性预测编码方法也叫差分脉冲编码调制方法,简称DPCM,主要用于图像数据的压缩处理。非线性预测编码方法采用的是自适应差分编码调制方法,简称ADPCM,它包括自适应量化和自适应预测两种形式,主要用于对中等质量的音频信号进行高效率的压缩。2、变换编码变换编码属于有损压缩编码,主要用于图像数据的压缩。变换编码实际上就是将信号数据变换到另外一个更适合压缩的数学域中,这样在解压缩时,变换编码将反向进行,也就是反变换,利用反变换来恢复编码前的原始数据。3、其它编码信源编码中除了常用的预测编码和变换编码外,还有其它类型的编码,比如矢量量化编码、位单元编码、亚取样编码、子带编码等类型,这些编码方式都有不同的编码算法。3.1.2.3混合编码混合编码是熵编码和信源编码的结合。混合编码主要有:用于静态图像的JPEG压缩编码方法、用于动态图像的MPEG压缩编码方法、以及可视通信的H.263的压缩编码方法。1、JPEG压缩编码方法为了保证图像质量损失不大而又有较高的压缩比,通常对同一帧图像采用两种或两种以上的编码方式。这种采用多种编码形式的方式叫“混合编码方式”。JPEG压缩编码方法有两种基本的编码方式,它们为无失真压缩编码和有失真压缩编码。(1)无失真压缩编码无失真压缩编码属于无损压缩,其压缩比一般为2∶1,由于其使用的是线性预测编码方法,因此也叫“无失真预测编码”。无失真预测编码采用了DPCM压缩算法和霍夫曼压缩算法,用硬件可以容易实现,并且可以获得质量不失真的图像。无失真压缩编码的过程(2)有失真压缩编码过程和解码过程图像处理为8×8的样本块DCT正变换量化熵编码表表压缩后的图像数据压缩编码过程解码过程熵编码表反量化表DCT逆变换恢复的8×8图像数据2、MPEG压缩编码MPEG在对图像进行处理时,根据图像的性质,可以把它分成三种类型:即帧内编码图像(Intrapictures)又叫“I图像”,预测编码图像(Predictedpictures)又叫“P图像”,双向预测编码图像(BidirectionalPrediction)又叫“B图像”。帧内编码图像:(即I图像)是一个独立的帧图像,其信息是由自身画面所决定的,它不需要参照其它画面来生成,它是P图像和B图像的参考图。I图像的压缩比一般不大,但是可提供随机存取的位置。编码图像的第一帧通常使用I图像。预测编码图像:(即P图像)该图像的编码需要通过对前边相邻的一帧I图像或P图像进行预测而得到。其目的是把前面的图像作为预测下一帧图像的参照物,使图像编码的数据量减少,达到压缩数据的目的。双向预测编码图像:(即B图像)该图像的数据压缩比最高,但是它在预测时需要前一帧和后一帧图像的信息。另外,双向预测编码图像不能作为其它图像的参考,它也不能作为图像的第一帧。3、H.263/H.261编码是一种帧间预测减少时域冗余、变换编码减少空域冗余的混合编码方法。H.263是ITU-T在原先H.261的基础上加以改进和发展起来的。适用于低速率下的视频编码标准,主要用于低于384K速率的应用场合,在低速率的会议电视系统中得到了广泛的应用。它总共提供有SQCIF、QCIF、CIF、4CIF、16CIF五种压缩编码的算法。3.1.3图像和视频压缩的国际标准静态图像压缩编码标准-JPEG动态图像压缩编码标准-MPEG电视电话和电视会议编码标准-H.2633.1.3.1静态图像压缩编码标准-JPEGJPEG(JointPhotographicExpertsGroup)是静态图像压缩标准的缩写。1992年成为国际标准。它是国际上第一个彩色、灰度、静止图像的国际压缩标准。JPEG标准既适用于静态图像的压缩,也适用于电视图像序列的帧内图像的压缩编码。它是一个实用范围非常广泛的通用标准。JPEG标准的特点JPEG标准属于有损失真压缩编码,即压缩后的图像质量与原始图像的质量之间存在有差别。JPEG编码标准的压缩比具有可调性,通常在保存文件时可以根据需要选择合适的压缩比。压缩比越高,图像质量越差,文件的数据量越小。压缩比越小,图像质量越好,但文件的数据量则越大。3.1.3.2动态图像压缩编码标准-MPEGMPEG是动态图像专家组(MovingPictureExpertsGroup)的英文缩写。这个专家组始建于1988年,它的成员均为视频、音频及系统领域的技术专家。专家组的目标是针对活动图像的数据进行压缩。所研究内容,主要有数字视频的压缩,数字音频的压缩以及数字音视频的同步压缩等。MPEG标准的特点是一个国际化的标准,具有良好的兼容性。比其它算法具有更高的压缩比,最高可达200:1。在提供高压缩比的同时,对数据的损失量很小。压缩比通常在40:1左右时,仍能提供较好的图像效果。MPEG的标准MPEG-1MPEG-2MPEG-4MPEG-7MPEG-211、MPEG-1标准:1988年5月制定,1992年11月形成国际标准,它是世界上第一个集成视频、音频编码的标准。它主要用于对活动图像以及伴音信号进行压缩编码。它可针对SIF标准分辨率(NTSC制式为352×240,PAL制式为352×288)的图像进行压缩,具有CD音质,图像质量级别基本与VHS相当。MPEG的编码速率最高可达4-5Mb/s,但随着速率的提高,其解码后的图像质量有所降低。广泛用于VCD光盘的制作。2、MPEG-2标准:1990年6月制定,1994年11月形成国际标准,设计目标是高级工业标准的图像质量以及更高的传输率。MPEG-2支持满屏的电视画面分辨率(NTSC制式为720×480,PAL制式为720×576),画面质量达到了广播级的标准,适应于高清晰度电视(HDTV)信号的传送与播放,除了用做DVD的制作外,还用于广播、有线电视网、电缆网络以及卫星直播提供广播级的数字视频。3、MPEG-4标准:1993年7月制定,1999年5月形成国际标准的第一个版本,随后又完成了MPEG-4标准的2、3、4版本的标准。MPEG-4标准是目前视频压缩技术中的最高水平。主要用于视频电话、视频电子邮件和电子新闻等。其传输速率要求的很低,视频码率在5Kb/s-10Mb/s之间,音频码率在2Kb/s-64Kb/s之间。MPEG-4利用很窄的带宽,通过帧的重建技术压缩和传输数据,来达到以最少的数据获得最佳的图像质量。4、MPEG-7标准:于1997年7月制定,2001年9月成国际标准,MPEG-7并不是一种压缩编码方法,而是一个多媒体内容描述接口。MPEG-7力求能够快速且有效地搜索出用户所需的不同类型的多媒体影像资料。它的应用领域主要是数字化图书馆、各种多媒体目录业务、广播媒体的选择以及多媒体编辑等领域。5、MPEG-21标准:制定工作于2001年12月完成。是一个旨在创建广泛深入的“多媒体框架”的研究课题。它不同于别的MPEG标准,MPEG-21将从全面的消费者需求目录开始工作,而不是从压缩或描述技术的细节开始并逐渐发展的。3.1.3.3电视电话和电视会议编码标准-H.263于1996年发布,是标准的视频会议编码解码标准,对低数据速度和相对低的运动进行了优化。H.263是在H.261和MPEG-1标准的基础上发展形成的,为产生低于64kb/s传输速度下获得更好的质量而设计。3.1.4流媒体压缩编码基础随着信息时代的到来,网络发展到今天,流媒体技术的出现,使互联网传播在线播放数字电影和数字音乐的设想已经成为现实。3.1.4.1流媒体的定义所谓流媒体是指采用流式传输方式在Internet播放的媒体格式,把连续的影像和声音信息,经过压缩处理后,放到网络服务器上,让用户一边下
本文标题:多媒体数据的常用压缩编码方法常用压缩编码的基本原理和处理方法
链接地址:https://www.777doc.com/doc-4920651 .html