多媒体图像压缩技术

多媒体图像压缩技术2010级电子信息科学与技术刘小辉2010271022摘要：随着计算机多媒体技术的不断发展，人们期望更高性能的图像压缩技术的出现。图像压缩是用最少的数据量来表示尽可能多的原图像的信息。多媒体数据压缩技术是现代网络发展的关键性技术之一。由于图像和声音信号中存在各种各样的冗余，为数据压缩提供了可能。数据压缩技术有无损压缩缩和有损压缩两大类，这些压缩技术又各有不同的标准。Abstract:Withtheever-growingmultimediatechnology,peoplearelookingforwardtonewimagecompressiontechnologieswithbetterperformances.Imagecompressionwiththeleastamountofdataisrepresentedasmuchinformationoforiginalimage.Multimediadatacompressiontechnologyisthemodernnetworkdevelopmentofthekeytechnologyof.Becauseoftheimageandsoundsignalinthepresenceofvariouskindsofredundancy,compressionofdataispossible.Datacompressiontechnologyoflosslessandlossycompressiontwocategories,thesecompressiontechniquesanddifferentstandards.关键字（Keyword）：多媒体数据压缩技术（Multimediadatacompressiontechnology）无损压缩和有损压缩（Losslessandlossycompression）图像和声音信号（Theimageandsoundsignal）最少的数据量（Theleastamountofdata）随着计算机多媒体技术和通信技术的日益发展，以及网络的迅速普及，图像数据信息以其直观、形象的表现效果，在信息交流中的使用越来越广泛。每天都有大量的图像信息通过数字方式进行存储、处理和传输。由于技术上对图像数据的要求，图像的分辨率在不断增加。由此导致图像数据量急剧增加。这就给图像的传输和存储带来了极大的困难。因此，图像数据压缩势在必行，通过压缩手段将信息的数据量降下来，以压缩的形式存储和传输，既节约了存储空间，又提高了通信干线的传输效率【1】。在信息环境中，大量的信息是以数字化的方式表示、存储和传输的，而这些数字化信息中图像信息又占了绝大部分。但是数字化后，图像占的空间是巨大的，如一幅分辨率为512×512、颜色深度为8位的黑白图像将占256kB的存储空间；同样，一副彩色图像则占3×256＝768kB，一副2330×2330×8bit地气象卫星红外云图占4.74MB。这样，一颗卫星每天的数据量为1.1GB，而当前的80G硬盘仅可以存储约70天的卫星云图资料。这样的存储需求是不可思议的，也是让人不能忍受的。为了对图像数据进行有效的处理、存储和传输，必须对图像数据进行压缩存储。数字图像信息压缩编码也就成为多媒体信息处理中的关键技术之一。1常用图像数据压缩编码方法数据编码，就是用某种方式对信息的符号进行表示。数据压缩中所指的数据编码是通过选用有效的表示方法，减少表示信息的数据量，从而达到数据压缩的目的。按照压缩还原效果是否存在失真，数据压缩分为无损压缩和有损压缩。对于某些数据（如计算机应用软件程序）里面的每个数据都不容许有任何变更，因此是无损压缩。而对于一副彩色照片，它的某些对人眼不敏感的地方被压缩掉，从而可以提高压缩比，此为有损压缩。前者又称为可逆压缩或无失真压缩，后者称为不可逆压缩和有失真压缩。通常图像数据压缩编码方法用的是无损压缩，无损压缩就是把数据中的冗余去掉或减少，但这些冗余量是可以重新插入到数据中的，因而不会产生失真。该方法一般用于文本数据的压缩，它可以保证完全地恢复原始数据；其缺点是压缩比小(其压缩比一般为2：1至5：1)。有损压缩是对熵进行压缩，因而存在一定程度的失真；它主要用于对声音、图像、动态视频等数据进行压缩，压缩比较高(其压缩比一般高达20：1以上。对于多媒体图像采用的有损压缩的标准有静态图像压缩标准(JPEG标准)和动态图像压缩标(MPEG标准)。JPEG利用了人眼的心理和生理特征及其局限性来对彩色的、单色的和多灰度连续色调的、静态图像的、数字图像的压缩，因此它非常适合不太复杂的以及一般来源于真实景物的图像。它定义了两种基本的压缩算法：一种是基于有失真的压缩算法，另一种是基于空间线性预测技术(DPCM)无失真的压缩算法。MPEG用于活动影像的压缩。MPEG标准具体包三部分内容：(1)MPEG视频、(2)MPEG音频、(3)MP系统(视频和音频的同步)。MPEG视频是标准的核心分，它采用了帧内和帧间相结合的压缩方法，以离散余变换(DCT)和运动补偿两项技术为基础，在图像质量基不变的情况下，MPEG可把图像压缩至1／100或更MPEG音频压缩算法则是根据人耳屏蔽滤波功能。利用音响心理学的基本原理，即“某些频率的音响在重放其频率的音频时听不到”这样一个特性，将那些人耳完全不到或基本上听到的多余音频信号压缩掉，最后使音频号的压缩比达到8：1或更高，音质逼真，与CD唱片可媲美。按照MPEG标准，MPEG数据流包含系统层和压层数据。系统层含有定时信号，图像和声音的同步、多分配等信息【1】。2多媒体数据压缩技术的实现方法【3】目前多媒体压缩技术的实现方法已有近百种，其中基于信源理论编码的压缩方法、离散余弦变换(DCT)和小波分解技术压缩算法的研究更具有代表性。小波技术突破了传统压缩方法的局限性，引入了局部和全局相关去冗余的新思想，具有较大的潜力，因此近几年来吸引了众多的研究者。在小波压缩技术中，一幅图像可以被分解为若干个叫做“小片”的区域；在每个小片中，图像经滤波后被分解成若干个低频与高频分量。低频分量可以用不同的分辨率进行量化，即图像的低频部分需要许多的二进制位，以改善图像重构时的信噪比。低频元素采用精细量化，高频分量可以量化得比较粗糙，因为你不太容易看到变化区域的噪声与误差。此外，碎片技术已经作为一种压缩方法被提出，这种技术依靠实际图形的重复特性。用碎片技术压缩图像时需要占用大量的计算机资源，但可以获得很好的结果。借助于从DNA序列研究中发展出来的模式识别技术，能减少通过WAN链路的流量，最多时的压缩比率能达到90％，从而为网络传送图像和声音提供更大的压缩比，减轻风络负荷，更好地实现网络信息传播。3压缩原理【2】由于图像数据之间存在着一定的冗余，所以使得数据的压缩成为可能。信息论的创始人Shannon提出把数据看作是信息和冗余度（redundancy）的组合。所谓冗余度，是由于一副图像的各像素之间存在着很大的相关性，可利用一些编码的方法删去它们，从而达到减少冗余压缩数据的目的。为了去掉数据中的冗余，常常要考虑信号源的统计特性，或建立信号源的统计模型。图像的冗余包括以下几种：(1)空间冗余：像素点之间的相关性。(2)时间冗余：活动图像的两个连续帧之间的冗余。(3)信息熵冗余：单位信息量大于其熵。(4)结构冗余：图像的区域上存在非常强的纹理结构。(5)知识冗余：有固定的结构，如人的头像。(6)视觉冗余：某些图像的失真是人眼不易觉察的。对数字图像进行压缩通常利用两个基本原理：(1)数字图像的相关性。在图像的同一行相邻像素之间、活动图像的相邻帧的对应像素之间往往存在很强的相关性，去除或减少这些相关性，也就去除或减少图像信息中的冗余度，即实现了对数字图像的压缩。(2)人的视觉心理特征。人的视觉对于边缘急剧变化不敏感(视觉掩盖效应)，对颜色分辨力弱，利用这些特征可以在相应部分适当降低编码精度，而使人从视觉上并不感觉到图像质量的下降，从而达到对数字图像压缩的目的。编码压缩方法有许多种，从不同的角度出发有不同的分类方法，比如从信息论角度出发可分为两大类：(1)冗余度压缩方法，也称无损压缩，信息保持编码或熵编码。具体讲就是解码图像和压缩编码前的图像严格相同，没有失真，从数学上讲是一种可逆运算。(2)信息量压缩方法，也称有损压缩，失真度编码或熵压缩编码。也就是讲解码图像和原始图像是有差别的，允许有一定的失真。衡量一个压缩编码方法优劣的重要指标(1)压缩比要高，有几倍、几十倍，也有几百乃至几千倍；(2)压缩与解压缩要快，算法要简单，硬件实现容易；(3)解压缩的图像质量要好。4JPEG图像压缩算法【4】JPEG压缩分四个步骤实现：（1）.颜色模式转换及采样；（2）.DCT变换；（3）.量化；（4）.编码。4．1颜色模式转换及采样RGB色彩系统是我们最常用的表示颜色的方式。JPEG采用的是YCbCr色彩系统。想要用JPEG基本压缩法处理全彩色图像，得先把RGB颜色模式图像数据，转换为YCbCr颜色模式的数据。Y代表亮度，Cb和Cr则代表色度、饱和度。人类的眼晴对低频的数据比对高频的数据具有更高的敏感度，事实上，人类的眼睛对亮度的改变也比对色彩的改变要敏感得多，也就是说Y成份的数据是比较重要的。既然Cb成份和Cr成份的数据比较相对不重要，就可以只取部分数据来处理。以增加压缩的比例。JPEG通常有两种采样方式：YUV411和YUV422，它们所代表的意义是Y、Cb和Cr三个成份的资料取样比例。4．2DCT变换DCT变换的全称是离散余弦变换(DiscreteCosineTransform)，是指将一组光强数据转换成频率数据，以便得知强度变化的情形。若对高频的数据做些修饰，再转回原来形式的数据时，显然与原始数据有些差异，但是人类的眼睛却是不容易辨认出来。JPEG将整个亮度矩阵与色度Cb矩阵，饱和度Cr矩阵，视为一个基本单元称作MCU。每个MCU所包含的矩阵数量不得超过10个。例如，行和列采样的比例皆为4:2:2，则每个MCU将包含四个亮度矩阵，一个色度矩阵及一个饱和度矩阵。4．3、量化图像数据转换为频率系数后，还得接受一项量化程序，才能进入编码阶段。量化阶段需要两个8*8矩阵数据，一个是专门处理亮度的频率系数，另一个则是针对色度的频率系数，将频率系数除以量化矩阵的值，取得与商数最近的整数，即完成量化。当频率系数经过量化后，将频率系数由浮点数转变为整数，这才便于执行最后的编码。4．4编码Huffman编码无专利权问题，成为JPEG最常用的编码方式，Huffman编码通常是以完整的MCU来进行的。编码时，每个矩阵数据的DC值与63个AC值，将分别使用不同的Huffman编码表，而亮度与色度也需要不同的Huffman编码表，所以一共需要四个编码表，才能顺利地完成JPEG编码工作。实现上述四个步骤，即完成一幅图像的JPEG压缩。5结语对多媒体数据进行数据压缩是实现现时有效地处理、传输和储存多媒体数据的首要问题和根本方法。视屏图像压缩的出发点是利用各种算法将数据冗余压缩到最小，以保留尽可能少的有用信息，为了使压缩后的数据能够互换，必须规定通用的标准格式。国际上静止图像压缩标准时JPEG，而活动图像压缩标准是MPEG-1，MPEG-2和MPEG-4。到目前为止，虽然图像压缩技术已很成熟，并得到了广泛应用，但是人们人在继续研究，以追求更高的压缩效率和更好的图像质量。参考文献:[1]李煌晖,朱山风,段上为等译．多媒体数字压缩原理与标准．第一版．北京；电子工业出版社．[2]李安强,张青.多媒体资源库图像自动压缩处理技术分析[J],微计算机信息.2009,5(3):309-310[3]蔡安妮,孙景鳘.多媒体通信技术基础电子工业出版杜.2000[4]龚华,刘雪松,张奎刚.JPEG标准格式的编码方法[J].微处理机.

多媒体图像压缩技术

免费阅读已结束，点击付费阅读剩下 ... 页

阅读已结束，您可以下载文档离线阅读

酒店锅炉房设备巡回检查规定

时代光华课程ISO9001(中)

品牌定位规划与传播

人力资源部述职报告(总结计划模板)

张敏01110007傅翊群-衰退品牌在市场竞争体制下的生存

铺实木复合地板选地板十大品牌

颅内动脉瘤的诊断与治疗现状

新会计准则体系改革要点

利润及利润分配表2

融资性担保公司的会计制度和会计核算

相关文档

相关搜索