您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 广告经营 > 多媒体技术ppt好资源-第03讲多媒体数据压缩基础
第3章多媒体数据压缩基础3.1媒体元素的特点3.2数据压缩编码简介3.3统计编码3.4预测编码3.5变换编码媒体元素的特点3.11.文本——是以文字和各种专用符号表达的信息形式,它是现实生活中使用得最多的一种信息存储和传递方式。用文本表达信息给人充分的想象空间,它主要用于对知识的描述性表示,如阐述概念、定义、原理和问题以及显示标题、菜单等内容。2.图形——是指由外部轮廓线条构成的矢量图。即由计算机绘制的直线、圆、矩形、曲线、图表等。3.图像——是多媒体中最重要的信息表现形式之一,它是决定一个多媒体软件视觉效果的关键因素。4.视频——指将一系列的静态影像以电信号方式加以捕捉,纪录,处理,储存,传送,与重现的各种技术。5.音频——按表达形式,声音分为讲解、音乐、效果三类。6.动画——动画是利用人的视觉暂留特性,快速播放一系列连续运动变化的图形图像,也包括画面的缩放、旋转、变换、淡入淡出等特殊效果。数据压缩编码简介(1)数据压缩的必要性图像信号:黑白480×360,8bit;大小是480×360÷1024=168.45KB彩色大小是480×360×3÷1024=506.25KB视频:PAL制每秒数据量506.25KB×25帧/秒=12.36MB/s(2)数据压缩的可能性空间冗余时间冗余结构冗余视觉冗余知识冗余信息熵冗余3.2数据压缩的可能性P16●[1]空间冗余——规则物体的物理相关性[2]时间冗余——视频与动画画面间的相关性[3]统计冗余——具有空间冗余和时间冗余[6]视觉冗余——视觉、听觉敏感度和非线性感觉[7]知识冗余——凭借经验识别[4]结构冗余——规则纹理、相互重叠的结构表面[5]信息熵冗余——编码冗余,数据与携带的信息10110001110010110001110001011010101010111100010111111010224色28色声音频率文字组句色彩渐变主观意识::教学进程(1)空间冗余–静态图像中存在的最主要的一种数据冗余–在同一幅图像中,规则物体和规则背景的表面物理特性具有相关性–即对同一景物表面上采样点的颜色之间存在着空间连贯性–例如:图像中一片连续的区域,其像素为相同的颜色—空间冗余数据压缩的可能性P16●(2)时间冗余–序列图像(电视图像、动画)和语音数据中所经常包含的冗余–一组连续的画面之间往往存在着时间和空间的相关性例如:唱歌的歌手、两人谈话时背景一致等数据压缩的可能性P16●(3)统计冗余是空间冗余和时间冗余的总称。在数据处理时,往往采用统计事件出现概率的办法来鉴别空间冗余和时间冗余,因此空间冗余和时间冗余具有统计特性。数据压缩的可能性P16●(4)结构冗余–在某些场景中,存在着明显的分布模式——结构–结构可以通过特定的过程来生成–例如:方格状的地板,蜂窝,砖墙等数据压缩的可能性P16●(5)信息熵冗余–信息熵:一组数据所携带的信息量。–冗余的产生是因为:在信源符号的表示过程中未遵循信息论下最优编码而造成。–通过熵编码进行压缩数据压缩的可能性P16●(6)视觉冗余–可以根据这些视觉特性来对图象信息进行取舍–人类的视觉系统对图像场的敏感性:非均匀和非线性的对亮度变化敏感,而对色度的变化相对不敏感在高亮度区,人眼对亮度变化敏感度下降对物体边缘敏感,内部区域相对不敏感对整体结构敏感,而对内部细节相对不敏感数据压缩的可能性P16●(7)知识冗余–有许多图像的理解与某些基础知识有相当大的相关性这类规律性的结构可以由先验知识和背景知识得到例如:人脸的图像知识冗余是模型编码的基础数据压缩的可能性P16●●多媒体数据压缩的性能指标●压缩比●压缩性能常常用压缩比定义(输入数据和输出数据比)例:512×480,24bit/pixel(bpp)输出15000byte输入=737280byte压缩比=737280/15000=49教学进程节省图象或视频的存储容量,增加访问速度,使数字视频能在PC机上实现,需要进行视频和图象的压缩。有三个关键参数评价一个压缩系统:压缩比、图象质量、压缩和解压的速度,●压缩质量●压缩方法分为无损压缩和有损压缩,对于有损压缩:失真情况很难量化,只能对测试的图象进行估计。模拟图象质量的指标:信噪比、分辨率、颜色错,但必须在观察了实际图象以后。教学进程●压缩和解压缩速度●在许多应用中,压缩和解压可能不同时用,在不同的位置不同的系统中。所以,压缩、解压速度分别估计。静态图象中,压缩速度没有解压速度严格;动态图象中,压缩、解压速度都有要求,因为需实时地从摄像机或VCR中抓取动态视频。●多媒体数据压缩的性能指标(3)数据压缩编码分类•无损压缩–指使用压缩后的数据进行重构(或者叫做还原,解压缩),重构后的数据与原来的数据完全相同。–无损压缩算法一般压缩比2~4。–常用的无损压缩算法有霍夫曼(Huffman)算法和LZW(Lenpel-Ziv&Welch)压缩算法。•有损压缩–指使用压缩后的数据进行重构,重构后的数据与原来的数据有所不同,但不影响人对原始资料表达的信息造成误解。–图像和声音的压缩就可以采用有损压缩,因为其中包含的数据往往多于我们的视觉系统和听觉系统所能接收的信息,丢掉一些数据而不至于对声音或者图像所表达的意思产生误解,但可大大提高压缩比。3.2数据压缩编码简介压缩技术分类通用数据压缩(均为无损压缩)多媒体数据压缩(无损和有损压缩)基于统计模型的压缩技术基于字典模型的压缩技术Huffman编码算术编码LZ77LZ78LZW图像压缩音频和视频压缩MPEG等二值图像CCITTJBIG等灰度图像FELICSJPEG等彩色图像RLE编码JPEG等矢量图像PostScriptWMFCAD等压缩技术的应用电报、传真(CCITT)通讯(Modem/网络协议)存储(压缩池)文件系统(压缩扇区)图像(GIF/TIFF/JPEG)音频(MP3)视频(MPEG/RM)数据库(B+树)归档(TAR/ZIP)密码学(消除数据的原始特征)全文索引(倒排索引表)编译(JAVA)程序设计(算法/空间和时间效率)人工智能(专家系统/知识树)压缩编码分类(按长度)•等长编码–ASCII编码•不等长编码–编码长度是不等长的–常见编码如Huffman编码等长与不等长编码•例如:符号序列x=“aabbccccddddeeeeeeee”采用ASCII编码:–a=01100001–b=01100010–c=01100011–d=01100100–e=01100101–空=00100000等长编码:24*8=192bit如用后3位进行编码只需要3*24=72bit压缩比为:72/192=等长与不等长编码•不等长编码方法–字符次数概率码字字长–E81/301–D41/61003–C41/61013–空41/61103–a21/1211104–B21/1211114需要空间:1*8+3*4+3*4+3*4+2*4+2*4=60平均码长=总位数/字符出现次数=60/24=2.5不等长码唯一性问题–字符码1码2码3–A000–B101001–C11011011–D111001111对序列010110译码码1abc码2daca或ddb或abca码3bca3.3统计编码(1)信息熵与信息量信息量是指从N个相等的可能事件中选出一个事件所需要的信息度量或含量,也就是在辨识N个事件中特定的一个事件的过程中所需要提问“是或否”的最少次数。设从N个数中选定任一个数xj的概率为p(xj),假定选定任意一个数的概率都相等,即p(xj)=1/N,因此定义其信息量为:P(xj)是信源X发出xj的概率。I(xj)的含义是,信源X发出xj这个消息(随机事件)后,接收端收到信息量的量度。)]([)(loglog/1log)(222jjjxpIxpNNxI(1)信息熵与信息量来源于40年代由ClaudeShannon创立的信息论中的一条定理,这一定理借用了热力学中的名词“熵”(Entropy)来表示一条信息中真正需要编码的信息量。信源S发出的xj(j=1,2,…,n)共n个随机事件的自信息统计平均,即H(X)称为信源X的“熵”,即信源X发出任意一个随机变量的平均信息量。其中:等概率事件的熵最大,为:当P(x1)=1时,P(x2)=P(x3)=…=P(xj)=0,由(4-6)式得此时熵为由上可得熵的范围为:njjjjxPxPxIESH12)(log)()}({)(NNNSHNj221log1log1)(0)(log)()(121xPxPSHNSH2log)(03.3统计编码平均码长与熵关系在编码中用熵值来衡量是否为最佳编码。若以Lc表示编码器输出码字的平均码长,则当Lc≥H(S)有冗余,不是最佳。Lc<H(S)不可能。Lc=H(S)最佳编码(Lc稍大于H(S))。熵值为平均码长Lc的下限。平均码长Lc的计算公式为其中:P(xj)是信源X发出xj的概率,L(xj)为xj的编码长。njjjcxLxPL1)()((j=1,2,…,n)3.3统计编码熵的计算范例例:对信息aabbaccbaa,字符串长度为10,字符a、b、c分别出现了5、3、2次,则Ia=-log2(0.5)=1Ib=-log2(0.3)=1.737Ic=-log2(0.2)=2.322H(S)=0.5Ia+0.3Ib+0.2Ic=1.4855如采用等长编码,则每个字符需要2位;总的码长:L=5*2+3*2+2*2=20位对比一下,我们用ASCII编码表示该信息需要80位统计编码(熵)•统计编码是根据消息出现概率的分布特性而进行的压缩编码•在消息和码字间找到明确的一一对应关系,以便恢复时能准确无误再现出来技术准备:编码通过模型,我们可以确定对某一个符号该用多少位二进制数进行编码。现在的问题是,如何设计一种编码方案,使其尽量精确地用模型计算出来的位数表示某个符号。前缀编码规则:任何一个符号的编码都不是另一个符号编码的前缀。最简单的前缀编码字符编码A0B10C110D1110E111101110010101110110111100010DABBDCEAABShannon-Fano编码•采用从上到下的方法进行编码。•仙农-范诺(Shannon-Fano)算法:–首先按照符号出现的频度或概率排序,–使用递归方法分成两个部分,每一部分具有近似相同的次数(概率)–当概率和为1,进行编码Shannon-Fano编码例1•有一幅40个象素组成的灰度图像,灰度共有5级,分别用符号A、B、C、D和E表示,40个象素中出现灰度A的象素数有15个,出现灰度B的象素数有7个,出现灰度C的象素数有7个等等。如果用3个位表示5个等级的灰度值,也就是每个象素用3位表示,编码这幅图像总共需要120位。符号ABCDE出现的次数157765H(S)=(15/40)*(40/15)+(7/40)*(40/7)+…+(5/40)*(40/5)=2.196这就是说每个符号用2.196位表示,40个象素需用87.84位Shannon-Fano编码例1符号出现的次数()分配的代码需要的位数A15(0.375)1.41500030B7(0.175)2.51450114C7(0.175)2.51451014D6(0.150)2.736911018E5(0.125)3.000011115Shannon-Fano编码例2例题:cabcedeacacdeddaaabaababaaabbacdebaceada例子中的信息编码为:1000011011111011100100010......码长共91位,而使用ASCII编码表示上述信息共需要320位a–16b–7c–6d–6e-5a–16b–7---------c–6-----d–6e-5a–00b–01c–10d–110e–111root0010111abcde03.3统计编码-霍夫曼编码依据信源字符出现的概率大小来构造代码,对出现概率较大的信源字符,给予较短码长,而对于出现概率较小的信源字符,给予较长的码长,最后使得编码的平均码字最短。3.3统计编码-霍夫
本文标题:多媒体技术ppt好资源-第03讲多媒体数据压缩基础
链接地址:https://www.777doc.com/doc-1473854 .html