您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 广告经营 > 多媒体数据压缩编码技术
第二章多媒体数据压缩编码技术2/146第二章多媒体数据压缩编码技术2.1多媒体数据压缩基本原理2.2数据压缩与解压缩常用算法2.3多媒体数据压缩常用标准3/1462.1多媒体数据压缩基本原理2.1.1数据压缩的必要性与可能性2.1.2数据冗余的基本概念和种类2.1.3图像压缩预处理技术2.1.4量化及其质量2.1.5数据压缩算法综合评价指标4/1462.1.1数据压缩的必要性与可能性数据压缩必要性数据量大BGR图像:一张640×480真彩(24位)的图像需:640×480×24=7372800(bit)=900KB(1Byte=8bit)相当于约46万汉字5/1462.1.1数据压缩的必要性与可能性数据压缩必要性数据量大视频:以这样的图像构成视频,以每秒30帧进行播放,所需数据量为:7372800×30≈26.37MB一张650MB(5200Mb)的光盘只能存储约25秒的视频节目很难满足计算机处理多媒体的要求6/1462.1.1数据压缩的必要性与可能性数据压缩必要性数据量大音频:以44.1KHz采样频率,量化为16bit双通道立体声,每秒数据量为:44100×16×2=1411200(bit)≈172.3KB一张650MB的光盘能存放:650×1024/172.3≈64分钟很难满足计算机处理多媒体的要求7/1462.1.1数据压缩的必要性与可能性数据压缩的可能性数字化的多媒体数据可以进行数据压缩是基于两种事实信息的冗余度:多媒体数据中存在大量的冗余,如:300…00(后跟100个0),可以表示为30(100),表示3后跟100个0,从而避免大量的重复0。(科学记数法)数据(文字、图形、声音、视频等)在计算机中都是以二进制值0、1来表达、存储和传输,其数值之间有空间相关和时间相关性。利用相关性可以进行压缩。8/1462.1.1数据压缩的必要性与可能性数据压缩的可能性数字化的多媒体数据可以进行数据压缩是基于以下两种事实人的视觉及听觉等感官特性视觉特征表现为对亮度信息很敏感而对边缘的急剧变化不敏感听觉特征表现出对部分音频信号不敏感,如人的听觉具有一个强音能抑制一个同时存在的弱音现象,而且人耳对低频端比较敏感,而对高频端不太敏感因此,完全可以利用这些特性去除一些多余及不敏感的信息,从而实现对数据的压缩9/1462.1.2数据冗余的基本概念与种类数据冗余的基本概念多媒体数据的数据量远远大于其所携带的信息量例:180个汉字,文本数据量为360B。广播员朗读使用1分钟,数字化时采样频率8000Hz,单声道,8为量化,则数据量为8000X60=480KB。可见,传递同样信息,语音数据有1300倍冗余数学描述:I=D-duI:信息量D:数据量du:冗余量10/1462.1.2数据冗余的基本概念与种类数据冗余的基本概念复习——信息量指从N个相等的可能事件中选出一个事件所需要的信息度量和含量复习——信息熵信源平均信息量I(x)=log2N=-log2=-log2p(x)1NH(x)=H(p(x1),(p(x2),…,p(xn))=-∑p(xi)×log2p(xi)i=1nn为数据或码元的个数,p(xi)为码元xi发生的概率11/1462.1.2数据冗余的基本概念与种类数据冗余的基本概念为使单位数据量D接近或等于H,应其中b(xi)为分配给码元xi的比特数。理论情况下,应取但实际上很难确定各码元的概率,因此,一般总取b(x1)=b(x2)=...=b(xn),即分配给每个码元的比特数相等(等长码),这样所得的D必然大于H,从而形成了信息冗余。例如,英文字母编码码元长为7bit,这样d必然大于H,由此带来的冗余称为信息熵冗余或编码冗余12/1462.1.2数据冗余的基本概念与种类数据冗余的类别空间冗余图像数据中,大量的相邻像素完全一样或十分接近时间冗余时间类媒体中经常存在地冗余相邻两帧的大部分数据无变化,只有少量数据变化AAA13/1462.1.2数据冗余的基本概念与种类数据冗余的类别结构冗余:图像由有规律的图案组成信息熵冗余:数据携带的信息量少于数据本身视觉冗余:由人的视觉特性所产生的冗余,人的视觉系统一般的分辨能力约为26灰度等级,而图像量化一般采用28灰度等级,这样的冗余就称为视觉冗余14/1462.1.2数据冗余的基本概念与种类数据冗余的类别知识冗余:图像的记录方式与人对该图像的知识之间的差异而产生。例如人脸的图像就有固定的结构,鼻子位于脸的中线上,上方是眼睛,下方是嘴等。我们可以构造其基本模型,并创建对应各种特征的图像库,进而图像的存储只需要保存一些特征参数,就可以大大减少数据量其他冗余:如图像的空间非定常特性所带来的冗余15/1462.1.3图像压缩预处理技术图像数据压缩的任务是在不影响或少影响图像质量的前提下,尽量设法减少图像数据中的数据量图像数据中存在各种冗余,数据压缩的首要任务就是去除各种冗余数据。当然删除冗余数据必然会给图像质量带来一定的损失,这就需要进行相应的预处理,来保证将这种损失降至最低限度16/1462.1.3图像压缩预处理技术图像预处理采用的主要技术二次抽样滤波器量化预测编码运动补偿变长码图像内插法17/1462.1.4压缩编码中的量化及其质量量化从模拟信号到数字信号的量化压缩编码中的量化以PCM码为输入,在量化器经过某种变换后输出存在量化误差量化方法标量量化矢量量化18/1462.1.4压缩编码中的量化及其质量量化量化方法——标量量化对经过映射变换后的数据或PCM数据逐个进行量化,在这种量化中,所有采样使用同一个量化器进行量化,每个采样的量化都与其他采样无关,也称为零记忆量化包含均匀量化和非均匀量化两种均匀量化非均匀量化19/1462.1.4压缩编码中的量化及其质量量化量化方法——矢量量化是近年来发展起来的一种新的编码方法,是一种有损的编码方案,其主要思想是先将输入的语音信号按一定方式分组,再把这些分组数据看成一个矢量,对它进行量化。每组形成的矢量看成一个元素,又叫码字,这些码字排列起来,就构成了一个表(码表),这样在接收端放置同样的码表,当接收到码字的下标信息后,就可以通过查表的到码字信息此方法以输入矢量与选出的码字之间失真最小为依据,与标量量化相比,它有更大的数据压缩比。但其关键问题是设计一个良好的码本20/1462.1.5数据压缩算法综合评价指标压缩倍数也称压缩率,有两种衡量方法方法一:压缩前后总的数据量之比例如:1024X768黑白图像,每像素8bit,将其分辨率降为512X384,再压缩使每像素用0.5bit,则其压缩倍数为64倍,压缩比为1:64将任何非压缩算法产生的效果(如降低分辨率、帧率等)排除在外,用压缩后的比特流中每个显示像素的平均比特数来表示例如:以15000字节存储一幅256×240的图像,则压缩率为(15000×8)/(256×240)=2比特/像素21/1462.1.5数据压缩算法综合评价指标图像/音频质量评估解压缩后所得数据的质量,常采用客观评估和主观评估两种方法客观评估:是通过一种具体的算法来统计多媒体数据压缩结果的评估方法,常使用信噪比来评价主观评价:由人主观进行打分以进行评价。具体做法是:由若干人(一般分专业组、非专业组)对所观测的重建图像的质量按很好、好、尚可、不好、坏五个等级评分,然后计算出平均分数MOS,一般MOS4分以上即为可收费标准22/1462.1.5数据压缩算法综合评价指标图像/音频质量解压缩后所得数据的质量还与压缩时所采用的压缩方法相关无损压缩:压缩后的数据经解压缩还原后与原始数据完全相同,压缩倍数不大有损压缩:压缩后的数据经解压缩还原后与原始数据不完全相同,压缩倍数较大,解压缩后的数据质量会降低23/1462.1.5数据压缩算法综合评价指标压缩和解压缩的速度压缩和解压缩速度是压缩系统的两项重要指标对称压缩:压缩和解压缩需要实时进行,如电视会议的图像传输,压缩和解压缩速度相同非对称压缩:解压缩实时,压缩非实时,如CD-ROM的制作与播放,压缩比解压缩速度慢数据的计算量:压缩和解压缩都需要大量的计算,如使用MPEG-1计算352×240的图像,需126720次乘法运算和638880次加法运算。通常解压缩比压缩的计算量小,如MPEG的压缩编码计算量约为解码的4倍。24/1462.2数据压缩与解压缩常用算法2.2.1数据压缩方法的分类2.2.2哈夫曼编码2.2.3预测编码2.2.4变换编码25/1462.2.1数据压缩方法的分类数据压缩方法也称编码方法,有多种分类方法按是否产生失真分无失真编码:也称可逆编码,无损压缩,此类方法解压缩后的还原数据与原始数据完全一致有失真编码:也称不可逆编码,有损压缩,此类方法解压缩后的还原数据与原始数据不完全一致26/1462.2.1数据压缩方法的分类按原理分预测编码针对空间冗余和时间冗余利用已被编码的点的值预测邻近的点的值变换编码针对空间冗余和时间冗余将图像或时域信号变换到频域上,再进行压缩子带编码:分频带编码将数据变换到频域后,按频率分带,分别量化语言和图像27/1462.2.1数据压缩方法的分类按原理分信息熵编码根据信息熵原理,对概率大的符号用短码字表示,反之用长码字表示典型的有哈夫曼编码、行程编码、算术编码统计编码根据一幅图像像素值的统计情况进行编码压缩,也可先将图像按前述方法压缩,对所得的值加以统计,再做压缩。统计编码既可单独使用,又可用在某个算法之后做进一步的压缩最常用的统计编码方法是哈夫曼编码方法28/1462.2.1数据压缩方法的分类数据压缩方法总结特点描述无损无失真地准确地恢复原始数据有损有失真帧内独立地完成帧的编码帧间参照前、后帧对帧进行编码,并考虑帧之间的时间冗余对称编码及译码的访问几乎相等不对称编码时间比译码时间长很多实时编-译码延迟不应该超过50ms29/1462.2.1数据压缩方法的分类数据压缩方法总结30/1462.2.2哈夫曼编码最佳编码定理哈夫曼1952年提出内容:在变字长编码中,对于出现概率大的信息符号编以短字长的码,对于概率小的符号编以长字长的码。如果码字长度严格按所对应符号出现概率大小逆序排列,则平均码字长度一定小于其他以任何符号顺序排列方式得到的平均码字长度31/1462.2.2哈夫曼编码编码方法根据以上定理而得到的一种编码方法步骤1.将符号按出现概率由大到小排列,给最后两个符号赋予一个二进制码,概率大的赋1,小的赋0(反之亦可)2.把最后两个符号的概率合成一个概率,重复上一步3.重复步骤2,直到最后只剩下两个概率为止4.将每个符号所对应的分支的0,1反序排出即可32/146可以看出,概率大的符号其编码短,概率小的符号其编码长,符号使用其编码来表示,达到数据压缩目的2.2.2哈夫曼编码哈夫曼编码过程演示A1A2A3A4A5A6A70.230.210.180.150.130.070.03100.10100.23100.33100.44100.56011编码01001111101011001100033/1462.2.2哈夫曼编码哈夫曼编码过程演示34/1462.2.2哈夫曼编码哈夫曼编码结果分析编码010011111010110011000码长2233344码字的平均长度_7N=∑niP(ai)=2.72biti=1信息符号的熵值7H(a)=∑P(ai)log2P(ai)=2.61biti=1编码效率:=2.61/2.72≈96%可见,哈夫曼编码结果,其平均长度接近于信息符号的熵值,但是仍有冗余35/1462.2.2哈夫曼编码哈夫曼编码最佳情况示例信源有四个符号:Xa1a2a3a41/21/41/81/8信息熵:H(x)=-1/2log2(1/2)-1/4log2(1/4)-1/8log2(1/8)2=1.75bit/字符36/
本文标题:多媒体数据压缩编码技术
链接地址:https://www.777doc.com/doc-1473965 .html