您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 广告经营 > 多媒体数据压缩编码标准
1第4讲多媒体数据压缩编码标准24.1静态图像压缩标准JPEG34.1.1JPEG标准的主要内容ISO/IEC10918号标准“多灰度连续色调静态图像压缩编码”即JPEG标准,选定ADCT作为静态图像压缩的标准化算法。该标准为保证通用性,包含以下两种方式:空间方式可逆编码空间方式对于基本系统和扩展系统来说,被称为独立功能。DCT方式非可逆编码,包含基本系统(必须保证的功能)和扩展系统(扩充功能)4基本系统是实现DCT编码与解码所需的最小功能集,大多数的应用系统只要用此标准,就能基本上满足要求。扩展系统是为了满足更为广阔领域的应用要求而设置的。54.1.2JPEG静态图像压缩算法1.基于DPCM的无失真编码预测器熵编码器表说明无失真编码器源图像数据压缩图像数据图1无失真编码简化框图6基于DPCM的无失真编码优点是硬件易实现,重建图像质量好。缺点是压缩比太低,大约为2:1。7工作原理是对X的预测值X’,将X-X’进行无失真熵编码。对X’的求法见图给出的预测方式。cbax选择值预测选择值预测0123非预测abc4567a+b-ca+(b-c)/2b+(a-c)/2(a+b)/2(a)X邻域(b)预测方式图2预测器82.基于DCT的有失真压缩编码离散余弦变换量化处理DC系数的编码和AC系数的行程编码熵编码9图3基于DCT编码过程FDCT熵编码器表说明无失真编码器源图像数据压缩图像数据量化器表说明88块(YUV每个分量)10图4解码过程熵解码器IDCT表说明解码器逆量化器表说明88块压缩图像数据恢复的图像数据11离散余弦变换(1)首先把原始图像顺序分割成8×8子块;(2)采样精度为P位(二进制),把[0,2P-1]范围的无符号数变换成[-2P-1,2P-1]范围的有符号数,作为离散余弦正变换(FDCT)的输入;(3)在输出端经离散余弦逆变换(IDCT)后又得到一系列8×8子块,需将数值范围[-2P-1,2P-1]变换回[0,2P-1]来重构图像。12这里用的8×8FDCT的数学定义为:F(u,v)=(1/4)C(u)C(v)[∑x=07∑y=07f(x,y)·cos((2x+1)u/16)·cos((2y+1)v/16)]8×8IDCT的数学定义为:f(x,y)=(1/4)[∑u=07∑v=07C(u)C(v)F(u,v)·cos((2x+1)u/16)·cos((2y+1)v/16)]其中C(u),C(v)=1/√2当u,v=0C(u),C(v)=1其他下面的编码针对FDCT输出的64个基信号的幅值(F(0,0),…,F(7,7)称作DCT系数)来进行13量化处理量化是一个“多到一”的过程,失真原因关键是找最小量化失真的量化器,JPEG采用线性均匀量化器,定义为对64个DCT系数除以量化步长,然后四舍五入取整:FQ(u,v)=IntegerRound[F(u,v)/Q(u,v)]Q(u,v)是量化器步长,它是量化表的元素。量化表元素随DCT系数的位置和彩色分量不同有不同的值,量化表尺寸为8×8与64个变换系数一一对应。这个量化表应由用户规定(JPEG给出参考值-见后面表格),并作为编码器的一个输入。141611101624405161121214192658605514131624405769561417222951878062182237566810910377243555648110411392496478871031211201017292959811210010399表1亮度量化表1517182447999999991821266699999999242656999999999947669999999999999999999999999999999999999999999999999999999999999999999999999999表2色度量化表16量化的作用是在一定主观保真度图像质量前提下,丢掉那些对视觉影响不大的信息,通过量化可调节数据压缩比。17DC系数的编码64个变换系数经量化后,坐标u=v=0的F(0,0)称DC系数(直流分量),它即64个空域图像采样值的平均值。相邻8×8块之间DC系数有强相关性。JPEG对量化后的DC系数采用DPCM编码,即对DIFF=DCi-DCi-1编码。…blocki-1blockiDCi-1DCiDC系数差分编码18AC系数的行程编码其余63个交流系数(AC)采用行程编码。从左上方AC0,1开始沿对角线方向“Z”字形扫描直到AC7,7扫描结束,这样可增加行程中连续0的个数。AC系数编码的码字用两个字节表示,如图所示:图5Z字形扫描19图6AC系数行程编码码字两个非0值间连续0的个数表示下一个非0值需要的bit数下一个非0实际值7430字节1字节2例子:对“…,3,0,0,0,0,0,12,0,0,…”编码…,(5,4),(12),….20熵编码为了进一步压缩数据,需对DC码和AC行程编码的码字再做基于统计特性的熵编码。JPEG建议的熵编码是Huffman编码和自适应二进制算术编码。熵编码可分成两步进行:把DC码和AC行程码转换为中间符号序列给这些符号赋以变长码字21AC系数熵编码的中间格式熵编码的中间格式由两个符号组成:符号1:(行程,尺寸)符号2:(幅值)第一个信息参数“行程”表示前后两个非0的AC系数之间连续0的个数。第二个信息参数“尺寸”是后一个非0的AC系数幅值编码所需比特数。22行程取值范围为1~15,超过15时用扩展符号1(15,0)来扩充,63个AC系数最多增加3个扩展符号1。编码结束时用(0,0)表示。“尺寸”取值范围为0~10。“幅值”用以表示非0的AC系数的值,范围为[-210,210-1](最长10bit),结构形式如下表所示。231-1,12-3..-2,2..33-7..-4,4..74-15..-8,8..1567……89-511..-256,256…51110-1023..-512,512…1023表3符号2结构24DC系数的熵编码对于直流分量DC也有类似于AC系数的编码格式符号1:(尺寸)符号2:(幅值)“尺寸”表示DC差值的幅值编码所需的比特数,而“幅值”表示DC差值的幅值,范围为[-211,211-1]。可在表3中多加一级,幅值尺寸以1到11比特表示。将63个AC系数表示成为符号1和符号2序列,其中连续0的长度超过15时,有多个符号1;块结束(EOB)时仅有一个符号1(0,0)。25“…4,0,0,0,0,0,0,0,……0,3,0”.4,3之间有31个0.(15,0),(15,0),(1,0),(3)可变长度熵编码就是对上述序列进行变长编码。对DC系数、AC系数中的符号1采用Huffman表中的变长码编码(VLC),这里Huffman变长码表必须作为JPEG编码器输入。符号2用码字长度在表3中给出的变长整数VLI码编码。VLI是变长码,但不是Huffman码。VLI的长度存放在VLC中,JPEG提供VLI码字表供用户使用26JPEG提供2套Huffman码表:亮度和色度。每套又有DC表和AC表各1个。共有4个表。表定义(亮度DC系数码表)16B说明码字长度:X’00010501010101010100000000000000’第i个(1-16)元素值表示长度为i的Huffman码个数。紧跟一组值说明亮度表分类:X’000102030405060708090A0B’27表4亮度DC系数表分类码长码字分类码长码字020064111013010751111023011861111103310097111111043101108111111105311011911111111028表5色度DC系数表分类码长码字分类码长码字020066111110120177111111022108811111110331109911111111044111010101111111110551111011111111111111029表6JPEG压缩效果评价压缩效果(比特/像素)质量0.25~0.50中~好0.50~0.75好~很好0.75~1.5极好1.2~2.0与原始图像分不出来303.基于DCT的累进操作方式编码顺序方式:每个图像分量的编码一次扫描完成的;累进方式:图像分量编码要经过多次扫描才完成。累进方式第一次扫描只进行一次粗糙图像的扫描压缩,以相对于总的传输时间快得多的时间传输粗糙图像,并重建一帧质量较低的可识别图像;在随后的扫描中再对图像作较细的压缩,这时只传递增加的信息,可重建一幅质量提高一些的图像。这样不断累进,直到满意的图像为止。31需在量化器的输出与熵编码的输入之间,增加一个足以存储量化后DCT系数的缓冲区,对缓冲区中存储的DCT系数多次扫描,分批编码。有以下两种累进方式:频谱选择法扫描中只对64个DCT变换系数中某些频带的系数进行编码、传送,随后对其他频带编码、传送,直到全部系数传送完毕为止。按位逼近法沿着DCT量化系数有效位(表示系数精度的位数)方向分段累进编码。如第一次扫描只取最高有效位的n位编码、传送,然后对其余位进行编码、传送。324.基于DCT的分层操作方式分层方式是对一幅原始图像的空间分辨率,分成多个分辨率进行“锥形”的编码方法,水平(垂直)方向分辨率的下降以2的倍数因子改变。图7分层操作方式33分层操作方式的过程(1)把原始图像空间分辨率降低。(2)对已降低分辨率的图像采用基于DCT的顺序方式、累进方式或无失真预测编码中的任何一种编码方法进行编码。(3)对低分辨率的图像解码,重建图像,使用插值滤波器,对它插值,恢复图像的水平和垂直分辨率。(4)把分辨率已升高的图像作为原始图像的预测值,对它们的差值采用基于DCT的顺序方式、累进方式或用无失真方式进行编码。(5)重复(3)、(4)直到图像达到完整的分辨率编码。344.1.2JPEG2000简介基于Internet网络的多媒体应用,给图像编码提出了新的要求.2000年12月公布的新的JPEG2000标准(ISO15444),其目标是在高压缩率的情况下,如何保证图像传输的质量。JPEG中采用DCT变换考察整个时域过程的频域特征或整个频域过程的时域特征。JPEG2000采用以小波变换为主的多分辨率编码方式。JPEG2000统一了面向静态图像和二值图像的编码方式,是既支持低比率压缩又支持高比率压缩的通用编码方式。35该算法主要特点如下:(1)高压缩率。与JPEG相比,可修复约30%的速率失真特性。JPEG和JPEG2000在压缩率相同时,JPEG2000的信噪比将提高30%左右;(2)无损压缩。预测编码作为对图像进行无损编码的成熟方法被集成在JPEG2000中;(3)渐进传输。JPEG2000可实现以空间清晰度和信噪比为首的各种可调节性,从而实现渐进传输,即具有“渐现”特性.(4)感兴趣区域压缩。JPEG2000支持所谓的“感兴趣区域”。364.2运动图像压缩标准MPEG374.2.1MPEG标准简介MPEG标准是面向运动图像压缩的一个系列标准。最初MPEG专家组的工作项目是3个,即在1.5Mbps,10Mbps,40Mbps传输速率下对图像编码,分别命名为MPEG-1,MPEG-2,MPEG-3。MPEG-3后被取消.为了满足不同的应用要求,MPEG又将陆续增加其他一些标准MPEG-4,MPEG-7,MPEG-21。38MPEG算法编码过程和解码过程是一种非镜象对称算法(不对称),解码过程要比编码过程相对简单些。MPEG-1和MPEG-2只规定了解码的方案,重点将解码算法标准化。因而用硬件实现MPEG算法时,人们首先实现MPEG的解码器,如C-Cube公司CL450解码器系列。最近几年,随着MPC性能的提高,软件解压功能也逐渐得到支持。394.2.2MPEG-1系统“用于数字存储媒体运动图像及其伴音速率为1.5Mbps的压缩编码”简称M
本文标题:多媒体数据压缩编码标准
链接地址:https://www.777doc.com/doc-3397246 .html