您好,欢迎访问三七文档
电视原理第三章视频压缩技术22/75视频压缩技术JPEG的传送和解码1彩色图像压缩2动态预测和视频压缩3视频标准43/751.传送和解码---熵解码HuffmanCodingBCCA100000010…4/751.传送和解码---熵解码Arithmetic:0.2421875-0.0011111(7bits)0.150.24218750.35BC0.220.24218750.28C0.2410.24218750.259A0.2410.24218750.24375/751.传送和解码示例:0111111011010000000001110001010熵解码DC系数AC系数3已知前一个块的DC系数76,本块的系数=76+3=796/751.传送和解码0111111011010000000001110001010熵解码DC系数AC系数79,0,-2,Run=1,前面有一个连续的零Size=2,第二组,-1,-1,-1,0,0,-1,EOB7/751.传送和解码79,0,-2,-1,-1,-1,0,0,-1,EOB8/75反量化反量化Q9/75逆DCTDCT-1F(u,v)f(i,j)10/75原图像重建图像压缩前:8x8x8=512bits压缩后:31bits压缩比率:512/31=16.511/75彩色图像压缩彩色坐标转换彩色坐标转换是要去掉数据冗余量,不属于JPEG算法,JPEG是独立于彩色坐标的。压缩可采用不同坐标(如RGB、YUV、YIQ等)的图像数据。12/75彩色图像压缩RGBYUV人眼对色度的不敏感降低色度的采样率13/75彩色图像压缩4:4:4,4:2:2,4:2:0X:亮度采样点O:色度Cr,采样点14/75彩色图像压缩4:2:0最常用的色彩取样水平方向和垂直方向上,U、V的采样率分别降为一半总采样点U=V=1/4Y总压缩比率?15/75彩色图像压缩YUV坐标的原始图像(RAW)图像中,Y,U,V以什么顺序存在?16/75JPEG文件格式17/75JPEG文件格式Frameheader(帧的信息)图像的宽和高(像素为单位),352x288,800x600彩色元素格式RGB,YUV数字格式4:2:2,4:2:0ScanHeader(要素的头信息)具体的某个要素的身份(R?/G?/B?)多少bits来表达这个要素用来量化这个要素的量化表格18/75每个scan包括一个或多个segments(段)每个段包括一组块每个段可以独立于其他部分解码不会被其他段影响克服了biterror的蔓延哪些东西会造成biterror的蔓延?19/75BMP只在Windows系统中使用从下到上保存图像信息,像素按B/G/R排列与其他大部分格式刚刚相反如果内存紧张,BMP有时候会从下到上显示出来通常无压缩,或使用RLE压缩“.bmp”扩展名20/75GIF1987(GIF87)网络图像中最常见的文件格式经常被使用在由线条画和少部分鲜明的颜色块组成的图画中GIF格式支持8bits或小于8bits的颜色信息GIF89a格式支持透明度动态“gif”扩展名21/75GIF的压缩减少颜色的数目24-bit彩色图像224种颜色从中选取256种最常见的颜色和原图中颜色更接近的颜色每个像素24-bit的颜色值8-bit的表格目录压缩比率3:122/75运动图像的编码帧间预测将画面分为三种区域。(1)背景区相邻的帧背景区的绝大部分数据相同,帧间相关性很强。(2)运动物体区若将物体运动近似看作简单的平移,则相邻帧的运动区的数据也基本相同。假如能采用某种位移估值方法对位移量进行“运动补偿”,那么两帧的运动区之间的相关性也是很强的。(3)暴露区是指物体运动后所暴露出的曾被物体遮盖住的区域。如果存储器将暴露区的数据暂存,则再次遮盖后暴露出来的数据与存储的数据相同。若画面从一个场景切换到另一场景时,就没有帧间相关性了。23/75空间分辨率和时间分辨率人眼对静止图像分辨力较高,在传输静止图像或图像的静止部分时,则要有较高的分辨率。人眼对于图像中运动物体的分辨率随着物体运动速率的增大而降低,摄像器件和显示器件也有一定的积分模糊效应。在传输图像中的运动部分时,可以降低这部分图像的分辨率,物体的运动速度越高,可用越低的分辨率进行传输,这种方法就叫做空间分辨率和时间分辨率的交换。如何区分静止和运动的区域?24/75时间冗余连续相邻帧之间的相似性降低时间冗余降低空间冗余动态预测和动态补偿25/75差值编码(静态)26/75差值编码(动态)27/75动态补偿预测28/75动态补偿预测29/75动态预测动态(补偿)向量Motionvector(u,v)30/75动态预测(MotionEstimation)中什么叫相似?衡量的标准:t-1帧t帧1281301281305658606256596161130131129130565860625668616156525872598056564962615659616131/75动态预测的搜索方法穷举法(exhaustivesearch,brute-force)搜索范围内所有的位置t-1帧t帧块大小:NxN搜索半径:D搜索的点数:(2D+1)2,计算(2D+1)2次代价函数SAD每个代价函数的计算量:N2个减法,N2个绝对值,N2-1个加法穷举法搜索顺序,从上到下,从左到右?计算量巨大32/75搜索顺序螺旋搜索(Spiralsearch)例:起始点(0,0)第二点(0,-1)xy第三点(-1,-1)(-1,0)(-1,1)(0,1)(1,1)…33/75n-stepHierarchicalsearch快速,计算量小陷入局部最优,而达不到全局最优34/75动态补偿(MotionCompensation)t-1帧t帧12813012813056586062565961611301311291305658606256686161565258725980565649626156596161130130131129MC(t-1帧)35/75源视频FrameMemoryDCT量化(Q)VLCcoder(熵编码)缓存(Buffer)反量化(Q-1)DCT-1FrameMemory动态补偿(MotionCompensation)动态预测(MotionEstimation)+++_预测帧(Predictiveframe)动态补偿向量(MotionVectors)Regulator36/75动态预测输入:当前帧t,参考帧t-1输出:动态向量(mv)动态补偿输入:参考帧t-1,动态向量mv输出:t-1的补偿帧MC(t-1帧)FrameMemory动态补偿(MotionCompensation)动态预测(MotionEstimation)t-1帧t帧t-1帧动态向量(mv)+_t帧MC(t-1帧)37/75视频编解码器38/75编码:第一帧39/75编码:第二帧40/75编码:第三帧41/75解码:第一帧42/75解码:第二帧43/75解码:第三帧44/75帧类型I帧(Intra)(第一帧)不参考其他图像,自身独立编解码提供accesspoints压缩比率中等10:1(MPEG-1)P帧(Predicted)(第二、三帧)参考其他I-帧、P帧也被用作其他帧的参考压缩比率大概20:145/75帧类型B-帧(Bidirectional)使用前后各一的参考帧(I,P)产生的动态预测帧本身不作为其他帧的参考(H.264中已经被允许,3DV中大量使用)最高的压缩比率(50:1)46/75传输和显示顺序显示顺序传输顺序47/75B-帧的预测对于B-帧中某一个宏块1.只有正向预测(1mv)2.只有逆向预测(1mv)3.双向预测的均值,内差值,Interpolation,(2mvs)48/75动态向量(MV)的编码MotionVectors相邻宏块的动态向量高度相关在很多标准里,“宏块”都是做动态预测的单位如果需要,也可以优化到“块”为单位编码MV的差值:利用变长编码(VariableLengthCode)t帧t-1帧49/75视频码流句法结构(syntax)-六层SequenceLayer序列层GOPLayerGroupofPictures图像组层PictureLayer图像层SliceLayer片层MacroblockLayer宏块层BlockLayer块层50/75宏块层和块层51/75宏块层和块层52/75图像层和片层53/75片层一系列连续的宏块提供弹性:不同的块可改变编码参数针对给定的目标比特率优化图像质量控制比特率(bitrate)54/75序列层和图像组层55/75视频码流句法结构(syntax)-六层56/75电视视频标准的分类和发展不同应用场合对图像质量要求是不同的,数字电视要播出新闻、体育比赛、文艺节目,对图像的质量要求很高;会议电视画面中人数少、运动少、背景不变,对图像质量的要求降低;而电视电话图像是单人头像,只有脸部表情的变化,对图像质量的要求最低。通常把图像编码分为下面几个应用层次:(1)标准数字电视图像分辨率为720×576,采用ISOMPEG-2标准,约8Mb/s的码率可以达到演播室级的图像质量要求。地面广播时,采用现代数字调制技术,可在一路8MHz信道传送4路标准数字电视。57/75视频标准(2)会议电视:图像分辨率为352×288,采用ITU-TH.261建议,码率为P×64kb/s(P=1~30),属中、低速码率的图像压缩。一般认为,码率为384kb/s(P=6)以上时,图像质量才比较满意。(3)数字影碟机等图像分辨率为352×288,国际标准为MPEG-1,码率为1.5Mb/s,其中约1.2Mb/s用于图像,其余用于声音和同步。(4)可视电话图像分辨率为176×144,采用ITU-TH.263建议,码率为64kb/s以下,经调制解调后,能在现有的模拟电话线上传送活动的彩色电视电话图像,因此也称为极低码率的图像编码。58/75视频标准(5)高清晰度电视图像分辨率可高达1920×1080,具有两倍于现有标准的水平和垂直清晰度,采用ISOMPEG-2标准,码率约为20Mb/s(6)H.264(7)H.265(HEVC,HighEfficiencyVideoCoding)和3DV。59/75视频标准会议电视和可视电话ITU-TH.261ITU-TH.263MPEG-1MPEG-2MPEG-4ITU-TISO/IECJTC1/SC29/WG11H.261建议——“p×64kb/s视听业务的视频编解码器”,其中p=1~30。该标准的应用目标是会议电视和可视电话,通常p=1,2时适用于可视电话,p在6以上时适用于会议电视业务。低于64kb/s的窄带通信信道的视频编码建议,可用于可视电话中极低比特率的编解码器上MPEG-7VCD之类的视频家电设备和视频点播(VoD,VideoonDemand)系统数字电视广播和DVD系统JVTH.264,MPEG4-Part10不以压缩为目的60/75MPEG-2标准MPEG-2输入格式:级(Levels)低级(LL,LowLevel)的图像输入格式,以亮度像素(记为pel)数计,是352×240×30pel/s或352×288×25pel/s,最大输出码率是4Mb/s。主级(ML,MainLevel)的图像输入格式完全符合ITU-R601标准,即720×480×30pel/s或720×576×25pel/s,最大输出码率为15Mb/s(高类主级是20Mb/s)。HL处理方法:类(Profiles)每升高一类将提供前一类没使用的附加的码率压缩工具,编码则更为精细。类之间存在向后兼容性,若
本文标题:电视原理视频压缩技
链接地址:https://www.777doc.com/doc-1481937 .html