您好,欢迎访问三七文档
第三讲时域预测技术王荣刚北京大学深圳研究生院数字媒体研究中心2015.09.28内容提要时域预测类型局部运动补偿亮度补偿全局运动补偿2内容提要时域预测类型局部运动补偿亮度补偿全局运动补偿3Picture级预测图像编码类型IPicturePPictureBPicture4IPicture为什么要编IPicture?镜头切换随机访问容错编辑5IPPPPPPicturePPicture特点只允许前向参考不会引入编码延时:编解码顺序一致允许多帧参考一般可继续被参考,预测效果具有传播特性6BPicture特点允许做双向预测,预测效率更好引入编码延时,输出需要重排序:编解码顺序不一致一般不做为参考帧,方便做码率调整7IBPBP层次BPicture如果允许BPicture作参考,则通过引入分层B帧,进一步提高编码效率8预测方法帧差问题为什么残差图像不是“零图像”?有办法进一步降低残差图像的信息量吗?9residual-=DecodedFrame1Frame2运动补偿10运动补偿residual-=DecodedFrame1MotionCompensatedFrame1Frame2-=residualFrame2内容提要时域预测图像类型局部运动补偿亮度补偿全局运动补偿11时域预测级别Picture级Slice级MB级Block级12局部运动估计13块匹配运动估计全搜索:FullSearchmethod(FS)三步搜索法:Three-StepSearch(3SS)新三步搜索法:NewThree-StepSearch(N3SS)四步搜索法:Four-StepSearch(4SS)菱形搜索法:DiamondSearch(DS)全搜索法遍历搜索范围内的所有候选块共(2w+1)2个位置的块需要被遍历优点:可以找到最佳匹配块弱点:计算量太大,难以实时快速运动估计简化代价函数计算提前结束判决缩小搜索范围选取最好的起始搜索点规划最佳搜索路径,最小化搜索点数16三步搜索法Three-StepSearch(3SS)Kogaetal9Points:Centralpoint&its8surroundingsDistance:w/2FindthebestmatchUsepreviousbestascenterHalfdistance,select8newRepeatalgorithm3timesExamines25pointsAssumesauniformdistributionofMV’sNewThree-StepSearch(N3SS)Li,Zeng,LiouExperimentsshowthatmostofbestmatchesarenearcenterAddmorepointsincenterinfirststep:8neighborsofcenterofsearcharea(33Searchpoints)Morerobust&Smallererrorinmotioncompensation111111111232222222333333311111111四步搜索法Four-StepSearch(4SS)Po,MaTheideaissameasN3SSCentralpointand8surroundingwithdistance=2Ifbestmatchoncenter,setdistance=1select8newpointsandend;elseselectbestmatchasnewcenterwithpreviousdistance(2)Iffollowingsteprepeated3times,setdistance=1,select8newpointsandend2to4steps17-27searchpoints,LesssearchpointsonaverageBetterMSEthan3SS&lesssearchpointsthanN3SS,Betterprediction3433333334444444311111122222222111BlockMatching(FastAlgorithms)DiamondSearch(DS)Zhu,MaStartwith9pointscreatingalargediamondwithcenterofsearchwindowincenterFindbestmatch,repeatwiththisbestmatchascenterIfbestmatchisincenter,use5pointscreatingsmalldiamond,findbestmatch,thisistargetBetterperformancethan3SSLesscomplexthanN3SSand4SS,withsameperformance性能对比比较各种快速算法的计算复杂度和解码图像PSNR值.实验条件图像块尺寸8x8搜索范围:+/-7个像素搜索窗口大小:22x22.计算复杂度AveragecomputationsforMEalgorithms050100150200250computationsChemicalplantCronkiteCaltrainToyvehicleChemicalplant20523252119Cronkite19722231918Caltrain20723231918Toyvehicle18521171614ESTSSNTSS4SSDSTable1:AveragenumberofcomputationsneededfordifferentMEalgorithms解码图像PSNR值Table2:AveragePSNR(dB)fordifferentMEalgorithmsAveragePSNRfordifferentMEalgorithms010203040PSNR(dB)ChemicalplantCronkiteCaltrainToyvehicleChemicalplant25.7924.5324.9124.7324.59Cronkite34.4233.2233.4733.1933.33Caltrain27.8626.2827.0427.6327.61Toyvehicle23.9123.8623.8623.8123.81ESTSSNTSS4SSDS结论全搜索法的解码图像质量最高,但计算复杂度是其他快速算法的近10倍三步搜索法不适于估计小幅度运动.新三步搜索法对三步搜索法的弱点进行了改进四步搜索法适于估计小幅度运动.菱形搜索法的性价比最高块匹配在以下情况下失效:有光线变化模糊化:Blur复杂运动:旋转,缩放,对象边界运动等初始搜索中心很重要!如何尽快找到合适的搜索中心?运动矢量预测局部相邻图像块的运动具有很大相似性,可以利用这种相似性,对当前块的运动矢量进行大致运动估计相邻替换法均值法中值法等等24DBCAE?问题:运动补偿块选多大合适?越小越好?越大越好?25例子26Residual(nomotioncompensation)Residual(16x16bocksize)Residual(8x8bocksize)Residual(4x4bocksize)可变块运动补偿恒定图像块无法精确估计对象边缘的运动,以及块内运动27Residual(nomotioncompensation)分像素运动补偿对象的运动是连续的,即使是刚性平移运动,不同时间点的位置差异不一定是和采样的整像素坐标对齐的例如半像素运动问题:这些位置不存在采样点,它们的值如何估计?28分像素滤波双线性滤波:像素相关性和距离成反比29a=round{[(1-dx)·(1-dx)·A]+dx·(1-dy)·B+(1-dx)·dy·C+dx·dy·D]}1-dx1-dy进一步提高运动补偿效率30Residual(4x4bocksize;halfpixel)Residual(4x4bocksize;quarterpixel)Residual(8x8bocksize)Residual(4x4bocksize)多帧参考有些对象周期性运动,例如多帧参考比单帧预测更准确31后向运动补偿有些对象在前向相邻帧中找不到,但在后向相邻中可以找到后向运动补偿效率更高32双向运动补偿有些场景下采用双向运动补偿效率更高,例如渐变场景F1=(F0+F2)/233F0F1F2场景发生变化的原因?物体运动局部运动补偿光照变化亮度补偿镜头切换突变渐变摄像机运动全局运动补偿34内容提要时域预测图像类型局部运动补偿亮度补偿全局运动补偿35亮度补偿当图像亮度发生局部或全局变化时,运动补偿失效,只能通过亮度补偿,提高预测效率例如:F1=a*F0+b36F0F1时域预测总结零运动补偿适用于静止区域前向运动补偿无法预测由于物体与运动引起的暴露区域和新出现的物体双向运动补偿可以弥补前向运动补偿的效率不足亮度补偿预测亮度变化37内容提要时域预测图像类型局部运动补偿亮度补偿全局运动补偿38全局运动估计全局运动是指在视频序列中占有较大比例的像素运动,一般主要是由摄像机的运动造成的通常视频图像由前景和背景构成,如果在拍摄过程中摄像机是运动的,同时前景物体也有其自身的运动,那么背景的运动是由摄像机运动造成的,称为全局运动而前景物体所表现出来的运动是前景物体相对于摄像机的运动,称为局部运动。全局运动估计的目的就是要从视频序列中找出造成全局运动的摄像机运动的规律39摄像机运动成像模型摄像机把3-D空间点(X,Y,Z)映射到2-D空间平面点(x,y)上。图像平面与Z轴垂直,中心坐标为(0,0,f),这里f表示摄像机的焦距。映射关系可表示为:40摄像机运动类型摄像机的运动主要有:Pan(摄像机绕Y轴角度的水平旋转运动)Tilt(摄像机绕X轴角度的垂直旋转运动)Track(摄像机沿水平轴的运动)Boom(摄像机沿着垂直轴的运动)Zoom(由摄像机焦距改变而产生的图像放大-zoomin或缩小-zoomout)Dolly(水平后向移动)41摄像机运动模型(1)设(X,Y,Z)和(X‘,Y’,Z‘)分别为一个物体上的点在相邻两帧中的三维坐标,如果三维场景中的物体的运动为位移、旋转和线性变化,则(X,Y,Z)和(X',Y',Z')的关系为:通常将三维空间中物体的表面看成许多空间平面的组合,其中每一个平面都满足下面的约束条件(不再同一条线上的三点确定一个平面):透视投影下,有如下关系:42摄像机运动模型(2)根据公式(1-2)-(1-4),可推导出八参数透视模型:对透视投影进行简化,即假设物体与摄像机的距离Z远大于物体本身的深度变化△Z,则可用正交投影来近似透视投影:根据公式(1-2),(1-3),(1-6),可推导出八参数透视模型的简化模型,即六参数仿射模型:43'ffZZ(,)(,),(',')(',')(16)xyXYxyXY摄像机运动模型(3)对仿射运动模型进一步简化,就可以得到刚性模型和位移模型摄像机运动模型的坐标轴变换关系和几何变换描述:44典型全局运动45translationalgeometricaffineperspective像素域全局运动估计最小二乘法找到一些初始的匹配点对(x,y)-(x’,y’)E分别对每个参数求偏导等于0,求解方程组46运动矢量域全局运动估计像素域估计复杂度过高,不适合实时处理应用运动矢量域估计47参数估计首先,将图像分块,对每个图像块采用位移模型做运动估计,得到每个图像块的运动矢量用8参数全局运动模型参数推算每个图像块的运动矢量,采用最小二乘拟合,使得推算的运动矢量尽量接近运动估计得结果具体计
本文标题:第三讲-预测技术
链接地址:https://www.777doc.com/doc-4552718 .html