您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 广告经营 > 08MPEG压缩技术
第8章MPEG压缩技术2020年1月15日星期三第1页8.1视频信号数字化内容提要8.2MPEG标准8.3MPEG-4电视图像编码8.4电视图像分辨率可变编码8.5数字视频交互技术DVI8.6多媒体内容描述接口MPEG-78.1视频信号数字化视频信号数字化处理的一些基本方式,如取样、量化、编码和D/A转换等,与音频信号基本相同。但由于视频信号自身的特点,其数字化处理也有其特殊性,主要表现在取样结构和取样频率上。视频信号指的是彩色全电视信号(FBAS):亮度信号、色度信号、行场同步信号、行场消隐信号及其他辅助信号组成。常用的电视制式:NTSC制和PAL制。PAL制即625/50制,场频为50HZ,两场为1帧,帧频为25Hz,每帧有625行。根据隔行扫描原理,每一场由312.5行组成,每一帧为625行,由此构成一幅完整的电视图像。同步信号和消隐信号是始终不变的,变化的是亮度信号,它随图像的明暗程度而变化。视频信号与音频信号的区别:1、由于亮度信号被同步信号和消隐信号分成一段一段的,在时间上成为不连续;2、音频信号的频率范围只有0~20kHz,而视频信号的频率范围则达0~6MHz,两者之间相差很大。视频信号数字化的特点对视频信号数字化的方式:全信号数字化和分量数字化全信号数字化:对图C信号直接进行数字化分量数字化:对图a、d和e信号分别进行数字化,然后利用时分复合方法进行处理。分量数字化由于省去了电视信号的反复解码和编码,亮度信号和色差信号被分开处理,相互间不存在干扰,同时对制式的兼容性也好,所以目前普遍采用分量数字化。视频信号数字化的方式视频信号的取样结构无论何种制式,电视屏幕上的一幅完整图像都是以隔行扫描的形式进行的,既有水平扫描又有垂直扫描。这样在取样时就产生了取样点的分布问题,因取样而构成图像上的样点排列方式称为取样结构。视频取样结构:移动型、固定型取样频率在电视信号中,取样频率考虑因素:亮度、色差、其他因素。1、亮度信号的取样频率1)与被取样信号的带宽有关根据奈奎斯特取样定理,取样频率至少是信号上限频率的2倍。对PAL制要求5.8-6MHz带宽,NTSC为5.6MHz带宽。2)混叠要求为了保证取样后的混叠噪声足够小,要求取样频率是信号带宽的2.2-2.7倍,对PAL制信号,取样频率至少应为12.72~13.2MHz,为留有余量,应大于13.2MHZ。3)正交取样结构的要求取样频率必须是行频的整数倍。4)制式兼容要求为了使NTSC和PAL两种制式兼容、必须采用同一种取样频率,而PAL制行频为l5625Hz,NTSC制行频为15734Hz。二者的最小公倍数为2.25MHz。综合以上因素,将亮度信号的取样频率定为13.5MHz。色度信号的取样频率为了获得满意的彩色图像,两个色差信号应有2MHz带宽,另外,考虑到混叠噪声、取样频率应为行频的整数倍、制式的兼容性等要求,色差信号的取样频率取6.75MHz。图4-4为亮度信号和色差信号的取样点,其中圆圈为亮度信号的取样点,三角为色差信号的取样点。第8页量化位数和码电平的分配信号的信噪比与量化位数有关。单极性信号,其信噪比与量化位数的关系:S/Ng=6n十10.8n为量化位数量化位数越大,信噪比越高。综合考虑图像质量和设备技术要求等因素,采用8位量化数比较合理,此时信噪比可达到59dB。量化位数和码电平的分配码电平是指对模拟信号的量化级电平。若对亮度信号采用8位均匀量化,可获得256个量化级,即码电平从0-255,对应二进制的00000000—11111111。由于电路工作的不稳定性、陡峭的前置滤波器和孔阑校正电路造成的过冲及钳位过程中的过渡过程等,亮度信号可能超过这一动态范围而产生过载性限幅。为了避免这一现象,256个量化级要进行分配,把亮度信号的峰峰值定为1V,便其电平变化范围为0.063V一0.922V,对应的量化级数便从16—235,共220级,在256个量化级中上端保留20级,下端保留16级作为保护带;两个色差信号与亮度信号不一样,它们以零电平为中心上下分布。中心零电平对应的量化级数为128,二进制表示为l0000000。另外上下保护带各留16个量化级,即两个色差信号共占用224级,从16—240,对应的二进制为00010000一11110000。传输速率在分量数字化中,亮度信号的取样频率为13.5MHz,两个色差信号为6.75MHz,量化数为8,于是视频数字信号的码率为:R=(13.5×8十(6.75×8)×2)Mbit/s=216Mbit/s可见它比数字音频的码率1.41Mbit/s要高得多,这就对数字视频电路提出了更高的要求,这也是要采取数据压缩的原因。视频信号数字标准视频信号数字标准有两个:主要标准和普通标推。主要标准:4:2:2标准,这是电视演播室的标准。4:2:2标准的水平清晰度可达480线,传输码率216Mbit/s。数字光盘DVD采用此标准。普通标准:2:1:1标准,这是低档的标准。2:1:1标准的水平清晰度只有240线,传输码率l08Mbit/s。数字光盘VCD采用此标准。两种标准具有兼容性,即可以互相转换。当从4:2:2标准转到2:1:1标推时,取样点数减少一半,称为数字抽取;当从2:1:1标准转到4:2:2标准时,取样点数将增加一倍,称为数字内插。2020年1月15日星期三第14页2020年1月15日星期三第15页视频图像信号经数字化后,数据量变的非常庞大。按电视信号数字化的标准,1帧信号有效行为576,每秒传递25帧(PAL制)。1行视频传号,若取720个像点,每个像点用16位量化,则1行视频信号的为:数字码=720×16bit=11520bit。码率=l1520×576×25bit/s=166Mbit/s。l张12cm的光盘容量为6.25Gbit,这样1张光盘只能存储:6.25Gbit/166Mbit/s=37.7s。对于一个2小时的电影节目,若要存在光盘里,则需要2×60×60s/37.7s张=19l张光盘,这显然是远远不能满足实际要求的。另一方面,166Mbit/s的码率对传输处理电路的技术要求也很高。因此,必须对数据进行大幅度的压缩。目前,活动图像数字信号压缩扩展的标准是MPEG标准8.2MPEG标准简介MPEG的全称是运动图像专家组——MovingPictureExpertsGroup是专门制定多媒体领域内的国际标准的一个组织,该组织成立于1988年,由全世界大约300名多媒体技术专家组成。MPEG标准是面向运动图像压缩的一个系列标准。最初MPEG专家组的工作项目是3个,即在1.5Mbps,10Mbps,40Mbps传输速率下对图像编码,分别命名为MPEG-1,MPEG-2,MPEG-3。l992年,MPEG-2适用范围扩大到HDTV,能支持MPEG-3的所有功能,因而MPEG-3被取消。MPEG-1MPEG-1即“用于数字存储媒体运动图像及其伴音速率为1.5Mbps的压缩编码”。MPEG-1的任务主要是,将视频信号及其伴音以可接收的重建质量压缩到约1.5Mbps的码率,并复合成一个单一的MPEG位流,同时保证视频和音频的同步。MPEG-1MPEG-1标准分4个部分:①MPEG系统:定义音频、视频及有关数据的同步;②MPEG视频:定义视频数据的编码和重建图像所需的解码过程,亮度信号分辨率为360×240,色度信号分辨率为180×120;③MPEG音频:定义音频数据的编码和解码;④一致性测试。MPEG-1MPEG-1标准没有规定编码器和解码器的体系结构或实现方法,但提出了功能和性能上的要求。此外,MPEG算法编码过程和解码过程是一种非镜像对称算法,也就是说运动图像的压缩编码过程与还原解码过程是不对称算法,解码过程要比编码过程相对简单。实际上,MPEG-1和MPEG-2只规定了解码的方案,重点将解码算法标准化。因而用硬件实现MPEG算法时,人们首先实现MPEG的解码器,如C—Cube公司CL450解码器系列。MPEG音频压缩算法是第一个高保真音频数据压缩国际标准,它同时可完全独立应用。MPEG音频标准具有如下特点:(1)音频信号采样率可以是32kHz,44.1kHz或48kHz;(2)压缩后的比特流可以按4种模式(128、192、256和384kbit/s)之一支持单声道或双声道;(3)压缩后的比特流具有预定义的比特率之一;(4)MPEG音频标准提供3个独立的压缩层次;(5)编码后的比特流支持循环冗余校验CRC;(6)MPEG音频标准支持在比特流中载带附加信息MPEG-1MPEG视频是MPEG标准的核心。为满足高压缩比和随机访问两方面的要求,MPEG采用预测和插补两种帧间编码技术。MPEG视频压缩算法中包含两种基本技术:一种是基于16×16子块的运动补偿技术,用来减少帧序列的时域冗余;另一种是基于DCT的压缩,用于减少帧序列的空域冗余,在帧内压缩及帧间预测中均使用了DCT变换。运动补偿算法是当前视频图像压缩技术中使用最普遍的方法之一。MPEG-1MPEG压缩编码基本原理活动图像能用编码压缩:一是图像数据本身的冗余度,二是人眼的视觉特性1.视频图像数据的冗余1)同一幅图像里,各个像素之间存在冗余。2)帧帧之间,也存在信息冗余。2.人的视觉特殊性1)对亮度比对彩色敏感。2)空间错觉感3)时间错觉感由于视觉特性方面存在这种时间错觉和空间错觉,因此眼睛观察景物有以下规律:1)静止物体比移动物体的视觉感受要高。2)慢速移动的物体比快速移动的物体视觉感受要高。3)对画面边缘位置的感应速度快,而对边缘尺寸的感应速度要慢。4)对倾斜物体,不论是水平方向或垂直方向,感觉都不敏感。5)对亮度信号的感觉比对色度信号的感觉敏感。利用这些视觉特性和规律,对数字信号的信息量安排上作适当调整,这就是数据压缩。要把这些视觉特性和规律用于数据压缩,还需要定量化、数字化,这就需要通过视觉实验来完成。在活动图像的数据编码压缩时,具体采用的技术主要有三项;1)帧内全帧编码对于不变化或变化很少的图像以及单一的彩色,减少其编码的比特数。如单一的蓝天、不动的青山等背景可用少量的编码数据来传送。2)前后帧差进行预测编码(帧间预测编码)对活动图像进行编码时,图像的背景等不动的部分仍沿用其数据,不再逐一编码,而只检测出现在画面与前一画面之间动作变化的差值,对其差值进行编码传送。3)利用码的出现频度对于出现频繁程度高的码数减少。帧内编码技术帧内编码技术,也称为空域冗余压缩,是对同一幅图像内的不同的空间部位(同一时域)进行压缩。MPEG编码压缩的帧内编码技术也是采用DCT技术。首先,将图像分为8×8的像素块(宏块),作为压缩处理的基本单位。然后,依靠“Z”扫描,对像素块进行离散余弦变换(DCT)。得到64个DCT系数,这些系数代表不同空间频率成分的大小。第三步是根据视觉心理特征量化表对DCT系数进行量化处理,使低频系数值减小,高频系数值被抑制为零。最后,对量化后的系数进行可变长编码(VLC)处理,以短码表示常用码,以零的个数值表示所有的零位,这样使数据大大压缩。帧内编码技术——DCT变换DCT是一种数学处理方法,类似于傅立叶变换。它是把空域中的8×8像素值变换到频域,成为各种频率系数。其中高频系数反映图像的细节,低频系数反映图像的主要特征。好处:一:第一项系数代表平均直流成分,反映该区块图像的平均亮度(或)色度。二:从1~63各系数的分布和大小,则可知该区块图像亮的程度(或)色度起伏变化的程度。帧内编码技术——量化处理DCT系数矩阵中只有左上角部分数值较大,而偏右偏下部分数值较小。这是因为左上角为直流和低频,是区块信息的主要部分,而右下角为高次谐波,其幅值较小。根据人眼的视觉特性,人眼对基础亮度的差别分辨率较高,而对高频不够敏感。人眼对不同的频率成分视觉感受不一样.可以用视觉阈值来度量;为进一步压缩数据,可以根据人眼对频率成分感受阀值的不同,对每一种频率设定一折算,将DCT数据进行折
本文标题:08MPEG压缩技术
链接地址:https://www.777doc.com/doc-3052760 .html