您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 广告经营 > (完整word版)多媒体作业2
作业二:简答题1.Huffman编码效率能否达到信息熵?何时能够达到信息熵?答:(1)Huffman编码效率能够达到信息熵。(2)信息熵编码是根据信源符号出现概率的分布特性而进行的压缩编码。Huffman编码是信息熵编码的一种。在变长编码中,对出现概率大的信源符号赋予短码字,而对于出现概率小的信源符号赋予长码字。如果码字长度严格按照所对应符号出现概率大小的逆序排序,则编码结果平均码字长度一定小于任何其他排列方式。2.算术编码不按照符号概率划分区间而是均分区间,是否可行?是否影响解码?有何影响?答:(1)不可行。(2)影响解码。(3)①算术编码的基本原理是将出现概率较多的“**”(可以是字符或字符串),用尽可能少的位或字节来表示②算术编码是一种变长码(与Huffman编码相同?),主要针对出现概率高的**序列标识的信息(消息)进行压缩③在算术编码中,将信息表示成实数轴上0和1之间的间隔,例如一个信息“10”可表示成[0.5,0.7]。信息越长,这个间隔就越小,例如一个较长的信息可表示成[0.514384,0.51442],显然表示这一间隔所需的二进制位数就越多④算术编码用到的两个基本的参数是符号的概率和它的编码间隔。信源符号的概率决定压缩编码的效率,也决定编码过程中信源符号的间隔,间隔则决定了符号压缩后的输出。算术编码是根据信源符号估计出各个元素的概率,然后进行迭代计算。故算术编码如果不按照符号概率划分区间,效率就非常低。3.算术编码的解码是否可以一直解下去?如何停止?答:(1)算术编码的解码可以一直解下去。(2)在译码器中需要添加一个专门的终止符,当译码器看到终止符时就停止译码4.在预测编码中,对于连续的多帧图像,上下帧通常具有一些相同的部分内容,如背景和静止的物体,可以预计在一定的时间内将不会发生变化。主要对其差值进行编码,可以达到压缩的目的,为什么?答:①根据离散信号之间存在一定的相关性的特点,利用前面的一个或多个信号对下一个信号进行预测,然后对实际值和预测值的差值进行编码。②预测编码的基本过程:根据算法模型,用原有的样本值对新样本进行预测,得到新样本的预测值;取新样本的实际数值和预测值进行比较,二者相减得到差值;对差值进行编码。③声音和图像中通常都存在冗余的信号,而且在相邻的音色或相邻像点之间的相关性比较强,它们的差值比较小,这样任何音色或像点都可以通过已知样本值进行预测。5.在DPCM预测编码中,DPCM用于图像压缩的基本工作原理:比较相邻的两个像素,如果两个像素之间存在差异,将差异之处的差值传送出去,若比较的像素之间没有差异,则不传送差值。上述描述是否正确?答:不正确。DPCM用于图像压缩的基本工作原理:①DPCM采用预测编码的方式传输信号,所谓预测编码就是根据过去的信号样值来预测下一个信号样值,并仅把预测值与现实样值的差值加以量化,编码后进行数字信号传输。在接收端经过和发送端相同的预测操作,低通滤波器便可恢复出与原始信号相近的波形。②DPCM是采用固定预测器与固定量化器的差值脉冲调制,它是分析ADPCM工作原理的基础。6.预测编码特点具有如下特点:要求数据传输速度很高;压缩能力有限,为什么?答:①这与预测编码的基本原理相关。预测编码是根据某一种模型,利用以前的(已收到)一个或几个样值,对当前的(正在接收的)样本值进行预测,将样本实际值和预测值之差进行编码。如果模型足够好,图像样本时间上相关性很强,一定可以获得较高的压缩比。②具体来说,从相邻像素之间有很强的相关性特点考虑,比如当前像素的灰度或颜色信号,数值上与其相邻像素总是比较接近,除非处于边界状态。那么,当前像素的灰度或颜色信号的数值,可用前面已出现的像素的值,进行预测(估计),得到一个预测值(估计值),将实际值与预测值求差,对这个差值信号进行编码、传送,这种编码方法称为预测编码方法。故预测编码具有要求数据传输速度很高;压缩能力有限等特点。7.变换编码经常与量化一起使用,为什么?答:①在不考虑运算误差的条件下,变换本身是一种无损且可逆的技术,为了能获得更好的编码效果,忽略了一些不重要的系数(或对于系数进行了量化),由此成为了有损的技术②变换编码不是直接对空域图像信号进行编码,而是首先将空域图像信号映射变换到另一个正交矢量空间(变换域或频域),产生一批变换系数,然后对这些变换系数进行编码处理。变换编码是一种间接编码方法,其中关键问题是在时域或空域描述时,数据之间相关性大,数据冗余度大,经过变换在变换域中描述,数据相关性大大减少,数据冗余量减少,参数**,数据量少,这样再进行量化,编码就能得到较大的压缩比。8.JPEG压缩编码中对于图像进行8×8分块:为什么不对于整个图像而是对于分块图像分别进行编码?答:①JPEG压缩算法基本系统流程如图1所示,压缩编码过程包括图像数据分块、DCT变换、量化、Huffman编码四个步骤.解压缩过程刚好相反。先将原始图像数据分成一系列的8×8块,然后按从左到右,从上到下的顺序进行处理,当水平或垂直方向的像素数不是8的整数倍时,采用填1的方法补齐。②即首先将要压缩的图像分割成一定的8×8像素的图像子块,再用离散余弦变换(DCT)将子块变为8×8的DCT系数阵列;然后用一个8×8的量化值阵列对这些系数进行量化;最后用熵编码器将量化后的系数编码成一串比特数据流。经过传输或存储,比特数据流经过熵解码器进行解码,重新生成一组量化了的DCT系数,使用与编码时相同的量化值阵列对这些量化了的系数进行反量化,利用反向离散余弦变换(IDCT)将此8×8DCT系数阵列变换成空问域的8×8图像子块.最后将反变换后的组合成一幅图像.这样完成了一幅图像的压缩与解压过程。③经过DCT变换、量化,8×8的方块的绝大部分中高频系数变成了0,据编码经验知,连续的0个数越多,编码效率越高,所以JPEG对**个系数采用了Z字形扫描的方式,熵编码采纳了平均压缩比最高的编码Huffman编码。9.在DCT变换中,采样精度为P位(二进制),为什么需要把[0,2P-1]范围的无符号数变换成[-2P-1,2P-1]范围的有符号数?然后作为正向离散余弦变换的输入,通过DCT变换,把能量集中在少数几个系数上。答:①DCT变换的基本思路是将图像分解为8×8的子块或16×16的子块,并对每一个子块进行单独的DCT变换,然后对变换结果进行量化、编码。随着子块尺寸的增加,算法的复杂度急剧上升,因此,实用中通常采用8×8的子块进行变换,但采用较大的子块可以明显减少图像分块效应。②在图像压缩中,一般把图像分解为8×8的子块,然后对每一个子块进行DCT变换、量化,并对量化后的数据进行Huffman编码。DCT变换可以消除图像的空间冗余,Huffman编码可以消除图像的信息熵冗余。③DCT是无损的,它只将图像从空间域转换到变换域上,使之更能有效地被编码。对一个图像子块而言,将对变换后的6?个系数进行量化,并对Z字顺序扫描系数表进行编码。这种排列方法有助于将低频非0系数置于高频系数之前,直流系数由于包含了所有图像特征中的关键部分而被单独编码。量化后的系数经过熵编码进一步无损压缩,通常采用的是Huffman编码。这种压缩编码方法中,图像质量的降低主要是由于对系数的量化造成,且不可恢复。假设子图像为f(x,y),则DCT变换可以由下面的公式实现:(式1)C(u,v)是一个偶函数,关于y轴对称。故需要把[0,2P-1]范围的无符号数变换成[-2P-1,2P-1]范围的有符号数。1010]2)12(cos[]2)12(cos[),()()(),(NxNyNvyNuxyxfvuvuC④(式2)其中式(1)的f(u,v)表示变换域的高频成分,也称为交流系数;式(2)中F(0,0)表示变换域中的低频成分,也称为直流系数。对变换结果进行分析,可以看出能量主要集中到左上角。DCT变换具有良好的去相关特性。在图像的压缩编码中,N一般取8。在解码时首先得到各点的DCT系数,然后根据下面的DCT反变换即可恢复出原图像。DCT的反变换公式为:(公式3)利用公式(3)可以无损地恢复原图像。在实际的应用中,使用DCT变换的矩阵描述形式更容易理解。综上,把[0,2P-1]范围的无符号数变换成[-2P-1,2P-1]范围的有符号数,然后作为正向离散余弦变换的输入,通过DCT变换,把能量集中在少数几个系数上。
本文标题:(完整word版)多媒体作业2
链接地址:https://www.777doc.com/doc-7308209 .html