您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 广告经营 > 《多媒体技术基础》第3版-答案
1《多媒体技术基础》第3版练习与思考题参考答案林福宗清华大学计算机科学与技术系2008-2-15linfz@mail.tsinghua.edu.cn第1章多媒体技术概要1.4无损压缩是什么?无损压缩是用压缩后的数据进行重构(也称还原或解压缩),重构后的数据与原来的数据完全相同的数据压缩技术。无损压缩用于要求重构的数据与原始数据完全一致的应用,如磁盘文件压缩就是一个应用实例。根据当前的技术水平,无损压缩算法可把普通文件的数据压缩到原来的1/2~1/4。常用的无损压缩算法包括哈夫曼编码和LZW等算法。1.5有损压缩是什么?有损压缩是用压缩后的数据进行重构,重构后的数据与原来的数据有所不同,但不影响人对原始资料表达的信息造成误解的数据压缩技术。有损压缩适用于重构数据不一定非要和原始数据完全相同的应用。例如,图像、视像和声音数据就可采用有损压缩,因为它们包含的数据往往多于我们的视觉系统和听觉系统所能感受的信息,丢掉一些数据而不至于对图像、视像或声音所表达的意思产生误解。第2章无损数据压缩2.4现有5个待编码的符号,它们的概率见练习表2-2。计算该符号集的:(1)熵;(2)霍夫曼码;(3)平均码长。练习表2-2符号2a1a3a4a5a概率0.40.20.20.10.1(1)熵21()()log()niiiHapapa==−Σ=-0.4×(0.4)-2×0.2*(0.2)-2×0.1(0.1)2log2log2log=0.4×1.3219+0.4×2.3219+0.2×3.3219=0.5288+-0.9288+0.6644=2.1220(位)(2)编码树和霍夫曼码练习图2-1编码树编码表符号概率霍夫曼码*码长所需位数2a0.4010.41a0.21120.43a0.210130.64a0.1100140.45a0.1100040.4*代码分配不唯一(3)平均码长L=0.4+0.4+0.6+0.4+.04=2.2(位/符号)2.5使用算术编码生成字符串games的代码。字符g,a,m,e,s的概率见练习表2-3。练习表2-3符号games概率0.40.20.20.10.1第3章数字声音编码3.1音频信号的频率范围大约多少?话音信号频率范围大约多少?(1)Audio:20~20000Hz(2)Speech:300~3400Hz3.4采样频率根据什么原则来确定?奈奎斯特理论和声音信号本身的最高频率。采样频率不应低于声音信号最高频率的两倍,这样就能把以数字表达的声音还原成原来的声音。3.5样本精度为8位的信噪比等于多少分贝?48分贝3.7选择采样频率为22.050kHz和样本精度为16位的录音参数。在不采用压缩技术的情况下,计算录制2分钟的立体声需要多少MB(兆字节)的存储空间(1MB=1024×1024B)(22050×2×2×2×60)/(1024×1024)=10.09MB3.13自适应差分脉冲编码调制(ADPCM)的两个基本思想是什么?ADPCM综合了APCM的自适应特性和DPCM系统的差分特性,是一种性能比较好的波形编码。它的核心想法是:①利用自适应的思想改变量化阶的大小,即使用小的量化阶(step-size)去编码小的差值,使用大的量化阶去编码大的差值,②使用过去的样本值估算下一个输入样本的预测值,使实际样本值和预测值之间的差值总是最小。第4章彩色数字图像基础4.3一个像素的RGB分量分别用3,3,2位表示的图像,该幅图像的颜色数目最多是多少?如果有一幅256色的图像,问该图的颜色深度是多少?(1)256种;(2)8位4.5JPEG压缩编码算法的主要计算步骤是:①DCT变换,②量化,③Z字形编码,④使用DPCM对直流系数(DC)进行编码,⑤使用RLE对交流系数(AC)进行编码,⑥熵编码。假设计算机的精度足够高,在上述计算方法中,哪些计算对图像的质量是有损的?哪些计算对图像的质量是无损的?第6章颜色空间变换6.1PAL制彩色电视使用什么颜色模型?NTSC制彩色电视使用什么颜色模型?计算机图像显示使用什么颜色模型?(1)PAL制彩色电视:YUV(2)NTSC制彩色电视:YIQ(3)计算机图像显示设备:RGB6.2用YUV或YIQ模型来表示彩色图像的优点是什么?为什么黑白电视机可看彩色电视图像?(1)YUV表示法的优点:①它的亮度信号(Y)和色度信号(U,V)是相互独立的,因此可以对这些单色图分别进行编码;②可以利用人眼的特性来降低数字彩色图像所需要的存储容量。YIQ同样具有YUV的这两个优点。(2)黑白电视能接收彩色电视信号的道理是利用了YUV/YIQ分量之间的独立性。6.3在RGB颜色空间中,当R=G=B,且为任意数值,问计算机显示器显示的颜色是什么颜色?灰色6.4在HSL颜色空间中,当H为任意值,S=L=0时,R,G和B的值是多少?当H=0,S=1,L=0.5,R,G和B的值是多少?(1)当H为任意值,S=L=0时,R=G=B=0(2)当H=0,S=1,L=0.5时,R=1,G=B=0第7章小波与小波变换7.4使用规范化的小波变换算法,用MATLAB编写一个M文件,重新计算f(x)=[2,5,8,9,7,4,-1,-1]的哈尔小波变换。(略)第8章小波图像编码8.2解释EZW的含义。嵌入零树小波编码(embeddedzerotreewavelet,EZW)是Shapiro,J.M在1993年开发的一种编码算法。小波表示该算法以离散小波变换为基础,以变换后的大系数比小系数更重要以及高频子带中的小系数可以忽略为背景;零树表示小波变换系数之间的一种数据结构,用同一方向和相同空间位置上的所有小波系数构成一棵树,如果树根及其子孙的小波系数的绝对值小于某个给定域值,则这棵树就称为零树;嵌入表示一幅图像可以分解成一幅低分辨率图像和分辨率由低到高(表示图像细节)的许多子图像,图像合成过程是通过子图像生成许多分辨率不同的图像。EZW编码就是按照用户对图像分辨率的不同要求,编码器进行多次编码,每进行一次编码,域值降低1/2,水平和垂直方向上的图像分辨率各提高1倍。编码从最低分辨率图像开始扫描,每当遇到幅度大于域值的正系数就用符号P表示,幅度小于域值的负系数用符号N表示,树根节点上的系数幅度小于域值而树枝中有大于域值的非零树用符号Z表示,零树用符号T表示,编码的输出是符号集{P,N,T,Z,0,1}中的一系列符号。第9章数字电视基础9.1电视是什么?电视制是什么?世界上主要的彩色电视制有哪几种?(1)电视是捕获、广播和接收活动图像和声音的远程通信系统;(2)电视制(televisionsystem)是传输图像和声音的方法;(3)目前世界上使用的彩色电视制式主要有PAL,NTSC,SECAM三种,都是模拟彩色电视制式。9.2隔行扫描是什么意思?非隔行扫描是什么意思?(1)在隔行扫描中,一帧画面分两场,第一场扫描总行数的一半,第二场扫描总行数的另一半。电子束扫完第1行后回到第3行开始的位置接着扫,如图10-01(b)所示,然后在第5、7、……,行上扫,直到最后一行。奇数行扫完后接着扫偶数行,这样就完成了一帧(frame)的扫描。隔行扫描要求第一场结束于最后一行的一半,不管电子束如何折回,它必须回到显示屏顶部的中央,这样就可以保证相邻的第二场扫描恰好嵌在第一场各扫描线的中间。正是这个原因,才要求总的行数必须是奇数。(2)在非隔行扫描中,电子束从显示屏的左上角一行接一行地扫到右下角,在显示屏上扫一遍就显示一幅完整的图像。9.3电视机和计算机的显示器各使用什么扫描方式?电视机通常使用隔行扫描;计算机的显示器通常使用非隔行扫描。9.6对彩色图像进行子采样的理论根据是什么?人的视觉系统所具有的两种特性。一是人眼对色度信号的敏感程度比对亮度信号的敏感程度低,利用这个特性可以把图像中表达颜色的信号去掉一些而使人不易察觉;二是人眼对图像细节的分辨能力有一定的限度,利用这个特性可以把图像中的高频信号去掉而使人不易察觉。子采样是压缩彩色电视信号的一种技术。9.7图像子采样是在哪个彩色空间进行的?在YCbCr颜色空间9.8一幅YUV彩色图像的分辨率为720×576像素。分别计算采用4:2:2、4:1:1和4:2:0子采样格式采样时的样本数。(1)4:4:4这种采样格式不是子采样格式,它是指在每条扫描线上每4个连续的采样点取4个亮度Y样本、4个红色差Cr样本和4个蓝色差Cb样本,这就相当于每个像素用3个样本表示。720×576×3=1244160(2)4:2:2这种子采样格式是指在每条扫描线上每4个连续的采样点取4个亮度Y样本、2个红色差Cr样本和2个蓝色差Cb样本,平均每个像素用2个样本表示。720×576×2=829440(3)4:1:1这种子采样格式是指在每条扫描线上每4个连续的采样点取4个亮度Y样本、1个红色差Cr样本和1个蓝色差Cb样本,平均每个像素用1.5个样本表示。720×576×1.5=622080(4)4:2:0这种子采样格式是指在水平和垂直方向上每2个连续的采样点上取2个亮度Y样本、1个红色差Cr样本和1个蓝色差Cb样本,平均每个像素用1.5个样本表示。720×576×1.5=622080第10章MPEG简介MPEG是在1988年5月由国际标准组织ISO和国际电工委员会IEC联合成立的专家组。1、MPEG-1,-2,-4,-7,-21分别是什么标准,各自要达到的目标是什么?MPEG-1是数字电视标准。MPEG-1处理的是标准图像交换格式的电视,即NTSC制为352像素×240行/帧×30帧/秒,PAL制为352像素×288行/帧×25帧/秒,压缩的输出速率定义在1.5Mbit/s以下。这个标准主要是针对当时具有这种数据传输率的CD-ROM和网络而开发的,用于在CD-ROM上存储数字影视和在网络上传输数字影视。MPEG-2是数字电视标准。MPEG-2标准是一个直接与数字电视广播有关的高质量图像和声音编码标准,是MPEG-1的扩充。MPEG-2提供位速率的可变性能功能,其最基本目标是:位速率为4~9Mbit/s,最高达15Mbit/s。MPEG-4是视听对象编码标准。MPEG-4的目标是要在异构网络环境下能够高度可靠地工作,并且具有很强的交互功能。MPEG-7是多媒体内容描述接口标准。目的是制定一套描述符标准,用来描述各种类型的多媒体信息及它们之间的关系,以便于多媒体信息的检索。MPEG-21是多媒体框架标准。它的目标是为未来多媒体的应用提供一个完整的平台。MPEG-21要解决的核心问题是资源共享、知识产权和版权的管理与保护。第11章MPEG声音11.2什么叫做听阈?什么叫做痛阈?(1)当声音弱到人的耳朵刚刚可以听见时,称此时的声音强度为“听阈”(2)当声音强到人的耳朵刚刚感到疼痛时,称此时的声音强度为“听阈”。实验表明,如果频率为1kHz的纯音的声强级达到120dB左右时,人的耳朵就感到疼痛,这个阈值称为“痛阈”。11.3什么叫做频域掩蔽?什么叫做时域掩蔽?(1)强纯音掩蔽在其附近同时发声的弱纯音,这种特性称为频域掩蔽。(2)在时间方向上相邻声音之间的掩蔽,这种特性称为时域掩蔽。11.4MPEG-1的层1、2和3编码分别使用了听觉系统的什么特性?层1:频域掩蔽特性;层2:频域掩蔽特性+时间掩蔽特性;层3:频域掩蔽特性+时间掩蔽特性+临界频带特性(声音频率与掩蔽曲线不是线性关系);第12章MPEG视像12.4MPEG专家组在制定MPEG-1/-2Video标准时定义了哪几种图像?哪种图像的压缩率最高?哪种图像的压缩率最低?(1)MPEG专家组定义了三种图像:帧内图像I(intra),预测图像P(predicted)和双向预测图像B(bi-directionallyinterpolated)。(2)双向预测图的压缩率最高,帧内图像的压缩率最低。12.8在MPEG-1和MPEG-2中,典型的宏块由多少个像素组成;子采样为4:2:0的宏块分成多少个亮度图块、红色差图块和蓝色差图块,每个图块由多少个像素组成。在MPEG-1,MPEG-2中,典型的宏块为16
本文标题:《多媒体技术基础》第3版-答案
链接地址:https://www.777doc.com/doc-3870067 .html