您好,欢迎访问三七文档
多媒体系统复习教学内容1多媒体基础2多媒体数据压缩原理3小波变换与图像编码*4多媒体网络应用第1章多媒体技术概要1.1多媒体是什么?超媒体是什么?多媒体与超媒体之间有什么关系?多媒体是融合两种或者两种以上媒体的一种人—机交互式信息交流和传播媒体。使用的媒体包括文字、图形、图像、声音、动画和电视图像(video)。超媒体使用文本、图形、图像、声音和电视图像等媒体任意组合的一种交互式信息传播媒体。多媒体是超媒体系统中的一个子集。1.2SGML是什么语言?HTML是什么语言?它们之间有何关系?(1)1986年国际标准化组织(ISO)采用的一个信息管理标准。该标准定义独立于平台和应用的文本文档的格式、索引和链接信息,为用户提供一种类似于语法的机制,用来定义文档的结构和指示文档结构的标签。(2)HTML是万维网上的文档所用的标记语言。(3)HTML是SGML的一个子集。SGML使用标签来标志文档中的文本或图形之类的元素,并告诉Web浏览器该如何向用户显示这些元素,以及应该如何响应用户的行为,例如当用户通过按键或鼠标单击某个链接时该如何响应。1.3有人认为“因特网就是万维网”,这种看法对不对?为什么?(1)不对。(2)因特网是专指全球范围内最大的、由众多网络相互连接而成的、基于TCP/IP协议的计算机网络;万维网是指分布在全世界所有HTTP服务器上互相连接的超媒体文档的集合。第2章数字声音及MIDI简介2.1音频信号的频率范围大约多少?话音信号频率范围大约多少?2.2什么叫做模拟信号?什么叫做数字信号?(1)幅度或频率发生连续变化的一种信号。(2)以二进制代码形式表示有无或者高低的一种信号。2.3什么叫做采样?什么叫做量化?什么叫做线性量化?什么叫做非线性量化?2.4采样定律2.5样本精度2.6什么叫做MIDI?它有什么特点?产生MIDI乐音得方法:(1)音乐合成器、乐器和计算机之间交换音乐信息的一种标准协议。(2)文件比较小;容易编辑等第3章话音编码3.1下面3种话音编译码器的基本想法。①波形编译码器,②音源编译码器,③混合编译码器(1)波形编译码器:不利用生成话音信号的任何知识而企图产生一种重构信号,它的波形与原始话音波形尽可能地一致。(2)企图从话音波形信号中提取生成话音的参数,使用这些参数通过话音生成模型重构出话音。(3)企图填补波形编译码和音源编译码之间的间隔。波形编译码器虽然可提供高话音的质量,但数据率低于16kb/s的情况下,在技术上还没有解决音质的问题;声码器的数据率虽然可降到2.4kb/s甚至更低,但它的音质根本不能与自然话音相提并论。普通编译码器的音质和数据率,如何计算数据率?P253.4什么叫做均匀量化?什么叫做非均匀量化?(1)均匀量化:采用相等的量化间隔对采样得到的信号进行量化。它是线性量化的另一种说法。(2)非均匀量化:采用非相等的量化间隔对采样得到的信号进行量化。例如,对大的输入信号采用大的量化间隔,对小的输入信号采用小的量化间隔。它是非线性量化的另一种说法。第3章话音编码3.5μ率压扩与A率压扩?(1)在脉冲编码调制(PCM)系统中,一种模拟信号和数字信号之间进行转换的CCITT压(缩)扩(展)标准。在北美PCM电话网中,使用μ率压扩算法,详见“3.2.4μ律压扩”。(2)在脉冲编码调制(PCM)系统中,一种模拟信号和数字信号之间进行转换的CCITT压(缩)扩(展)标准。在欧洲电话网,使用A律压扩算法,详见“3.2.5A律压扩”对于采样频率为8kHz,样本精度为13比特、14比特或16比特的输入信号,使用μ律压扩编码或使用A律压扩编码,经过PCM编码器之后每个样本的精度为8比特,输出的数据率为64kb/s。3.8自适应脉冲编码调制(APCM)的基本思想是什么?根据输入信号幅度大小来改变量化阶大小的一种波形编码技术。这种自适应可以是瞬时自适应,即量化阶的大小每隔几个样本就改变,也可以是音节自适应,即量化阶的大小在较长时间周期里发生变化。第3章话音编码3.9差分脉冲编码调制(DPCM)的基本思想是什么?利用样本与样本之间存在的信息冗余度来进行编码的一种数据压缩技术。这种技术是根据过去的样本去估算(estimate)下一个样本信号的幅度大小,这个值称为预测值,然后对实际信号值与预测值之差进行量化编码,从而就减少了表示每个样本信号的位数。它与脉冲编码调制(PCM)不同的是,PCM是直接对采样信号进行量化编码,而DPCM是对实际信号值与预测值之差进行量化编码,存储或者传送的是差值而不是幅度绝对值,这就降低了传送或存储的数据量。此外,它还能适应大范围变化的输入信号。什么叫做斜率过载?P343.10自适应差分脉冲编码调制(ADPCM)的两个基本思想是什么?ADPCM综合了APCM的自适应特性和DPCM系统的差分特性,是一种性能比较好的波形编码。它的核心想法是:利用自适应的思想改变量化阶的大小,即使用小的量化阶(step-size)去编码小的差值,使用大的量化阶去编码大的差值。使用过去的样本值估算下一个输入样本的预测值,使实际样本值和预测值之间的差值总是最小。第4章无损数据压缩4.1熵的兴义,如何计算,哈夫曼编码算法4.2算术编码,LZW算法第5章彩色数字图像基础5.1什么叫做真彩色和伪彩色?在一幅彩色图像中,每个像素值有R,G,B三个基色分量,每个基色分量直接决定显示设备的基色强度,这样产生的彩色称为真彩色。例如用RGB5∶5∶5表示的彩色图像,R,G,B各用5位,用R,G,B分量大小的值直接确定三个基色的强度,这样得到的彩色是真实的原图彩色。现在,通常把每个像素的颜色值用24位表示的颜色叫做真彩色。24位表示的颜色总数:224=16777216种颜色。RGB与CMYK之间的关系?P66图像的三个基本属性。第5章彩色数字图像基础5.5JPEG压缩编码算法的主要计算步骤是:①DCT变换,②量化,③Z字形编码,④使用DPCM对直流系数(DC)进行编码,⑤使用RLE对交流系数(AC)进行编码,⑥熵编码。假设计算机的精度足够高,问在上述计算方法中,哪些计算对图像的质量是有损的?哪些计算对图像的质量是无损的?(1)DCT变换:无损(2)量化:有损(3)Z字形编码:无损(4)使用DPCM对直流系数(DC)进行编码:无损(5)使用RLE对交流系数(AC)进行编码:无损(6)熵编码:无损第7章颜色空间变换7.1PAL制彩色电视使用什么颜色模型?NTSC制彩色电视使用什么颜色模型?计算机图像显示使用什么颜色模型?(1)PAL制彩色电视:YUV(2)NTSC制彩色电视:YIQ(3)计算机图像显示设备:RGB7.2用YUV或YIQ模型来表示彩色图像的优点是什么?为什么黑白电视机可看彩色电视图像?(1)YUV表示法的一个优点:它的亮度信号(Y)和色度信号(U,V)是相互独立的,因此可以对这些单色图分别进行编码;另一个优点:可以利用人眼的特性来降低数字彩色图像所需要的存储容量。YIQ同样具有YUV的这两个优点。(2)黑白电视能接收彩色电视信号的道理是利用了YUV/YIQ分量之间的独立性。7.3颜色空间的分类第10章彩色数字电视基础10.1世界上主要的彩色电视制式是哪几种?目前世界上使用的彩色电视制式主要有PAL,NTSC,SECAM三种,都是模拟彩色电视制式。10.2隔行扫描是什么意思?非隔行扫描是什么意思?(1)在隔行扫描中,一帧画面分两场,第一场扫描总行数的一半,第二场扫描总行数的另一半。电子束扫完第1行后回到第3行开始的位置接着扫,如图10-01(b)所示,然后在第5、7、……,行上扫,直到最后一行。奇数行扫完后接着扫偶数行,这样就完成了一帧(frame)的扫描。隔行扫描要求第一场结束于最后一行的一半,不管电子束如何折回,它必须回到显示屏顶部的中央,这样就可以保证相邻的第二场扫描恰好嵌在第一场各扫描线的中间。正是这个原因,才要求总的行数必须是奇数。(2)在非隔行扫描中,电子束从显示屏的左上角一行接一行地扫到右下角,在显示屏上扫一遍就显示一幅完整的图像。10.3电视机和计算机的显示器各使用什么扫描方式?电视机通常使用隔行扫描;计算机的显示器通常使用非隔行扫描。第10章彩色数字电视基础10.6图像子采样,对彩色图像进行子采样的理论根据是什么?人的视觉系统所具有的两种特性。一是人眼对色度信号的敏感程度比对亮度信号的敏感程度低,利用这个特性可以把图像中表达颜色的信号去掉一些而使人不察觉;二是人眼对图像细节的分辨能力有一定的限度,利用这个特性可以把图像中的高频信号去掉而使人不易察觉。子采样是压缩彩色电视信号的一种技术。第10章彩色数字电视基础10.8一幅YUV彩色图像的分辨率为720×576。分别计算采用4:2:2、4:1:1和4:2:0子采样格式采样时的样本数。(1)4:4:4这种采样格式不是子采样格式,它是指在每条扫描线上每4个连续的采样点取4个亮度Y样本、4个红色差Cr样本和4个蓝色差Cb样本,这就相当于每个像素用3个样本表示。720×576×3=1244160(2)4:2:2这种子采样格式是指在每条扫描线上每4个连续的采样点取4个亮度Y样本、2个红色差Cr样本和2个蓝色差Cb样本,平均每个像素用2个样本表示。720×576×2=829440(3)4:1:1这种子采样格式是指在每条扫描线上每4个连续的采样点取4个亮度Y样本、1个红色差Cr样本和1个蓝色差Cb样本,平均每个像素用1.5个样本表示。720×576×1.5=622080(4)4:2:0这种子采样格式是指在水平和垂直方向上每2个连续的采样点上取2个亮度Y样本、1个红色差Cr样本和1个蓝色差Cb样本,平均每个像素用1.5个样本表示。720×576×1.5=622080第11章MPEG简介10.2MPEG-1,-2,-4和-7的目标是什么?MPEG-1处理的是标准图像交换格式的电视,即NTSC制为352像素×240行/帧×30帧/秒,PAL制为352像素×288行/帧×25帧/秒,压缩的输出速率定义在1.5Mb/s以下。这个标准主要是针对当时具有这种数据传输率的CD-ROM和网络而开发的,用于在CD-ROM上存储数字影视和在网络上传输数字影视。MPEG-2标准是一个直接与数字电视广播有关的高质量图像和声音编码标准,是MPEG-1的扩充。MPEG-2提供位速率的可变性能功能,其最基本目标是:位速率为4~9Mb/s,最高达15Mb/s。MPEG-4是为视听数据的编码和交互播放开发算法和工具,是一个数据速率很低的多媒体通信标准。MPEG-4的目标是要在异构网络环境下能够高度可靠地工作,并且具有很强的交互功能。MPEG-7的名称叫做多媒体内容描述接口,目的是制定一套描述符标准,用来描述各种类型的多媒体信息及它们之间的关系,以便更快更有效地检索信息。这些媒体材料可包括静态图像、图形、3D模型、声音、话音、电视以及在多媒体演示中它们之间的组合关系。在某些情况下,数据类型还可包括面部特性和个人特性的表达。第12章MPEG声音12.1听觉系统的特性。响度感知,音高感知,掩蔽效应12.2什么叫做听阈?什么叫做痛阈?(1)当声音弱到人的耳朵刚刚可以听见时,称此时的声音强度为“听阈”(2)当声音强到人的耳朵刚刚感到疼痛时,称此时的声音强度为“听阈”。实验表明,如果频率为1kHz的纯音的声强级达到120dB左右时,人的耳朵就感到疼痛,这个阈值称为“痛阈”。12.3什么叫做频域掩蔽?什么叫做时域掩蔽?强纯音掩蔽在其附近同时发声的弱纯音,这种特性称为频域掩蔽。(2)在时间方向上相邻声音之间的掩蔽,这种特性称为时域掩蔽。12.4MPEG-1的层1、2和3编码分别使用了听觉系统的什么特性?层1:频域掩蔽特性层2:频域掩蔽特性,时间掩蔽特性层3:频域掩蔽特性,时间掩蔽特性第12章MPEG声音12.10什么叫做TTS?至少列举TTS的3个潜在应用例子。通过话音合成设备自动地把基于文字的数据转换为声音输出的一种技术。文语转换的最终目标是要使计算机像人一样输出清晰而又自然的声音,也就是说,根据文本的内容可以不同
本文标题:多媒体系统复习1
链接地址:https://www.777doc.com/doc-3507971 .html