您好,欢迎访问三七文档
威海北洋职业技术学校《多媒体技术教程》第二章多媒体信息的表示威海北洋职业技术学校《多媒体技术教程》【学习目标】1.掌握:位图、矢量图的定义。2.理解:音频信号的数字化处理,矢量图与位图、图像与图形的比较。3.了解:超文本与超媒体。【学习要点】多媒体信息(文字、音频、视觉媒体、动画)在计算机中是如何表示的。2.1文字文字是人与计算机之间进行信息交换的主要媒体。文本文件在现实世界中,文字是人们进行通讯的主要形式,文字包括西文和汉字。2.1.1西文在计算机中西文采用ASCII码表示。是由美国国家标准局(ANSI)制定的ASCII码(AmericanStandardCodeforInformationInterchange)例如:字符A的ASCII码值为065;字符B的ASCII码值为066;字符C的ASCII码值为067;2.1.2汉字1.汉字的输入编码(1)数字编码数字编码输入的优点是无重码,缺点难以记忆。(2)拼音码以汉语拼音为基础的输入法,汉字输入法重码率很高,同音字的选择影响了输入速度的提高。(3)字型编码五笔2.汉字内码汉字内码用于汉字信息的存储、交换、检索等操作的机内代码,一般采用两个字节表示。3.汉字字模码字模码是用点阵表示的汉字字形代码,它是汉字的输出形式2.2音频音频–分类1.波形声音–包含了所有的声音形式,它可以把任何声音都进行采样量化,并恰当地恢复出来。2.2音频音频–分类2.语音–人的说话声虽是一种特殊的媒体,但也是一种波形,所以和波形声音的文件格式相同。3.音乐–符号化了的声音,乐谱可转变为符号媒体形式。2.2.1数字音频音频–数字声音波形质量的主要技术参数•采样频率–等于波形被等分的份数,份数越多,质量越好•11.025KHZ、22.05KHZ、44.1KHZ•采样精度–每次采样信息量•8位、16位•通道数–声音产生的波形数•单声道、立体声道、5.1声道数据量计算:(采样频率×采样精度×通道数×时间)/8字节2.1.1常见的媒体元素动画–动画的概念运动的图画,实质是一幅幅静态图像的连续播放。动画的连续播放既指时间上的连续,也指图像内容上的连续,即播放的相邻两幅图像之间内容相差不大。–计算机设计动画方法•造型动画•帧动画2.1.1常见的媒体元素动画–帧动画2.1.1常见的媒体元素动画–帧动画2.1.2媒体的种类视觉视觉(静止)图像图形文字符号语言文字抽象化抽象化(动态)图像图形动态影像视频真实感三维动画二维动画三维动画其它表示为视觉的媒体2.1.2媒体与多媒体听觉触觉其他感觉抽象化听觉声音声响(自然界)语音(人类语言)音乐其它(嗅觉、味觉等)触觉振动运动传感/发生器2.1.3媒体的性质和特点各种媒体具有不同特点和性质–媒体是有格式的–不同媒体表达信息的特点和程度各不相同–媒体之间可以相互转换–媒体之间的关系也具有丰富的信息媒体具有空间性质–表现空间–媒体按相互的空间关系进行组织–视觉空间、听觉空间和触觉空间这3者既相互独立又需要相互结合2.1.3媒体的性质和特点媒体的时间性质–表现需要时间–媒体在时间坐标轴上的相互关系媒体的语义–媒体的语义是有层次的–抽象的程度不同,语义的重点也就不同媒体结合的影响–媒体结合是多层次的–媒体结合有利于信息接受和理解隐喻–交互的概念模型,也称心智模型威海北洋职业技术学校《多媒体技术教程》2.2听觉媒体技术2.2.1声音心理学1.声音的量纲声音的振动是一种正弦波,声音的变化必须确定三件事:频率(变化的速度)、幅度(产生的压力)、相位(何时开始)。另外一方面,人们可以感觉到声音的强弱,可以感觉到歌唱家音调的高低。因此,声音的量纲分为声音的物理量纲和心理量纲。2.2.1声音心理学物理量纲可以用精确的值来描述,但对某一具体声音得来的心理印象却不容易说明白,因为心理印象要由被测者的经验而定。声音的心理属性和物理属性不可等同,首先,这些关系不是线性的;其次这些关系不是孤立的;第三这些关系不是不变的。2.2.1声音心理学两者之间确有关系:例如声音的响度取决于强度和频率两个因素,如果频率不变,强声显得比弱声要响些。但如果强度不变,过高频率的声音和过低频率的声音似乎比中频的声音听起来都要弱一些。由此可见,响度依赖于频率,原因是人耳能反应的频率范围是有上限和下限的。2.2.1声音的量纲心理变量首要的物理变量次要的物理变量响度声强声波频率音调声波频率声强音色声波复合-音量频率和强度-密度频率和强度-谐和(流畅或粗糙)谐波结构音乐技巧噪声强度频率组合,各种时间参量骚扰声强度频率组合,无意义2.2.1声音心理学2.听觉特性等响曲线由于响度与频率和强度有关,所以在不同频率上的强度是不同的。先设一个音为标准音,给予固定的频率、强度和持续时间,例如1000Hz、40分贝、持续0.5秒;再给一个音也持续0.5秒,但频率不同,通过调整使其响度听起来一样,得到的这样一组曲线称之为等响曲线。等响曲线描述的是响度与频率和强度的关系。从声音心理学考虑,对同一响度的声音在频率上和强度上可以有很大的差别,这对声音表现有重要意义。2.2.1声音心理学掩蔽(masking)声音的响度不仅取决于自身的强度和频率,而且也依赖于同时出现的其它声音。各种声音可以互相掩蔽,也就是说一种声音的出现可能使得另一种声音难于听清。由于声音的掩蔽效果,可以欺骗人的听觉。例如,本来是多种频率的声音的复合,但听众以为是另一种声音。所以,声音的掩蔽特性常常用于声音的压缩。2.2.1声音心理学临界频带在频率的某一临界区里,各种声音是相互作用的,合成声音的响度由这些频率共同决定。如果超出临界区,声音的响度不再相互作用,声音的响度随频率的改变而改变。这个临界区就是临界频带,其宽度视其中心频率而定。对于临界频带的确定,使得对声音响度的处理能够有的放矢。2.2.1声音心理学相位从声音的波形来看,声音的起点和方向也要反映声音的特性,这就是声音的相位。当两个声音相同相位完全相反时,它们将相互抵消;当两个声音相同而且相位也相同时,声音就会得到加强。相位的确定对于多声道声音系统的设计非常重要,其可以应用在回声的消除、会议系统的声音设计上。2.2.1声音心理学自然声音的时变现象声音的音调分成三个区域:起始区、稳定状态区、延迟区。研究表明,音调的频谱分量随时间改变。在稳定状态区,频谱保持固定。在起始区,振幅频谱随时间变化。因此自然声音的起始部分是非常难识别的。例如刚听了一小节音调后要识别乐器,专家也会觉得较难。时变现象用于数字系统中,说明声音中的某些错误是不太容易发现的,但如果出现停顿就很容易引起人的注意。2.2.1声音心理学听觉空间人耳可听到来自各个方向的声音,并用不同的因素来判定声源的位置。声源的位置不论对于增进人们的感受还是增进对声音的理解,都是非常重要的。通过声音的精确再现,就可以构造出听觉空间。方位的线索是各种声音到达两耳的精确时间和强度。2.2.1声音心理学听觉的频谱特性声音是时间函数,通过傅里叶变换可做出其频谱图。人耳对频谱成分的波峰和波谷是非常敏感的。在语言中,元音很少有频谱变速变化的区域。基频改变,人耳是很敏感的。例如:快进的录像,音调会发生变化。音色非常复杂,目前尚在研究中。音色的处理将使我们能识别音源,音色也代表和声音有关的主观质量。2.2.1声音心理学声音的心理模拟通过人工真实的方法,可以对视觉空间的景物进行再造或虚构,同样也可以对听觉空间的声音进行心理的模拟,这就是所谓的可听化(audiolization)。用声音可以表达出一些声音的效果。2.2.2音频的数字化和符号化从人与计算机交互的角度看,音频信号的处理包括下述3点:人与计算机通信,也就是计算机接收音频信号。包括音频获取、语音的识别和理解。计算机与人通信,也就是计算机输出音频。包括音乐合成、语音合成、声音的定位以及音频视频的同步。人-计算机-人通信。人通过网络与异地的人进行语音通信,相关的音频处理有语音采集、音频的编码和解码、音频的存储、音频的传输、基于内容的检索等。2.2.2音频的数字化和符号化1.音频的数字化与再现在计算机中,所有的信息都以数字来表示。声音信号也是由一系列的数字来表示的,称为数字音频。数字音频的特点就是保真度好,动态范围大。数字声音是一个数据序列。它是由外界声音经过采样、量化和编码后得到的。2.2.2音频的数字化和符号化对声音进行采样用奈奎斯特采样定理来决定采样的频率。根据该定理,只要采样频率高于信号中最高频率的两倍,就可以从采样中完全恢复原始信号的波形。因为人耳所能听到的频率范围为20Hz到20KHz,所以实际的采样过程中,为了达到好的效果,就采用44.1KHz作为高质量声音的采样频率。如果达不到这么高的频率,声音恢复的效果就会差一些,例如电话声音的质量等。一般来说,声音恢复和采样频率、信道带宽都有关。声音的采样以及量化图2.2.2音频的数字化和符号化2.2.2音频的数字化和符号化与数字音频相关的重要特性:采样频率采样频率与声音的质量关系最为紧密。采样频率越高,声音质量越接近原始声音,所需的存储量便越多。标准的采样频率有三个:44.1KHz,22.05kHz,和11.025kHz。采样位数存放一个采样点所需的比特数。一般的采样位数为8位或16位,即把声音采集为256等份或65536等分。2.2.2音频的数字化和符号化声道数有单声道、双声道和多声道。如多种语言音频混存时,需要多声道数据量(采样频率×每点采样位数×声道数)数据量=8(字节/秒)2.2.2音频的数字化和符号化2.声音的符号化波形声音可以把音乐、语音都进行数据化并且表示出来,但是并没有把它看成音乐和语音。对于声音的符号化(也可以称为抽象化)表示包括两种类型:一种是音乐,一种是语音。2.2.2音频的数字化和符号化(1)音乐的符号化-MIDIMIDI(MusicInstrumentDigitalInterface)是指乐器数字接口的国际标准。MIDI消息,是指乐谱的数字描述。任何电子乐器,只要有处理MIDI消息的微处理器和合适的硬件接口,就构成了一个MIDI设备。当一组MIDI消息通过音乐合成芯片处理时,合成器能解释这些符号并且产生音乐。MIDI的关键是作为媒体能够记录这些音乐的符号,相应的设备能够产生和解释这些符号。它给出了一种得到音乐声音的方法。2.2.2音频的数字化和符号化MIDI的特点:与波形声音相比,MIDI不是声音数据而是指令,所以数据量要少得多。30分钟的音乐,用MIDI文件记录只需200KB,用16位CD品质的未压缩WAV文件记录需317MBMIDI可以与其他波形声音配合使用,形成伴乐的效果。而两个波形声音一般是不能同时使用的对MIDI的编辑也很灵活,用户可以自由地改变音调、音色等属性,直到自己想要的效果MIDI在音质上还不能与真正的乐器完全相似。无法模拟自然界中其它非乐曲类声音2.2.2音频的数字化和符号化(2)语音的符号化语音与文字是对应的。波形声音可以记录表示语音,它是不是语音取决于听者对声音的理解。对语音的符号化实际上就是对语音的识别,将语音转变为字符,反之也可以将文字合成语音。语音指构成人类语音信号的各种声音。在采集和存储上可以与波形声音一样,但由于语音是由一连串的音素组成。“一句话”中包含许多音节以及上下文过渡过程的连接体等特殊的信息,并且语音本身与语言有关,所以要把它作为一个独立的媒体来看待。2.2.3音频媒体的三维化处理1.三维虚拟声空间所谓三维虚拟声空间(ThreeDimensionalVirtualAcoustic,3DVA),是指用一定的声音设备人为地产生出来的具有空间位置信息的声音空间。三维听觉的使用明显地依赖于用户对听觉空间中各种信息源的定位能力。一般说来,三维虚拟声空间要达到以下的一些目标:①在可听的范围内重现频率分辨度和动态范围;②在三维空间中精确地呈现声音的位置信息;③能表达多个静止和移动的声源;④能和头部的动作具有一定的关联;⑤能够支持一定程度的交互。2.2.3音频媒体的三维化处理
本文标题:多媒体技术教程-2
链接地址:https://www.777doc.com/doc-1473842 .html