您好,欢迎访问三七文档
第四章数字媒体及应用4.1.1数制及相互转换数制也称计数制,是指用一组固定的符号和统一的规则来表示数值的方法。编码是采用少量的基本符号,选用一定的组合原则,以表示大量复杂多样的信息的技术。计算机是信息处理的工具,任何信息必须转换成二进制形式数据后才能由计算机进行处理、存储和传输。1.基本概念(4)数位,基数和位权①数位是指数码在一个数中所处的位置。②基数是指在某种进位计数制中,每个数位上所能使用的数码的个数。例如:二进制数基数是2,每个数位上所能使用的数码为0和1两个数码。③对于多位数,处在某一位上的“1”所表示的数值的大小,称为该位的位权。例如,二进制第2位的位权为2,第3位的位权为4。一般情况下,对于N进制数,整数部分第i位的位权为Ni-1,而小数部分第j位的位权为N-j。(5)常用进制数及其书写方式考试中常用到的进制数是二进制数、八进制数、十进制数、十六进制数。进制数的书写方式有两种:•用(进制数)下角标。如(1001)2(45)8•用大写字母表示,B—二进制,D—十进制,O—八进制,H—十六进制。如1001B,45O,3AH。注意,十进制在书写的时候可以不用标示出符号。2.数制与编码(1)二进制(二进位计数制)具有二个不同的数码符号0、1,其基数为2;二进制数的特点是逢二进一,例如:(1011)2=1×23+1×22+1×21+1×20=(11)10(2)十进制(十进位计数制)具有十个不同的数码符号0、1、2、3、4、5、6、7、8、9,其基数为10;十进制数的特点是逢十进一,例如:(1011)10=1×103+0×102+1×101+1×100=1011(3)八进制(八进位计数制)具有八个不同的数码符号0、1、2、3、4、5、6、7,其基数为8;八进制数的特点是逢八进一,例如:(1011)8=1×83+0×82+1×81+1×80=(521)10(4)十六进制(十六进位计数制)具有十六个不同的数码符号0、1、2、3、4、5、6、7、8、9、A、B、C、D、E、F,其基数为16,十六进制数的特点是逢十六进一,例如:(1011)16=1×163+0×162+1×161+1×160=(4113)103.不同数制的转换(五句口诀)①十进制整数转换为R进制数——除R(基数)取余法,余数倒序排列。②十进制纯小数转换为R进制数——乘R(基数)取整法,整数正序排列。③R进制数转换为十进制数——乘权求和法。④八.十六进制转换为二进制——每1位八进制数码用3位二进制数码表示,每1位十六进制数码用4位二进制数码表示。⑤二进制转换为八.十六进制——从小数点开始分别向左向右展开:每3位二进制数码用1位八进制数码表示,每4位二进制数码用1位十六进制数码表示。4.1.2数值计算1.R进制算数运算法则加法运算:逢R进一。减法运算:借一位,当R用。2.逻辑运算①二进制有两个逻辑值:1(逻辑真),0(逻辑假)②逻辑加(也称“或”运算,用符号“OR”.“∨”或“+”表示)当A和B均为假时,结果为假,否则结果为真③逻辑乘(也称“与”运算,用符号“AND”.“∧”或“•”表示)当A和B均为真时,结果为真,否则结果为假。④取反(也称“非”运算,用符号“NOT”或“-”表示)⑤异或(用符号“XOR”表示)两个值不同时为真,相同时为假。4.1.3数值信息表示1.整数表示(定点数)计算机中的整数一般用定点数表示,定点数指小数点在数中有固定的位置。整数又可分为无符号整数(不带符号的整数)和整数(带符号的整数)。无符号整数中,所有二进制位全部用来表示数的大小,有符号整数用最高位表示数的正负号,其它位表示数的大小。如果用一个字节表示一个无符号整数,其取值范围是0~255(28-1)。表示一个有符号整数,其取值范围-128~+127(-27~+27-1)。例如:如果用一个字节表示整数,则能表示的最大正整数为01111111(最高位为符号位),即最大值为127,若数值>|127|,则“溢出”。计算机中表示一个带符号的整数,数的正负用最高位来表示,定义为符号位,用“0”表示正数,“1”表示负数。带符号整数有原码和补码两种表示方式,其中带符号的正数的补码就是原码本身;带符号的负数的补码是原码取反再加一换算得来,计算机中带符号的负数采用补码的形式存放。原码到补码的换算过程是:保持最高位符号为不变,其余各位取反,然后末位加1。补码到原码的换算过程是:保持最高位符号为不变,其余各位取反,然后末位加1。注意:如果是正数,则补码就是其原码本身,反推,如果带符号数补码的最高位是0,则该补码表示形式也是该数值的原码表示形式。2.浮点数表示实数一般用浮点数表示,因为它的小数点位置不固定,所以称浮点数。它是既有整数又有小数的数,纯小数可以看作实数的特例。任何一个实数都可以表达成一个乘幂和一个纯小数之积,57.6256.-1984.043.0.004567都是实数以上三个数又可以表示为:57.6256=102×(0.576256)-1984.043=104×(-0.1984043)0.004567=10-2×(0.4567)其中指数部分(称为“阶码”,是一个整数)用来指出实数中小数点的位置,括号内是一个纯小数(称为“尾数”)。二进制的实数表示也是这样,例如:1001.011=2100×(0.1001011)-0.0010101=2-10×(-0.10101)在计算机中通常把浮点数分成阶码和尾数两部分组成,其中阶码一般用补码定点整数表示,尾数一般用补码或原码定点小数表示。阶符表示指数的符号位,阶码表示幂次,数符表示尾数的符号位,尾数表示规格化的小数值。用科学计数法表示:N=S×2i,其中S为尾数,i为阶码。阶符阶码数符尾数N=-S×2i数符尾数阶符阶码4.2文本与文本处理4.2.1基本概念字符(character):是记录语言的符号,它适用于一种或多种书面语言。字符集(characterset):相关的多个字符的集合称为字符集。文本(text):基于特定字符集的、具有上下文相关性的一个字符流,每个字符均使用编码表示。如:一个记事本文档、一个Word文档。字符的编码1.西文字符编码(ASCII码)西文字符集:由拉丁字母、数字、标点符号及一些特殊符号组成。西文字符的编码:对字符集中每一个字符各有一个二进制编码,通常记为十进制数或十六进制数。(1)标准ASCII码——美国标准信息交换码(AmericanStandardCodeforInformationInterchange)•使用7个二进位对字符进行编码。•每个ASCII字符以一个字节存放(8位,最高位为0)•标准的ASCII字符集共有128个字符,其中含:96个可打印字符(常用字母、数字、标点符号等),32个控制字符。•一般要记住几个特殊字符的ASCII码:空格(32)、A(65)、a(97)、0(48)•注意:数字、字母的ASCII码是连续的;对应大小写字母ASCII码相差32。•不同类型的ASCII码的十进制数值由小到大的排序:数字大写字母小写字母128个字符与8位(01111111)是否相冲突?(2)扩展ASCII码标准ASCII字符集只有128个不同的字符,在很多应用中无法满足要求。扩展ASCII码:将标准ASCII码的最高位置1,得到十进制数代码128~255,称为扩展ASCII码,可代表扩展的另128个字符。扩充ASCII字符集=标准ASCII字符集+扩展字符集2.汉字字符的编码(1)我国汉字编码的国家标准•GB2312-80(6763个常用简体汉字和682个图形符号)•GBK-95(21003个汉字和883个图形符号)•GB18030-2000(27000多个汉字)区分这两个128?1000000011111111(2)GB2312-80字符集•GB2312构成:包括6763个汉字和682个非汉字字符•一级常用汉字3755个,按汉语拼音排列•二级常用汉字3008个,按偏旁部首排列•非汉字字符682个•GB2312构成一个二维平面,分成94行和94列,行号称为区号,列号称为位号。唯一标识一个汉字。•将区位码的区号和位号分别加上32(20H),得到国标交换码•将国标码的两个字节的最高位置1(加128,即80H),得到PC机常用的机内码•汉字的区位码、国标码、机内码有如下关系:国标码=区位码+2020H机内码=国标码+8080H机内码=区位码+A0A0H汉字机内码双字节,最高位是1;西文字符机内码单字节,最高位是0。汉字:双字节1西文:单字节0(4)UCS/Unicode编码标准UCS/Unicode—通用编码字符集UCS—国际标准化组织制定的ISO/IEC10646标准Unicode—统一码或联合码,微软、IBM等联合制定、与UCS完全等同的工业标准。UCS/Unicode用4个字节对全世界现代书面文字所使用的所有字符、符号进行编码(记作UCS-4)汉字输入编码方法的分类:①数字编码:使用一串数字来表示汉字的编码方法,例如电报码、区位码等缺点:难以记忆,不易推广②字音编码:一种基于汉语拼音的编码方法,简单易学,适合于非专业人员。缺点:同音字引起的重码多,需增加选择操作③字形编码:将汉字的字形分解归类而给出的编码方法,重码少、输入速度较快,如五笔字形法和表形码等。缺点:编码规则不易掌握④形音编码:吸取了字音编码和字形编码的优点,使编码规则适当简化、重码减少。缺点:不易掌握印刷体汉字识别:将传统纸介质上的文字信息自动输入计算机并转换为数字文本形式的一种技术,也叫做汉字OCR(OpticalCharacterRecognition)。4.2.4文本类型文本是计算机表示文字及符号信息的最常用也是最基本的一种数字媒体。使用计算机制作的数字文本,根据用途分为:简单文本、丰富格式文本和超文本三类。1.简单文本(纯文本)除了表达正文的字符和几个打印控制字符外,不含其它格式信息和结构信息。简单文本又称为纯文本或ASCII文本。如在Windows中,文件的后缀名为“.txt”的文件就是文本文件。简单文本为一种线性结构,由若干行构成,每行由若干个字符构成。2.丰富格式文本在简单文本中增加格式控制和结构说明信息,构成丰富格式文本,如Word文本。RTF是一种中间格式,它的目的是使各种丰富格式文本在不同的软件和系统中互换使用。3.超文本•超文本采用一种网状结构来组织信息•节点可以是文字、文本块、图形、图像、声音或视频•超链接、链源、链宿•通过链接、跳转、导航、回溯等操作实现跳跃式阅读•超文本中的节点不单是文本节点,还包含图形、图像、声音或动画节点,这种基于多媒体信息结点的超文本,有时也称为“超媒体”例如:Windows中的“帮助”文件就是一种典型的超文本。Web中的网页通常也是超文本。(2)面向办公的文本处理软件•MS-Office•WPS2000•永中Office中的文本处理软件(3)面向出版的文本处理软件排版软件的主要功能:将文字、图形和图像等合理地安排在页面内•方正集团公司的“飞腾”排版软件。•美国Adobe公司的PageMaker和PDFWriter。4.3图像与图形4.3.2图像的表示方法与主要参数1.图像的表示方法一幅取样图像由M行×N列个取样点组成,每个取样点称为像素(pictureelement,简写为pixel)。2.取样图像的属性•图像分辩率(包括垂直分辨率和水平分辨率):图像在屏幕上的大小•常用颜色模型:RGB(红、绿、蓝)、CMYK(青、品红、黄、黑)、HSV(色彩、饱和度、亮度)、YUV(亮度、色度)等。•像素深度:像素的所有颜色分量的二进制位数之和,它决定了不同颜色(亮度)的最大数目。3.图像数据量的计算公式(以字节为单位)数据量=图像水平分辨率×图像垂直分辨率×像素深度/8几种常用图像的数据量图像大小8位(256色)16位(65536色)24位(真彩色)512×512256KB512KB768KB640×480300KB600KB900KB1024×768768KB1.5MB2.25MB1024×10241MB2MB
本文标题:数字媒体及应用
链接地址:https://www.777doc.com/doc-3701830 .html