您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 广告经营 > 第5章 数字媒体及应用
第5章数字媒体及应用5.1文本与文本处理5.2图像与图形5.3数字声音及应用5.4数字视频及应用25.1文本与文本处理5.1.1字符的编码5.1.2文本准备5.1.3文本的展现3文字处理是计算机应用的基础计算机应用=使用计算机进行信息处理其中,文字信息处理是涉及面最广的一种计算机应用,几乎与任何领域任何人都有关。文字数值语言音乐图像···信息的形态有多种4计算机文字处理过程文字信息在计算机中称为“文本”(text),文本是计算机中最常用的一种数字媒体文本由一系列“字符”(character)组成,每个字符均使用二进制编码表示文本在计算机中的处理过程是:(文本编辑器)文本编辑与排版格式化的电子文本(2)文本展现(文本阅读器)(5)文本处理(文本处理软件)(3)文本准备电子文本(1)(文字与图表的输入)文本存储与传输(4)(存档/通信软件)55.1.1.字符在计算机中的表示6字符、字符集及其码表文字的基本元素是字母和符号,统称为“字符”(character),它包括:字母、数字、标点、符号等字符集:一组特定字符的集合不同的字符集包含的字符数目与内容不同,如:中文字符集、西文字符集、日文字符集等字符的编码:字符集中每个字符都使用二进位(code)表示,称为该字符的编码不同的字符其编码各不相同字符集中所有字符的编码的一览表,称为该字符集的码表7西文字符的编码——ASCII码西文是表音文字(拼音文字),它由拉丁字母、数字、标点符号以及一些特殊符号所组成美国标准信息交换码(AmericanStandardCodeforInformationInterchange,简称ASCII码):ASCII字符集包含96个可打印字符和32个控制字符采用7个二进位进行编码计算机中使用1个字节存储1个ASCII字符存在问题:7位代码空间太小(只能对128个字符编码)不同国家和地区使用不同的字符集及其编码,互不兼容东亚地区使用的大字符集无法编码8标准ASCII字符集及其码表b6b5b4b3b2b1b0012345670123456789ABCDEFb6b5b4b3b2b1b0011010011010119常用的汉字编码字符集国家标准GB2312汉字扩充规范GBK国家标准GB18030台湾地区的标准汉字字符集CNS11643(BIG5,俗称“大五码”)日本工业标准汉字字符集JISX0208-90韩国国家标准汉字字符集KSC5601-8710一级汉字(3755个)二级汉字(3008个)(扩充使用)字母、数字和各种符号………………19423位号…………191655568794区号(按汉语拼音排列)(按偏旁部首排列)GB2312汉字编码字符集1980年颁布《信息交换用汉字编码字符集·基本集》——GB2312-1980GB2312字符集由三个部分构成:拉丁字母、俄文、日文平假名与片假名、希腊字母、汉语拼音等共682个共6763个汉字和682个符号,每个汉字或符号都有一个确定位置,该位置的区号和位号就是这个汉字的“区位码”(注:区位码仅用于在键盘上输入汉字)11背景材料:UCS/Unicode解决多文种信息处理方法的发展:传统方法(ISO):扩展ASCII码微软的方法:代码页切换UCS/Unicode:所有文字字母和符号集中在同一字符集进行统一编码(目前收集了17x216=1,114,112个)UCS/Unicode的编码方案:尽量与已有编码标准兼容先实现部分字符的编码(101,000个)允许有若干不同的编码方案,例如:单字节:ASCII字符双字节:拉丁、希腊、阿拉伯,···三字节:CJK汉字四字节:其他Unicode:UTF-8单字节可变长编码应用:Linux,Web网页,电子邮件双字节:ASCII字符、拉丁、希腊、阿拉伯,常用CJK汉字,···四字节:CJK汉字Unicode:UTF-16双字节可变长编码应用:Windows,Mac,Java,···12例:IE浏览网页时文字编码的选择135.1.2.文本准备——文稿如何输入计算机14文字符号输入计算机的方法键盘输入自动识别输入字符信息的输入人工输入(1)数字编码,如电报码、区位码等,(2)字音编码,如智能ABC等(3)字形编码,如五笔字形和表形码等,(4)形音编码发展趋势:基于统计和学习功能的以词语(短语)或句子作为输入单位的输入方法15文字符号输入计算机的方法键盘输入联机手写输入自动识别输入字符信息的输入人工输入•优点:–自然,流畅–小型化,适合移动计算•不足:–识别速度和正确性还需提高–书写要求还要降低16文字符号输入计算机的方法键盘输入联机手写输入语音输入自动识别输入字符信息的输入人工输入•优点:•自然,方便,适合移动计算•不足:•对说话人、说话方式、说话内容的适应能力要大大增强•识别速度和正确性还需大大提高17文字符号输入计算机的方法印刷体识别键盘输入联机手写输入语音输入自动识别输入字符信息的输入人工输入扫描仪OCR数字文本纸介质文本文本的映象(image)•识别率已达到98%•功能:–简、繁体字混合识别–中文、西文混合识别–文字、表格混合识别–智能校对功能18文字符号输入计算机的方法印刷体识别手写体识别键盘输入联机手写输入语音输入自动识别输入字符信息的输入人工输入–技术上非常困难,还无法实用–目前准备先突破工整的楷书手写体的识别!19汉字的键盘输入汉字与键盘上的键无法一一对应,因此必须使用几个键来表示一个汉字,这就称为汉字的“键盘输入编码”优秀的汉字键盘输入编码应具有的特点:易学习、易记忆效率高(平均击键次数较少)重码少容量大(可输入的汉字字数多)205.1.3文本的展现(输出)21文本的展现(输出)目的:阅读、浏览或打印文本使用的软件:文本阅读器/文本浏览器嵌入在文本编辑(处理)软件中,如微软的Word,独立的软件:如Adobe公司的AcrobatReader,微软公司的IE等文本展现的过程:1.对文本的格式描述进行解释2.生成文字和图表的映像(bitmap)3.传送到显示器或打印机输出22附:输出过程中字形的生成过程:先根据字符的字体确定相应的字库(font),再按照该字符的代码从字库中取出该字符的形状描述信息然后按形状描述信息生成字形,并按照字号大小及有关属性(粗体、斜体、下横线)将字形作必要的变换最后将变换得到的字形放置在页面的指定位置处2种不同的字库:点阵描述轮廓描述轮廓点直线二次曲线5.2图像与图形5.2.1数字图像的获取5.2.2图像的表示与压缩编码5.2.3数字图像处理与应用5.2.4计算机图形245.2.1数字图像的获取25图像的获取过程扫描模拟图像取样取样取样数字图像分色量化量化量化从现实世界中获得数字图像的过程称为图像的“获取”常用的图像获取设备:扫描仪、数码相机、摄像头、摄像机等图像获取过程:将画面划分为M×N个网格,每个网格称为一个取样点将彩色图像取样点的颜色分解成R,G,B三个基色测量每个取样点的每个分量(基色)的亮度值对取样点每个分量的亮度值进行A/D转换,使用数字整型量表示265.2.2图像的表示与压缩编码27数字(取样)图像的组成数字取样图像由M(列)×N(行)个取样点组成取样点是组成数字取样图像的基本单位,称为“像素”彩色图像的像素通常由3个彩色分量组成灰度图像和黑白图像的像素只包含1个亮度分量Red分量Green分量Blue分量像素28例1:黑白图象的表示黑白图像黑白图像的每个像素只有一个分量,且只用1个二进位表示,其取值仅“0”(黑)和“1”(白)两种29例2:灰度图象的表示灰度图像灰度图像的每个像素也只有一个分量,一般用8~12个二进位表示,其取值范围是:0~2n-1,可表示2n个不同的亮度30例3:彩色图象的表示蓝色分量绿色分量红色分量彩色图像的每个像素有三个分量,分别表示三个基色的亮度,假设3个分量分别用n,m,k个二进位表示,则可表示2n+m+k种不同的颜色31数字(取样)图像的主要参数图像大小(图像分辨率):用来表示组成该图像的行列数目,亦即图像所包含的像素数目使用水平分辨率x垂直分辨率表示对在屏幕上显示出来的大小有影响颜色空间的类型,指彩色图像所使用的颜色描述方法,如:RGB(红、绿、蓝)模型,显示器使用CMYK(青、品红、黄、黑)模型,彩色打印机使用HSB(色彩、饱和度、亮度)模型,用户界面中使用YUV(亮度、色度)模型,彩色电视信号传输时使用像素深度,即像素的所有颜色分量的二进位数目之和图像类型像素的组成像素深度(位数)颜色空间单色图像黑白图像仅1个分量1位不使用灰度图像仅1个分量2~12位不使用彩色图像彩色图像3个分量以上8~36位RGB,CMY,YUV等32数字图像的数据量数字图像数据量的计算公式(以字节为单位):数据量=水平分辨率×垂直分辨率×像素深度/8几种常用格式的图像的数据量:图像大小8位(256色)16位(65536色)24位(真彩色)640×480300KB600KB900KB1024×768768KB1.5MB2.25MB1280×10241.25MB2.5MB3.75MB例:数字图像传输时间的计算假设数据传输速率为56kb/s(电话上网),则传输一幅分辨率为640×480的6.5万种颜色的未压缩图像的时间为:(640x480x16)/56000=87.8秒33数字图像的数据压缩图像数据压缩的必要性:节省存储数字图像所需要的存储器容量提高图像的传输速度,减少通信费用图像数据压缩的可能性:数字图像中有大量的数据冗余人眼视觉有局限性,允许图像有一些失真图像数据压缩的两种类型:无损压缩:用压缩后的数据还原出来的图像没有任何误差有损压缩:用压缩后的数据还原出来的图像有一定的误差压缩编码方法的评价压缩倍数的高低(压缩比)重建图像的质量(有损压缩时)压缩算法的复杂程度34图像文件格式例1:BMP格式BMP图像格式是Windows操作系统下使用的一种标准图像格式支持单色、16色、256色、真彩色图像一个文件一幅图像,可以进行无损压缩,也可不压缩非压缩的BMP文件是一种通用的图像文件格式,几乎所有Windows应用软件都能支持35图像文件格式例2:GIF图像颜色数目不超过256色,适合用作插图、剪贴画等色彩数要求不高的场合,文件特别小,适合网络传输GIF图像格式具有累进显示功能,适合网络浏览器观看GIF图像格式能支持透明背景(JPEG不支持)GIF图像格式能支持动画透明背景36图像文件格式例3:JPEG图像JPEG是静止图像数据压缩编码的国际标准,采用JPEG标准的图像文件扩展名是.jpgJPEG特别适合各种连续色调的彩色或灰度图像,在计算机和数码相机中已得到广泛应用JPEG的最新标准是JPEG2000(图像文件扩展名是.jp2),它采用更先进的技术,可取得更好的效果375.2.3数字图像处理与应用38数字图象处理:目的与内容目的:(1)提高图像的视觉质量(2)恢复与重建有失真和畸变的图像(3)图像分析,包括:图像的分类、识别和理解等(4)图像数据的变换、编码和数据压缩(5)图像的存储、管理与检索(6)图像内容与知识产权的保护内容:去噪、增强、复原、分割、提取特征、压缩、存储、检索等39数字图像处理的应用(1)图像通信,包括图像传输、电视电话、电视会议等。(2)遥感(3)医疗诊断(4)工业生产中的应用,如产品质量检测,生产过程自动控制等(5)机器人视觉(6)军事、公安、档案管理等其他方面的应用X光图像CT图像核磁共振图像指纹图像405.2.4计算机图形41什么是计算机图形(graphics)通过计算机和软件对景物的结构、形状与外貌进行描述(称为“建模”),然后根据该描述和选定的观察位置及光线状况,生成该景物的图形(称为“绘制”或“图像合成”)计算机图形也称为计算机合成图像计算机制作图形的步骤如下:建模/造型(Modeling)
本文标题:第5章 数字媒体及应用
链接地址:https://www.777doc.com/doc-1482944 .html