您好,欢迎访问三七文档
计算机中字符的编码一个二进制数位简称为位(英文名称为bit)。计算机中最直接、最基本的操作就是对二进制位的操作。一个二进制位可表示两种状态(0或1)。两个二进制位可表示四种状态(00,01,10,11)。位数多,所表示的状态就越多。ASCII码ASCII码是美国信息交换用标准代码(AmericanStandardCodeforInformationInterchange)。ASCII码虽然是美国国家标准,但它已被国际标准化组织(ISO)认定为国际标准,为世界公认,并在世界范围内通用。ASCII码用一个8位二进制数(字节)表示,每个字节只占用了7位,最高位恒为0。7位ASCII码可以表示128(27=128)种字符,其中通用控制字符34个,阿拉伯数字10个,大、小写英文字母52个,各种标点符号和运算符号32个。当最高位为0时,称为基本ASCII码,当最高位为1时,形成扩充的ASCII码,它表示数的范围为128~255,可表示128种字符。通常各个国家都把扩充的ASCII码作为自己国家语言文字的代码。第五章中文操作环境与汉字输入方法教学内容:汉字操作系统、汉字编码、汉字输入方法教学目的:了解汉字操作系统的基本组成,理解汉字编码方法,熟悉汉字输入方法教学重点:汉字编码教学时间:1学时教学方法:多媒体课件讲授5.1汉字操作系统汉字操作系统与西文操作系统的主要区别:汉字操作系统增加了汉字信息处理功能(具有汉字的输入、存储、输出能力)。实现思想:在通用的、流行的西文操作系统DOS基础上扩充汉字处理功能(即汉化),使其既保留西文操作系统的全部功能和特点,又具有西文操作系统所不具有的汉字信息处理能力。目前国内已研制出的汉字操作系统有:CCDOS、SPDOS、UCDOS、王码DOS等。一、汉字操作系统的基本组成1、键盘管理模块:将汉字输入码转换为汉字机内码存储起来。2、显示管理模块:根据汉字显示字库,将汉字机内码转换成汉字字型码送显示器输出。3、打印管理模块:根据汉字打印字库,将汉字机内码转换成汉字字型码送打印机输出。注:以上三个模块统称为汉字输入输出模块,它们负责解决对汉字输入输出设备的调用要求。4、字模管理模块:负责对需要显示或打印输出的汉字字模信息,提供相应汉字点阵信息。5.2汉字的编码表示我们知道,在计算机内部,字母、数字、符号的表示均采用ASCII编码,同样道理,计算机上使用的汉字也是用编码来表示的。汉字编码是为了计算机识别并处理汉字的需要。在汉字处理的各个不同环节,由于要求不同,采用的汉字编码也有所不同。目前计算机上使用的汉字编码主要有下列四种:1、用于输入汉字的编码-------汉字输入码(外码)作用:让用户能直接用西文键盘输入汉字。按编码规则将输入码分类:①形码:如:五笔字型码、、郑码②音码:如:全拼双音、双拼双音③混合码:如:自然码2、用于存储汉字的编码------汉字机内码作用:统一了各种不同的汉字输入在计算机内部的表示。用以将用户输入时使用的多种汉字输入码统一转换成汉字机内码进行存储,以方便机内的汉字处理。目前,我国使用的汉字机内码是采用双字节的变形国标码。即将国标码每个字节的最高位统一置成1,以区别于西文字符的ASCII编码。3、用于信息交换的汉字编码-------交换码作用:便于不同计算机之间能够准确无误地交换汉字信息。这是由于各种计算机系统所使用的机内码还未形成统一的标准,因此在汉字信息交换时不能采用机内码。目前,我国已制定了用于汉字信息交换的统一编码(即国标码),该编码集的全称是“信息交换用汉字编码字符集-----------基本集”,国家标准号是“GB2312-80”。国标码集中收集了二级汉字,共7445个汉字及符号。其中,一级常用汉字3755个,汉字的排列顺序为拼音字典序;二级常用汉字3008个,排列顺序为偏旁序;还收集了682个图形符号。国标码与机内码的区别:b7b6b5b4b3b2b1b0b7b6b5b4b3b2b1b00xxxxxxx0xxxxxxx国标码的格式b7b6b5b4b3b2b1b0b7b6b5b4b3b2b1b01xxxxxxx1xxxxxxx机内码的格式例:已知汉字“大”的国标码是“3473”(十六进制数),请问汉字“大”的机内码是多少?第一步:将3473用二进制数来表示:0011010001110011第二步:将两个字节的最高位分别置1得到:1011010011110011第三步:将其转换成十六进制数为:B4F3从而可以知道汉字“大”的机内码是B4F3(十六进制数)区位码的概念在国标码中,所有的汉字与符号组成一个94X94的矩阵,每一行称为一个“区”,每一列称为一个“位”。矩阵中每个汉字都有一个区号和一个位号,区号与位号连在一起形成的代码叫区位码。例如:从区位码表中可以查到如下汉字的区位码汉字科技学院区位码3138282849075226注:汉字“科”的区码为“31”,位码为“38”区位码、国标码、机内码之间的关系如下:①国标码高位=区码+20H②国标码低位=位码+20H③机内码高位=区码+20H+80H④机内码低位=位码+20H+80H注:H表示十六进制例题:已知汉字“学”的区位码为“4907”(用十进制表示),求它的国标码和机内码?①将区码“49”用十六进制表示:31H②将位码“07”用十六进制表示:07H③国标码高位=区码+20H=31H+20H=51H④国标码低位=位码+20H=07H+20H=27H⑤机内码高位=区码+20H+80H=31H+A0H=D1H⑥机内码低位=位码+20H+80H=07H+A0H=A7H汉字“学”的国标码为“5127H”,机内码为“D1A7H”4、汉字的输出码(字形码)与汉字库字型码也叫字模点阵码,是确定一个汉字字型和字体的代码。规格的字型码有7级。是16X16,24X24,32X32,40X40,48X48,64X64,96X96。例如:32X32点阵的一个汉字字形需要用128个字节的空间来存放。输出码的作用是:提供输出汉字时所需要的汉字字形,用以将机内码还原为汉字进行输出。汉字库:所有汉字字模信息的集合。5.3汉字输入法简介1、区位码输入法例:“啊”的区位码:1601“科”的区位码:3138其中前两位是区号,后两位是位号。2、全拼输入法例:“黄”的全拼输入码:huang3、双拼输入法例:“中”的双拼输入码:ay其中a代表声母“zh”,代表韵母“ong”3、智能ABC输入法智能abc是目前最流行的中文输入法。智能abc的使用非常简单。只要键入拼音后敲击空格键就可以输入汉字,并且支持输入一连串拼音之后转换为词句。对于常用的字词或成语,只要键入其声母即可,并且还有很强的自动选词功能;对于不会发音的字,智能abc提供了笔型输入法,只要我们在其状态条中单击鼠标右键,在其弹出的菜单中单击“属性”,在弹出的对话框中进入智能abc的“属性”,选中“笔型输入”,就可以利用笔型输入法来弥补拼音的不足之处;选中“词频调整”则将常用字词默认为1号位置,省去了找字的麻烦。4、五笔字型输入法五笔字型输入法因其重码少、录入速度快,备受用户的青睐。例:“题”的五笔字型输入码:jghn“学校”的五笔字型输入码:ipsu“计算机”的五笔字型输入码:ytsm小结与作业熟悉汉字操作系统的基本组成:1、键盘管理模块2、显示管理模块3、打印管理模块4、字模管理模块理解汉字的编码:1、输入码2、机内码3、交换码4、输出码了解常用的汉字输入法
本文标题:第二章(编码)
链接地址:https://www.777doc.com/doc-3130044 .html