您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 咨询培训 > 《最新五笔字型速成培训教程》第5章:汉字的编码规则与输入
第5章汉字的编码规则与输入(时间:2次课,4学时)第5章汉字的编码规则与输入教学提示:在了解了五笔字型编码基础、字根在键盘上的布局和分区拆字的一些基础知识教学目标:本章介绍汉字编码的一般原则、键名字根的编码规则与输入、成字字根的编码规则与输入、合体字的编码规则与输入以及不易拆分汉字的拆分方法,让用户掌握如何真正在计算机中输入汉字。第5章汉字的编码规则与输入5.1汉字编码的一般原则5.2键名字根的编码规则与输入5.3成字字根的编码规则与输入5.4合体字的编码规则与输入5.5不易拆分汉字的拆分5.6上机实战——在写字板中练习单字输入5.7综合训练与自我检测汉字编码的一般原则在输入文字之前,先介绍汉字的编码原则。五笔字型汉字输入法是一种拼形输入法,当看到一个汉字时,很快地就能根据汉字的各部分字根写出一个汉字编码,如,“树”字的编码为木(S)、又(C)和寸(F),再如,“会”字的编码为人(W)、二(F)和厶(C)。由此可以看出,汉字的编码规则首先是根据书写汉字的原则制定出来的,其次,这些规则还必须遵循一定的原则,这些原则是:按书写顺序从左到右,从上到下,从外到内取码。例:“树”的取码顺序为木(S)、又(C)、寸(F)。以基本字根为单位取码。例:“社”的取码为、丶、土,而不是礻、土,因为礻不是基本字根。按一、二、三、末4个字根,最多只取4码;例:“徽”由彳(T)、山(M)、一(G)、幺(X)、小(I)和攵(T)6个字根组成,只取第一、二、三及最末一个字根,即彳(T)、山(M)、一(G)和攵(T)。单体字拆分,取大优先。例:“末”应拆成二、小而不能拆成一、木。字根数不满4个时,再取末笔字型交叉识别码。例:“村”由木(S)、寸(F)两个字根组成,其信息量不够,需加末笔交叉识别码51(Y)。汉字编码的一般原则一个汉字要输入到计算机中,首先应该先把这个汉字拆分,拆分成几个字根,如将“修”字拆分成“亻、丨、夂、彡”,将“照”字拆分成“日、刀、口、灬”,拆分时必须以基本字根为单位,按取大优先的原则,且在拆分字时,尽可能拆分出笔画最多的字根,拆分出的字根数量要尽量少。在可能的多种拆分中,以拆分出字根数量少的那种为优先。拆分好后,即可由键盘输入字母(即键码),如从键盘上输入“WHTE”就输入了“修”字。在汉字五笔字型输入法中,根据汉字的结构特点、使用频率和字根结构,把汉字分为键面字(包括键名字根和成字字根)和键外字(又称为合体字),其编码方案有所不同。键名字根的编码规则与输入五笔字型编码方案中,利用标准键盘上的A~Y共二十五个键上的每一个键位,设置一个中文键名字,即各个键上的第1个字根,也就是“助记口诀”中开头的字根,称之为键名字根,简称为“键名字”。其特征是组字频度较高,而形体上又有一定代表性的字根;除X键位的“纟”以外,它们本身就是一个汉字。键名汉字的位置如图5.1所示。要输入这个作为键名的汉字编码规则是:在所在的键上连续击键4下。表5.1所示为25个键名字根的编码和输入方法。键名字根的编码规则与输入键名字根的编码规则与输入键名字根的编码规则与输入键名字根的编码规则与输入成字字根的编码规则与输入在五笔字型字根键盘的每个键面字中,除了一个键名字根以外,还有数量不等的一些其它字根,我们把这部分字根称之为成字字根。成字字根中的一部分字根其本身也是一个汉字,例如五、用、石等,也有一些包括在国标字符集中被视为汉字的字根,例如“氵、亻、勹、刂”等。成字字根大约有100个,如表5.2所示。成字字根的编码规则与输入方法如下:键名代码+首笔代码+次笔代码+末笔代码具体地说,就是先打一下该字所在的键(通俗地称之为“报户口”),接着依次打该字的第一单笔画,第二单笔画,以及该字的最后一个单笔画;若字根总数不足4码,则只需再加打一个空格键即可(但成字字根不用加识别码)。下面举例说明成字字根的输入方法,如表5.3所示。特别地,在王码五笔字型输入法中,存在这样几个单笔画,即“一、丨、丿、、乙”,若按照成字字根的输入法的规定,打入所在的键后,再打一下单笔画所在的键即可,结果造成了它们的编码只有2码,汉字成千上万,如果让这5个不常用的“汉字”占用2码,那岂不是可惜,于是想出一个更好的方法,将这5个单笔画享用的2码让位给其他一些更常用的汉字,而人为地在这两个正常码之后再加两个L,加L是因为L键除了用于方便操作外,作为竖笔画结尾的单体型字识别键码,是极不常用的;而要加两个L而不是一个L是为了避免引起重码的现象。这5种单笔画的编码为:成字字根的编码规则与输入成字字根的编码规则与输入成字字根的编码规则与输入合体字的编码规则与输入5.4.1汉字的拆分原则5.4.2如何使用识别码5.4.3五笔字型汉字编码流程合体字的编码规则与输入除了键名字根汉字和成字字根汉字以外的汉字统称为合体字或者键外字,而汉字的输入法编码主要是针对这些合体字的。与键名字的编码不同,合体字以字根来编码,而不是以单笔画来编码,下面具体介绍其编码方式。若汉字的字根超过4码,则用第一、二、三、末4个字根组成编码。如“戆”字可拆分为“立(42U)、早(22J)、夂(31T)、贝(25M)、心(51N)”5个字根,取其第一、二、三、末共4个字根,即“立(42U)、早(22J)、夂(31T)、心(51N)”;若汉字的字根刚好是4码,则取其4码即可。如“潮”字可拆分为“氵(43I)、十(12F)、早(22J)、月(33E)”正好4个字根,就取其4个字根;若汉字的字根不足4码,则先打完字根码,再补加一个末笔字型交叉识别码。如“扯”字可拆分为“扌(32R)、止(21H)”2个字根,就先取这两个字根码,再追加一个末笔字型识别码(11G)。关于识别码的内容,详见5.4.2节。汉字的拆分原则汉字要拆分成一个个字根,并且依次在键盘上敲击其相应的键码,最终录入一个汉字。这对于刚开始学习五笔字型输入法的人来说,不是一件很容易的事,往往会出现不知从何处下手的情形。拆分时,如果一个汉字不按正确的书写顺序来拆分,或者将其无限制地拆分,都是不行的,且拆分的同时还要碰到一些特殊情况。汉字的拆分必须遵循一定的原则,主要有5点:书写顺序、取大优先、兼顾直观、能连不交、能散不连。1.书写顺序汉字的分解要遵从的顺序是先左后右,先上后下,先横后竖,先撇后捺,先内后外,先中间后两边等。合体字拆分字根,也要遵从这一书写顺序,下面举例说明:“剥”字拆分成“彐、水、刂”是正确的,若拆分成“彐、刂、水”是错误的。“申”字拆分成“日、丨”是正确的,若拆分成“丨、日”是错误的。“囡”字拆分成“囗、女”是正确的,若拆分成“女、囗”是错误的。汉字的拆分原则2.取大优先对一个汉字在按书写顺序进行拆分时,不能无限制地将其拆分,结果都变成了单笔画,这显然是不行的。我们的目的是要将一个汉字拆分成一个个字根,且是尽可能笔画多的字根,要达到再添一个笔画就不能构成一个字根的限度。下面举例说明:“世”字的第1种拆分方法:一、凵、乙;第2种拆分方法:廿、乙。第1种拆分方法显然是错误的,因为第2个字根“凵”完全可以并到前一个字根上,构成一个更多笔画的字根“廿”。再如:“革”字的第1种拆分方法:廿、口、十;第2种拆分方法:廿、µ。同样,第1种拆分方法是错误的,因为第2个字根“口”和第3个字根“十”可以合并成一个更大的字根“µ”。3.兼顾直观汉字在拆分时,为了考虑汉字字根的完整性,有时可以不遵循“书写顺序”和“取大优先”的原则,形成一些例外的拆分方法。如“国”字按照书写顺序应拆分成“冂、王、丶、一”,但这种拆分方法既违背了该字的字源,也影响了该字的直观性。所以,将它拆分为“囗、王、丶”。再如,“自”字按照取大优先应拆分成“亻、冂、三”,但这种拆分方法同样违背了字源,影响了该字的直观性。所以,将它拆分为“丿,目”。汉字的拆分原则4.能连不交请看下面几个例子:“天”拆分成“一、大”(两者是相连的)是正确的,若拆分成“二、人”(两者是相交的)是错误的。“于”拆分成“一、十”(两者是相连的)是正确的,若拆分成“二、丨”(两者是相交的)是错误的。(两者是相连的)是正确的,若拆分成“、丨”(两者是相交的)是错误的。5.能散不连笔画与字根之间,字根与字根之间的关系,可以是“散”的关系,“连”的关系和“交”的关系。如,“明”的字根“日、月”之间是“散”的关系,“自”的字根“丿、目”之间是“连”的关系,“末”的字根“一、木”之间是“交”的关系。汉字的字型取决于字根与字根之间的关系。根据字根的关系,字型可以分为左右型、上下型和杂合型。如,“占”可拆分成“卜、口”两个字根,若按照连的原则,则可将其视为杂合型,若按照散的原则,则可将其归为上下型。“严”可拆分为“一、、厂”3个字根,若按照连的原则,则可将其视为杂合型,若按照散的原则,则可将其归为上下型。像这种模棱两可的情形,规定,一律按“能散不连”来判别(不包含单笔画),所以,“占”和“严”两字都视为上下型。如何使用识别码输入一个不足4码的合体字时,依次键入该汉字的字根码后,最后补加一个识别码(末笔字型识别码),若补加识别码后仍不足4码,则敲击空格键。识别码实际包含有两部分信息,即“末笔”和“字型”,因此,可以将识别码规定为由两位数组成,十位数为末笔画代码编号(横1、竖2、撇3、捺4、折5),个位数是字型代码编号(左右型1、上下型2、杂合型3)。表5.4所示为末笔字型交叉识别码。1.末笔画的一些说明关于末笔画有如下规定,这些规定可以使对识别码的取码变得简单、明确;末字根为“力、刀、九、匕”时,一律将其认为是折。如:男:田、力;分:八、刀;仇:人、九;化:人、匕以上4字的末笔画为“乙”。“运、远、进”等字,不以“走之”的末笔为末笔画,约定以去掉“走之”后的整个字的末笔作为末笔画来构造识别码。辅助说明一点,这里不将“走之”的末笔作为末笔画,主要是因为,带“走之”的汉字实在太多,如果都作考虑,那好多字的识别码都是一样的,减少了许多识别码的信息量。“团、图、国”等字,不以“囗”的末笔为末笔画,约定以去掉“囗”后的整个字的末笔作为末笔画来构造识别码。“我、戋、成、戈”等字的末笔画为“丿”。
本文标题:《最新五笔字型速成培训教程》第5章:汉字的编码规则与输入
链接地址:https://www.777doc.com/doc-962560 .html