第四讲 五笔字型输入法 打印本页  
 
  第一节 五笔输入法简介
  
  五笔字型汉字输入法是王永民教授发明的一种完全依照汉字字形进行编码的汉字输入方法,该技术已成为众多电脑用户的好帮手。1986年王永民教授发明了86版五笔字型输入法,1998年,王永民又推出了98版王码五笔字型输入法,与前版本相比,其输入方法基本相同,只是字根分布稍有变化。98版弥补了86版中的许多不足,而且囊括了当前社会上许多常用的词组和流行的各种短语。
  本课程主要是讲86版的五笔输入法。现在流行的86版五笔输入法版本很多,这些版本的输入法也弥补了原86版五笔的一些不足之处,而且扩大了词汇量,这些方面的改进也使得86版五笔成为一款很好的汉字输入方法。
  
  第二节 汉字结构特点
  
  一、汉字的五种基本笔画
  笔画是书写汉字时,一次写成的一个连续不断的线段。汉字有许多笔画,五笔字型输入方法,把国家标准汉字字形按楷书书写顺序归纳为五种基本笔画:横、竖、撇、捺、折。把习惯上不属于这五种的笔画也分别归纳在这五笔笔画之内。它们是:
  提笔视为横,例如:现、场、特、扛、冲等字左边最后一笔都是“提笔”,把这些“提”的笔画归纳在“横”笔画之内。
  点点均为捺,例如:学、家、寸、斥、低等字中的“点”归纳在“捺”笔画中。
  左竖钩为竖,例如:争、于、予、乎、手、行等字中的“丁”笔画,归在“竖”笔画中。
  带折均为折,除右竖钩以外的带转折的笔画,包括横折、折弯钩、向右钩等笔画。例如:毛、孔、买、乞、飞、书、与、乃、断、永、成等字中的笔画 等都归纳横折笔画中。  
  二、汉字的三种字型结构
  基于汉字的整个轮廓,五笔字型把组成汉字的字根之间排列的相互关系分为三种类型:左右型、上下型和杂合型。
  (1)左右型:包括双合字和三合字。
  双合字中,两部分分列左右,如:好、肚、胡、理、胆、咽、拥、种等。
  三合字中,整个汉字由从左到右三部分组成,或者单独占据一边的部分与另外两个部分
  呈左右排列。如:树、侧、别、谈、校、较等。
  (2)上下型:包括双合字和三合字
  双合字中,分别由上下两部分组成,两部分间有一定的距离。如:字、节、看、要、百、步、录、麦等。
  三合字中,三个部分上中下排列,或者单独占层的部分与另外两部分作上下排列。如:意、想、花、美、黄、黑、型、晶等字。
  (3)杂合型:包括外内型汉字和单体型汉字。
  杂合型指组成整字的各部分之间没有简单明确的左右型、上下型关系。例如:团、同、这、斗、区、国、远、也、夹、串、在、床等字。
  各种类型划分中有如下约定:
  (1)凡属字根相连(指单笔与字根相连或带点结构)一律称为杂合型。
  (2)凡键面字(单个基本字根就是一个完整的字),有单独编码方法,不归为字型范围。  
  
  第三节 五笔字型输入法
  
  一、字根。  
  1. 汉字的130个字根
  由笔画或笔画交叉而形成的相对不变的结构,都通称为偏旁、部首,在五笔字型中称为字根。汉字的偏旁、部首有200多个,为了尽量减少它们的种类,五笔字型把它们分成130个基本字根,并把这些字根分布在25个字母键上。130个字根按笔画分成5个区。区号分别是1—5。每个区包括5个英文字母键。从中间向两边分成1—5位号,也就是说,由一个区号(1—5)和一个位号(1—5)对应一个字母键,区号与位号构成字母键的键位,如21是H字母的键位。每个字母键表示若干个字根。每个区表示一种笔画的全部字根。1(1区)横、2(2区)竖、3(3区)撇,4(4区)捺,5(5区)折。字根在键盘上分布的情况,见图2-1,图2-2;
      
                图2-1 五笔字根分布图
     
     
     
     
     
                  图2-2 五笔字根表  
  2. 字根间的结构关系
  基本字根可以拼合成所有的汉字,五笔字型输入方法就是一个汉字折分成若干个字根依次输入,便输入了该汉字。了解组成汉字的各字根间结构关系,是拆分汉字的基础。字根间的关系有单、连、散、交四种:
  (1)单:本身就是单独成为汉字的字根,共有89个,如:一、土、金、大、木、人等。这些汉字称为“键面字”(或称字根字),对这些汉字不必折分。
  (2)连:特指单笔与某一基本字根相连和带点结构两种情况。
  单笔画与某一个基本字根相连,如:自、尺、产、千、不、下、且、于、入等。而单笔画与某一基本字根有明显距离则是“散”而不是“连”。如:个、少、么、旦、旧、孔、乞等是“散”而不是“连”。
  带点的结构认为是连。这里所说的“点”是指单独形成字根的“点”。如:勺、术、太、主、义、玉、尤、刃、户、下、头、斗等字。表2-2属于连的情况的汉字拆分的情况。
          
  表的每一列中,第一个是要拆分的汉字,后边是被拆分的字根。
  (3)散:构成汉字不止一个字根,且字根间保持一定距离,不相连也不相交。如:汉、字、笔、相、培、训、打、划、分等汉字。
  (4)交:两个或多个字根成交叉、套选的结构称为交的关系。如农、里、必、申、果、专等。
  
  二、汉字的拆字原则。
  汉字的拆分是把汉字分解成基本字根,这是五笔字型输入方法的关键。字根间的四种结构中,“单”的情况不必拆分;“散”的情况易于拆分,在此主要对“连”、“交”和混合型情况的四个拆分原则进行说明。
  (1)取大优先:把汉字拆分成几个最大的字根。所谓“最大的字根”的意思是如果再加任何一笔就不是字根了。“先”的意思是,若能拆分成“先大后小”不拆分成“先小后大”,例:“奉”应该拆分成“三人二|”而不能拆分成“二大一十”。
  (2)兼顾直观:要按汉字的书写顺序,拆分成比较直观的字根,例如:“夷”字应拆分成“一弓人”而不要拆分成“大弓”。
  (3)能散不连:如果能把汉字的字根看成“散”的关系就要作为“连”的关系拆分,例如:“午”字可拆分为“十”散的关系,而不拆分成“丿干”连的关系。
  (4)能连不交:能按连的关系拆分就不按交的关系拆分。例如:“天”字应拆分成“一大”连的关系,而不拆成“二人”交的关系。
  
  三、五笔字型的输入方法  
  1. 字根汉字的输入方法
  字根汉字是哪些基本字根本身就是完整的汉字。字根汉字又分成键名汉字和非键名汉字。分布着130个基本字根的25个字母键,每个键上有一个键名汉字。  
王(G键) 土(F键) 大(D键) 木(S键) 工(A键)
目(H键) 日(J键) 口(K键) 田(L键) 山(M键)
禾(T键) 白(R键) 月(E键) 人(W键) 金(Q键)
言(Y键) 立(U键) 水(I键) 火(O键) 之(P键)
已(N键) 子(B键) 女(V键) 又(C键) 纟(X键)
  这25个键名汉字的编码是所在键的四个小写字母。例如:“王”字的编码是“gggg”、“土”字是“ffff”。输入键名汉字时只要把其编码键入即可。
  字根汉字除去25个键名汉字,其余的是非键名汉字。非键名汉字编码规则是:
  键名码 + 首笔码 + 次笔码 + 末笔码
  例如:“五”字在G键上(键名码是g)、首笔是“一”(首笔码是g)、次笔是“|”(次笔码是h)、末笔是“一”(末笔码是g),所以“五”字的编码是“gghg”。
  当非键名汉字如果是两笔时,编码规则是:
  键名码 + 首笔码 + 次笔码 + 空格
  例如:“丁”字在S键上(键名码是S)、首笔码是g、末笔码是h,所以“丁”字的五笔字型输入码是“sgh”。又如“二”字的输入码是“fgg”、“九”字的输入码是“vtn”。
  有时需要输入五笔字型的单独笔画(一丨丿丶乙),这五个笔画的编码方法是:
  键名码 + 键名码 + l + l
  例如:“一”笔画在“G”键上,所以它的编码是“ggll”;“丨”笔画在H键上,所以“丨”的编码是“hhll”;“丿”笔画在“T”键上,所以“丿”键的编码是“ttll”;“丶”笔画在“Y”键上,所以“丶”的编码是“yyll”;“乙”笔画在“N”键上,所以“乙”的编码是“nnll”。   
  2. 一般汉字的输入方法
  一般汉字是指不是字根的汉字。它们的编码是以字根为基本单位,所以需要熟练的把汉字拆分成字根。
  (1)若汉字能拆分成四个或四个以上的字根,则它们的编码方法是:
  首字根码 + 次字根码 + 三字根码 + 末字根码
  例如:“浦”字的编码是igey; “横”字的编码是“samw”;“输”字的编码是“lwgj”等。
         
  若汉字是只能拆分成三个或三个以下字根也就是说汉字的字根的个数不足四个的情况,如:“注”字只有三个字根,如果只输出三个字根的编码势必出现重码字的情况。在编码后加一个字形识别码可以不出重码。
  (2)三个字根的汉字编码方法:首字根码 + 次字根码 + 三字根码 + 字形识别码
  例如:“注”字的编码是“iygg”,最后一个“g”是“注”字的字形识别码。
  (3)两个字根的汉字编码方法:首字根码 + 次字根码 + 字形识别码
  例如:“杉”字的编码是“set”,最后一个“t”是其识别码。
  (4)如何确定字形识别码呢?字形识别码是将汉字的最后一笔画(不是最后一个字根)所在的区(横1、竖2、撇3、捺4、折5、)中,位号等于该字字型号(左右型1、上下型2、杂合型3)的键。例如:“注”字最后一笔是“一”,字型是左右型,所以“注”字的字形识别码是“1区1位”中的g,因而“注”字的编码是“iygg”。表2-3是字形识别码的说明。
        
     
  3. 简码输入
  前面介绍的字根汉字的编码和一般汉字的编码方法中,都要凑足四个码。为简化输入,减少码长,五笔字形方法允许对一些字用简码输入方法。对这些简码汉字可以用四个码输入,也可以用简码输入。简码汉字可分为一、二、三级。一级简码汉字有25个,二级简码汉字有25x25=625个,三级简码汉字有25x25x25=15625个。一、二、三汉字只需分别键入一、二、三个字母键再空格键确认。
  (1)一级简码汉字也称高频字。在a -> y一共25个键位上。根据每个键上的字根形态特征,在每个键上字排一个常用的高频汉字。这类字只要击一个字母键,再追加一个空格键即可输入,这些字及编码如下:  
一 11(G) 地 12(F) 在 13(D) 要 14(S) 工 15(A)
上 21(H) 是 22(J) 中 23(K) 国 24(L) 同 25(M)
和 31(T) 的 32(R) 有 33(E) 人 34(W) 我 35(Q)
主 41(Y) 产 42(U) 不 43(I) 为 44(O) 这 45(P)
民 51(N) 了 52(B) 发 53(V) 以 54(C) 经 55(X)
  
  (2)二级简码汉字的简码和其全码的前两岸个字根编码相同。输入二级简码汉字时只需键入两个码再空格确认。例如:输入“下”字需键入“gh”,输入“产”字键入“ut”。
       
  (3)三级简码汉字的输入只键入每个汉字的前三个字根,空格键确认。例如:“华”的简码是“wxf”。
  有的汉字可以用一级简码,二级简码,三级简码,全码中的任一编码输入。用户可任选一种。  
  4. 词组编码与输入
  在汉字输入方法中,以词语为单位的输入方法可减少码长,提高输入效率。五笔字型汉字输入方法把单字输入和词语输入统一起来,输入单字词组时不需切换。这是因为词组的编码也是四码。
  (1)二字词组的输入方法:二字词组的编码是按笔顺分别取前两个字的头两个根组成。例如:“机器”一词编码是“smkk”。“汉字”的编码是“icpb”。“计算”的编码是“yfth”。“时间”的编码是“jfuj”。
  (2)三字词组输入方法:前两个字名取第一个字根、第三个字取前两个字根。例如:“计算机”的编码是“ytsm”,“电视机”的编码是“jpsm”,“操作员”的编码是“rwkm”,“组织部”的编码是“xxuk”,“教职工”的编码是“fbaa”。
  (3)四字词组和四个以上的词的编码规则是:依次取前三个字的第一个字根码,再取最后一个字的第一个字根码。如:无产阶级(fubx),五笔字型(gtpg),汉字编码(ipxd),电子计算机(jbys),中华人民共和国(kwwl)。  
  5.“Z”键功能
  前边介绍的五笔输入方法中没有使用“Z”键,“Z”键在汉字输入中有重要作用。当用户对一个汉字的某个字根不能确定时,可用“Z”键代替。例如:要输入“敬”,而第二个字根不能确定,可用“Z”键代替,键入azkt。会列出多个汉字,从中选择我们要输入的即可。不过现在的五笔输入软件种类繁多,有些版本的五笔不支持“Z”键功能。