---
五筆字型概述
五筆字型是著名漢字信息處理專(zhuān)家王永民教授在五筆畫(huà)基礎(chǔ)上進(jìn)一步完善的一種更高效率的漢字輸入方法,與其它音形類(lèi)或純音類(lèi)輸入法的一個(gè)不同點(diǎn)就是,它完全根據(jù)漢字的字形結(jié)構(gòu)來(lái)進(jìn)行編碼,編碼與一個(gè)漢字的讀音沒(méi)有任何關(guān)系。會(huì)五筆字型的操作員,即使碰到一個(gè)不會(huì)念的漢字,只要知道它怎樣寫(xiě),分成幾部分,就可以將其輸入計(jì)算機(jī)。
五筆字型目前問(wèn)世以來(lái),廣泛應(yīng)用于各種機(jī)型及各種漢字操作系統(tǒng)上,成為當(dāng)前微機(jī)中或小型機(jī)中不可缺少的漢字輸入方法。另外,五筆字型輸入法出現(xiàn),對(duì)于打破漢字難于用計(jì)算機(jī)處理觀念,發(fā)展?jié)h字信息的計(jì)算機(jī)輸入都產(chǎn)生過(guò)積極的影響。
五筆字型是一種純字形的編碼方案。它分析漢字的結(jié)構(gòu)特點(diǎn),認(rèn)為所有漢字都是由130多個(gè)基本字形組成,所以就將這130多個(gè)基本字形做為構(gòu)成漢字的基本單元,分布在25個(gè)字母鍵上,將漢字按一定的規(guī)則分成若干個(gè)這些基本部件,然后根據(jù)這些部件按鍵組成編碼。
五筆字型的漢字碼長(zhǎng)為四,也就是說(shuō)用四個(gè)字母代表一個(gè)漢字,這四個(gè)字母的有序排列就是這個(gè)漢字的五筆字型的編碼,在編碼過(guò)程中,為提高錄入效率,也同時(shí)規(guī)定有碼長(zhǎng)為一、二、三的漢字編碼,也就是五筆編碼中的簡(jiǎn)碼。
現(xiàn)在的五筆字型流行的86版和98版兩種,98版是在86版基礎(chǔ)上進(jìn)行改進(jìn)后推出的,字根的排列同86版有些區(qū)別,布局更合理一些,改進(jìn)了一些原來(lái)不合理的地方,但編碼方法是一致的。
五筆相關(guān)的漢字知識(shí)
從前面的講述中我們已經(jīng)知道五筆字型是一種字型編碼方案,同漢字的讀音是無(wú)關(guān)的,要正確使用五筆字型輸入法,使用者具備一定的漢字相關(guān)知識(shí)是必須的,否則在拆字根、確定識(shí)別碼等關(guān)鍵環(huán)節(jié)上將無(wú)法進(jìn)行。
從書(shū)寫(xiě)形態(tài)上來(lái)看漢字的筆畫(huà)有:點(diǎn)、橫、豎、撇、捺、挑(提)、鉤、(左右)折等八種。
但在五筆字型編碼方案方法中,漢字的筆劃只歸結(jié)為橫、豎、撇、捺、折五種。因?yàn)?點(diǎn)"和"捺"兩者運(yùn)筆方向基本一致,所以把"點(diǎn)"歸為"捺";把挑(提)歸結(jié)于"橫"類(lèi);左鉤歸為"豎",其他帶轉(zhuǎn)折的筆劃都?xì)w結(jié)為"折"類(lèi)。
在書(shū)寫(xiě)漢字時(shí),應(yīng)該按照如下規(guī)則:先左后右,先上后下,先橫后豎,先撇后捺,先內(nèi)后外,先中間后兩邊,先進(jìn)門(mén)后關(guān)門(mén)等。
漢字都是由筆劃或部首組成的,一個(gè)漢字可以拆成一些最常用的基本單位,這個(gè)基本單位在五筆字型里就叫字根。在五筆字型編碼輸入方案中,選取了大約130個(gè)這種基本單位作為組字的字根。眾多的漢字全部由它們組合而成。如,"明字"由"日""月"組成,"呂"字是由兩個(gè)"口"組成;在這些基本字根中有些字根本身就是一個(gè)完整的漢字,例如:日月人火手等,這種字根在五筆字型里叫做"成字字根"。
基本字根按一定的方式組成漢字,在組字時(shí)這些字根之間的位置關(guān)系就是漢字的部位結(jié)構(gòu)。
(1)、單體結(jié)構(gòu) 由基本字根獨(dú)立組成的漢字,例如:目、一、手、山等。
(2)、左右結(jié)構(gòu) 左右結(jié)構(gòu)的字由左右兩部分或左中右三部分構(gòu)成,例如:明、響、辯等。
(3)、上下結(jié)構(gòu) 上下結(jié)構(gòu)的字由上下兩部分或自上往下幾部分構(gòu)成,例如:昌、旦、莒、感等。
(4)、內(nèi)外結(jié)構(gòu) 漢字由內(nèi)外部分構(gòu)成,例如:巨、匠、國(guó)、連、原、問(wèn)等。
在五筆字型輸入法中,為獲取的字型信息,把漢字字型信息分成三類(lèi):
1型: 左右部位結(jié)構(gòu)的漢字,例如:明、響、構(gòu)等。雖然"構(gòu)"的右邊"勾"是兩個(gè)基本字根按內(nèi)外型組合成的,但整字仍屬于左右型,這種分類(lèi)主要是根據(jù)漢字的偏旁部首位置來(lái)進(jìn)行的。
2型: 部位結(jié)構(gòu)是上下型的字,例如:昌、感、萎、巍等。同左右型一樣,像"巍"這類(lèi)字雖然下面的"魏"是按左右型組合成的,但整字仍是上下型。
3型: 稱(chēng)為雜合型。包括單體結(jié)構(gòu)和內(nèi)外結(jié)構(gòu)的漢字,也就是沒(méi)有明顯下下和左右結(jié)構(gòu)特點(diǎn)的漢字。
在使用五筆字型輸入漢字時(shí),有時(shí)只靠輸入該字的字根編碼還不夠,還需要根據(jù)字型信息確定,例如:"叭"和"只"字,都是由"口"和"八"兩個(gè)字根組成的,為了區(qū)別究竟是哪一個(gè)字還必須使用字型信息。
在成千上萬(wàn)的漢字中,左右型結(jié)構(gòu)的漢字占的比重較大,其次就是上下型,占比例量少的是雜合型。
在所有的漢字中,我們把由兩個(gè)字根組成的漢字稱(chēng)作雙合字,由三個(gè)字根組成的漢字稱(chēng)作三合字,四個(gè)字根組成的漢字稱(chēng)四合字,由多于四個(gè)字根組成的漢字稱(chēng)多合字。
我們必須注意,對(duì)漢字的結(jié)構(gòu)進(jìn)行如此的劃分,不是只對(duì)于組成漢字的部分字根而言,而是就漢字的整體輪廓來(lái)進(jìn)行劃分的,是指整個(gè)漢字中字根之間排列的相互位置關(guān)系。由于漢字的結(jié)構(gòu)比較復(fù)雜,為更容易的掌握怎樣確定多字根的漢字的類(lèi)型,下面再對(duì)三種漢字結(jié)構(gòu)類(lèi)型進(jìn)行較為詳細(xì)的說(shuō)明。
左右型:
在左右型漢字中,包括下面幾種情況:
(1)在由兩個(gè)字根組成的漢字,即雙合字中,兩個(gè)字根分列左右,整個(gè)漢字中有著明顯的界線(xiàn),并且字根間有一定的距離,如:漢、明、林、極、休等。象這類(lèi)漢字,就屬于左右型結(jié)構(gòu)。
(2)在三合字中,組成整個(gè)漢字的三個(gè)字根從左到右排列,或者單獨(dú)占據(jù)一邊的一個(gè)字根與另外兩個(gè)字根呈左右排列,如,辯、掰等,都屬于左右型結(jié)構(gòu)。
(3)在四合字或多合字中,組成整個(gè)漢字的若干字根很明顯地分成左右兩部分,無(wú)論左右那一邊字根數(shù)多,都將這種漢字定為左右類(lèi)結(jié)構(gòu)的漢字,如,械、訛、鍵等。
上下型:
上下型漢字也包括幾種情況:
(1)在雙合字中,兩個(gè)字根的位置是上下的關(guān)系,這兩個(gè)字根之間有著明顯的界線(xiàn),且有一定的距離,如,節(jié)、個(gè)、字、另等。
(2)在三合字中,三個(gè)字根也是分成兩個(gè)部分,雖然其中一個(gè)部分的字根數(shù)要多一些,但兩個(gè)部分仍然是上下兩層的位置關(guān)系,這樣的字如:意、花、怒、想等。
(3)組成四合字或多合字的字根也明顯地分成上下兩部分,則無(wú)論是上半部分字根數(shù)多一些或是或是下半部分字根數(shù)多一些,這樣的漢字也屬于上下結(jié)構(gòu)型漢字,如;贏、離、聚等。
雜合型:
雜合型漢字包括單體,內(nèi)體,包圍三種類(lèi)型,指組成整字的各個(gè)字根之間沒(méi)有簡(jiǎn)單明確的左右或上下型關(guān)系,如:因、周、半、太等,象這樣的漢字,字根之間都是內(nèi)外或包圍的關(guān)系。
在五筆字型漢字結(jié)構(gòu)的劃分中,必須著重注意下面幾個(gè)約定:
(1)凡單筆畫(huà)與字根相連者或帶點(diǎn)結(jié)構(gòu)都視為雜合型。
(2)漢字結(jié)構(gòu)區(qū)分時(shí),也要按"能散不連"的原則來(lái)進(jìn)行。如"矢、卡、嚴(yán)"都視為上下型。
(3)含兩字根且相交者屬雜含型,如"樂(lè)、串、電、本、無(wú)、農(nóng)"。
(4)下含"走之"字為雜合型,如"進(jìn)、過(guò),遂"等。
(5)以下各字為雜合型:司、床、廳、龍、尼、式、后、處等,但相似的右、左、有、布、灰等可視上下型。
五筆字型的鍵盤(pán)設(shè)計(jì)
由于五筆字型漢字編碼方案中有130多個(gè)基本漢字單位,也就是有130多個(gè)字根,但計(jì)算機(jī)鍵盤(pán)沒(méi)有這么多,且有很大一部分是功能或數(shù)字鍵,真正的字母鍵有26個(gè)。所以必須精心安排這130多個(gè)字根在鍵盤(pán)上的分布。因?yàn)殒I盤(pán)安排的優(yōu)劣,很大程度地影響著漢字輸入的速度、效率,也影響著方法的易學(xué)易用性。
在五筆字型編碼方案中,只使用了26個(gè)英文字母鍵,除了字母z作為學(xué)習(xí)鍵外,其余25個(gè)字母都作為基本編碼用。并且按五筆對(duì)漢字筆畫(huà)的分類(lèi)(即橫、豎、撇、捺、折),將鍵盤(pán)上的所使用的25個(gè)字母鍵分成了五個(gè)區(qū),再根據(jù)字根的第一筆的類(lèi)型,將所有有130多個(gè)基本字根分成五個(gè)部分,對(duì)應(yīng)到每一個(gè)區(qū)上的各個(gè)鍵上,下面就是25個(gè)字母鍵的五個(gè)區(qū)的劃分:
第一區(qū):G F D S A
第二區(qū):H J K L M
第三區(qū):T R E W Q
第四區(qū):Y U I O P
第五區(qū):N B V C X
在上面的講述中,我們?cè)岬竭^(guò)五筆字型編碼方案中,將鍵盤(pán)上的二十五個(gè)字母鍵分成五組,即五個(gè)區(qū),每個(gè)區(qū)為了進(jìn)一步區(qū)分開(kāi)來(lái),又分為五個(gè)位,然后將130多個(gè)基本字根按起筆分布在這五個(gè)區(qū)25個(gè)位(即25個(gè)鍵)中,每個(gè)鍵位平均5-6個(gè)基本字根。
在同一個(gè)鍵位上的幾個(gè)基本字根中,選擇一個(gè)具有代表性的字根,稱(chēng)為鍵名字根。五筆編碼鍵盤(pán)圖中各個(gè)鍵位左上角的字根就是鍵名字根,下面是鍵名字根與各字母的對(duì)應(yīng)表:
第一區(qū):區(qū)號(hào)為1,橫起筆,各鍵鍵名為:王土大木工
對(duì)應(yīng)鍵為:G F D S A,位號(hào)分別為1、2、3、4、5
第二區(qū):區(qū)號(hào)為2,豎起筆,各鍵鍵名為:目日口田山
對(duì)應(yīng)鍵為: H J K L M ,位號(hào)分別為1、2、3、4、5
第三區(qū):區(qū)號(hào)為3,撇起筆,各鍵鍵名為:禾白月人金
對(duì)應(yīng)鍵為: T R E W Q ,位號(hào)分別為1、2、3、4、5
第四區(qū):區(qū)號(hào)為4,捺起筆,各鍵鍵名為:言立水火之
對(duì)應(yīng)鍵為:Y U I O P ,位號(hào)分別為1、2、3、4、5
第五區(qū):區(qū)號(hào)為5,折起筆,各鍵鍵名為:已子女又纟
對(duì)應(yīng)鍵為:N B V C X ,位號(hào)分別為1、2、3、4、5
另外,每區(qū)的第一個(gè)字母鍵,又作為基本筆畫(huà)的字母代碼,即G代表橫,H代表豎,T代表撇,Y代表捺,N代表折,這種字母代碼與前面所說(shuō)過(guò)的數(shù)字碼相對(duì)應(yīng),主要作構(gòu)成識(shí)別碼用。
基本字根在鍵盤(pán)的分布還可以參見(jiàn)下面的五筆字型字根圖,
(86版字根圖)
(98版字根圖) 在五筆字型編碼方案中,字根在鍵盤(pán)上的分布是有規(guī)律的,大部分都可以在音、形、義上有相近的地方,概括起來(lái),下面的一些分布特征有助于我們學(xué)習(xí)記憶。
1、除了字根的第一個(gè)基本筆畫(huà)的代號(hào)與這個(gè)字根所在鍵盤(pán)分區(qū)的"區(qū)號(hào)"保持一致外,相當(dāng)一部分字根的第二筆代號(hào)與該字根所在鍵的"位號(hào)"相一致。
如,王,戔等它們的第一筆為橫,代號(hào)1與所在區(qū)號(hào)一致,第二也是橫,代號(hào)仍為1,與其所有鍵有位號(hào)一致。因此,這些字根的區(qū)位號(hào)為11,字根代碼G;又如:文、方、廣,它們的首筆是捺,代號(hào)為4,次筆是橫,代號(hào)為1,所以它們的區(qū)位號(hào)為41,字根代碼為Y。
2、與鍵名字根形態(tài)相似或相近,如:"王"字鍵上,有"五,戔"等字根,"日"字鍵上有"蟲(chóng)、早"等字根。
3、鍵位代碼還表示了組成字根的單筆畫(huà)的種類(lèi)和數(shù)目,即位號(hào)與各鍵位上的復(fù)合散筆字根的筆畫(huà)數(shù)目保持一致。如:點(diǎn)的代號(hào)為4,哪么41代表一個(gè)點(diǎn)"、",42代表兩點(diǎn)水"",43代表三點(diǎn)水,44代表四點(diǎn)腳等等。依次類(lèi)推,一個(gè)橫"一"一定在11區(qū),"二"一定在12鍵上,三個(gè)橫"三"一定在13鍵上。
掌握了以上三個(gè)字根在鍵盤(pán)上的分布特征,整個(gè)字根的鍵位表是較容易熟悉的。
對(duì)于哪些與鍵面上的主要字根屬于同種類(lèi)型的次要字根,一是稍加熟悉進(jìn)行聯(lián)想;二是使用練習(xí)軟件加強(qiáng)記憶。要記住字根,還可以依靠口訣,但更重要的是要常做拆字練習(xí),拆的字多了,就可以牢固的記住各個(gè)字根據(jù)在鍵位。
五筆字型編碼的漢字拆分原則
由基本字根組成一個(gè)漢字,這是一個(gè)正過(guò)程,這個(gè)過(guò)程對(duì)我們沒(méi)有什么影響。我們學(xué)習(xí)的是逆過(guò)程。即將一個(gè)完整的漢字拆分成若干個(gè)基本字根。
五筆字型編碼方案拆字的基本原則可概括為下面幾種情況:
這種漢字就是我們所說(shuō)的成字字根。由于這種漢字只有一個(gè)基本字根,所以不用再拆,這類(lèi)漢字的拆分有單獨(dú)規(guī)定,在下一節(jié)中會(huì)詳細(xì)講述。
由于組成這種漢字的字根之間沒(méi)有什么關(guān)聯(lián)。各部分相對(duì)獨(dú)立,所以拆分時(shí)只需要簡(jiǎn)單地將這些字根孤立出來(lái)就行,這類(lèi)漢字的拆分也相對(duì)簡(jiǎn)單。如"只"的字根是"口"和"八"。 "數(shù)",這個(gè)字的字根是"米" "女" "文"。
這類(lèi)漢字如果一個(gè)漢字只是由單筆畫(huà)與基本字根相連組成,哪么就可以將這個(gè)漢字直接拆份成單筆畫(huà)和基本字根即可,如:"上"可以拆分為"卜""一","太"可以分為"大"和"、"。
除此之外,更多的的漢字是哪些結(jié)構(gòu)較復(fù)雜的,這些漢字由于組成字根之間有相連,包含或嵌套的關(guān)系,沒(méi)有很明顯的界限,對(duì)于初學(xué)者來(lái)說(shuō),難以拆分。對(duì)這樣的漢字,拆分時(shí)要按以下原則進(jìn)行,也就是"取大優(yōu)先"、"兼顧直觀"、"能連不交"、"能散不連"。
書(shū)寫(xiě)順序:
拆分"合體字"時(shí),一定要按照正確的書(shū)寫(xiě)順序進(jìn)行。
例:"新"只能拆成"立、木、斤",不能拆成"立、斤、木" "中"只能拆成"口、丨",不能拆成"丨、口";"夷"只能拆成"一、弓、人",不能拆成"大、弓"。
取大優(yōu)先:
也叫做"優(yōu)先取大"。按書(shū)寫(xiě)順序拆分漢字時(shí),應(yīng)以"再添一個(gè)筆畫(huà)便不能成其為字根"為限,每次都拆取一個(gè)"盡可能大"的,即盡可能筆畫(huà)多的字根。
例1:"世"字:第一種拆法:一、凵、乙(誤)第二種拆法:廿、乙(正)顯然,前者是錯(cuò)誤的,因?yàn)槠涞诙€(gè)碼元"凵",完全可以向前"湊"到"一"上,形成一個(gè)"更大"的已知碼元"廿"。
例2:"制"字:第一種拆法:、一、冂、丨、刂(誤)第二種拆法:、冂、丨、刂(正)同樣,第一種拆法是錯(cuò)誤的。因?yàn)榈诙a的"一",作為""后一個(gè)筆畫(huà),全可以向前"湊",與第一個(gè)碼元""湊成"更大"一點(diǎn)的碼元""。
總之,"取大優(yōu)先",俗稱(chēng)"盡量往前湊",是一個(gè)在漢字拆分中最常用到的基本原則。至于什么才算"大","大"到什么程度才到"邊",這要等熟悉了字根總表,便不會(huì)出錯(cuò)誤了,所以熟悉字根表非常關(guān)鍵。
兼顧直觀:
在拆分漢字時(shí),為了照顧漢字碼元的完整性,有時(shí)不得不暫且犧牲一下"書(shū)寫(xiě)順序"和"取大優(yōu)先"的原則,形成個(gè)別例外的情況。
例1:國(guó):按"書(shū)寫(xiě)順序"應(yīng)拆成:"冂、王、丶、一",但這樣便破壞了漢字構(gòu)造的直觀性,故只好違背"書(shū)寫(xiě)順序",拆作"囗、王、丶"了。
例2:自:按"取大優(yōu)先"應(yīng)拆成:"亻、乙、三",但這樣拆,不僅不直觀,而且也有悖于"自"字的字源(這個(gè)字的字源是"一個(gè)手指指著鼻子")故只能拆作"丿、目",這叫做"兼顧直觀"。
能連不交:
請(qǐng)看以下拆分實(shí)例:于:一十(二者是相連的)、二丨(二者是相交的)丑:乙土(二者是相連的)、刀二(二者是相交的)。當(dāng)一個(gè)字既可拆成相連的幾個(gè)部分,也可拆成相交的幾個(gè)部分時(shí),我們認(rèn)為"相連"的拆法是正確的。因?yàn)橐话銇?lái)說(shuō),"連"比"交"更為"直觀"。
能散不連:
筆畫(huà)和字根之間,字根與字根之間的關(guān)系,可以分為"散"、"連"和"交"的三種關(guān)系。如:倡:三個(gè)字根之間是"散"的關(guān)系;自:首筆"丿"與"目"之間是"連"的關(guān)系;夷:"一"、"弓"與"人"是"交"的關(guān)系。字根之間的關(guān)系,決定了漢字的字型(上下、左右、雜合)。
1)、幾個(gè)字根都"交""連"在一起的,如"夷"、"丙"等,便肯定是"雜合型",屬于"3"型字,不會(huì)有爭(zhēng)議。而散根結(jié)構(gòu)必定是"1"型或"2"型字。
2)、值得注意的是,有時(shí)候一個(gè)漢字被拆成的幾個(gè)部分都是復(fù)筆字根(不是單筆畫(huà)),它們之間的關(guān)系,在"散"和"連"之間模棱兩可。如:占:卜口兩者按"連"處理,便是雜合型(3型)。兩者按"散"處理,便是上下型(2型正確)。嚴(yán):一廠(chǎng)后兩者按"連"處理,便是雜合型(3型)后兩者按"散"處理,便是上下型(2型正確)。當(dāng)遇到這種既能"散",又能"連"的情況時(shí).我們規(guī)定:只要不是單筆畫(huà),一律按"能散不連"判別之。因此,以上兩例中的"占"和"嚴(yán)",都被認(rèn)為是"上下型"字(2型)。
3)、作為以上這些規(guī)定,是為了保證編碼體系的嚴(yán)整性。實(shí)際上,用得上后三條規(guī)定的字只是極少數(shù)。
五筆字型單字編碼規(guī)則
掌握漢字的編碼規(guī)則,熟悉每個(gè)漢字的編碼,是五筆字型輸入的基礎(chǔ),下面提供的單個(gè)字的五筆字型編碼規(guī)則歌忘記訣:
五筆字型均直觀,依照筆順把碼編;
鍵名漢字打四下,基本字根請(qǐng)照搬;
一二三末取四碼,順序拆分大優(yōu)先;
不足四碼要注意,交叉識(shí)別補(bǔ)后邊。
從這歌訣就可以看出五筆字型編碼規(guī)則的大致面貌,同時(shí)口訣也概括了五筆字型拆字取碼的五項(xiàng)原則:
1、從形取其順序按書(shū)寫(xiě)規(guī)則,即從左到右、從上到下、從外到內(nèi);
2、以130多個(gè)字根為基本單位;
3、對(duì)于字根數(shù)超過(guò)四個(gè)的漢字,按一二三末字根的順序,最多只取四碼;
4、單體結(jié)構(gòu)拆分取大優(yōu)先;
5、末筆與字型交叉識(shí)別。
下圖是五筆字型編碼流程圖,以方便讀者了解整個(gè)編碼方案的概貌:
五筆字型中規(guī)定的鍵名漢字共有25個(gè),"王土大木工目日口田山禾白月人金言立水火之已子女又纟"
25個(gè)鍵名漢字與25個(gè)字母鍵相應(yīng),這些字的編碼相當(dāng)簡(jiǎn)單,它們的編碼就是4個(gè)所在字母鍵字母,如:"言"字的編碼為"YYYY","纟"字的編碼為"XXXX",等等。輸入鍵名漢字時(shí),只要連續(xù)擊四次該字所在的字母鍵即可。
在五筆字型字根鍵盤(pán)的每個(gè)字母鍵上,除了一個(gè)鍵名字根外,還有一些其它類(lèi)型的字根。有些字根其本身就是一個(gè)漢字,這樣的字根稱(chēng)為成字字根。成字字根的編碼是按下面公式進(jìn)行的:
鍵名碼+首筆碼+次筆碼+末筆碼
當(dāng)成字字根僅為兩筆時(shí),編碼只有三碼,公式為:
鍵名碼+首筆碼+末筆碼
例如:"石",字根所在的鍵為D,第一筆劃為 "橫"的編碼是G,第二筆為 "撇"的編碼是T鍵,末筆"橫"的編碼也是G鍵,所以這個(gè)字的五筆編碼就是DGTG。再比如"蟲(chóng)"字,這個(gè)字根是在J鍵,第一筆是豎H,第二筆是折N,最末一筆是捺(在五筆里"點(diǎn)"做為"捺")Y,所以"蟲(chóng)"的五筆編碼就是JHNY。
國(guó)標(biāo)GB2312-80中,上述的鍵名和成字字根這樣的鍵面字總共才有一百多個(gè),絕大部分漢字都不是成字字根,這些才是我們?cè)谑褂卯?dāng)中用得最多的。
五筆字型漢字編碼主要是鍵外字的編碼,編碼可以分為兩類(lèi),純字根碼和識(shí)別碼。如果一個(gè)漢字的字根是四個(gè)或超過(guò)四個(gè),就用前三后一總共四個(gè)字根碼組成編碼。
不足四個(gè)字根的漢字需補(bǔ)一個(gè)字型結(jié)構(gòu)識(shí)別碼,以增加區(qū)分漢字的信息量。
1、字根碼
每個(gè)字根都分派在一個(gè)字母鍵上,其所在鍵上的英文就是該字根的"字根碼"。
凡含四個(gè)或超過(guò)四個(gè)字根的漢字,取其第一、二、三、末四個(gè)字根碼組成鍵外字的輸入編碼。
第一字根編碼+第二字根編碼+第三字根編碼+最末一個(gè)字根編碼
這里一、二、三、末應(yīng)按正常書(shū)寫(xiě)順序,先左后右,先上后下,先外后內(nèi)。
2、交叉識(shí)別碼
一個(gè)字的字根不足四個(gè)時(shí),依次擊入字根碼后,最后需要補(bǔ)一個(gè)識(shí)別碼。為什么需要這個(gè)識(shí)別碼呢,這里可以舉例說(shuō)明:如"沐"和"汀"字,這兩個(gè)字都是由兩個(gè)字根組成的,且這兩個(gè)字的字根碼都是IS。雖然也可以讓輸入者選擇的方式來(lái)確定到底需要輸入哪一個(gè)字,但這對(duì)漢字輸入速度極為不利,重碼率要越低越好,所以五筆編碼中才引入了識(shí)別碼這個(gè)概念來(lái)對(duì)這類(lèi)漢字進(jìn)行區(qū)分。
識(shí)別碼是用該漢字最后一個(gè)筆畫(huà)和字型結(jié)構(gòu)信息來(lái)確定的,具體規(guī)則如下表:
左右結(jié)構(gòu)(第1位)上下結(jié)構(gòu)(第2位)雜合結(jié)構(gòu)(第3位)
末筆是"橫",在一區(qū)GFD
末筆是"豎",在二區(qū)HJK
末筆是"撇",在三區(qū)TRE
末筆是"捺",在四區(qū)YUI
末筆是"折",在五區(qū)NBV
從上表可以看出,識(shí)別碼的確定分兩個(gè)步驟,第一步根據(jù)最后一筆確定是在哪個(gè)區(qū),第二步再以該漢字的字型結(jié)構(gòu)來(lái)確定在哪一位,然后就能得到具體識(shí)碼了。
例:"旮"字,這個(gè)字同旭一樣字根只有兩個(gè),字根碼為VJ,但字型不同,可以通過(guò)識(shí)別碼來(lái)區(qū)分,"旮"最末筆是橫,在一區(qū),是上下結(jié)構(gòu),所以是在第二位,即F,所以"旮"的五筆編碼就是VJF。再如"汀"字,最末一筆是左豎鉤,在五筆里為豎,在第二區(qū),這個(gè)字是左右型結(jié)構(gòu),所以在第一位,即H,所以"汀"的五筆編碼就是ISH。
加識(shí)別碼后仍不足四碼時(shí),擊空格鍵結(jié)束。單筆與字根相連的字型為雜合型,見(jiàn)前面所述。
關(guān)于末筆畫(huà)還有如下規(guī)定,這些規(guī)定使取碼更為簡(jiǎn)單,明確。
(1)、末字根為"力"、"刀"、"九"、"七"等時(shí),一律認(rèn)為末筆畫(huà)為折。
(2)、"進(jìn)"、"逞"、"選"等字,不以"走之"的末筆為末筆(書(shū)寫(xiě)時(shí)確實(shí)是末筆,但這樣末筆都一樣,減少了識(shí)別信息量,約定以去掉"走之"部分后的末筆整個(gè)字的末筆來(lái)構(gòu)造識(shí)別碼。進(jìn)、逞、遠(yuǎn)的識(shí)別碼應(yīng)分別為:23,K;13,D;53,V。當(dāng)以"走之"末筆為末筆時(shí),則識(shí)別碼都相同,為43,I。沒(méi)有得到識(shí)別信息。
(3)、"我"、"戔",成等字的末筆取"丿"。
為了提高輸入速度,五筆字型方案還設(shè)計(jì)了簡(jiǎn)碼輸入,它將常用漢字只取其前邊的一個(gè)、兩個(gè)或三個(gè)字根構(gòu)成,因?yàn)?識(shí)別碼"總是在全碼的最后位置,所以簡(jiǎn)碼的設(shè)計(jì)不但減少了擊鍵次數(shù),而且省去了部分漢字的"識(shí)別碼"的判別和編碼,給擊鍵帶來(lái)了很大方便。
簡(jiǎn)碼漢字共分三級(jí):
1、一級(jí)簡(jiǎn)碼
五筆字型中,根據(jù)每個(gè)字母鍵上的字根形態(tài)特征,每鍵安排一個(gè)最為常用的高頻漢字,這類(lèi)字共25個(gè),它們的編碼只有一位,輸入時(shí)只要擊鍵一次再加一次空格鍵即可。這些高頻字及其編碼如下:
一 G 地 F 在 D 要 S 工 A
上 H 是 J 中 K 國(guó) L 同 M
和 T 的 R 有 E 人 W 我 Q
主 Y 產(chǎn) U 不 I 為 O 這 P
民 N 了 B 發(fā) V 以 C 經(jīng) X
這些高頻字實(shí)際情況的鍵位記憶可以與鍵名聯(lián)想起來(lái)進(jìn)行,大家詳細(xì)看看,可以發(fā)現(xiàn)有兩個(gè)字,其一級(jí)簡(jiǎn)碼字與鍵名字是相同的。下面是高頻字與鍵名字對(duì)照表:
第一區(qū): 一 ->王 地 ->土 在 ->大 要 ->木 工 ->工
第二區(qū): 上 ->目 是 ->日 中 ->口 國(guó) ->田 同 ->山
第三區(qū): 和 ->禾 的 ->白 有 ->月 人 ->人 我 ->金
第四區(qū): 主 ->言 產(chǎn) ->立 不 ->水 為 ->火 這 ->之
第五區(qū): 民 ->已 了 ->子 發(fā) ->女 以 ->又 經(jīng) ->纟
2、二級(jí)簡(jiǎn)碼
二級(jí)簡(jiǎn)碼是指編碼時(shí)取單字全碼的前兩個(gè)字根代碼。二十五個(gè)鍵位代碼,其兩碼組合共計(jì)有25*25=625個(gè)編碼。也就是說(shuō),用兩位碼可以給與625個(gè)漢字編碼。五筆字型就選取使用頻率較高的600多個(gè)漢字與這些對(duì)應(yīng),這些編碼就成為這些漢字的簡(jiǎn)碼。
3、三級(jí)簡(jiǎn)碼
三級(jí)簡(jiǎn)碼由一個(gè)漢字的前三個(gè)字根組成,只要一個(gè)漢字的前三個(gè)字根碼在整個(gè)編碼體系中是唯一的,一般都作為三級(jí)簡(jiǎn)碼,三個(gè)字母可以組成的編碼數(shù)是:25*25*25=15625個(gè)。實(shí)際上,在國(guó)際基本集的5763個(gè)漢字中,有三級(jí)簡(jiǎn)碼的漢字有4400多個(gè)。要輸入這些漢字,只要依次鍵入這三個(gè)字根代碼,再加上空格鍵即可。這樣看上去似乎擊鍵次數(shù)仍為四鍵,并沒(méi)有減少,但是由于省略了前三個(gè)字根之后的字根判定或者交叉識(shí)別代碼的判定,則可達(dá)到提高編碼速度,進(jìn)而達(dá)到提高輸入速度的目的。
在五筆字型編碼方案中,具有簡(jiǎn)碼的漢字總數(shù)達(dá)5000多個(gè),它們已占國(guó)際基本集的5763個(gè)的絕大多數(shù)。因此,簡(jiǎn)碼不但使用得編碼輸入變得非常簡(jiǎn)明直觀,而且可以大地提高輸入效率。
當(dāng)然,由于簡(jiǎn)碼都是四碼簡(jiǎn)略而得,所以有的字就會(huì)同時(shí)有幾種簡(jiǎn)碼。例如"經(jīng)"字,即有一級(jí)簡(jiǎn)碼、二級(jí)簡(jiǎn)碼,又有三級(jí)簡(jiǎn)碼,還可以用四位輸入。所以,最好能夠?qū)⒑?jiǎn)碼漢字背熟,對(duì)于一個(gè)有幾種簡(jiǎn)碼的漢字,盡量采用擊鍵次數(shù)少為好,這樣可以提高你的輸入速度。
如果一個(gè)編碼對(duì)應(yīng)著幾個(gè)漢字,這幾個(gè)字稱(chēng)為重碼字;幾個(gè)編碼對(duì)應(yīng)一個(gè)漢字,這幾個(gè)編碼稱(chēng)為漢字的容錯(cuò)碼。
在五筆字型中,當(dāng)輸入重碼時(shí),重碼字顯示在提示行中,較常用的字排在第一個(gè)位置上,并用數(shù)字指出重碼字的序號(hào),如果你要的就是第一個(gè)字,可繼續(xù)輸入下一個(gè)字,該字自動(dòng)跳到當(dāng)前光標(biāo)位置。如果是其它的重碼字則需要用數(shù)字鍵加以選擇。
例如:"嘉"字和"喜"字,都分解(FKUK),因"喜"字較常用,它排在第一位,"嘉"字排在第二位。若你需要"嘉"字則要用數(shù)字鍵2來(lái)選擇。
在漢字中有些字的書(shū)寫(xiě)順序往往因人而異,為了能適應(yīng)這種情況,允許一個(gè)字有多種輸入碼,這些字就稱(chēng)為容錯(cuò)字。在五筆字型編碼輸入方案中,容錯(cuò)字有500多個(gè)。
五筆字型詞組編碼規(guī)則
許多方法的實(shí)踐都證實(shí),詞匯編碼輸入可以有效降低重碼率并顯著縮短碼長(zhǎng),從而大大提高速度、效率。在五筆字型輸入方法中增強(qiáng)了詞匯輸入的功能,并給出開(kāi)放式結(jié)構(gòu),以利于用戶(hù)根據(jù)自己專(zhuān)業(yè)需要自行組織詞庫(kù)。可以說(shuō),五筆字型最有效的還是詞匯輸入。
五筆字型詞語(yǔ)輸入法有一個(gè)特點(diǎn),那就是它與單個(gè)漢字輸入是統(tǒng)一的,即輸入時(shí)不用加字或詞的輸入標(biāo)記(如五筆畫(huà)詞語(yǔ)輸入時(shí)必須先輸入"7"),也不用換檔。這主要是由于單個(gè)漢字才6700多個(gè),所以還有大量的編碼空間空閑著。詞語(yǔ)的編碼大部分就是利用邊些空閑的編碼區(qū)。
二字詞在漢語(yǔ)詞匯中占有相當(dāng)大的比重。二字詞的編碼由所含的兩個(gè)漢字各取前兩個(gè)字根碼組成,即每個(gè)漢字按書(shū)寫(xiě)順序取前兩個(gè)字根來(lái)進(jìn)行編碼。如:
機(jī)器:木 幾 口 口 SMKK
計(jì)算:言 十 竹 目 YFTH
數(shù)量:米 女 日 一 OVJG
三字詞的編碼與二字詞的編碼類(lèi)似 ,只不過(guò)它的編碼是由前兩個(gè)漢字的第一個(gè)字根碼和后一個(gè)漢字的前兩個(gè)字根碼構(gòu)成。如:
計(jì)算機(jī):言 竹 木 幾 YTSM
工藝品:工 艸 口 口 AAKK
四字詞的編碼是由每個(gè)漢字的前一字根碼組成,共四碼,例如
巧奪天工:工 大 一 工 ADGA
原原本本:廠(chǎng) 廠(chǎng) 大 大 DDSS
多字詞是指構(gòu)成詞的單個(gè)漢字?jǐn)?shù)超四個(gè),多個(gè)詞的編碼按"一、二、三、末"的規(guī)則,即分別取第一、第二、第三及最末一個(gè)漢字的第一個(gè)字根碼來(lái)構(gòu)成的編碼。例如:
中華人民共和國(guó):口 亻 人 國(guó) ?。耍祝祝?div style="height:15px;">