漢字編碼系統

提要

在中國，為了保證對於所有系統中文的編碼一致能夠互相進行操作，中文信息編碼由政府負責制定並監督實施。我國的GB18030標準作為強制標準實行，所有不支持GB18030標準的軟體將不能作為產品售出。

漢字編碼，包括計算機內碼和外碼。外碼中的輸入編碼，具有很多編碼樣式。這些編碼，它們各自獨立，不成體系。假如，我們把這些編碼系統化，模式化，讓它們既具有“個性化”，又具有“通用性”，並且，不局限於漢字輸入，那么，這樣的漢字編碼，將會發生一些全新的變化。

漢字編碼，就是字詞基本屬性的拼寫形式，這些拼寫形式，是用《漢語拼音方案》拼寫的。

這個定義規定：①編碼內容，是字詞的基本屬性。這些基本屬性，是最基本的啟蒙常識，包括漢字的讀音、筆順、偏旁部首及其組合等內容。②拼寫工具，是《漢語拼音方案》。

漢字編碼的“通用模式”是：

[漢字編碼]=[讀音描述’]+[形義特徵描述’]+[檢索序號]；

等式右邊，包括讀音部分、形義特徵部分和序號部分；各部分及分隔設定號，可根據需要定義取捨。

讀音部分，描述字詞的讀音屬性，它按照《漢語拼音方案》和《漢語拼音正詞法基本規則》的規定，拼寫字詞。

形義特徵部分，描述字詞的筆順、偏旁部首和詞性等屬性，或同音字詞的區別特徵。

序號部分，描述字詞在同一個屬性分類中的排列順序，其自身，也是一種語文屬性，它使字詞的屬性描述具有確定性。

這個共同的編碼“通用模式”，具有開放性，它可以不斷地揚棄和吸收，以適應社會信息化需要。利用編碼通用模式，可以實現編碼樣式的相互演化。

取其“讀音描述”部分，就是現有的“音碼”；

取其“形義特徵”部分，就是現有的“形碼”；

兩部分全取，就是現有的“音形碼”；調換兩部分位置，就是現有的“形音碼”。

“漢字編碼系統”，使用統一的代碼。它們是：

(1)、讀音代碼，描述字詞讀音和部件名稱；用《漢語拼音方案》拼寫，或縮寫。

(2)、筆畫代碼，描述漢字筆畫或書寫筆順；橫、豎、撇、點、折，用《漢語拼音方案》拼寫，或縮寫。

(3)、聲調代碼，描述漢語音節的聲調；陰平、陽平、上聲、去聲，用《漢語拼音方案》拼寫，或縮寫（陽平聲調的縮寫，用“平”字的聲母“p”表示），輕聲不標，或將聲調用數字表示。

(4)、序號代碼，描述字詞在屬性分類中的排列序號，用漢語拼音字母表示，按字母表排序，或用數字表示，或將字母（或數字）定義相應的數值進制。

漢字部件，有讀音的，用讀音代碼描述；無讀音的，用筆畫代碼描述；也可以全用筆畫代碼描述。