漢字編碼國家標準

漢字編碼國家標準

漢字編碼國家標準,分為雙位元組部分和四位元組部分;雙位元組部分和GBK基本完全相同。四位元組部分到目前為止,比GBK多了6582個漢字(27484-20902)。

現有漢字編碼,不同相互關係,GB18030,支持的標準,存在的問題,

現有漢字編碼

GB 2312-1980(信息交換用漢字編碼字元集 基本集)
GBK-1995(漢字內碼擴展規範)
GB13000.1-1993(信息技術 通用多八位編碼字元集(UCS)第一部分:體系結構與基本多文種平面(idt ISO/IEC 10646.1-1993))
GB18030-2000(信息交換用漢字編碼字元集 基本集的擴充)

不同相互關係

GB 18030完全兼容GBK、GB2312,並且是後二者的替代標準,也將是今後唯一的字元集國家標準。
GB 18030和GB13000.1的關係:在字彙上兼容,碼錶則不兼容。例如,兩個標準中都會有“啊”字,但兩個標準中,“啊”的內碼是不同的。
GB13000.1和ISO10646為同一體系,與工業標準Unicode3.1是兼容的。

GB18030

該標準分為兩個部分:雙位元組部分和四位元組部分。
雙位元組部分和GBK基本完全相同。
四位元組部分到目前為止,比GBK多了6582個漢字(27484-20902),0x8139ef30~0x82358738。對應GB13000.1則為0x3400~0x4db5。

支持的標準

2001年9月1日後的Windows 2000 的補丁版;
Windows XP;
以及一些Linux、Unix的OS。

存在的問題

由於GB18030中包括了4位元組編碼漢字,和目前Windows平台中普遍使用的2位元組編碼的GBK和Unicode3.1有較大區別,因此在使用中出現了很多問題。例如微軟的Windows XP中實際上只支持Unicode3.1編碼,並不支持GB18030的4位元組編碼漢字。

相關詞條

熱門詞條

聯絡我們