通用多八位編碼字元集

簡介

通用多八位編碼字元集包括了其他所有字元集。它保證了與其他字元集的雙向兼容，即，如果你將任何文本字元串翻譯到UCS格式，然後再翻譯回原編碼，你不會丟失任何信息。UCS包含了已知語言的所有字元。除了拉丁語、希臘語、斯拉夫語、希伯來語、阿拉伯語、亞美尼亞語、喬治亞語，還包括中文、日文、韓文這樣的方塊文字，UCS還包括大量的圖形、印刷、數學、科學符號。ISO/IEC 10646定義了一個31位的字元集。UCS不僅給每個字元分配一個代碼，而且賦予了一個正式的名字。表示一個UCS或Unicode值的十六進制數通常在前面加上“U+”，例如“U+0041”代表字元“A”。

版本

ISO/IEC 10646-1:1993 = Unicode 1.1 = GB 13000.1-93《信息技術　通用多八位編碼字元集（UCS）第一部分：體系結構與基本多文種平面》。
ISO/IEC 10646-1:1993 plus Amendments 5 to 7 = Unicode 2.0
ISO/IEC 10646-1:1993 plus Amendments 5 to 7 = Unicode 2.1 excluding Euro Sign and Object Replacement Character, which are included in Amendment 18
ISO/IEC 10646-1:2000 = Unicode 3.0
ISO/IEC 10646-1:2000 and ISO/IEC 10646-2:2001 = Unicode 3.1
ISO/IEC 10646-1:2000 plus Amendment 1 and ISO/IEC 10646-2:2001 = Unicode 3.2
ISO/IEC 10646:2003 = Unicode 4.0 = GB 13000-2010
ISO/IEC 10646:2003 plus Amendment 1 = Unicode 4.1
ISO/IEC 10646:2003 plus Amendments 1 to 2 = Unicode 5.0 excluding Devanagari Letters GGA, JJA, DDDA and BBA, which are included in Amendment 3
ISO/IEC 10646:2003 plus Amendments 1 to 4 = Unicode 5.1
ISO/IEC 10646:2003 plus Amendments 1 to 6 = Unicode 5.2
ISO/IEC 10646:2003 plus Amendments 1 to 8 = ISO/IEC 10646:2011 = Unicode 6.0 excluding Indian Rupee Sign
ISO/IEC 10646:2012 = Unicode 6.1
ISO/IEC 10646:2012 = Unicode 6.2 excluding Turkish Lira Sign, which is included in Amendment 1
ISO/IEC 10646:2012 = Unicode 6.3 excluding Turkish Lira Sign, which is included in Amendment 1, and five bidirectional control characters (Arabic Letter Mark, Left-To-Right Isolate, Right-To-Left Isolate, First Strong Isolate, Pop Directional Isolate), which are included in Amendment 2
ISO/IEC 10646:2012 plus Amendments 1 and 2 = Unicode 7.0 excluding the Ruble sign
ISO/IEC 10646:2014 plus Amendment 1 = Unicode 8.0

通用多八位編碼字元集

基本介紹

簡介

版本

Unicode和ISO 10646的關係

Unicode和ISO 10646的異同

相關詞條

熱門詞條