ISO8859

ISO8859 不是一個標準,而是一系列的標準,這套字元集與編碼系統的共同特色是,以同樣的碼位對應不同字元集。

基本介紹

  • 中文名:ISO8859
  • 屬性:一系列的標準
  • 特色:同樣的碼位對應不同字元集
  • 限制:定義至多 95 個字元
  • 特性:其碼位都在 0xA1 -- 0xFF
  • 要求:不準許折行的空格
編碼,符集介紹,控制碼,字元編碼,

編碼

其基本精神是:
1.與 ASCII 相容,所以所有的低位皆不使用。
2.高位中的前 32 個碼位 (0x80 -- 0x9F 或 128--159),保留給擴充定義的 32 個控制碼,稱為 C1 控制碼 (0--31 稱為 C0 控制碼)。
3.高位中第 33 個碼位 (0xA0 或 160),也就是對應 ASCII 中 SP (空格) 的碼位,總是代表 Non-breakable space,也就是不準許折行的空格。
4.每個字元集定義至多 95 個字元,其碼位都在 0xA1 -- 0xFF 或 161--255。
5.每個字元集收錄歐洲某地區的共同常用字元。

符集介紹

ISO8859-1 字元集,也就是 Latin-1,是西歐常用字元,包括德法兩國的字母。
ISO8859-2 字元集,也稱為 Latin-2,收集了東歐字元。
ISO8859-3 字元集,也稱為 Latin-3,收集了南歐字元。
ISO8859-4 字元集,也稱為 Latin-4,收集了北歐字元。
ISO8859-5 字元集,也稱為 Cyrillic,收集了斯拉夫語系字元。
ISO8859-6 字元集,也稱為 Arabic,收集了阿拉伯語系字元。
ISO8859-7 字元集,也稱為 Greek,收集了希臘字元。
ISO8859-8 字元集,也稱為 Hebrew,收集了西伯萊 (猶太人) 字元。
ISO8859-9 字元集,也稱為 Latin-5 或 Turkish,收集了土耳其字元。
ISO8859-10 字元集,也稱為 Latin-6 或 Nordic,收集了北歐 (主要指斯堪地那維亞半島) 的字元。
ISO8859-11 字元集,也稱為 Thai,它是從泰國的 TIS620 標準字元集演化而來。
ISO8859-12 字元集,目前尚未定義。
ISO8859-13 字元集,也稱為 Latin-7,主要函蓋波羅的海(Baltic) 諸國的文字元號,也補充一些在 Latin-6 中遺漏的拉脫維亞 (Latvian) 字元。
ISO8859-14 字元集,也稱為 Latin-8,它將 Latin-1 中的某些符號換成塞爾特語 (Celtic) 的字元。塞爾特族是指英倫外圍的威爾斯人 (Welsh) 和蓋爾人 (Gaelic)。
ISO8859-15 字元集,也稱為 Latin-9,或者被匿稱為 Latin-0,它將 Latin-1 中較少用到的符號刪除,換成當初遺漏的法文和芬蘭字母;還有,把英鎊和日元之間的金錢符號,換成了歐盟貨幣符號。
ISO 8859-16,正式編號為ISO/IEC 8859-16:2001,又稱Latin-10,這個字元集設計來涵蓋阿爾巴尼亞語、克羅地亞語、匈牙利語、義大利語、波蘭語、羅馬尼亞語及斯洛維尼亞語等東南歐國家語言。 `

控制碼

以下是 C1 控制碼的號碼和名稱。
HEX DEC 功能
80 128 PADDING CHARACTER
81 129 HIGH OCTET PRESET
82 130 BREAK PERMITTED HERE
83 131 NO BREAK HERE
84 132 INDEX
85 133 NEXT LINE
86 134 START OF SELECTED AREA
87 135 END OF SELECTED AREA
88 136 CHARACTER TABULATION SET
89 137 CHARACTER TABULATION WITH JUSTIFICATION
8A 138 LINE TABULATION SET
8B 139 PARTIAL LINE FORWARD
8C 140 PARTIAL LINE BACKWARD
8D 141 REVERSE LINE FEED
8E 142 SINGLE-SHIFT TWO
8F 143 SINGLE-SHIFT THREE
90 144 DEVICE CONTROL STRING
91 145 PRIVATE USE ONE
92 146 PRIVATE USE TWO
93 147 SET TRANSMIT STATE
94 148 CANCEL CHARACTER
95 149 MESSAGE WAITING
96 150 START OF GUARDED AREA
97 151 END OF GUARDED AREA
98 152 START OF STRING
99 153 SINGLE GRAPHIC CHARACTER INTRODUCER
9A 154 SINGLE CHARACTER INTRODUCER
9B 155 CONTROL SEQUENCE INTRODUCER
9C 156 STRING TERMINATOR
9D 157 OPERATING SYSTEM COMMAND
9E 158 PRIVACY MESSAGE
9F 159 APPLICATION PROGRAM COMMAND
ISO 8859-1字元編碼

字元編碼

十進 十六 字元 說明
制 進制
---------------------------------------------------------------
160 A0 無間斷空間
161 A1 ? 倒置的嘆號
162 A2 ¢ 美分標誌
163 A3 £ 英鎊標誌
164 A4 € 貨幣標誌
165 A5 ¥ 日元標誌
166 A6 ? BROKEN BAR
167 A7 § 節標誌
168 A8 ? 分音符號
169 A9 ? 著作權標誌
170 AA a 陰性順序指示
171 AB ? 左指向雙角引號
172 AC ? NOT SIGN
173 AD 軟連字元
174 AE ? 已註冊標誌
175 AF ˉ 長音符號
176 B0 ° 度標誌
177 B1 ± 正負標誌
178 B2 2 上角標2
179 B3 3 上角標3
180 B4 ? 高音重音符號
181 B5 μ MICRO SIGN
182 B6 ? PILCROW SIGN
183 B7 · 中間點
184 B8 ? 變音符號
185 B9 1 上角標1
186 BA o 陽性順序指示
187 BB ? 右指向雙角引號
188 BC ? 普通分數四分之一
189 BD ? 普通分數二分之一
190 BE ? 普通分數四分之三
191 BF ? 倒置的問號
192 C0 à 拉丁大寫字母A帶抑音符號
193 C1 á 拉丁大寫字母A帶高音符號
194 C2 ? 拉丁大寫字母A帶抑揚音符號
195 C3 ? 拉丁大寫字母A帶鼻音符號
196 C4 ? 拉丁大寫字母A帶分音符號
197 C5 ? 拉丁大寫字母A帶上環符號
198 C6 ? 拉丁大寫字母AE
199 C7 ? 拉丁大寫字母C帶變音符號
200 C8 è 拉丁大寫字母E帶抑音符號
201 C9 é 拉丁大寫字母E帶高音符號
202 CA ê 拉丁大寫字母E帶抑揚音符號
203 CB ? 拉丁大寫字母E帶分音符號
204 CC ì 拉丁大寫字母I帶抑音符號
205 CD í 拉丁大寫字母I帶高音符號
206 CE ? 拉丁大寫字母I帶抑揚音符號
207 CF ? 拉丁大寫字母I帶分音符號
208 D0 D 拉丁大寫字母ETH
209 D1 ? 拉丁大寫字母N帶鼻音符號
210 D2 ò 拉丁大寫字母O帶抑音符號
211 D3 ó 拉丁大寫字母O帶高音符號
212 D4 ? 拉丁大寫字母O帶抑揚音符號
213 D5 ? 拉丁大寫字母O帶鼻音符號
214 D6 ? 拉丁大寫字母O帶分音符號
215 D7 × 乘法標誌
216 D8 ? 拉丁大寫字母O帶刪除符號
217 D9 ù 拉丁大寫字母U帶抑音符號
218 DA ú 拉丁大寫字母U帶高音符號
219 DB ? 拉丁大寫字母U帶抑揚音符號
220 DC ü 拉丁大寫字母U帶分音符號
221 DD Y 拉丁大寫字母Y帶高音符號
222 DE T 拉丁大寫字母THORN
223 DF ? 拉丁小寫字母SHARP S
224 E0 à 拉丁小寫字母A帶抑音符號
225 E1 á 拉丁小寫字母A帶高音符號
226 E2 a 拉丁小寫字母A帶抑揚音符號
227 E3 ? 拉丁小寫字母A帶鼻音符號
228 E4 ? 拉丁小寫字母A帶分音符號
229 E5 ? 拉丁小寫字母A帶上環符號
230 E6 ? 拉丁小寫字母AE
231 E7 ? 拉丁小寫字母C帶變音符號
232 E8 è 拉丁小寫字母E帶抑音符號
233 E9 é 拉丁小寫字母E帶高音符號
234 EA ê 拉丁小寫字母E帶抑揚音符號
235 EB ? 拉丁小寫字母E帶分音符號
236 EC ì 拉丁小寫字母I帶抑音符號
237 ED í 拉丁小寫字母I帶高音符號
238 EE ? 拉丁小寫字母I帶抑揚音符號
239 EF ? 拉丁小寫字母I帶分音符號
240 F0 e 拉丁小寫字母ETH
241 F1 ? 拉丁小寫字母N帶鼻音符號
242 F2 ò 拉丁小寫字母O帶抑音符號
243 F3 ó 拉丁小寫字母O帶高音符號
244 F4 ? 拉丁小寫字母O帶抑揚音符號
245 F5 ? 拉丁小寫字母O帶鼻音符號
246 F6 ? 拉丁小寫字母O帶分音符號
247 F7 ÷ 除法標誌
248 F8 ? 拉丁小寫字母O帶刪除符號
249 F9 ù 拉丁小寫字母U帶抑音符號
250 FA ú 拉丁小寫字母U帶高音符號
251 FB ? 拉丁小寫字母U帶抑揚音符號
252 FC ü 拉丁小寫字母U帶分音符號
253 FD y 拉丁小寫字母Y帶高音符號
254 FE t 拉丁小寫字母THORN
255 FF ? 拉丁小寫字母Y帶分音符號
ISO8859-1ISO8859-1

相關詞條

熱門詞條

聯絡我們