統一字元編碼標準

統一字元編碼標準(Unicode)完全是一個關於建立文本或手寫字元的二進制編碼的新想法。

UCCS: Unified Character Coded Standard . 程式設計師對程式中的各個元素加以命名時,使用的命名記號稱為標識符(identifier), 變數、函式、類、方法、接口和對象的名稱都是標識符。統一字元編碼標準是用來規定命名時的合法標識符, 如, a,b,c,d,e,f,g,h,i,j,k,l,m,n,o,p,q,r,s,t,u,v,w,x,y,z, #, @, ¥, %, ^, &, *, (, ),{, }, [, ], ~, !,<,>,?,/, \, |, =, +, -, _," ,"等
統一字元編碼標準是一種計算機行業標準,其目的是無論任何腳本使文本一致表示。
例如英語、阿拉伯語、中文、希伯來語、泰語 - 任何書面語言,無論是從左到右讀取或是從右到左讀取都可以顧及。統一字元編碼標準有超過十萬字的容量,涵蓋九90種不同的腳本。UTF-8 是最常見的Unicode字元編碼,它是一種可變長度編碼,表示每個字元的Unicode字元集。UTF-8作為電子郵件和網站的默認編碼系統,採用它將確保您的網站幾乎被任何語言所兼容。
今天,統一字元編碼標準包括34168個源自24種不同語言文字的不同的編碼字元。這些字元覆蓋了世界上基本書寫文字。
還有一項工作正在進行中,就是添加一些目前尚未包括進去的現代語言。
請參見當前最流行的文字代碼,ASCII和擴展二進制編碼十進制內交換代碼(EBCDIC)。

相關詞條

熱門詞條

聯絡我們