Java字元

計算機記憶體和硬碟等存儲空間的管理都是以位元組為基本單位,每個位元組都有自己的編號,而“字元-Char”是人們用作標記的符號,如'A'、'一'等,每個字元都具有約定的抽象含義。

基本介紹

  • 中文名:Java字元
  • 外文名:char
  • 基本單位位元組
  • 含義:字元-Char
  • 編號:A'、'一'
java基本數據類型,數據類型,位元組byte,字元集Charset,字元常量,轉義符,

java基本數據類型

占用空間(B)
取值範圍(起點)
取值範圍(結束點)
byte(整型)
1
-2^7 (-128)
2^7-1(127)
short(整型)
2
...
...
int(整型)
4
...
...
long(整型)
8
...
...
char(字元)
1~4
任意單個字元
任意單個字元
1
true/false
true/false
float(單精度)
4
-3.403e38(有效位數6~7位)
3.403e38(有效位數6~7位)
double(雙精度)
8
-1.798e308(有效位數15位)
1.793e308(有效位數15位)

數據類型

位元組byte

它是計算機的數據存儲單元,每個位元組包括8個二進制位-bit”,可以保存8位的二進制數
由於受到電子設備的物理特定限制,例如磁性存儲器只適合保存兩種狀態的信息—磁性的強弱、以電信號的方式也只適合傳遞兩種狀態的信息—電壓的高低,因此在計算機中最終結果時再將轉換為人們熟悉的格式,如十進制數值、字元和圖形等。

字元集Charset

為了實現對字元信息的存儲,人們將可能用到的字元排成一個有序的字元佇列,這種由多個有序字元組成的集合稱為“字元集-Charset”,而在計算機中世紀保存的是字元在字元集中的序號,即一個二進制形式的整數。而到底採用1個還是多個位元組以及具體如何來存儲一個字元集的字元,這種相關的規定被稱為“編碼-Encoding”。
Java最初採用的是16位Unicode編碼(UTF-16)來表示字元,無論序號大小,每個Java字元都占用定長的2B(16個二進制位),因此最多能表示65536個不同的字元,這只是粗略的說法,實際上如果採用變通的方式進行字元編碼,UTF-16編碼可以表示的字元遠多於65536個。
例如,從JDK5開始Java語言引入了Unicode編碼規範中的代碼點(Code Point)機制,將每個字元對應的代碼稱為一個代碼點,基本的多語言字元的代碼點還是用16位表示,這16位的二進制數據也稱為一個單元代碼(Code Unit),此時一個代碼單元也對應一個代碼點;
而後擴充輔助字元則編碼為2個連續的代碼單元(32位),此時一個代碼點有兩個代碼單元組成,這實際上是將UTF-16也變成了可變長度編碼。

字元常量

(1) 用英文單引號括起來的單個字元,例如:'a'、'字'。這是最常見的聲明字元形式。
(2) 用英文單引號括起來的十六進制字元代碼值來表示單個字元。其格式為:'uXXXX',其中u是約定的前綴(u是unicode的第一個字母),而後面的XXXX位4位十六進制數,是該字元在unicode字元集中的序號。例如:'uFFFF'。

轉義符

某些特殊的字元可以採用轉義符來表示,如換行和制表符源檔案直接出現會被當做分隔設定、而不是做字元常量來使用,因而分別使用'n'和't'來轉移,下面給出一些常見的Java程式中用到的轉義符:
n:換行符,unicode值為'u000a'
t:制表符,unicode值為'u0009'
r:回車符,unicode值為'u000d'
":雙引號,unicode值為'u0022'
':單引號,unicode值為'u0027'
\:反斜槓,unicode值為'u005c'
b:退格符,unicode值為'u0008'
Java中聲明字元:char c1 = '一'; 即表示c1是一個字元。

相關詞條

熱門詞條

聯絡我們