代碼頁

概況

代碼頁是字元集編碼的別名，也有人稱"內碼錶"。早期，代碼頁是IBM稱呼電腦BIOS本身支持的字元集編碼的名稱。當時通用的作業系統都是命令行界面系統，這些作業系統直接使用BIOS供應的VGA功能來顯示字元，作業系統的編碼支持也就依靠BIOS的編碼。現在這BIOS代碼頁被稱為OEM代碼頁。圖形作業系統解決了此問題，圖形作業系統使用自己字元呈現引擎可以支持很多不同的字元集編碼。

早期IBM和微軟內部使用特別數字來標記這些編碼，其實大多的這些編碼已經有自己的名稱了。雖然圖形作業系統可以支持很多編碼，很多微軟程式還使用這些數字來點名某編碼。

簡介

概述

對於字元和Unicode數據的位模式的定義，此模式代表特定字母、數字或符號（例如 0x20 代表一個空格，而 0x74 代表字元“t”）。一些數據類型每個字元使用一個位元組；每個位元組可以具有 256 個不同的位模式中的一個模式。

在計算機中，字元由不同的位模式（ON 或 OFF）表示。每個位元組有 8 位，這 8 位可以有 256 種不同的 ON 和 OFF 組合模式。對於使用 1 個位元組存儲每個字元的程式，通過給每個位模式指派字元可表示最多 256 個不同的字元。2 個位元組有 16 位，這 16 位可以有 65,536 種唯一的 ON 和 OFF 組合模式。使用 2 個位元組表示每個字元的程式可表示最多 65,536 個字元。

單位元組

單位元組代碼頁是字元定義，這些字元映射到每個位元組可能有的 256 種位模式中的每一種。代碼頁定義大小寫字元、數字、符號以及 !、@、#、% 等特殊字元的位模式。每種歐洲語言（如德語和西班牙語）都有各自的單位元組代碼頁。雖然用於表示 A 到 Z 拉丁字母表字元的位模式在所有的代碼頁中都相同，但用於表示重音字元（如"é"和"á"）的位模式在不同的代碼頁中卻不同。如果在運行不同代碼頁的計算機間交換數據，必須將所有字元數據由傳送計算機的代碼頁轉換為接收計算機的代碼頁。如果源數據中的擴展字元在接收計算機的代碼頁中未定義，那么數據將丟失。如果某個資料庫為來自許多不同國家的客戶端提供服務，則很難為該資料庫選擇這樣一種代碼頁，使其包括所有客戶端計算機所需的全部擴展字元。而且，在代碼頁間不停地轉換需要花費大量的處理時間。

雙位元組

僅靠單位元組字元集存儲許多語言所使用的字元也是不夠的。例如，一些亞洲語言包含上千個字元，所以每個字元必須使用雙位元組。雙位元組字元集正是為這些語言定義的。但是，這些語言都有各自的代碼頁，在運行不同雙位元組代碼頁的計算機之間傳輸數據也存在困難。

描述

1258 越南語

1257 波羅的語

1256 阿拉伯語

1255 希伯來語

1254 土耳其語

1253 希臘語

代碼頁

基本介紹

概況

簡介

概述

單位元組

雙位元組

描述

標準

SQL相關

設定方法

通過DOS命令

通過C語言函式

現狀

相關詞條

熱門詞條