文本檔案格式

文本檔案格式

文本檔案格式是一種由若干行字元構成的計算機檔案。文本檔案存在於計算機檔案系統中。通常,通過在文本檔案最後一行後放置檔案結束標誌來指明檔案的結束。 文本檔案是指一種容器,而純文本是指一種內容。文本檔案可以包含純文本。 一般來說,計算機檔案可以分為兩類:文本檔案和二進制檔案 。

基本介紹

簡介,常見格式,使用方法,常見格式,ASCII,MIME,.txt,*.txt檔案,

簡介

文本檔案有很多種不同的格式,相對應不同的套用軟體。常用文本檔案格式有ASCll、MIME、*.txt等等。
詳細信息請見“常見文本檔案格式簡介”中的介紹。

常見格式

ASCll、MIME、*.txt

使用方法

配合相對應的套用軟體使用。

常見格式

ASCII

ASCII標準使得只含有ASCII字元的文本檔案可以在UnixMacintoshMicrosoft WindowsDOS和其它作業系統之間自由互動,而其它格式的檔案是很難做到這一點的。但是,在這些作業系統中,換行符並不相同,處理非ASCII字元的方式也不一致。

MIME

文本檔案在MIME標準中的類型為“text/plain”,此外,它通常還附加編碼的信息。在Mac OS X出現前,當Resource fork指定某一個檔案的類型為“TEXT”時,Mac OS就認為這個檔案是文本檔案。在Windows中,當一個檔案的擴展名為“txt”時,系統就認為它是一個文本檔案。此外,處於特殊的目的,有些文本檔案使用其它的擴展名。例如,計算機的原始碼也是文本檔案,它們的後綴是用來指明它的程式語言的。

.txt

.txt是包含極少格式信息的文字檔案的擴展名。.txt格式並沒有明確的定義,它通常是指那些能夠被系統終端或者簡單的文本編輯器接受的格式。任何能讀取文字的程式都能讀取帶有.txt擴展名的檔案,因此,通常認為這種檔案是通用的、跨平台的。
在英文文本檔案中,ASCII字元集是最為常見的格式,而且在許多場合,它也是默認的格式。對於帶重音符號的和其它的非ASCII字元,必須選擇一種字元編碼。在很多系統中,字元編碼是由計算機的區域設定決定的。常見的字元編碼包括支持許多歐洲語言的ISO 8859-1。
由於許多編碼只能表達有限的字元,通常它們只能用於表達幾種語言。Unicode制定了一種試圖能夠表達所有已知語言的標準,Unicode字元集非常大,它囊括了大多數已知的字元集。Unicode有多種字元編碼,其中最常見的是UTF-8,這種編碼能夠向後兼容ASCII,相同內容的ASCII文本檔案和UTF-8文本檔案完全一致。

*.txt檔案

微軟的MS-DOS和Windows採用了相同的文本檔案格式,它們都使用CR和LF兩個字元作為換行符,這兩個字元對應的ASCII碼分別為13和10。通常,最後一行文本並不以換行符(CR-LF標誌)結尾,包括記事本在內的很多文本編輯器也不在檔案的最後添加換行符。
大多數Windows文本檔案使用ANSI、OEM或者Unicode編碼。Windows所指的ANSI編碼通常是1位元組的ISO-8859編碼,不過對於像中文、日文、朝鮮文這樣的環境,需要使用2位元組字元集。在過渡至Unicode前,Windows一直用ANSI作為系統默認的編碼。而OEM編碼,也是通常所說的MS-DOS代碼頁,是IBM為早期IBM個人電腦的文本模式顯示系統定義的。在全螢幕的MS-DOS程式中同時使用了圖形的和按行繪製的字元。新版本的Windows可以使用UTF-16LE和UTF-8之類的Unicode編碼。
編程的基本工具的存儲格式.txt檔案
大多數多媒體互動都用自己的編程工具。且一部分是收費的。但有個任何人都能見到的程式編寫器卻不是每個人都知道——這就是windows下的附屬檔案程式——記事本。記事本可以說是每個人都認識的程式。但同時又是編程外行都視而不見的編程工具。他的存儲格式就是有極高曝光率的*.txt格式

相關詞條

熱門詞條

聯絡我們