音頻格式

音頻格式

音頻格式即音樂格式。音頻格式是指要在計算機內播放或是處理音頻檔案,是對聲音檔案進行數、模轉換的過程。音頻格式最大頻寬是20KHZ,速率介於40~50KHZ之間,採用線性脈衝編碼調製PCM,每一量化步長都具有相等的長度。

基本介紹

  • 中文名:音頻格式
  • 最大頻寬:20KHZ
  • 速率:介於40~50KHZ之間
  • 最高頻率:20KHz
  • 最低頻率:20Hz
常見格式,CD,WAVE,AIFF,MPEG,MP3,MPEG-4,MIDI,WMA,RealAudio,VQF,OggVorbis,AMR,APE,FLAC,AAC,特點,比較,發展,

常見格式

CD

CD格式的音質是比較高的音頻格式。因此要講音頻格式,CD自然是打頭陣的先鋒。在大多數播放軟體的“打開檔案類型”中,都可以看到*.cda格式,這就是CD音軌了。標準CD格式也就是44.1K的採樣頻率,速率1411K/秒,16位量化位數,因為CD音軌可以說是近似無損的,因此它的聲音基本上是忠於原聲的,因此如果你是一個音響發燒友的話,CD是你的首選。它會讓你感受到天籟之音。CD光碟可以在CD唱機中播放,也能用電腦里的各種播放軟體來重放。一個CD音頻檔案是一個*.cda檔案,這只是一個索引信息,並不是真正的包含聲音信息,所以不論CD音樂的長短,在電腦上看到的“*.cda檔案”都是44位元組長。注意:不能直接的複製CD格式的*.cda檔案到硬碟上播放,需要使用像EAC這樣的抓音軌軟體把CD格式的檔案轉換成WAV,這個轉換過程如果光碟驅動器質量過關而且EAC的參數設定得當的話,可以說是基本上無損抓音頻。推薦大家使用這種方法。
cd光碟用於儲存cd格式檔案cd光碟用於儲存cd格式檔案

WAVE

WAVE(*.WAV)是微軟公司開發的一種聲音檔案格式,它符合PIFFResource Interchange File Format 檔案規範,用於保存WINDOWS平台的音頻信息資源,被WINDOWS平台及其應用程式所支持。“*.WAV”格式支持MSADPCM、CCITT A LAW等多種壓縮算法,支持多種音頻位數、採樣頻率和聲道,標準格式的WAV檔案和CD格式一樣,也是44.1K的採樣頻率,速率1411K/秒,16位量化位數,看到了吧,WAV格式的聲音檔案質量和CD相差無幾,也是目前PC機上廣為流行的聲音檔案格式,幾乎所有的音頻編輯軟體都“認識”WAV格式。
WAVE格式檔案音頻圖WAVE格式檔案音頻圖

AIFF

AIFF(Audio Interchange File Format)格式和AU格式,它們都和WAV非常相像,在大多數的音頻編輯軟體中也都支持它們這幾種常見的音樂格式。AIFF是音頻交換檔案格式的英文縮寫。是APPLE公司開發的一種音頻檔案格式,被MACINTOSH平台及其應用程式所支持,NETSCAPE瀏覽器中LIVEAUDIO也支持AIFF格式。所以大家都不常見。AIFF是Apple蘋果電腦上面的標準音頻格式,屬於QuickTime技術的一部分。這一格式的特點就是格式本身與數據的意義無關,因此受到了Microsoft的青睞,並據此搞出來WAV格式。AIFF雖然是一種很優秀的檔案格式,但由於它是蘋果電腦上的格式,因此在PC平台上並沒有得到很大的流行。不過由於Apple電腦多用於多媒體製作出版行業,因此幾乎所有的音頻編輯軟體和播放軟體都或多或少地支持AIFF格式。只要蘋果電腦還在,AIFF就始終還占有一席之地。由於AIFF的包容特性,所以它支持許多壓縮技術

MPEG

MPEG是動態圖象專家組的英文縮寫。這個專家組始建於1988年,專門負責為CD建立視頻和音頻壓縮標準。MPEG音頻檔案指的是MPEG標準中的聲音部分即MPEG音頻層。目前INTERNET上的音樂格式以MP3最為常見。雖然它是一種有損壓縮,但是它的最大優勢是以極小的聲音失真換來了較高的壓縮比。MPEG含有格式包括:MPEG-1MPEG-2、MPEG-Layer3、MPEG-4

MP3

MP3格式誕生於八十年代的德國,所謂的MP3也就是指的是MPEG標準中的音頻部分,也就是MPEG音頻層。根據壓縮質量和編碼處理的不同分為3層,分別對應 *.mp1 / *.mp2/ *.mp3 這3種聲音檔案。需要提醒大家注意的地方是:MPEG音頻檔案的壓縮是一種有損壓縮,MPEG3音頻編碼具有10:1~12:1的高壓縮率,同時基本保持低音頻部分不失真,但是犧牲了聲音檔案中12KHz到16KHz高音頻這部分的質量來換取檔案的尺寸,相同長度的音樂檔案,用 *.mp3 格式來儲存,一般只有 *.wav 檔案的1/10,因而音質要次於CD格式或WAV格式的聲音檔案。由於其檔案尺寸小,音質好;所以在它問世之初還沒有什麼別的音頻格式可以與之匹敵,因而為*.mp3格式的發展提供了良好的條件。直到現在,這種格式還是很流行,作為主流音頻格式的地位難以被撼動。但是樹大招風,MP3音樂的著作權問題也一直找不到辦法解決,因為MP3沒有著作權保護技術,說白了也就是誰都可以用。
MP3格式壓縮音樂的採樣頻率有很多種,可以用64Kbps或更低的採樣頻率節省空間,也可以用320Kbps的標準達到極高的音質。用裝有Fraunhofer IIS Mpeg Lyaer3的 MP3編碼器(現在效果最好的編碼器)MusicMatch Jukebox 6.0在128Kbps的頻率下編碼一首3分鐘的歌曲,得到2.82MB的MP3檔案。採用預設的CBR(固定採樣頻率)技術可以以固定的頻率採樣一首歌曲,而VBR(可變採樣頻率)則可以在音樂“忙”的時候加大採樣的頻率獲取更高的音質,不過產生的MP3檔案可能在某些播放器上無法播放。把VBR的級別設定成為與前面的CBR檔案的音質基本一樣,生成的VBR MP3檔案為2.9MB。
MP3是到2008年止使用用戶最多的有損壓縮數字音頻格式了。它的全稱是MPEG(MPEG:MovingPictureExpertsGroup)AudioLayer-3,剛出現時它的編碼技術並不完善,它更像一個編碼標準框架,留待人們去完善。早期的MP3編碼採用的的是固定編碼率的方式(CBR),看到的128Kbps,就是代表它是以128Kbps固定數據速率編碼——你可以提高這個編碼率,最高可以到320Kbps,音質會更好,自然,檔案的體積會相應增大。
因為MP3的編碼方式是開放的,可以在這個標準框架的基礎上自己選擇不同的聲學原理進行壓縮處理,所以,很快由Xing公司推出可變編碼率的壓縮方式(VBR)。它的原理就是利用將一首歌的複雜部分用高bitrate編碼,簡單部分用低bitrate編碼,通過這種方式,進一步取得質量和體積的統一。當然,早期的Xing編碼器的VBR算法很差,音質與CBR(固定碼率)相去甚遠。但是,這種算法指明了一種方向,其他開發者紛紛推出自己的VBR算法,使得效果一直在改進。目前公認比較好的首推LAME,它完美地實現了VBR算法,而且它是是完全免費的軟體,並且由愛好者組成的開發團隊一直在不斷的發展完善
而在VBR的基礎上,LAME更加發展出ABR算法。ABR(AverageBitrate)平均比特率,是VBR的一種插值參數。LAME針對CBR不佳的檔案體積比和VBR生成檔案大小不定的特點獨創了這種編碼模式。ABR在指定的檔案大小內,以每50幀(30幀約1秒)為一段,低頻和不敏感頻率使用相對低的流量,高頻和大動態表現時使用高流量,可以做為VBR和CBR的一種折衷選擇。
MP3問世不久,就憑這較高的壓縮比12:1和較好的音質創造了一個全新的音樂領域,然而MP3的開放性卻最終不可避免的導致了著作權之爭,在這樣的背景之下,檔案更小,音質更佳,同時還能有效保護著作權的MP4就應運而生了。MP3和MP4之間其實並沒有必然的聯繫,首先MP3是一種音頻壓縮的國際技術標準,而MP4卻是一個商標的名稱。
音頻格式

MPEG-4

MPEG-4標準是由國際運動圖像專家組於2000年10月公布的一種面向多媒體套用的視頻壓縮標準。它採用了基於對象的壓縮編碼技術,在編碼前首先對視頻序列進行分析,從原始圖像中分割出各個視頻對象,然後再分別對每個視頻對象的形狀信息、運動信息、紋理信息單獨編碼,並通過比MPEG-2更優的運動預測和運動補償來去除連續幀之間的時間冗餘。其核心是基於內容的尺度可變性(Content-basedscalability),可以對圖像中各個對象分配優先權,對比較重要的對象用高的空間和時間解析度表示,對不甚重要的對象(如監控系統的背景)以較低的解析度表示,甚至不顯示。因此它具有自適應調配資源能力,可以實現高質量低速率的圖像通信和視頻傳輸。 MPEG-4以其高質量、低傳輸速率等優點已經被廣泛套用到網路多媒體、視頻會議和多媒體監控等圖像傳輸系統中。中國內外大部分成熟的MPEG-4套用均為基於PC層面的客戶端和伺服器模式,套用在嵌入式系統上的並不多,且多數嵌入式MPEG-4解碼系統大多使用商業的嵌入式作業系統,如WindowsCE、VxWorks等,成本高、靈活性差。如以嵌入式Linux作為作業系統不僅開發方便,且可以節約成本,並可以根據實際情況進行裁減,占用資源少、靈活性強,網路性能好,適用範圍更廣。

MIDI

MIDI(Musical Instrument Digital Interface)格式被經常玩音樂的人使用,MIDI允許數字合成器和其他設備交換數據。MID檔案格式由MIDI繼承而來。MID檔案並不是一段錄製好的聲音,而是記錄聲音的信息,然後再告訴音效卡如何再現音樂的一組指令。這樣一個MIDI檔案每存1分鐘的音樂只用大約5~10KB。MID檔案主要用於原始樂器作品,流行歌曲的業餘表演,遊戲音軌以及電子賀卡等。*.mid檔案重放的效果完全依賴音效卡的檔次。*.mid格式的最大用處是在電腦作曲領域。*.mid檔案可以用作曲軟體寫出,也可以通過音效卡的MIDI口把外接音序器演奏的樂曲輸入電腦里,製成*.mid檔案。

WMA

WMA (Windows Media Audio) 格式是來自於微軟的重量級選手,後台強硬,音質要強於MP3格式,更遠勝於RA格式,它和日本YAMAHA公司開發的VQF格式一樣,是以減少數據流量但保持音質的方法來達到比MP3壓縮率更高的目的,WMA的壓縮率一般都可以達到1:18左右,WMA的另一個優點是內容提供商可以通過DRM(Digital Rights Management)方案如Windows Media Rights Manager 7加入防拷貝保護。這種內置了著作權保護技術可以限制播放時間和播放次數甚至於播放的機器等等,這對被盜版攪得焦頭爛額的音樂公司來說可是一個福音,另外WMA還支持音頻流(Stream)技術,適合在網路上線上播放,作為微軟搶占網路音樂的開路先鋒可以說是技術領先、風頭強勁,更方便的是不用象MP3那樣需要安裝額外的播放器,而Windows作業系統和Windows Media Player的無縫捆綁讓你只要安裝了windows作業系統就可以直接播放WMA音樂,新版本的Windows Media Player7.0更是增加了直接把CD光碟轉換為WMA聲音格式的功能,在新出品的作業系統Windows XP中,WMA是默認的編碼格式,大家知道Netscape的遭遇,現在“狼”又來了。WMA這種格式在錄製時可以對音質進行調節。同一格式,音質好的可與CD媲美,壓縮率較高的可用於網路廣播。雖然現在網路上還不是很流行,但是在微軟的大規模推廣下已經是得到了越來越多站點的承認和大力支持,在網路音樂領域中直逼*.mp3,在網路廣播方面,也正在瓜分Real打下的天下。因此,幾乎所有的音頻格式都感受到了WMA格式的壓力。微軟官方宣布的資料中稱WMA格式的可保護性極強,甚至可以限定播放機器、播放時間及播放次數,具有相當的著作權保護能力。應該說,WMA的推出,就是針對MP3沒有著作權限制的缺點而來——普通用戶可能很歡迎這種格式,但作為著作權擁有者的唱片公司來說,它們更喜歡難以複製拷貝的音樂壓縮技術,而微軟的WMA則照顧到了這些唱片公司的需求。
除了著作權保護外,WMA還在壓縮比上進行了深化,它的目標是在相同音質條件下檔案體積可以變的更小(當然,只在MP3低於192KBPS碼率的情況下有效,實際上當採用LAME算法壓縮MP3格式時,高於192KBPS時普遍的反映是MP3的音質要好於WMA)。

RealAudio

RealAudio主要適用於在網路上的線上音樂欣賞。real的的檔案格式主要有這么幾種:有RA(RealAudio)、RM(RealMedia,RealAudio G2)、RMX(RealAudio Secured),還有更多。這些格式的特點是可以隨網路頻寬的不同而改變聲音的質量,在保證大多數人聽到流暢聲音的前提下,令頻寬較富裕的聽眾獲得較好的音質
近來隨著網路頻寬的普遍改善,Real公司正推出用於網路廣播、達到CD音質的格式。如果你的RealPlayer軟體不能處理這種格式,它就會提醒你下載一個免費的升級包。許多音樂網站 提供了歌曲的Real格式的試聽版本。現在最新的版本是RealPlayer 9.0。

VQF

山葉公司另一種格式是*.vqf,它的核心是減少數據流量但保持音質的方法來達到更高的壓縮比,VQF的音頻壓縮率比標準的MPEG音頻壓縮率高出近一倍,可以達到18:1左右甚至更高。也就是說把一首4分鐘的歌曲(WAV檔案)壓成MP3,大約需要4MB左右的硬碟空間,而同一首歌曲,如果使用VQF音頻壓縮技術的話,那只需要2MB左右的硬碟空間。因此,在音頻壓縮率方面,MP3和RA都不是VQF的對手。相同情況下壓縮後VQF的檔案體積比MP3小30%~50%,更便利於網上傳播,同時音質極佳,接近CD音質(16位44.1kHz立體聲)。可以說技術上也是很先進的,但是由於宣傳不力,這種格式難有用武之地。*.vqf可以用山葉的播放器播放。同時山葉也提供從*.wav檔案轉換到*.vqf檔案的軟體。 此檔案缺少特點外加缺乏宣傳。
當VQF以44KHz、80kbit/s的音頻採樣率壓縮音樂時,它的音質優於44KHz、128kbit/s的MP3,當VQF以44KHz、96kbit/s的頻率壓縮時,它的音質幾乎等於44KHz、256kbit/s的MP3。經SoundVQ壓縮後的音頻檔案在進行回放效果試聽時,幾乎沒有人能聽出它與原音頻檔案的差異。播放VQF對計算機的配置要求僅為奔騰75或更高,當然如果您用奔騰100或以上的機器,VQF能夠運行得更加出色。實際上,播放VQF對CPU的要求僅比Mp3高5~10%左右。
VQF音頻檔案個格式VQF音頻檔案個格式
VQF即TwinVQ技術雖然是由NTT和YAMAHA開發的,但它們的套用軟體都是免費的。只是NTT和YAMAHA並沒有公布VQF的原始碼

OggVorbis

OggVorbis是一種新的音頻壓縮格式,類似於MP3等現有的音樂格式。但有一點不同的是,它是完全免費、開放和沒有專利限制的。Vorbis是這種音頻壓縮機制的名字,而Ogg則是一個計畫的名字,該計畫意圖設計一個完全開放性的多媒體系統。目前該計畫只實現了OggVorbis這一部分。
OggVorbis檔案的擴展名是*.OGG。這種檔案的設計格式是非常先進的。這種檔案格式可以不斷地進行大小和音質的改良,而不影響舊有的編碼器或播放器。
VORBIS採用有損壓縮,但通過使用更加先進的聲學模型去減少損失,因此,同樣位速率(BitRate)編碼的OGG與MP3相比聽起來更好一些。另外,還有一個原因,MP3格式是受專利保護的。如果你想使用MP3格式發布自己的作品,則需要付給Fraunhofer(發明MP3的公司)專利使用費。而VORBIS就完全沒有這個問題。
對於樂迷來說,使用OGG檔案的顯著好處是可以用更小的檔案獲得優越的聲音質量。而且,由於OGG是完全開放和免費的,製作OGG檔案將不受任何專利限制,可望可以獲得大量的編碼器和播放器。這也是為何現在MP3編碼器如此少而且大多是商業軟體的原因,因為Fraunhofer要收取專利使用費。Vorbis使用了與MP3相比完全不同的數學原理,因此在壓縮音樂時受到的挑戰也不同。同樣位速率編碼的Vorbis和MP3檔案具有同等的聲音質量。Vorbis具有一個設計良好、靈活的注釋,避免了象MP3檔案的ID3標記那樣煩瑣的操作;Vorbis還具有位速率縮放:可以不用重新編碼便可調節檔案的位速率。Vorbis檔案可以被分成小塊並以樣本粒度進行編輯;Vorbis支持多通道;Vorbis檔案可以以邏輯方式相連線等。
OggVorbis格式OggVorbis格式

AMR

AMR全稱Adaptive Multi-Rate,自適應多速率編碼,主要用於移動設備的音頻,壓縮比比較大,但相對其他的壓縮格式質量比較差,由於多用於人聲,通話,效果還是很不錯的。
一、分類
1. AMR: 又稱為AMR-NB,相對於下面的WB而言,語音頻寬範圍:300-3400Hz,8KHz抽樣
2. AMR-WB:AMR WideBand,
語音頻寬範圍: 50-7000Hz 16KHz抽樣
“AMR-WB”全稱為“Adaptive Multi-rate - Wideband”,即“自適應多速率寬頻編碼”,採樣頻率為16kHz,是一種同時被國際標準化組織ITU-T和3GPP採用的寬頻語音編碼標準,也稱為G722.2標準。AMR-WB提供語音頻寬範圍達到50~7000Hz,用戶可主觀感受到話音比以前更加自然、舒適和易於分辨。
與之作比較,現在GSM用的EFR(Enhenced Full Rate,增強型全速率編碼)採樣頻率為8kHz,語音頻寬為200~3400Hz。
AMR-WB套用於窄帶GSM(全速信道16k,GMSK)的優勢在於其可採用從6.6kb/s, 8.85kb/s和12.65kb/s三種編碼,當網路繁忙時C/I惡化,編碼器可以自動調整編碼模式,從而增強QoS。在這種套用中,AMR-WB抗擾度優於AMR-NB。
AMR-WB套用於EDGE、3G可充分體現其優勢。足夠的傳輸頻寬保證AMR-WB可採用從 6.6kb/s到23.85kb/s共九種編碼,語音質量超越PSTN固定電話。

APE

APE是目前流行的數字音樂檔案格式之一。與MP3這類有損壓縮方式不同,APE是一種無損壓縮音頻技術,也就是說當你將從音頻CD上讀取的音頻數據檔案壓縮成APE格式後,你還可以再將APE格式的檔案還原,而還原後的音頻檔案與壓縮前的一模一樣,沒有任何損失。APE的檔案大小大概為CD的一半,隨著寬頻的普及,APE格式受到了許多音樂愛好者的喜愛,特別是對於希望通過網路傳輸音頻CD的朋友來說,APE可以幫助他們節約大量的資源。當然,目前只能把音樂CD中的曲目和未壓縮的WAV檔案轉換成APE格式,MP3檔案還無法轉換為APE格式。事實上APE的壓縮率並不高,雖然音質保持得很好,但是壓縮後的容量也沒小多少。一個34MB的WAV檔案,壓縮為APE格式後,仍有17MB左右。對於一整張CD來說,壓縮省下來的容量還是可觀的。

FLAC

FLAC與MP3相仿,都是音頻壓縮編碼,但FLAC是無損壓縮,也就是說音頻以FLAC編碼壓縮後不會丟失任何信息,將FLAC檔案還原為WAV檔案後,與壓縮前的WAV檔案內容相同。這種壓縮與ZIP的方式類似,但FLAC的壓縮比率大於ZIP和RAR,因為FLAC是專門針對PCM音頻的特點設計的壓縮方式。而且可以使用播放器直接播放FLAC壓縮的檔案,就象通常播放你的MP3檔案一樣。FLAC檔案的體積同樣約等於普通音頻CD的一半,並且可以自由地互相轉換,所以它也是音樂光碟存儲在電腦上的最好選擇之一,它會完整保留音頻的原始資料,用戶可以隨時將其轉回光碟,音樂質量不會有任何改變,而在播放當中,FLAC檔案的每個數據幀都包含了解碼所需的全部信息,中間的錯誤不會影響其它幀的正常播放,這保證了它的實用有效和最小的網路時間延遲。目前在國內市場上,FLAC已經是和APE齊名的兩大最常用無損音頻格式之一,並且它的編碼技術原理使得它在未來有超過APE的巨大的發展空間。

AAC

AAC實際上是高級音頻編碼的縮寫,蘋果ipod、諾基亞手機也支持AAC格式的音頻檔案。AAC是由Fraunhofer IIS-A、杜比和AT&T共同開發的一種音頻格式,它是MPEG-2規範的一部分。AAC所採用的運算法則與MP3的運算法則有所不同,AAC 通過結合其他的功能來提高編碼效率。AAC的音頻算法在壓縮能力上遠遠超過了以前的一些壓縮算法(比如MP3等)。它還同時支持多達48個音軌、15個低頻音軌、更多種採樣率和比特率、多種語言的兼容能力、更高的解碼效率。總之,AAC可以在比MP3檔案縮小30%的前提下提供更好的音質。

特點

音頻檔案格式常見的特點有:要在計算機內播放或是處理音頻檔案,也就是要對聲音檔案進行數、模轉換,這個過程同樣由採樣和量化構成,人耳所能聽到的聲音,最低的頻率是從20Hz起一直到最高頻率20KHZ,20KHz以上人耳是聽不到的,因此音頻檔案格式的最大頻寬是20KHZ,故而採樣速率需要介於40~50KHZ之間,而且對每個樣本需要更多的量化比特數。音頻數位化的標準是每個樣本16位-96dB的信噪比,採用線性脈衝編碼調製PCM,每一量化步長都具有相等的長度。在音頻檔案的製作中,正是採用這一標準。

比較

作為數字音樂檔案格式的標準,WAV格式容量過大,因而使用起來很不方便。因此,一般情況下我們把它壓縮為MP3或WMA格式。壓縮方法有無損壓縮有損壓縮,以及混成壓縮。MPEG,JPEG就屬於混成壓縮,如果把壓縮的數據還原回去,數據其實是不一樣的。當然,人耳是無法分辨的。因此,如果把MP3,OGG格式從壓縮的狀態還原回去的話,就會產生損失。然而,APE格式即使還原,也能毫無損失地保留原有音質。所以,APE可以無損失高音質地壓縮和還原。在完全保持音質的前提下,APE的壓縮容量有了適當的減小。拿一個最為常見的38MBWAV檔案為例,壓縮為APE格式後為25MB左右,比開始足足少了13MB。而且MP3容量越來越大的今天,25M的歌曲已經算不上什麼龐然大物了。以1GB的mp3來說可以放入4張CD,那就是40多首歌曲,已經足夠了!
MP3支持格式有MP3和WMA。MP3由於是有損壓縮,因此講求採樣率,一般是44.1KHZ。另外,還有比特率,即數據流,一般為8---320KBPS。在MP3編碼時,還看看它是否支持可變比特率(VBR),現在出的MP3機大部分都支持,這樣可以減小有效檔案的體積。WMA則是微軟力推的一種音頻格式,相對來說要比MP3體積更小。

發展

音頻格式日新月異,到2008年音頻格式包括:CD格式、WAVE(*.WAV)、AIFF、AU、MP3、MIDI、WMA、RealAudio、VQF、OggVorbis、AAC、APE。
音頻格式

相關詞條

熱門詞條

聯絡我們