進階音訊編碼

進階音訊編碼(英語:Advanced Audio Coding,AAC),出現於1997年,為一種基於MPEG-2的有損數字音頻壓縮的專利音頻編碼標準,由Fraunhofer IIS杜比實驗室AT&TSonyNokia等公司共同開發。2000年,MPEG-4標準在原本的基礎上加上了PNS(Perceptual Noise Substitution)等技術,並提供了多種擴展工具。為了區別於傳統的MPEG-2 AAC又稱為MPEG-4 AAC。其作為MP3的後繼者而被設計出來,在相同的比特率之下,AAC相較於MP3通常可以達到更好的聲音品質。

基本介紹

  • 中文名:進階音訊編碼
  • 外文名:Advanced Audio Coding
  • 簡寫:AAC
  • 領域:計算機
簡介,擴展名,概覽,相較於MP3的改進,技術,低碼率規格,許可和專利,

簡介

AAC由國際標準化組織國際電工委員會標準化為MPEG-2MPEG-4規格的一部分。部分的AAC、HE-AAC(AAC+)為MPEG-4音頻的一部分,並且被採用在數字聲音廣播、世界數字廣播兩個數字廣播標準中以及DVB-H、ATSC-M/H兩個移動電視標準中。
AAC支持包含一個流中48個最高至96 kHz的全頻寬聲道,加上16個120 Hz的低頻聲道(LFE)、不多於16個耦合聲道及數據流。在joint stereo模式下,要使立體聲的品質達到可接受的程度僅需96 kbps的比特率,若要達到Hi-fi則最少需要在可變碼率下128 kbps。
AAC 被YouTubeiPhoneiPodiPad任天堂DSi任天堂3DSiTunesDivXPlayStation 3和多款Nokia40系列手機採用為默認的音頻編碼格式,並且被PlayStation VitaWii、Sony Walkman MP3系列及隨後的AndroidBlackBerry等移動作業系統支持。

擴展名

AAC編碼的主要擴展名有三種:
  • .aac - 使用MPEG-2 Audio Transport Stream(ADTS,參見MPEG-2)容器,區別於使用MPEG-4容器的MP4/M4A格式,屬於傳統的AAC編碼(FAAC默認的封裝,但FAAC亦可輸出MPEG-4封裝的AAC)。
  • .mp4 - 使用了MPEG-4 Part 14(第14部分)的簡化版即3GPP Media Release 6 Basic(3gp6,參見3GP)進行封裝的AAC編碼(Nero AAC編碼器僅能輸出MPEG-4封裝的AAC)。
  • .m4a - 為了區別純音頻MP4檔案和包含視頻的MP4檔案而由蘋果(Apple)公司使用的擴展名,Apple iTunes對純音頻MP4檔案採用了".m4a"命名。M4A的本質和音頻MP4相同,故音頻MP4檔案亦可直接更改擴展名為M4A。

概覽

作為一種高壓縮比的音頻壓縮算法,AAC壓縮比通常為18:1,也有數據說為20:1;在音質方面,由於採用多聲道,和使用低複雜性的描述方式,使其比幾乎所有的傳統編碼方式在同規格的情況下更勝一籌。不過直到2006年,使用這一格式存儲音樂的並不多,可以播放該格式的mp3播放器更是少之又少,目前所知僅有蘋果iPodSonyWalkman(NWZ-A、NWZ-S、NWZ-E、NWZ-X系列)、任天堂NDSiiPhone微軟推出的Windows 7附帶的Windows Media Player 12也支持AAC)。此外電腦上很多音樂播放軟體都支持AAC(前提是安裝過AAC解碼器),如蘋果iTunes。但在行動電話領域,AAC的支持度已很普遍,NokiaSony EricssonMotorola等品牌均在其中高端產品中支持AAC(一開始主要是LC-AAC,隨著行動電話性能的發展,HE-AAC的支持也已廣泛)。

相較於MP3的改進

AAC是作為MP3的後繼者被設計出來,在1990年代後期的雙盲試驗中顯示在相同的比特率下,AAC比MP3表現出更好的聲音品質。
AAC相較於MP3的改進包含:
  • 更多的採樣率選擇(8 kHz至96 kHz,MP3為16 kHz至48 kHz)
  • 更高的聲道數上限(48個,MP3在MPEG-1模式下為最多雙聲道,MPEG-2模式下5.1聲道)
  • 任意的比特率和可變的幀長度
  • 更高效率及更單純的濾波器組(AAC使用純粹的MDCT,MP3則使用較複雜的混和濾波器組)
  • 對平穩的信號有更高的編碼效率(AAC使用較長的1024/960點區塊長度,MP3則為576點)
  • 對暫態變化的信號有更高的編碼準確度(AAC使用較短的128/120點區塊長度,MP3則為192點)
  • 可選擇使用凱澤窗函式,以較大的主瓣(main lobe)為代價,消除頻譜泄漏效應(spectral leakage)
  • 對於頻率在16 kHz的聲音頻號成分有更好的處理
  • 有額外的模組如噪聲移頻(noise shaping)、反向預測(backward prediction)、感知上的噪聲替代(perceptual noise substitution)等,可結合這些模組建構出各種不同的編碼規格
整體而言,AAC格式相較於MP3給予開發者在設計編碼上更大的彈性,並且修正許多在MPEG-1音頻規格上的設計選擇,這些增加的彈性使得更多的編碼策略可以同時存在,進而達成更高的壓縮效率。儘管如此,若要論及AAC是否比MP3好,AAC並沒有完全的決定性的優勢,MP3雖然較為古老且有相當的瑕疵,卻也被證實是意外的堅固耐用。在低比特率的情況下(通常低於128 kbps),AAC及HE-AAC則因為更好的立體聲編碼、純粹的MDCT及更好的窗函式長度,優於MP3,尤其在極低比特率的情況下優勢更為顯著。
MP3作為最早數年音樂開始在網路上傳播、分享所被使用的格式,擁有最為普遍的軟體及硬體支持,AAC則由於一些產業界持續堅定的支持,成為MP3一個有力的競爭對手。

技術

AAC是一種寬頻音頻編碼算法,主要利用以下兩種編碼策略來大幅減少存儲高品質數字音頻所需要的數據量:
  • 捨去與感知上無關的信號成分
  • 去除編碼後信號的冗餘部分
實際的編碼流程包含以下步驟:
  • 利用改進的離散餘弦變換(MDCT)將信號由時域轉換至頻域:選取適當的時域取樣點數由濾波器組將其轉換至頻域
  • 基於心理聲學將頻域信號量化及編碼
  • 加入內部的錯誤更正碼
  • 存儲或傳輸信號
  • 為必免損壞的取樣點,對每幀使用模N的Luhn算法作為校驗
在MPEG-4中並沒有定義一個單一的高效率壓縮流程,而是一組複雜的工具來達成從低編碼速率的語音編碼到高品質音頻壓縮、音樂合成等廣泛的操作。
  • MPEG-4音頻編碼算法家族橫跨了從低比特率的語音編碼(最低至2 kbps)到高品質音頻編碼(每聲道64 kbps或更高)
  • AAC提供了低至8 kHz高至96 kHz的多種採樣率、更高的比特深度(8, 16, 24, 32 bit),並且支持1到48之間的任何聲道數
  • 相較於MP3使用的混和濾波器組,AAC使用MDCT搭配增加至1024或960點的長度
AAC編碼器可以動態的在單一的1024點MDCT區塊或8個128點區塊之間切換(或960及120點)
  • 在有暫態的信號變化時,選擇使用8個較短的128/120點區塊以達到更好的時域解析度
  • 在默認的情況下則使用較長的1024/960點區塊以增加頻域的解析度,因為如此可以運用更複雜的心理聲學模型來達成更好的編碼效率

低碼率規格

  • 相對於傳統的LC-AAC,High Efficiency AAC(高效AAC,簡寫為HE-AAC或AAC-HE)又稱為"aacPlus v1"或"AAC+"- 結合了譜帶複製(Spectral Band Replication,SBR)及AAC技術;適用於低比特率(64kbps以下);
  • HE-AAC v2,又稱為"aacPlus v2" - 結合了參數化立體聲(Parametric Stereo,PS)和HE-AAC中的SBR技術。HE/AAC v2進一步降低了對碼率的需求(接近於50%),被套用於類似於DAB等碼率資源很有限的領域。

許可和專利

用戶不需要許可或付款來流式傳輸或分發AAC格式的內容。這個原因可以使AAC比照其前身的MP3一樣,特別是根據適用於流媒體(如網際網路廣播)分發內容成為更有吸引力的格式。
然而,AAC 編解碼器的所有製造商或開發商都需要專利許可。因此,FFmpeg和FAAC等自由開放原始碼軟體的實現可能僅以原始碼形式分發,以避免專利侵權。

相關詞條

熱門詞條

聯絡我們