音頻視頻信號壓縮技術

簡介

伴隨著多媒體技術套用的日益普及，要傳輸、處理、存儲包含文本、圖形、圖像、音頻、視頻在內的多媒體數據。音頻視頻信號採用數位化表示後數據量十分龐大，例1秒鐘視頻的彩色數字圖象數據量高達150Mb 左右，對它們進行數據壓縮，是多媒體系統中的關鍵技術。它的主要任務是在保證聲音圖象質量的情況下，儘量減少所需要的數據量(即比特數)。由於在聲音圖象數據中存在著大量的冗餘數據，減少這些冗餘可達到壓縮的效果。另外，利用人的聽覺視覺心理特點，也可用較少的數據表達同樣主觀效果的聲音圖象信息。音頻視頻信號壓縮技術簡單來說是指對音頻視頻信號進行壓縮編碼的技術，數據壓縮手段可以把信息數據壓下來，以壓縮形式存儲和傳輸，既節約了存儲空間，又提高了通信幹線的傳輸效率，同時也可使計算機實時處理音頻、視頻信息，以保證播放出高質量的視頻、音頻節目成為可能。用於聲音圖象數據壓縮的編碼方法甚多。從壓縮的方法來看，主要可分為變換編碼、預測編碼和統計編碼等三大類。

壓縮的方法

變換編碼

這裡主要指正交變換。它將原先的時域的聲音信號或空間的圖象信號變換到另一個矢量空間(變換域)，從而得到變換係數。若係數的分布比較集中，那么可用這些少量的數據同樣表述原有的信息。對這些係數進行量化、編碼，就可以達到壓縮編碼的目的。正交變換應是可逆的，但是由於利用係數分布集中的特點，當捨去集中區域外的那些係數後的逆變換就會產生一定的誤差。一個好的正交變換，捨去集中區域外的係數值後，進行的逆變換得到的圖象和聲音與原先圖象和聲音質量相差不大。這就達到了在基本保質的前提下較大的提高數據壓縮率的目的。常用的變換有離散傅立葉變換(DFT)、離散餘弦變換 (DCT)、沃爾什變換、哈爾變換、K-L 變換。其中 K-L 變換是基於統計特性的變換，能量集中、係數相關性好。但是計算非常複雜，難以套用在實時系統中。沃爾什變換和哈爾變換的特點是用方波作為正交函式，計算簡單，適於計算機處理。而離散的餘弦變換具有 K-L 變換的優點且計算複雜度適中，是用於實時視頻壓縮變換的主要方法。

預測編碼

利用聲音和圖象在時間、空間上相鄰的信號數據相關性較高的特點，把信號的值變換成相對值，這些相對值變化範圍較小，經過量化和編碼後可以用較少的比特數來表示。預測編碼法

中的相對數據並不是簡單的前後相鄰數據之差，而是按一定的預測規則從前面的數據來預測後面的數據，再與實際數據求得相對值。若預測值較正確，則可以得到非常小的數據值。常用的預測編碼方法是差分脈衝編碼調製(DPCM)編碼法。它的優點是結構簡單，效率較高。但是當輸入信號變化較大時，編碼質量會受到影響。具有自動適應輸入變化的預測編碼器稱為自適應差分脈衝編碼調製 (ADPCM)編碼器，它可改善壓縮質量，有時可得到較高的數據壓縮率。

統計編碼

根據被編碼的符號出現機率不同這一特點，對機率大的符號使用較短的代碼，而機率小的符號使用較長的代碼進行編碼，從而使整體上減少比特數。統計編碼又稱熵編碼，常用的統計編碼有 Huffman 編碼，Shannon-Fano 編碼和算術編碼，它們均是變長碼。Huffman 碼是一種普遍使用的熵編碼，它具有計算簡單，便於硬體實現等特點。Shannon-Fano 碼的特性與 Huffman 碼相似。算術編碼計算比較複雜，但具有較高的數據壓縮率，而且不必保存和傳輸碼錶。對數字圖象還有行程碼和等值線碼兩種常用壓縮編碼。前者把圖象(行)掃描過程中相鄰的具有相同數值的象素串用它們的串長度和象素值來表示。等值線碼採用邊界曲線來表示圖象中的具有相同值象素區域。這兩種編碼法同樣對色彩分布均勻的圖象具有較好的壓縮效果。在實際的多媒體系統中，單一的編碼法所產生的數據壓縮率常常不能滿足系統的需要。因此採用多種基本編碼法相結合的方案，稱為混合編碼。好的混合編碼可達到相當高的壓縮率，同時具有計算量適中，抗干擾能力強的優點。由於音頻和視頻的結構複雜程度不同，數據壓

音頻視頻信號壓縮技術

基本介紹

簡介

壓縮的方法

數據冗餘

有損壓縮編碼和無損壓縮編碼

相關詞條

熱門詞條