最佳碼

定義

最佳碼(optimal code)是信源編碼的一種類型，對於某一信源和某一碼元集，若有一個惟一可解碼，其平均長度

小於等於所有其他惟一可解碼的平均長度，則稱該碼為最佳碼或緊緻碼。無失真信源編碼的基本問題就是尋找最佳碼。若一個離散無記憶信源

具有熵為

、並有碼元集

，則總可找到一種無失真編碼方法，構成惟一可解碼，使其平均碼長

滿足

上式表示最佳碼的平均長度的下限值與信源熵

成正比。

Huffman編碼

基本介紹

1952年赫夫曼(D.A. Huffman)提出了一種構造最佳碼的方法，稱之為Huffman碼。Huffman碼適用於多元獨立信源，對於多元獨立信源來說它是最佳碼。它充分利用了信源機率分布的特性進行編碼，是一種最佳的逐個符號的編碼方法。

二元Huffman編碼

二元Huffman碼的編碼步驟如下：

1) 將

個信源符號按機率遞減的次序排列：

。

2) 用0和1碼符號分別分配給機率最小的兩個信源符號，並將這兩個機率最小的信源符號合併成一個新符號，並用這兩個最小機率之和作為新符號的機率，從而得到由

個符號組成的新信源

，稱

為信源

的縮減信源。

3) 把縮減信源

的信源符號按機率遞減的次序排列，將其最後兩個機率最小的信源符號合併成一個新符號，並分別用0和1碼符號表示，形成

個符號的縮減信源

。

4) 依次下去，直至縮減信源

只剩兩個符號為止。將最後兩個新符號分別用0和1碼符號表示(最後兩個符號的機率和為1)。然後從最後一級縮減信源開始，依編碼路徑由後向前返回，就得出各信源符號所對應的碼符號序列，即得對應的碼字。

Huffman編碼得到的碼並非是唯一的。這是因為以下兩點：

1) 每次對縮減信源最後兩個機率最小的符號分配0和1碼是可以任意的，所以可得到不同的編碼。

2) 若當縮減信源中縮減合併後的符號的機率與其他信源符號機率相同時，其不同的機率次序排列導致不同的編碼結果，但它們的平均碼長相同，方差不同。

通常，在Huffman編碼過程中，當縮減信源的機率分布重新排列時，應使合併得來的機率和儘量處於最高的位置，這樣可以使合併的元素重複編碼次數減少，使短碼得到充分利用。

特點

Huffman碼具有以下3個特點：

1) Huffman碼的編碼方法保證了機率大的符號對應短碼，機率小的符號對應長碼，而且短碼得到充分利用。

2) 每次縮減信源的最後兩個碼字總是最後一位碼元不同，前面各位碼元相同(二元編碼情況)。

3) 每次縮減信源的最長兩個碼字有相同的碼長。

這三個特點保證了所得的Huffman碼一定是最佳碼。

s元Huffman編碼

上面討論的是二元Huffman碼，它的編碼方法同樣可以推廣到s元編碼中。不同的只是每次把s個符號(機率最小的)合併成一個新的信源符號，並分別用

等碼元。

最佳碼

基本介紹

定義

Huffman編碼

基本介紹

二元Huffman編碼

特點

s元Huffman編碼

Huffman碼的最佳性

其他編碼分析

香農編碼

Fano編碼

相關詞條

熱門詞條