信息冗餘

信息冗餘

在資訊理論中,信息冗餘是傳輸訊息所用數據位的數目與訊息中所包含的實際信息的數據位的數目的差值。數據壓縮是一種用來消除不需要的冗餘的方法,校驗和是在經過有限信道容量的噪聲信道中通信,為了進行錯誤校正而增加冗餘的方法。

基本介紹

  • 中文名:信息冗餘
  • 別名:信息冗餘是傳輸訊息
定量定義,其它的冗餘概念,

定量定義

在描述原始數據的冗餘時,信源信息率為平均每個符號的。對於無記憶信源,這僅是每個符號的熵;而對於一個隨機過程的最普遍形式為前n個符號的聯合熵除以n之後,隨著n趨於無窮時的極限
在資訊理論中經常提及一種語言的“熵率”或者“信息熵”。當信源是英文散文時這是正確的。由於無記憶信源的訊息之間沒有相互依賴性,所以無記憶信源的信息率為
信源的絕對信息率
即是訊息空間基數對數值。這個公式也稱作Hartley函式。這是傳送用這個字母表表示的信息的最大信息率。其中對數要根據所用的測量單位選擇合適的底數若且唯若信源是無記憶的且均勻分布的時候,絕對信息率等於信息率。
絕對信息冗餘定義為
即信息率與絕對信息率之間的差。
稱為相對信息冗餘,它表示了最大的數據壓縮率,這個壓縮率用檔案大小減小比例所表示。當用原始檔案與壓縮後的檔案表示的時候,
表示能夠得到的最大壓縮率。與相對信息冗餘互補的是效率 ,於是
。均勻分布的無記憶信源的冗餘為0,效率為100%,因此無法壓縮。

其它的冗餘概念

兩個變數之間冗餘的度量是互信息或者正規化變數。多個變數之間冗餘的度量是全相關(total correlation)。
壓縮數據的冗餘是指 n}個訊息的期望壓縮數據長度為
(或期望數據熵率
)與熵值
(或熵率
)的差。(這裡我們假設數據是遍歷的也是平穩的,例如無記憶信源。)雖然熵率之差
會隨著
增加而任意小,實際的差
已不能(儘管理論上可以)在有限熵的無記憶信源情況下上界為 1。

相關詞條

熱門詞條

聯絡我們