解碼規則

解碼規則

解碼是編碼的逆過程,同時去掉比特流在傳播過程中混入的噪聲。利用解碼表把文字譯成一組組數碼或用解碼表將代表某一項信息的一系列信號譯成文字的過程稱之為解碼。解碼時需要參考一定的規則進行解碼,即解碼規則,解碼規則不同,得到的信息也不同。

基本介紹

  • 中文名:解碼規則
  • 外文名: decoding rule
  • 拼音: yì mǎ guī zé
  • 領域:數位訊號處理
  • 定義:編碼的逆過程
  • 套用:通訊
定義,解碼規則的不同種類,PPM 多級編碼規則,LDPC解碼規則,FPGA解碼規則,解碼規則的套用,

定義

解碼規則(decoding rule)解碼過程中必須遵循的規定.設信道的輸人碼字集為A={a;}(i=1,2,),輸出信號集為B={b;}(j=1,2,""",s).制定解碼規則就是設計一個函式F<b;),它對於每一個輸出信號b,確定一個惟一的輸人碼字a與其對應(單值函式),即F (b;) = a; (i=1,2,…,r;j=1,2,…,s).當確定F(b;)=a後,若信道輸出端接收到的信號為b;,而傳送的碼字不是a,則認為有錯.其錯誤機率P(e}b;)稱為條件錯誤機率.而解碼的條件正確機率為P[(b)=P(a)兩者的關係為 P(e}b;)=1一P(a;}b;) = 1一P[F(b;) }b;}.經過解碼後的錯誤機率屍F應是條件錯誤機率對B集取平均值,稱PE為平均錯誤機率。

解碼規則的不同種類

PPM 多級編碼規則

針對 PPM 調製與多級編碼結合中的錯誤傳播問題,利用多階段解碼原理的“鏈式規則”,提出一種基於疊代的解調解碼方法,給出了 8-PPM 多級編碼調製的硬判決疊代算法。仿真分析表明,疊代解調解碼方法可以改善錯誤傳播現象,提高系統誤碼性能;在相同疊代次數下,信道衰減越大,該解碼方法獲得的增益越明顯。綜合性能改善效果及開銷,M 階編碼調製系統的疊代次數宜選 M 次以內。脈衝位置調製(Pulse Position Modulation,PPM)方式是目前無線光通信中廣泛研究採用的調製方式。光信號在大氣信道中傳輸受衰減和湍流的影響,會產生深度和隨機衰落,為此,人們引入信道編碼並開展編碼與 PPM 調製的結合研究。深度衰落下,PPM 誤解調易出現連續的傳輸錯誤,傳統採用最大化歐式距離的編碼調製方法對性能改善有限。將比特交織編碼調製技術(Bit Interleaved and Coded Modulation, BICM)與 Turbo 疊代技術相結合,利用信道附加信息改善解調解碼效果,對信道具有魯棒性,近年來在無線光通信中獲得了廣泛關注和研究,但採用軟輸入輸出結合疊代方式,涉及接收信號似然度的反覆運算和更新,算法複雜,時延較大。與 BICM 技術相對應,另一種提高系統對信道魯棒性的方法是多級編碼(Multilevel Coding, MLC),其多子編碼通道結構直接適用於高階調製,通過自交織作用可獲得抗突發錯誤能力,同時,多級編碼結構可以很容易地構造任意長碼字,並運用多階段解碼(Multiple-Step Decoding,MSD)實現性能與複雜度的折衷。多級編碼在採用多階段解碼方法時會出現“錯誤傳播”問題,為此,J.B.Hube 提出了一種信道容量準則配置方法,這種方法預先計算出多級編碼調製各等價信道的信道容量,並使各級編碼碼率工作在信道容量限上,從而能在傳輸速率限制下,提供給各級子通道任意小的誤碼率,減小“錯誤傳播”。但這種方法受限於系統各等價信道信道容量的估算,需知道信道狀態信息(channel state information, CSI)條件。而文獻[13]提出採用 PDL 結合不同映射規則的方案,這雖然可以避免錯誤傳播現象,但 PDL 方案把各子信道看作是相互獨立的部分,會造成較大的性能損失。將 PPM 調製與多級編碼結合,在分析 PPM 信號集分割基礎上,根據多階段解碼原理的“鏈式規則”,提出了多級編碼調製基於疊代的解調解碼方法,給出了 8-PPM 多級編碼調製下硬判決疊代解調解碼的具體算法實現,並通過蒙特卡洛方法對其在大氣湍流中的誤碼性能進行仿真分析。

LDPC解碼規則

針對圖形處理器高速並行的特點和規則低密度奇偶校驗碼解碼過程中的可並行部分,提出了使用圖形處理器來加速規則低密度奇偶校驗碼解碼的方法。該方法在圖形處理器上採用以節點的邊並行代替節點並行進行解碼,提高了執行緒利用率;同時,在解碼過程中採用圖形處理器高速的片上記憶體———共享記憶體和暫存器來存儲數據,使數據存儲減少對全局記憶體的依賴,縮短數據訪問時間。仿真結果顯示,使用邊並行和片上記憶體,解碼速度約是圖形處理器不使用文中最佳化方法的低密度奇偶校驗碼解碼程式的5。32~10。41倍變數節點對應的校驗邊更新過程。變數節點,則該節點在計算時所需的校驗節點的第邊,文中在校驗節點的邊並行更新時,將這,計算結果可存入該執行緒塊的共享記憶體。所需傳遞信息的校驗邊都在同一執行緒塊內,變數節點更新不再需要從全局記憶體讀取數據。變數節點內條變數邊更新過程。校驗的計算結果存入共享記憶體後,當變數邊和變數邊所線上程同時讀取該值時,容易造成讀取共享記憶體時的衝突,其他執行緒也存在同樣的問題。為避免讀取共享記憶體時的衝突,可把變數邊交給號執行緒計算,變數邊交給號執行緒計算,變數邊交給號執行緒計算。校驗節點的每條邊在更新完成後,更新好的值同時寫入該執行緒暫存器和對應的共享記憶體。可以看到,號執行緒在完成校驗邊更新後,存入暫存器的值直接被將要在該執行緒進行更新的變數邊使用,存入共享記憶體的值僅被號執行緒中的變數邊使用。將此方法套用於其他執行緒,可有效避免共享記憶體讀取時的衝突。

FPGA解碼規則

光信號大氣傳輸主要受到大氣衰減效應、大氣湍流效應以及背景光的影響,大氣衰減主要影響通信鏈路的通信距離,大氣湍流效應則是由於大氣的湍流運動狀態使大氣折射率隨機起伏,使得接收信號變得隨機,影響通信質量。在較長距離的大氣光通信中還需討論光束的瞄準、空間捕獲及跟蹤(APT)等。在本文所建系統模型中,設光通信鏈路損耗為常數,背景光噪聲通過濾光措施可有效消除,同時認為時隙信號獨立傳輸且同步良好,則整個通信信道可等效為大氣湍流與高斯級聯多級編碼調製是通過多級分量編碼與調製實現了重構,構造成一個超長碼字,其極大似然(Maximum Likelihood Decoding, MLD)方法將非常複雜。Imai 提出一種 MSD 方法,從第一級分量碼開始,逐階段進行,每一階段的解碼信息傳遞到下一階段,結束於最後一級分量碼。由於 MSD 中後級解碼基於前級解碼結果,因此當前級解碼正確率較高時,可以提供一定保護作用,使得後級在碼字糾錯性能不強的條件下也具有較高的正確率;但當出現前級解碼錯誤較多的情況時,MSD 方法也會引起“錯誤傳播”現象,導致系統整體差錯性能的惡化。針對於此,套用多階段解碼原理的“鏈式規則”,提出了多級編碼調製的疊代解調解碼方法。

解碼規則的套用

1993年,國際標準ISO10646 定義了通用字元集(Universal Character Set,UCS)。UCS 是所有其他字元集標準的一個超集。它保證與其他字元集是雙向兼容的。就是說,如果你將任何文本字元串翻譯到 UCS格式,然後再翻譯回原編碼,你不會丟失任何信息。
UCS 包含了用於表達所有已知語言的字元。不僅包括拉丁語,希臘語,斯拉夫語,希伯來語,阿拉伯語,亞美尼亞語和喬治亞語的描述, 還包括中文,日文和韓文這樣的象形文字,以及平假名,片假名,孟加拉語,旁遮普語果魯穆奇字元(Gurmukhi), 泰米爾語, 印.埃納德語(Kannada),Malayalam,泰國語,寮語, 漢語拼音(Bopomofo), Hangul,Devangari,Gujarati, Oriya,Telugu 以及其它語種。對於還沒有加入的語言,由於正在研究怎樣在計算機中最好地編碼它們, 因而最終它們都將被加入。這些語言包括Tibetian,高棉語,Runic(古代北歐文字),衣索比亞語, 其他象形文字,以及各種各樣的印-歐語系的語言,還包括挑選出來的藝術語言比如 Tengwar,Cirth 和 克林貢語(Klingon)。UCS 還包括大量的圖形的,印刷用的,數學用的和科學用的符號,包括所有由 TeX,Postscript, MS-DOS,MS-Windows, Macintosh, OCR 字型, 以及許多其他字處理和出版系統提供的字元
ISO 10646 定義了一個 31 位的字元集。然而,在這巨大的編碼空間中,迄今為止只分配了前 65534 個碼位 (0x0000 到 0xFFFD)。這個UCS的16位子集稱為基本多語言面 (Basic Multilingual Plane,BMP)。將被編碼在16位BMP以外的字元都屬於非常特殊的字元(比如象形文字),且只有專家在歷史和科學領域裡才會用到它們。按當前的計畫,將來也許再也不會有字元被分配到從0x000000到0x10FFFF這個覆蓋了超過100萬個潛在的未來字元的 21 位的編碼空間以外去了。ISO 10646-1標準第一次發表於1993年,定義了字元集與 BMP 中內容的架構。定義 BMP以外的字元編碼的第二部分 ISO 10646-2 正在準備中,但也許要過好幾年才能完成。新的字元仍源源不斷地加入到 BMP 中,但已經存在的字元是穩定的且不會再改變了。
UCS 不僅給每個字元分配一個代碼,而且賦予了一個正式的名字。表示一個 UCS 或 Unicode 值的十六進制數,通常在前面加上 "U+",就象U+0041 代表字元"拉丁大寫字母A"。UCS字元U+0000到U+007F 與 US-ASCII(ISO 646) 是一致的, U+0000 到 U+00FF 與 ISO 8859-1(Latin-1) 也是一致的。從 U+E000 到 U+F8FF,已經BMP 以外的大範圍的編碼是為私用保留的。
1993年,ISO10646中定義的USC-4 (Universal Character Set) ,使用了4 個位元組的寬度以容納足夠多的相當可觀的空間,但是這個過於肥胖的字元標準在當時乃至現在都有其不現實的一面,就是會過分侵占存儲空間並影響信息傳輸的效率。與此同時,Unicode 組織於約 10 年前以 Universal,Unique和Uniform 為主旨也開始開發一個16位字元標準, 為避免兩種16位編碼的競爭,1992年兩家組織開始協商,以期折衷尋找共同點,這就是今天的 UCS-2 (BMP,Basic Multilingual Plane,16bit) 和Unicode,但它們仍然是不同的方案。

相關詞條

熱門詞條

聯絡我們