聲碼器

定義

聲碼器在傳送端對語音信號進行分析，提取出語音信號的特徵參量加以編碼和加密，以取得和信道的匹配，經信息通道傳遞到接受端，再根據收到的特徵參量恢復原始語音波形。分析可在頻域中進行，對語音信號作頻譜分析，鑑別清濁音，測定濁音基頻，進而選取清-濁判斷、濁音基頻和頻譜包絡作為特徵參量加以傳送。分析也可在時域中進行，利用其周期性提取一些參數進行線性預測，或對語音信號作相關分析。根據工作原理，聲碼器可以分成：通道式聲碼器、共振峰聲碼器、圖案聲碼器、線性預測聲碼器、相關聲碼器、正交函式聲碼器。

它主要用於數字電話通信，特別是保密電話通信。

原理

人講話時，氣流經過喉頭形成聲源信號，然後激勵由口、鼻腔構成的聲道，產生話音信號。聲碼器發信端的分析器首先對話音信號進行分析，提取主要話音參數：①聲源特性，如聲帶“振動-不振動”（濁-清音）、聲帶振動時的基本頻率（基頻□□）；②聲道傳輸聲源信號的特性。這些話音參數變化很慢，它們所占的總頻帶比話音本身的頻帶窄得多，因而對這些參數採樣編碼時總數碼率只有幾千甚至幾百比特/秒，只有直接由話音信號採樣編碼的數碼率的十幾分之一，可以通過一個普通電話信道來傳輸。收信端的合成器利用這些參數來合成話音。

起源

聲碼器最早出現在美國貝爾實驗室。這個實驗室的H.W.達得利在1928年提出合成話音的構想，並於1939年在紐約世界博覽會上首次表演了他取名為聲碼器的話音合成器。此後，話音合成的原理被用來研究壓縮話音頻帶。聲碼器的研究工作不斷取得進展,數碼率已降到2400或1200比特/秒，甚至更低。合成後的話音質量有較大提高。在售價、結構、耗電等諸方面符合商用的聲碼器已經出現。中國於50年代末開始研製聲碼器，並已用於數字通信。

壓縮頻帶聲碼器能壓縮頻帶的根本依據是話音信號中存在信息多餘度。話音信號只要保留聲源和聲道的主要參量，就能保證有較高的話音清晰度。

類型採用頻譜包絡和基頻作為參數的聲碼器稱為信道聲碼器。除信道聲碼器外，還有多種其他類型的聲碼器。它們在合成話音質量、數碼率和複雜程度等方面不大一樣，主要的差別在於話音參數和提取這些參數的方式不同。例如，用共振峰的位置、幅度和寬度表示頻譜包絡的,稱為共振峰聲碼器；利用同態濾波技術,如對話音信號進行積分變換、取對數和反變換以獲得各參數的，稱為同態聲碼器；直接編碼和傳輸話音的基帶（如取200～600赫的頻帶）以表征聲源特性的，稱為聲激勵聲碼器。此外，還有相位聲碼器、線性預測聲碼器（見線性預測編碼）等。

模型

語音模型是聲碼器技術的基礎。在聲碼器所用的模型中，語音被看成是一個快變化的激勵信號送入一個慢變化的聲道濾波器後所得的輸出。激勵信號在清音時為噪聲，在濁音時為具有基音周期的脈衝串。按照這種模型，語音信號可以用兩組參數表示。一組是激勵源的參數，包括清濁音指示、基音頻率和幅度。另一組參數代表聲道濾波器的回響。這些參數，特別是代表聲道濾波器回響的參數所取的不同的具體形式就構成了各種不同的聲碼器。由於聲碼器只傳遞模型參數，完全去除了語音模型所揭示的語音信號中的多餘性，因而可得到巨大的壓縮效果。波形編碼器雖然也可利用語音模型對語音進行壓縮，但不管怎樣它總還需要傳送按語音模型無法預測的那部分信號波形或信號頻譜。這些按模型預測後的誤差信號代表了我們尚未了解的、在模型中尚未得到反映的語音細節。聲碼器捨去了這些細節，給語音信號的自然度帶來較大的損害。

聲碼器

基本介紹

定義

原理

起源

模型

類型

特點

CDMA系統

語音合成

運行條件

套用與前景

相關詞條

熱門詞條