語音分析

定義

語音分析（SpeechAnalytics）技術，是指通過語音識別等核心技術將非結構化的語音信息轉換為結構化的索引，實現對海量錄音檔案、音頻檔案的的知識挖掘和快速檢索。

呼叫中心保存著大量的客服錄音數據，這些語音中包含著客戶需求、投訴、滿意度、建議、競爭性情報等大量的有價值的信息，但是由於數量巨大，檢索不便，目前普遍只能用於質檢。

科大訊飛VoiceInsight語音分析系統，通過領先的語音分析核心技術，針對客服中心的實際業務需要，可有效的對錄音數據進行自動分析，提取出有效的信息，讓用戶駕馭海量客服錄音數據，輔助客服質檢，進而針對性的改善客服質量，提高客戶滿意度；同時也可以通過系統挖掘到用戶行為數據，進而及時進行準確的市場決策。

語音分析常用的特有參數有：共振峰幅度與頻率，它是語音短時功率譜中能量集中的幾個區域，區域中心頻率稱為共振峰頻率，一般語音有三至五個共振峰。這些共振峰頻率成分的幅度稱為共振峰幅度。有時把共振峰幅度從中心到下降3dB處的頻寬稱為共振峰頻寬。共振峰的參數完全確定了發音中元音的屬性。

用時域方法，採用線性預測計算方法獲得的語音參數，稱為線性預測參數。線性預測參數是語音的時域分析參數，它能準確地獲得聲道的傳輸特性，由時域與頻域參數之間的確定關係，由線性預測參數可轉換求得共振峰參數。利用線性預測參數可以求得另一組參數稱為反射係數，反射係數比線性預測參數具有更好的數值穩定性。由線性預測參數還可以求得另外一套係數，稱為線譜對參數，它們既保留時域計算的特點，又具有反映共振峰頻率特性的內涵。

利用同態信號分析方法，對語音信號進行分析可以得到一組倒譜參數。倒譜參數被認為是更適用於語音識別的一組參數。

語音分析技術常被用於語音編碼壓縮，形成各種中速、低速編碼的新方案。例如子帶編碼、交換編碼、自適應預測編碼、多脈衝激勵線性預測編碼、碼激勵線性預測編碼等。語音識別也是基於語音分析的結果，進行參數的分類與識別，運用不同的參數，可以導致不同的識別結果。利用語音分析技術還可以設計製造用於發音的各種矯正儀器，可供發音器官疾病的治療或聾啞人發音訓練等使用。

語音分析的常用儀器有語圖儀，用於語音動態頻譜的分析及記錄。實時數字語圖儀是一種新的語圖儀。語音分析更常用的方法是利用通用微機加入語音處理設定，通過專用軟體計算獲得。

語音理解

語音理解(speech understanding) 利用知識表達和組織等人工智慧技術進行語句自動識別和語意理解。同語音識別的主要不同點是對語法和語義知識的充分利用程度。

語音理解起源於美國，1971年，美國遠景研究計畫局(ARPA)資助了一個龐大的研究項目，該項目要達到的目標叫做語音理解系統。由於人對語音有廣泛的知識，可以對要說的話有一定的預見性，所以人對語音具有感知和分析能力。依靠人對語言和談論的內容所具有的廣泛知識，利用知識提高計算機理解語言的能力，就是語音理解研究的核心。

利用理解能力，可以使系統提高性能：①能排除噪聲和嘈雜聲；②能理解上下文的意思並能用它來糾正錯誤，澄清不確定的語義；③能夠處理不合語法或不完整的語句。因此，研究語音理解的目的，可以說是與其研究系統仔細地去識別每一個單詞，倒不如去研究系統能抓住說話的要旨更為有效。

語音分析

基本介紹

定義

語音理解

語音識別

核心功能

套用價值

相關詞條

熱門詞條