實用語音識別基礎

實用語音識別基礎

《實用語音識別基礎》是2005年國防工業出版社出版的圖書,作者是王炳錫屈丹彭煊。

基本介紹

  • 書名:實用語音識別基礎
  • 作者:王炳錫 屈丹 彭煊
  • ISBN:711803746
  • 定價:38
  • 出版社:國防工業出版社
  • 出版時間::2005-1-1
  • 裝幀:平裝
  • 開本:16開
書籍簡介,目錄,

書籍簡介

書名:實用語音識別基礎--21世紀高等院校技術優秀教材
ISBN:711803746
作者:王炳錫 屈丹 彭煊
出版社:國防工業出版社
定價:38
頁數:0
出版日期:2005-1-1
版次:
開本:16開
包裝:平裝
簡介:本書從語音識別的基本理論出發,以“從理論到實用”為主線,講解了國際上最新、最前沿的語音識別領域的關鍵技術,從語料庫建立、語音信號預處理、特徵提取、特徵變換、模型建立等方面詳細介紹了語音識別系統建立的過程,並針對語音識別系統實用化的問題,給出了一些改善語音識別系統性能的關鍵技術,力求語音識別能走出實驗室,向實用發展。
全書共分四個部分(17章),第一部分介紹語音識別的基本理論;第二部分介紹實用語音識別系統建立的過程;第三部分列舉了語音識別系統工程化所需的關鍵技術;第四部分對語音識別的4個主要套用領域進行了詳盡的、深入淺出的講解,並根據最新的研究與實驗結果提供了大量的實際參數、圖表,與實際工作聯繫緊密,具有很強的可操作性與實用性。章節之間緊密配合、前後呼應,具有很強酶系統性。同時,通過書中的研究過程和研究方法,讀者能夠在以後的研究工作中得到很大的啟發。
本書可作為高等院校理工科通信和信息處理及相關專業的高年級本科生和(碩士、博士)研究生的教材或參考書,也可供從事信息處理、通信工程等專業的研究人員參考。

目錄

第1章 緒論
1. 1 概述
1. 2 語音識別綜述
1. 3 國內外語音識別的研究現狀和發展趨勢
參考文獻
第一部分 基本理論
第2章 聽覺機理和漢語語音基礎
2. 1 概述
2. 2 聽覺機理和心理
2. 2. 1 語音聽覺器官的生理結構
2. 2. 2 語音聽覺的心理
2. 3 發音的生理機構與過程
2. 4 漢語語音基本特性
2. 4. 1 元音和輔音
2. 4. 2 聲母和韻母
2. 4. 3 音調 字調
2. 4. 4 音節 字 構成
2. 4. 5 漢語的波形特徵
2. 4. 6 音的頻譜特性
2. 4. 7 輔音的頻譜特性
2. 4. 8 漢語語音的韻律特徵
2. 5 小結
參考文獻
第3章 語音信號處理方法--時域處理
3. 1 概述
3. 2 語音信號的數位化和預處理
3. 2. 1 語音信號的數位化
3. 2. 2 語音信號的預處理
3. 3 短時平均能量和短時平均幅度
3. 3. 1 短時平均能量
3. 3. 2 短時平均幅度
3. 4 短時過零分析
3. 4. 1 短時平均過零率
3. 4. 2 短時上升過零間隔
3. 5 短時自相關函式和平均幅度差函式
3. 5. 1 短時自相關函式
3. 5. 2 短時平均幅度差函式
3. 6 高階統計量
3. 6. 1 單個隨機變數情況
3. 6. 2 多個隨機變數及隨機過程情況
3. 6. 3 高斯過程的高階累積量
3. 7 小結
參考文獻
第4章 語音信號處理方法--時頻處理
4. 1 概述
4. 2 短時傅立葉變換
4. 2. 1 短時傅立葉變換的定義和物理意義
4. 2. 2 基於短時傅立葉變換的語譜圖及其時頻解析度
4. 2. 3 短時傅立葉譜的採樣
4. 3 小波變換
4. 3. 1 連續小波變換
4. 3. 2 二進小波變換
4. 3. 3 離散小波變換
4. 3. 4 多分辨分析
4. 3. 5 正交小波包
4. 4 Wigner分布
4. 4. 1 Wigner分布的定義
4. 4. 2 Wigner分布的一般性質
4. 4. 3 兩個信號和妁Wigner分布
4. 4. 4 Wigner分布的重建
4. 4. 5 Wigner分布的實現
4. 5 小結
參考文獻
第5章 語音信號處理方法--倒譜同態處理
5. 1 概述
5. 2 復倒譜和倒譜
5. 2. 1 定義
5. 2. 2 復倒譜的性質
5. 3 語音信號的倒譜分析與同態解卷積
5. 3. 1 疊加原理和廣義疊加原理
5. 3. 2 同態解卷特徵系統和同態解卷反特徵系統
5. 3. 3 同態解卷系統
5. 3. 4 語音的復倒譜及同態解卷
5. 4 避免相位卷繞的算法
5. 4. 1 最小相位信號法
5. 4. 2 遞歸法
5. 5 小結
參考文獻
第二部分 語音識別系統
第6章 語料庫
6. 1 概述
6. 2 語料庫的基本特徵
6. 3 語料庫的類型
6. 4 語音語料庫
6. 4. 1 語音語料庫建立. 收集和標註的意義
6. 4. 2 語音語料庫的建立和收集要點
6. 4. 3 標準語音庫語音特性描述
6. 5 語料庫的設計舉例--863漢語國語語音合成語料庫的設計
6. 5. 1 語料庫設計原則
6. 5. 2 語音庫的標註
6. 5. 3 與語音語料庫相關的文字語料庫標註
6. 6 小結
參考文獻
第7章 語音識別的預處理
7. 1 概述
7. 2 語音識別單元的選取
7. 2. 1 漢語音節
7. 2. 2 漢語的基本音素
7. 2. 3 漢語半音節
7. 3 自動分段--端點檢測技術
7. 3. 1 基於能量的端點檢測
7. 3. 2 基於LPC-10聲碼器的端點檢測
7. 3. 3 基於信息熵的語音端點檢測
7. 3. 4 基於頻帶方差的端點檢測
7. 3. 5 基於倒譜特徵的帶噪語音信號端點檢測
7. 3. 6 基於HMM的端點檢測方法
7. 3. 7 基於分形技術的端點檢測
7, 3. 8 基於自相關相似距離的端點檢測
7. 3. 9 基於遲滯編碼的端點檢測
7. 3. 10 實時端點檢測算法
7. 4 小結
參考文獻
第8章 語音信號特徵參數
8. 1 概述
8. 2 基音周期
8. 2. 1 自相關法及其改進
8. 2. 2 並行處理法
8. 2. 3 倒譜法
8. 2. 4 簡化逆濾波法
8. 3 線性預測參數
8. 3. 1 線性預測信號模型
8. 3. 2 線性預測誤差濾波
8. 3. 3 語音信號的線性預測分析
8. 3. 4 線性預測分析的解法
8. 3. 5 斜格法及其改進
8. 4 線譜對 LSP 參數
8. 4. 1 線譜對分析原理
8. 4. 2 線譜對分析的求解
8. 5 LPCC參數
8. 6 MFCC參數
8. 7 ASCC參數
8. 8 感覺加權的線性預測 PLP 特徵
8. 8. 1 PLP參數
8. 8. 2 RASTA-PLP參數
8. 9 動態差分參數
8. 10 高階信號譜類特徵
8. 10. 1 WV譜的定義及其主要性質
8. 10. 2 WV譜計算式的一些變形
8. 11 小結
參考文獻
第9章 特徵變換
9. 1 概述
9. 2 線性判別分析 LDA
9. 2. 1 線性判別分析的概念
9. 2. 2 廣義線性判別函式
9. 2. 3 Fisher線性判別
9. 2. 4 多類問題
9. 3 主分量分析 PCA
9. 3. 1 基於K-L變換的主分量分析
9. 3. 2 隨機向量的K-L展開
9. 3. 3 基於K-L變換的降維
9. 4 獨立分量分析 ICA
9. 4. 1 引言
9. 4. 2 線性獨立分量分析
9. 4. 3 線性獨立分量分析算法
9. 4. 4 獨立分量分析的預處理
9. 4. 5 非線性獨立分量分析
9. 5 小結
參考文獻
第10章 語音識別的模型
10. 1 概述
10. 2 動態時間規整 DTW
10. 2. 1 動態規劃技術 DP
10. 2. 2 DTW算法的改進
10. 3 隱馬爾可夫模型 HMM
10. 3. 1 隱馬爾可夫模型的定義
10. 3. 2 HMM中的3個基本問題及其解決方案
10. 3. 3 隱馬爾可夫模型的類型
10. 3. 4 HMM算法實現的問題
10. 4 分類模型 SVM
10. 4. 1 引言
10. 4. 2 學習問題
10. 4. 3 學習過程一致性的條件
10. 4. 4 學習過程收斂速度的界
10. 4. 5 結構風險最小歸納原理
10. 4. 6 支持向量機
10. 5 人工神經網路
10. 5. 1 引言
10. 5. 2 神經元的基本模型
10. 5. 3 前向網路
10. 5. 4 反饋網路
10. 6 高斯混合模型 GMM
10. 6. 1 高斯混合模型的定義
10. 6. 2 參數調整算法--EM算法
10. 7 小結
參考文獻
第三部分 語音識別中關鍵處理技術
第11章 說話人自適應和說話人歸一化技術
11. 1 概述
11. 2 自適應方式的分類
11. 3 MLLR算法介紹
11. 3. 1 語音特徵空間的劃分
11. 3. 2 參數的估計
11. 3. 3 對均值矢量的變換
11. 4 MAP算法介紹
11. 4. 1 MAP算法準則
11. 4. 2 MAP算法公式推導
11. 4. 3 MAP算法討論
11. 5 說話人歸一化技術
11. 5. 1 說話人歸一化技術原理
11. 5. 2 聲道長度歸一化 VTLN
11. 6 小結
參考文獻
第12章 噪聲抑制
12. 1 概述
12. 2 基於小波變換的噪聲抑制
12. 2. 1 利用小波變換去除周期性噪聲
12. 2. 2 利用小波變換去除衝激噪聲
12. 2. 3 利用小波變換去除寬頻噪聲
12. 2. 4 小波去噪方法的分析
12. 3 基於EVRC編碼的噪聲抑制
12. 4 基於HMM模型的噪聲補償
12. 5 小結
參考文獻
第13章 信道補償
13. 1 概述
13. 2 穩健語音識別技術
13. 2. 1 穩健語音識別的提出
13. 2. 2 穩健語音識別的研究現狀
13. 3 信道補償技術的主要方法
13. 3. 1 經驗補償技術
13. 3. 2 盲補償
13. 3. 3 基於特徵及模型的補償
13. 4 信道補償技術在語音識別中的套用
13. 4. 1 信道補償技術在汽車內語音識別中的套用
13. 4. 2 基於信道補償的電話語音識別
13. 5 小結
參考文獻
第四部分語音識別套用
第14章 說話人識別
14. 1 概述
14. 2 說話人識別的基本原理
14. 2. 1 說話人識別系統的典型結構
14. 2. 2 技術原理
14. 3 說話人識別的特徵選擇
14. 3. 1 說話人識別系統中常用的特徵
14. 3. 2 特徵參數的統計評價
14. 4 說話人識別的主要方法
14. 4. 1 模板匹配法
14. 4. 2 機率統計方法
14. 4. 3 辨別分類器方法
14. 4. 4. 混合方法
14. 5 判決規則與性能評價標準
14. 5. 1 說話人辨認
14. 5. 2 說話人確認 檢測
14. 6 說話人識別中的穩健技術
14. 7 系統舉例
14. 7. 1 GMM說話人辨認算法
14. 7. 2 SVM-GMM混合模型
14. 7. 3 CMM-UBM說話人確認
14. 8 小結
參考文獻
第15章 關鍵字識別
15. 1 概述
15. 2 關鍵字識別及其與連續語音識別的關係
15. 3 關鍵字識別原理
15. 3. 1 關鍵字識別系統組成
15. 3. 2 關鍵字識別的基本問題
15. 3. 3 關鍵字識別系統的主要技術難點
15. 4 搜尋策略
15. 4. 1 語音起始和結束點的粗判
15. 4. 2 幀同步的Viterbi解碼算法
15. 4. 3 加入駐留懲罰的改進Viterbi解碼算法
15. 4. 4 語法節點處的路徑合併
15. 4. 5 回溯
15. 5 識別結果的確認
15. 5. 1 置信度的原理
15. 5. 2 利用反詞模型的拒識方法
15. 5. 3 利用識別結果本身信息的拒識方法
15. 6 系統實現
15. 6. 1 訓練和識別系統框圖
15. 6. 2 訓練系統的具體實現
15. 6. 3 識別系統的具體實現
15. 7 小結
參考文獻
第16章 語言辨識
16. 1 概述
16. 1. 1 語言辨識的原理
16. 1. 2 語言辨識技術研究發展的歷史
16. 2 語言辨識所需要的有用信息
16. 3 針對自動語言辨識的知覺研究
16. 4 語言辨識的主要方法
16. 4. 1 頻譜相似性方法
16. 4. 2 基於韻律信息的方法
16. 4. 3 基於音素識別的方法
16. 4. 4 基於多語言語音單元的方法
16. 4. 5 單詞層次方法
16. 4. 6 基於連續語音識別的方法
16. 4. 7 元音系統模型
16. 5 語言辨識系統舉例
16. 5. 1 基於GMM-UBM模型的語言辨識系統
16. 5. 2 基於最小分類誤差準則的語言辨識系統
16. 5. 3 基於說話人聚類和高斯混合模型的語言辨識系統
16. 5. 4 基於時頻主分量分析和高斯混合模型的語言辨識系統
16. 5. 5 基於高斯混合二元模型的語言辨識系統
16. 6 語言辨識系統評估
16. 7 小結
參考文獻
第17章 連續語音識別
17. 1 概述
17. 2 連續語音識別整體模型
17. 3 聲學模型
17. 3. 1 語音識別單元的選取
17. 3. 2 基於予詞單元HMM的訓練
17. 4 連續語音識別中的搜尋策略
17. 4. 1 傳統的幀同步算法
17. 4. 2 基於統計知識的幀同步搜尋算法原理
17. 4. 3 受詞法約束的詞搜尋樹
17. 4. 4 連續語音識別中的雙層搜尋網路
17. 5 語言模型
17. 5. 1 基於規則的方法
17. 5. 2 基於統計的方法
17. 5. 3 N-gram模型的平滑
17. 5. 4 基於文法規則的方法和基於統計的方法相結合
17. 6 小結
參考文獻
附錄 英漢名詞對照

相關詞條

熱門詞條

聯絡我們