VXML

VXML是被用來創建語音對話系統,可以調用語音合成以及語音識別服務,可以用來記錄語音錄入和連線電話系統。創建 VXML 語音的主要目的就是用 Web 開發的理念來開發互動式的語音套用。VXML 提供了基於 Menu 和基於 Form 的兩套框架,整合了語音識別和語音合成兩個關鍵服務,使得語音套用的開發變得更為方便和快捷。

基本介紹

  • 中文名:VXML
  • 外文名:Voice eXtensible Markup Language
  • 發展歷史:論壇的發布VoiceXML 0.9版本
  • VXML功能範圍:輸出合成語音輸出語音檔案
  • VXML主要目標:把web開發方式帶到互動式程式
Voice eXtensible Markup Language (VoiceXML),最初是由AT&T, IBM, Lucent(朗訊)和 Motorola(摩托羅拉)幾個電信巨頭創立的,目前已經廣泛用於電信行業的套用伺服器和媒體伺服器互動上。
發展歷史:
1995年AT&T研究院的Dave Ladd, Chris Ramming, Ken Rehor以及Curt Tuckey在頭腦風暴關於網際網路會如何改變電話套用的時候,產生了一些新的想法:為什麼不設計這樣一個系統來運行一種可以解析某種語音標記語言的語音瀏覽器,用來把網際網路的內容和服務提供到千家萬戶的電話上。於是,AT&T就開始“電話網路項目”(Phone Web Project)。之後,Chris繼續留在AT&T,Ken去了朗訊,Dave和Curt去了摩托羅拉。1999年初的時候,他們分別在各自的公司邁出了語音標記語言規範實質性的第一步。因為他們的密友關係,這幾家公司合作成立了一個VoiceXML論壇組織,IBM也作為一個創始公司加入了進來。
1999年3月至8月,這個論壇的一個小組發布了VoiceXML 0.9版本。
2000年3月,VoiceXML 1.0問世。
一個月後,VoiceXML論壇把1.0規範提交給了權威的World Wide Web組織(W3C)。
2000年5月,W3C接手了這個VoiceXML 1.0規範。
2001年10月,VoiceXML 2.0試驗版問世。
2002年4月,最後一個版本的2.0試驗版發布。
2003年1月,VoiceXML 2.0正式版發布。
VXML的架構模型:VXML的架構模型中包含以下幾個主要組件:
1.DocumentServer(文檔伺服器):由於編寫VXML程式需要寫一些定義互動流程的xml檔案,文檔伺服器就是用來接受終端(比如手機,固定電話)的請求,並根據用戶輸入產生一個xml文檔,再由VXML解釋器解析並執行下個流程。
2.VoiceXML Interpreter(VXML解釋器):用來解析xml文檔,執行與用戶終端的互動。比如和文檔伺服器配合重複播放語音,對輸入進行驗證等循環流程,等等。
3.VoiceXML Interpreter Context(VXML解釋器環境,context雖然有上下文的意思,但是這裡應該是VXML解釋器工作環境的意思):可以通過解釋器並行監視用戶輸入,並把一些用戶特徵信息保存起來。比如,一個上下文監視某個流程出口並負責把用戶帶到高級個性化幫助;另一個上下文則監視用戶修改參數如音量和TTS特徵等。
4.Implementation Platform(實現平台):由解釋器和解釋器上下文控制。實現平台的主要作用是在和用戶互動過程中產生各種事件(比如用戶輸入,說話或連線斷開)和系統事件(比如逾時)。
VXML主要目標:VXML設計的目的是為了把好的Web開發方式帶到互動式語音程式,把這些開發者從低級的編程和資源管理中解放出來。
VXML功能範圍
輸出合成語音(TTS)
輸出語音檔案
識別語音輸入
識別DTMF輸入
對語音輸入錄音
其它像呼叫轉移,下線之類的電話功能。(Milano:VXML是沒有電話呼叫功能的,要通過ccxml來控制)
難免有遺漏疏忽之處,望批評指正並完善!!!

相關詞條

熱門詞條

聯絡我們