Google神經機器翻譯系統

開發背景

機器翻譯的特徵主要表現為自動化、機械性、以語句為翻譯單位、二度摹仿和語境制約有限五大特徵,且機器翻譯與人工翻譯之間的關係並非矛盾、零和的關係,而是相輔相成、相互促進的關係。進入90年代之後,機器翻譯開始迅速發展,而谷歌翻譯是機器翻譯的代表。語言中出現一些變化、新詞或者外來詞時,谷歌翻譯可以通過升級、完善其語料庫,增加對應的新詞、外來詞文本,使譯文適應語言的發展,十分便利。

歷史

谷歌大腦項目於2011年由Google研究員傑夫·迪恩，格雷戈·科拉多和史丹佛大學計算機科學教授吳恩達在Google X秘密實驗室成立。吳恩達的工作令Google和史丹佛大學獲取了突破。

2016年9月，Google研究團隊宣布開發Google神經機器翻譯系統，同年11月，Google翻譯停止使用其自2007年10月以來一直使用的專有統計機器翻譯（SMT）技術，開始使用神經機器翻譯（NMT）。

Google翻譯的NMT系統使用了一種能夠深度學習的大型人造神經網路。GNMT使用通過使用數百萬更廣泛的來源來推斷出最相關的翻譯，提高翻譯的質量。然後將結果重新排列並組成基於人類語言的語法翻譯。 GNMT提出的系統學習架構通過Google翻譯支持的語言進行了測試。 GNMT沒有創建自己的普遍語言，而是針對許多語言之間發現的共同點，因此心理學家和語言學家比計算機科學家對此更感興趣。2016年，Google翻譯的其中八種語言開始嘗試使用此系統，包括英語，法語，德語，西班牙語，葡萄牙語，中文，日語，韓語和土耳其語。2017年3月，增加了俄語、印地語和越南語。同月，因谷歌翻譯社群的幫助下，添加了對希伯來語和阿拉伯語的支持。2017年4月底，增加了9種印度語言的支持，包括印度語，孟加拉語，馬拉地語，古吉拉特語，旁遮普語，泰米爾語，泰盧固語，馬拉雅拉姆語和康納達語。

零點翻譯

GNMT系統改進了以前的Google翻譯系統，GNMT系統可以處理“零點翻譯”，即直接將一種語言翻譯成另一種語言（例如中文到日文）。以前Google翻譯會先將源語言翻譯成英文，然後將英文翻譯成目標語言，而不是直接從一種語言翻譯成另一種語言。

GNMT系統和英語專業學生翻譯效果對比及分析

讓谷歌神經機器翻譯系統系統和英語專業學生分別翻譯兩篇英文,之後對兩者的翻譯效果進行對比。英文段落翻譯中包含全國翻譯專業資格考試英語筆譯三級樣題一篇,529字,2016年12月全國大學英語四級考試閱讀理解段落一篇,211字。2017年8月11日,在採用GNMT系統的https://translate.google.cn/網站上獲得譯文;參與翻譯測試的學生為瀋陽市4所高校4個班級英語專業大三的學生。

Google神經機器翻譯系統

基本介紹

開發背景

歷史

零點翻譯

GNMT系統和英語專業學生翻譯效果對比及分析

GNMT系統出現的問題

總結

相關詞條

熱門詞條