百度機器翻譯

百度機器翻譯

2010年初,百度組建了機器翻譯核心研發團隊,2011年6月30日,百度機器翻譯服務正式上線,目前支持27種語言的互譯。百度翻譯在海量翻譯知識獲取、翻譯模型、多語種翻譯技術等方面取得重大突破,實時準確地回響網際網路海量、複雜的翻譯請求。所研發的深度學習與多種主流翻譯模型相融合的線上翻譯系統以及基於“樞軸語言”等技術,處於業內領先水平,在國際上獲得了廣泛認可,使我國掌握了網際網路機器翻譯的核心技術。

翻譯介紹,技術優勢,產品形式,產品套用,獲獎,

翻譯介紹

大數據給機器翻譯帶來的機遇和挑戰
隨著網際網路的飛速發展,數據量激增,既給機器翻譯的發展帶來新的機遇,同時也帶來的巨大挑戰。一方面,語言資源數據量激增,使得海量翻譯知識的自動獲取和實時更新成為可能。但同時,網際網路大數據也帶來了新的挑戰:
1) 數據規模和翻譯需求的激增,導致翻譯系統計算負荷高;
2) 網際網路數據複雜多樣,語言數據噪聲大,翻譯知識獲取困難;
3) 語言歧義現象多,語義理解困難;
4) 大多數小語種語言,雙語資源數據稀缺,難以構建高質量翻譯系統。
傳統的翻譯方法和模型亟待創新。如果將網際網路大數據比喻為浩瀚的大海,傳統方法猶如一葉扁舟,難以應對網際網路大數據帶來的衝擊。要想顯著的提高翻譯質量,必須打破傳統方法的束縛,打造能夠乘風破浪的翻譯航空母艦。

技術優勢

第一,創新性地提出了將深度學習模型和多種主流翻譯模型相融合,包括傳統的基於規則、基於實例、基於統計等翻譯策略,做到發揮多種方法各自優勢,從而從整體上提升翻譯效果。據公開資料顯示,百度翻譯是國際上第一個基於深度學習模型的大規模線上機器翻譯系統。
第二,通過將句法分析技術融入翻譯系統,利用句法特徵有效的解決了翻譯過程中的句子長距離調序問題。
第三,系統提出了基於“樞軸語言(pivot language)”的機器翻譯模型,攻克了機器翻譯中小語種覆蓋和語言快速遷移的難題。
第四,將百度最先進的搜尋技術與翻譯技術相結合,基於網頁檢索、網站權威性計算、大數據挖掘、新詞偵測等技術,從海量的網際網路網頁中獲取高質量翻譯知識。

產品形式

百度翻譯擁有網頁版和手機APP等多種產品形態,此外還針對開發者提供開放雲接口服務,日均回響上億次翻譯請求。除文本翻譯外,結合用戶多樣性的翻譯需求,推出網頁翻譯、網路釋義、海量例句、權威詞典、離線翻譯、語音翻譯和拍照翻譯等功能,讓用戶暢享每一次翻譯體驗。

產品套用

小到出國旅遊、科技文獻翻譯,大到國際貿易、跨語言文化交流,機器翻譯都發揮重要價值。網際網路上有大量例子顯示,用戶在工作、生活中已經真正感受到翻譯服務帶來的價值。例如,電子商務領域,很多網店通過百度翻譯把他們的產品簡介翻譯成外語,幫他們節省一大筆翻譯的開支。越來越多的人們出境游,只需要隨身攜帶的手機裝一款“百度翻譯”就可以跨越語言障礙。據新聞報導,靖江市民警在語言不通的情況下,用百度翻譯成功救助4名外籍船員。

獲獎

2016年1月8日,2015年度國家科學技術獎勵大會今日在京舉行,百度機器翻譯項目,獲頒國家科學技術進步獎二等獎。
2015年4月,百度機器翻譯獲得中國中國電子學會科技進步一等獎,項目成果被院士專家鑑定為“在多策略融合翻譯等技術方面取得突破,在翻譯質量、翻譯語種方向、回響時間三個指標上達到國際領先水平,並取得了顯著的經濟效益和巨大的社會效益”。

相關詞條

熱門詞條

聯絡我們