自動翻譯系統

發展簡史

1946年第一批計算機問世時，W.韋弗和A.D.布思就提出把翻譯任務全部地或部分地交給計算機執行的構想。他們認為把源語的辭彙替換成譯語的等價詞，就能得到譯文。事實上，為了使譯文具有一定的意義,需要進行結構的變換,即變換詞序、詞性和詞的數目。1949年美國華盛頓大學的E.萊夫勒最早開始自動翻譯的研究。1954年美國喬治敦大學的L.多斯特爾特與 IBM公司開始合作研究英俄自動翻譯，並於1960年推出自動翻譯系統。1956年蘇聯科學院也開始研究自動翻譯。1957年蘇聯發射第一顆人造衛星，使美國感到需要了解蘇聯技術發展動向，加速了俄英自動翻譯的研究工作。1960年法國格勒諾布爾建立自動翻譯研究中心CETA。1964年美國政府發表對自動翻譯的評價報告(即ALPAC報告),認為自動翻譯不論在技術或經濟方面短期內都不會有什麼前途。於是中止了自動翻譯的研究項目。1970年喬治敦大學研製出第一代自動翻譯系統 SYSTRAN系統。自動翻譯理論方面也有了新的進展。

1968年C.菲爾莫爾提出格語法理論，以非常一般的方式描述了詞在句中可能具有不同的功能。1971年T.維諾格勒進行自然語言理解系統實驗，證明對自然語言的理解不僅與它的內部規律有關，而且與它的套用環境有關。1977年加拿大蒙特婁大學研製出了自動翻譯系統TAUMMETEO系統,它能在24小時內把加拿大各地區的氣象預報從英文譯成法文。1978年法國格勒諾布爾大學B.沃克領導的自動翻譯實驗室研製出第二代自動翻譯系統ARIAN78,其語言模型利用樹型結構來表示句子，它把描寫詞典和文法的語言模型部分與進行分析、轉換和生成的算法的軟體部分分開，因而可獨立於系統的軟體來改進語法和語言模型。目前大多數自動翻譯系統都是第二代系統。1978年美國德克薩斯大學與聯邦德國西門子公司開始合作研製德英機器翻譯系統METAL 系統。它是高度模組化的結構，可併入語義分析、情報檢索和專家系統模組。它採用短語結構文法構造語言規則系統,通過轉換生成目標語言,用馬爾科夫過程的方法實現系統運行。運行速度為每秒一詞,日產200頁英譯文。它已成功地運行在幾個專業領域。1980年美國推出ALPS系統，它是包括機助翻譯功能較完善的多語種語言信息處理系統,有豐富的語言數據處理與管理軟體,通過人機對話進行機器翻譯,可用於辦公自動化系統。1982年歐洲經濟共同體開始自動翻譯計畫 EUROTRA。對從美國引進的 SYSTRAN系統進行了大量開發工作，現已成為較完善的多語種機器翻譯系統，能翻譯9個語種,包括英、法、德、意、荷、葡、西等。主要語種的詞典規模都在10萬詞條以上,軟體規模已達10萬行,能翻譯的對口專業有12個，用於共同體成員國之間不同語言文獻的相互翻譯，每小時可翻譯 3萬個詞。日本於1982年開始自動翻譯計畫，已推出 TITRAN等實驗系統，有TITRAN EJ（英日）,TITRAN JE(日英),TITRAN JF(日法)等系統。中國於1985年推出英漢機器翻譯系統，如軍事科學院的KY-1型，中國社會科學院語言所的《天語》系統（ECT－2）。《天語》系統的首期目標是翻譯美國AD報告、NASA報告及英國INSPEC磁帶的文獻題錄。它屬於第二代系統，語言數據與軟體互相獨立。語言數據的加工是語法語義並重,注重語言事實的描寫和分析。平均每3分鐘一條題錄，正確率在80%以上。現在正在研究第三代自動翻譯系統，它的特點是辭彙驅動，不但使用一些通用的規則，而且還使用一定數量的針對每個詞的個別規則。第四代自動翻譯系統則是自然語言理解系統。

自動翻譯系統

基本介紹

發展簡史

基本方法

相關詞條

熱門詞條