馮志偉(教育部語言文字套用研究所研究員)

馮志偉(教育部語言文字套用研究所研究員)

本詞條是多義詞,共2個義項
更多義項 ▼ 收起列表 ▲

馮志偉,1939年4月生,雲南省昆明市人,計算語言學家,專門從事語言學和計算機科學的跨學科研究。他先後在北京大學中國科學技術大學研究生院兩次研究生畢業,獲雙碩士學位。先後到法國格勒諾布爾理科醫科大學德國夫琅禾費研究院(FhG)新信息技術與通信系統研究所德國特里爾大學語言文學院德國康斯坦茨高等技術學院國際術語學和套用語言學中心(CiTaL)、桑夏自然語言處理研究院、韓國科學技術院(KAIST)電子工程與計算機科學系(EECS)學習、工作。現為國家教育部語言文字套用研究所研究員、博士生導師、學術委員會委員。

基本介紹

  • 中文名:馮志偉
  • 國籍:中國
  • 出生日期:1939年4月
  • 職業:研究員  博士導師
  • 性別:男
簡介,主要課程,與數理語言學共舞,學術背景與經歷,

簡介

1939年4月生,雲南省昆明市人,計算語言學家,專門從事語言學和計算機科學的跨學科研究。他先後在北京大學和中國科學技術大學研究生院兩次研究生畢業,獲雙碩士學位。1978年到法國格勒諾布爾理科醫科大學套用數學研究所(IMAG)自動翻譯中心(CETA)師從法國著名數學家、國際計算語言學委員會主席沃古瓦(B.Vauquois)教授專門研究數理語言學和機器翻譯問題,研製了世界上第一個漢語到多種外語的FAJRA機器翻譯系統。1981年回國,在中國科學技術情報研究所計算中心擔任機器翻譯研究組組長。1985年調入國家語言文字工作委員會語言文字套用研究所,擔任計算語言學研究室主任。1986-1988年在德國夫琅禾費研究院(FhG)新信息技術與通信系統研究所擔任客座研究員,研製了世界上第一個中文術語資料庫GLOT-C。1990-1993年在德國特里爾大學語言文學院(Fachbereich-II)擔任客座教授。1996年在德國康斯坦茨高等技術學院國際術語學和套用語言學中心(CiTaL)擔任技術顧問。1999年10月-2000年8月再次在德國特里爾大學語言文學院(Fachbereich-II)擔任客座教授。2000年8月-2001年8月在桑夏自然語言處理研究院擔任高級研究員。2001年9月到2004年8月在韓國科學技術院(KAIST)電子工程與計算機科學系(EECS)擔任訪問教授,用英語講授“自然語言處理技術”(NLP-II)的博士課程。現為國家教育部語言文字套用研究所研究員、博士生導師、學術委員會委員。
在中國,他是中國語文現代化學會副會長、中國人工智慧學會理事、中國社會科學基金語言學評審組成員、中國自然科學基金信息科學部計算機學科評審組成員、北京市自然科學基金計算機學科評審委員、國家語言文字工作委員會21世紀語言文字規範(標準)審定委員會委員、全國科學技術名詞審定委員會委員、全國術語標準化技術委員會委員,《中國語文》《語言文字套用》《科技術語研究》《語言研究》等核心期刊編委,北京大學、浙江大學、黑龍江大學、中國傳媒大學兼職教授、中國科學院自動化研究所國家模式識別重點實驗室學術委員會委員。
在國際上,他是TELRI(Trans-European Language Resources Infrastructure)(跨歐洲語言資源基礎建設工程學會)的顧問委員會委員,第一、二、三屆LREC (Language Resources and Evaluation Committee)(語言資源與評測會議)的國際顧問委員會委員,IJCL (International Journal of Corpus Linguistics)(語料庫語言學國際雜誌)的編委,IJCC(International Journal of Chinese and Computing)(中文與計算國際雜誌)的編委,英國Continuum出版公司系列叢書《語料庫與話語研究》(Research in Corpus and Discourse)的編委。

主要課程

人工智慧研究
機器翻譯研究
語音識別與合成

與數理語言學共舞

跨學科奇才
語言學家馮志偉教授是極為罕見的跨學科奇才。過去的著名語言學家有的只懂社會科學,不懂自然科學;許多人只懂古代漢語、現代漢語普通語言學,一般只著重研究漢語的語音、辭彙、語法或文字等某一個方面的問題,研究的問題和領域比較單一;他們中的一些佼佼者,至多也只懂得兩三門外語,視野不夠開闊,語言的縱橫向對比研究都不夠,有一定的局限性。而馮志偉先生卻懂得理科中的數學、物理、化學和計算機科學,又懂得語言學中的古代漢語、現代漢語、文字學、音韻學和普通語言學,深研過漢、英、法、德、俄、日等語言的語音、辭彙和語法的自動處理,並把各方面的知識緊密地結合起來綜合套用,在計算機上加以實現,成為文理兼通的語言學專家。馮志偉教授不但在國外著名大學的電子工程與計算機科學系講授理科的“機器翻譯的方法和技術研究”、“自然語言處理的算法研究”、“計算語言學專題研究”等艱深的博士課程,而且還在國內外大學的中文系講授“漢魏六朝散文”、“唐詩”、“宋詞”、“古代漢語”、“現代漢語”、“漢字的歷史與結構”等饒有風趣的課程,他還能給學生們輔導英、德、法、俄、日等外國語課程,提高學生們的外語口語表達能力和書面寫作能力。他的散文和詩歌也寫得很好,他為哀悼好友馬希文教授(著名數學家)英年早逝而寫的詩歌《長歌當哭》,淒楚感人,讀後令人潸然淚下。他還是一位翻譯專家,出版過翻譯著作。這樣的人才確實是很罕見的。
馮志偉自幼聰慧沉靜,18歲就以優異成績考入北京大學地球化學專業。他在北大圖書館偶然看到了美國語言學家喬姆斯基(N. Chomsky)的論文《語言描寫的三個模型》(Three models for the description of language),被喬姆斯基在語言研究中的新思想深深地吸引,繼而從理科轉到中文系語言學專業從事語言學的學習。在中文系讀書期間,馮志偉一面學好傳統語言學的各門課程和外語,一面利用課餘時間,繼續研究數理語言學的問題,他充分地利用北京大學圖書館豐富藏書和最新的雜誌,跟蹤著國際上數理語言學發展的足跡,他成為了班上名列前茅的學生。1964年考上北京大學語言學理論的研究生後,經導師岑麒祥教授同意,他的研究生畢業論文的題目定為《數學方法在語言學中的套用》,在我國語言學研究中,首次系統地、全面地來研究數理語言學這個新興學科。
這樣,我國的數理語言學研究便首先在北京大學正式地開展起來。北京大學中文系的著名語言學家王力先生和朱德熙先生都支持馮志偉的數理語言學研究,王力先生曾對馮志偉說:“語言學不是很簡單的學問,我們應該像趙元任先生那樣,首先做一個數學家、物理學家、文學家、音樂家,然後再做一個合格的語言學家。”朱德熙先生曾對馮志偉說:“數學和語言學的研究都需要有邏輯抽象的能力,在這一方面,數學和語言學有共同性。”北京大學的這些第一流的學者,總是站在科學的最前沿來看待學術的發展,他們的鼓勵給了馮志偉以巨大的力量。
1978年,之前畢業於北京大學中文系研究生的文科學生馮志偉,以優異的理科成績考上了中國科學技術大學研究生院信息科學系的研究生,又開始了理科的學習。1979年,入學不到一年,他就在《計算機科學》雜誌創刊號上發表了《形式語言理論》的長篇論文,用嚴格的數學表達方式向計算機科學界說明數理語言學中的形式化方法如何推動了當代計算機科學的發展,並且指出:在數理語言學研究中發展起來的形式語言理論,事實上已經成為了當代計算機科學不可缺少的一塊重要的理論基石,計算機科學絕不可忽視形式語言理論。許多人認為這篇文章一定是資深的計算機科學家寫的,後來,當計算機界的一些專家了解到,這篇論文的作者竟然是文革前北京大學中文系的一個文科研究生的時候,感到非常驚訝。
1990年~1993年,馮志偉應邀在德國特里爾大學用德語講授一系列的漢語語言學課程,並且用德語出版了語言學的專著,顯示了他的外語才能。在我國中文系出身的語言學家當中,像馮志偉這樣通曉多門外語的人還不多。他不僅是一位善於深思的語言學的理論家,而且還是一位勇於實踐的能操多種外國語的多面手。
梅花香自苦寒來
在多學科間遊走是需要深厚的知識積澱的,知識積澱則來自於勤奮。馮志偉在上世紀六十年代初期就已經學會了4門外語,而且能夠使用這4種外語閱讀數理語言學的外文文獻。他取得這樣的學習成績,不僅是天賦,更多的是因為勤力。為了學習英語,他就買一本中型的英漢詞典來,一頁一頁地記憶和背誦,背完一頁就撕去一頁。幾年來,馮志偉先後撕完了英漢、俄漢、法漢、德漢、日漢等多部詞典,他就用這樣的笨方法,學會了多門外語。
又比如,“文革”期間,馮志偉在朋友們的幫助下,用了將近10年的時間,對數百萬字的現代漢語文本(占70%)和古代漢語文本(占30%)進行手工查頻,從小到大地逐步擴大統計的規模,建立了6個不同容量的漢字頻度表,最後根據這些不同的漢字頻度表,逐步地擴大漢字的容量,終於計算出了漢字的熵。在當時的政治環境和技術環境下,能實現如此繁重的工作,難度可想而知。
馮志偉不僅自己的學習時候勤奮有加,對待教學也是一絲不苟。在特里爾大學文學院任教期間,馮志偉用德語給德國學生講授《漢魏六朝散文選》、《唐詩宋詞選》、《中國現代散文選》、《漢字的發展與結構》、《漢語拼音正詞法》、《漢語辭彙史》、《機器翻譯的理論和方法》等課程。為了講好課,他苦練德語口語,認真用德語備課,在上每一節課之前,他都要先用德語把講課的內容自己對自己敘述一遍或多遍,直到能夠熟練地背誦為止,他把“備課”當作了“背課”。由於馮志偉的備課特別認真,課堂教學效果很好,他的講課受到德國學生們的一致好評。
馮志偉在韓國科學技術院任教期間,利用全部的業餘時間來翻譯《語音和語言處理 – 自然語言處理,計算語言學和語音識別導論》(原文為英語)一書,晚上加班到深夜,連續工作了11個月,當翻譯完14章(全書的三分之二)的時候,他不幸患了黃斑前膜的眼病,視力出現障礙,難於繼續翻譯工作。剩下的7章由中國科學院軟體研究所的一位年輕的副研究員協助他完成。這位副研究員把剩下的7章逐一翻譯成中文,通過計算機網路一章一章地傳給在韓國的馮志偉,馮志偉使用語音合成裝置,讓計算機把書面的文本讀出來,通過讀出來的語音進行譯文的校正。2004年,全書的翻譯大功告成,由電子工業出版社以《自然語言處理綜論》的書名出版。這本書的出版受到廣大讀者的歡迎,而馮志偉為此卻損害了自己的視力,他不得不藉助於語音合成裝置來閱讀了。
碩果纍纍著作豐
天賦和勤勉成就了跨學科奇才,馮志偉在數理語言學領域不斷前行,解決一個又一個難度很高的問題,碩果纍纍。
在法國留學期間,經過在計算機上編寫程式進行潛心的鑽研和反覆的試驗,馮志偉提出了“多叉多標記樹模型”(Multiple-labeled and Multiple-branched Tree Model,簡稱MMT模型)。這個模型提出後,立即引起了國際計算語言學界的高度重視。馮志偉根據他提出的MMT模型,於1981年完成了漢-法/英/日/俄/德多語言機器翻譯試驗,建立了FAJRA系統(FAJRA是“法語-英語-日語-俄語-德語”的法文首字母縮寫),在IBM-4341大型計算機上,把二十多篇漢語的文章自動地翻譯成英文、法文、日文俄文、德文,當時在實驗室工作的外國朋友親自目睹他們視為天書的一篇篇漢語文章被計算機翻譯成他們懂得的五種外國語之後,無不拍手叫絕。這是世界上第一個漢語到多種外語的機器翻譯系統,開創了多語言機器翻譯系統之先河。
從法國回國之後,馮志偉在中國科技信息研究所計算中心擔任機器翻譯研究組的組長,在王力先生的鼓勵之下,他利用當時北京遙感技術研究所的IBM-4361計算機,於1985年進行了德-漢機器翻譯試驗和法-漢機器翻譯試驗,建立了GCAT德-漢機器翻譯系統和FCAT法-漢機器翻譯系統,進一步檢驗了MMT模型分析漢語和生成漢語的能力,試驗結果良好。
在北京大學“語言學中的數學問題”選修課講稿的基礎之上,馮志偉寫出了我國第一部數理語言學的專著,書名就叫做《數理語言學》,於1985年8月由上海知識出版社出版。接著,他又出版了《自動翻譯》的專著,深入地探討自然語言機器翻譯的理論和實踐問題。這兩本專著的出版,受到了我國計算語言學界的歡迎。當時不少出國學習計算語言學的留學生,出國時都帶著這兩本書,作為入門的嚮導,在本書的引導下,他們很快就接觸到了國外計算語言學研究中的前沿問題。
馮志偉上世紀80年代在德國夫琅禾費研究院新信息技術與通訊系統研究所(FhG)擔任客座研究員期間,克服了重重困難,使用UNIX作業系統和INGRES軟體,建立了數據處理領域的中文術語資料庫GLOT-C,並且把這個資料庫與FhG的其他語言的術語資料庫相連線,可以快速地進行多語言術語的查詢和檢索,並且能夠處理漢字(當時計算機上還沒有成熟的中文作業系統)。這是世界上第一個使用漢字的中文術語資料庫,具有開創作用。
2006年,聯合國教科文組織奧地利委員會(Austrian Commission for UNESCO)、維也納市(City of Vienna)和國際術語信息中心(INFOTERM)給馮志偉教授頒發了維斯特獎(Wüster Special Prize),以表彰他在術語學理論和術語學方法研究方面做出的突出貢獻。維斯特(Eugen Wüster,1898-1977)是奧地利著名科學家,是術語學和術語標準化工作的奠基人。維斯特獎是專門為那些對於術語學和術語標準化工作有出色成就的科學家而設定的。
今年七十一歲的馮志偉著述頗豐,其內容涉及不少領域,引起國內外不少同行專家的廣泛關注和高度評價。他現在已在多家著名出版社出版了二十餘部專著,翻譯國外重要論著數十篇(部),並用漢、英、法、德文等撰寫了有代表性的重要學術論文百餘篇,在國內外許多著名刊物上發表。最主要的代表作如:專著《數理語言學》、《自動翻譯》、《現代語言學流派》、《現代漢字和計算機》、《中文信息處理與漢語研究》、《數學與語言》(新版更名為《語言與數學》)、《自然語言機器翻譯新論》、《套用語言學綜論》、《套用語言學新論》、《計算語言學基礎》、《計算語言學探索》、《機器翻譯研究》、《現代術語學引論》、《自然語言的計算機處理》、《漢語教學與漢語拼音正詞法》、《自然語言處理的形式模型》、《漢字的歷史與現狀》(德文版),譯著《自然語言處理綜論》,等等。他還主持和參與了若干個國家標準的制定,為我國標準化做出了貢獻。他又是《中國大百科全書》語言文字卷編輯組成員、《數學辭海》總編委會委員、《計算機百科全書》和《中國少年百科全書》等大型工具書的撰稿人,為這些權威性工具書寫了不少重要條目。他還為一些當代語言學名著的外文版寫導讀,如《套用語言學中的語料庫》、《語言學中的數學方法》、《譯者的電子工具》、《人工智慧在第二語言教學中的套用》、《牛津計算語言學手冊》、《自然語言生成系統的建造》等,幫助國內讀者閱讀外文原著。
馮志偉對於他的這些成就卻看得很平淡,他很少對別人談起他的成就。除了平時喜歡喝白開水和游泳之外,他幾乎沒有什麼特殊的嗜好,他每日粗茶淡飯,過著非常清貧的生活。他從來不以為自己是什麼“專家”,沒有任何的架子,總是謙和地對待他的學生和周圍的同志。在北京大學中文系59級同學紀念冊上,他寫下了這樣的人生感言:“先天不足,後天失調;歲月蹉跎,艱辛備嘗;老當益壯,窮且越堅;平生無悔,褒貶由之。”他始終認為自己是一個很平常的普通人,對於別人的褒貶,他是看得很平淡的。他對於生活的信條是:“在科學探索的過程中,我所知道的東西終究是有限的,而我不知道的東西始終是無限的,只要平生無悔就很好了!

學術背景與經歷

他先後在北京大學和中國科學技術大學研究生院兩次研究生畢業,獲雙碩士學位。
在北京大學學習期間,他師從岑麒祥教授學習理論語言學,岑麒祥早年留學法國,是著名語言學家、法蘭西科學院院士梅耶(A. Meillet)的學生,而梅耶是現代語言學奠基人索緒爾(De Saussure)的學生,因此,馮志偉是索緒爾的第四代傳人。
1978年到法國格勒諾布爾理科醫科大學套用數學研究所(IMAG)自動翻譯中心(CETA)師從法國著名數學家、國際計算語言學委員會主席沃古瓦(B.Vauquois)教授專門研究數理語言學和機器翻譯問題,研製了世界上第一個漢語到多種外語的FAJRA機器翻譯系統。
1981年回國,在中國科學技術信息研究所計算中心擔任機器翻譯研究組組長。
1985年調入國家語言文字工作委員會語言文字套用研究所,擔任計算語言學研究室主任。
1986-1988年在德國夫琅禾費研究院(FhG)新信息技術與通信系統研究所擔任客座研究員,研製了世界上第一個中文術語資料庫GLOT-C。
1990-1993年在德國特里爾大學語言文學院(Fachbereich-II)擔任客座教授。
1996年在德國康斯坦茨高等技術學院國際術語學和套用語言學中心(CiTaL)擔任技術顧問。
1999年10月-2000年8月再次在德國特里爾大學語言文學院(Fachbereich-II)擔任客座教授。
2000年8月-2001年8月在桑夏自然語言處理研究院擔任高級研究員。
2001年9月到2004年8月在韓國科學技術院(KAIST)電子工程與計算機科學系(EECS)擔任訪問教授,用英語講授“自然語言處理技術”(NLP-II)的博士課程。
曾任國家教育部語言文字套用研究所研究員、博士生導師、學術委員會委員。
2012年6月起任杭州師範大學特聘教授。

相關詞條

熱門詞條

聯絡我們