BabelNet

BabelNet的數據統計

截至2016年8月，BabelNet（v3.7）已覆蓋了271種語言，包栝全部的歐洲語言、大多數亞洲語言及拉丁語。BabelNet 3.7包含了大約1400萬個同義詞集和7.46億個詞義（不論其語言）。在每種語言中，每個Babel synset（詞義）平均包含2個同義詞。BabelNet的語義網路包含了豐富的辭彙語義關係。這些語義關係有兩個來源：一是，來自於WordNet的語義關係，如上下位關係、部分整體關係、反義、同義關係等，總共大約36.4萬條關係；二是，來自於維基百科的非特定的相關關係，總共大約3.8億條關係。BabelNet 3.7將大約1100萬張圖片與Babel synset建立了關聯，並為這些資源提供了LemonRDF編碼，可通過SPARQLendpoint獲取。BabelNet 3.7為267萬個同義詞集指定了領域標籤。

套用

BabelNet可廣泛套用在多語自然語言處理中。BabelNet中的辭彙化知識可在以下任務中取得最佳效果：

語義相關性；
多語詞義消歧；
基於Babelfy系統的多語詞義消岐及實體連結；
有目的的視頻遊戲。

獎勵榮譽

BabelNet是一個多語辭彙語義網路和本體，因其在克服語言障礙和利用異構數據源方面做了巨大的開創性工作，BabelNet於2015年被授予META獎。

BabelNet是最新的辭彙知識資源庫，具有巨大創新性，《時代周刊》曾專題報導BabelNet的研究工作，認為BabelNet將在21世紀發揮引領作用。

自然語言處理

自然語言處理（英語：natural language processing，縮寫作NLP）是人工智慧和語言學領域的分支學科。此領域探討如何處理及運用自然語言；自然語言認知則是指讓電腦“懂”人類的語言。

自然語言生成系統把計算機數據轉化為自然語言。自然語言理解系統把自然語言轉化為電腦程式更易於處理的形式。

自然語言處理的主要範疇

文本朗讀（Text to speech）/語音合成（Speech synthesis）
語音識別（Speech recognition）
中文自動分詞（Chinese word segmentation）
詞性標註（Part-of-speech tagging）
句法分析（Parsing）
自然語言生成（Natural language generation）
文本分類（Text categorization）
信息檢索（Information retrieval）
信息抽取（Information extraction）
文字校對（Text-proofing）
問答系統（Question answering）：

BabelNet

基本介紹

BabelNet的數據統計

套用

獎勵榮譽

自然語言處理

自然語言處理的主要範疇

自然語言處理研究的難點

參見

相關詞條

熱門詞條