基於關聯數據的信息聚合模型與實現研究

項目摘要

關聯數據可以被視為語義網的一種實現方式，它使得來自於不同來源的數據相互關聯，從而促進了全球資訊網的發展。目前已有的信息聚合技術主要面向傳統的全球資訊網，而基於關聯數據的信息聚合技術主要面向語義網，關注的焦點在信息本身而不是承載信息的頁面或是信息的訪問接口API，聚合的對象直接深入到細粒度級的具有語義信息的實體。本項研究擬在對不同的數據集進行本體映射和數據連結的基礎上，構建基於關聯數據的信息聚合模型，並設計開發實驗系統，在LOD數據集中進行測試和評估，實現對動態、分布和異構的數據源進行細粒度的語義信息聚合，為用戶提供多角度、全方位、可視化的訪問和了解信息的途徑，在此過程中，語義相似度的計算及動態關聯分析技術是待解決的關鍵問題。本項研究將遵循理論-模型-實證的技術路線，採用文獻查閱、專家諮詢、模型構建、系統設計、程式開發、實驗結果分析等方法，從理論與實踐相結合開展研究。

結題摘要

關聯數據可以被視為語義網的一種實現方式，它使得來自於不同來源的數據相互關聯，從而促進了全球資訊網的發展。目前已有的信息聚合技術主要面向傳統的全球資訊網，而基於關聯數據的信息聚合技術主要面向語義網，關注的焦點在信息本身而不是承載信息的頁面或是信息的訪問接口API，聚合的對象直接深入到細粒度級的具有語義信息的實體。本項研究擬在對不同的數據集進行本體映射和數據連結的基礎上，構建基於關聯數據的信息聚合模型，並設計開發實驗系統，在LOD數據集中進行測試和評估，實現對動態、分布和異構的數據源進行細粒度的語義信息聚合，為用戶提供多角度、全方位、可視化的訪問和了解信息的途徑。本項研究主要包括信息聚合模型設計、本體映射、數據連結、信息聚合系統設計與開發、基於關聯數據的信息聚合套用等內容。首先，項目組設計開發了面向關聯數據的信息聚合模型，分為資源層、聚合層與套用層，其中資源層包括本地資源與外部資源，聚合層是本項研究的重點，包括本體映射、數據連結、信息集成等關鍵技術，套用層則包括圖書館、政府等各套用領域。在本體映射研究中，項目組提出了適用於關聯數據網路中的基於WordNet的本體映射方法，建立了本體映射總體研究架構，並將待映射概念對按照通用本體元素與自有本體元素進行分類，從而建立映射模型，並在此基礎上設計開發了半自動映射系統OntologyMatching。在數據連結研究中，本項目組提出了一種人工輔助條件下基於規則的共指實體識別方法，即在用戶的參與下建立共指實體判別規則並以檔案的形式保存起來，然後自動調用這些規則對不同數據集內的共指實體進行識別。項目組還將基於關聯數據的信息聚合模型與技術套用於圖書館書目資源整合與政府數據發布與利用當中，取得了較好的效果。

基於關聯數據的信息聚合模型與實現研究

基本介紹

項目摘要

結題摘要

相關詞條

熱門詞條