語義web

語義網,是計算機業和網際網路業對網路下一階段發展所作出的術語化定義,其基本含義即基於網路建立任何微小數據的連線,這種連線不僅僅局限於網頁。這樣一來,任何微小的數據都可以與其他信息進行“溝通”。

語義網,它的核心是:通過給全球資訊網上的文檔 (如:標準通用標記語言下的一個套用HTML)添加能夠被計算機所理解的語義“元數據”(外語:Meta data),從而使整個網際網路成為一個通用的信息交換媒介。

基本介紹

  • 中文名語義網
  • 外文名:semantic web
  • 其它稱呼:語義web、語義環球網
含義,用途,技術挑戰,體系結構,套用,所用技術,

含義

現有的網際網路網路是網頁的集合,而谷歌及其他搜尋引擎正是通過網頁互相之間的連結來幫助用戶上網進行搜尋。與此不同的是,“語義Web”將在更加微小的信息之間建立直接的連線,例如一條街道的地址與一份地圖等等。

用途

全球資訊網之父蒂姆·貝納斯-李(Tim Berners-Lee)稱,使用“語義網”的用戶將可套用遠遠強於現有網路中任何東西的功能。他表示,在“語義網”中,用戶可將兩個毫不相干的東西連線在一起,比如說銀行報帳單和日曆。用戶可以將銀行報帳單拖到日曆上,也可以將日曆拖到銀行報帳單上,這樣就可以知道何時應當進行支付。他指出,“語義網”將呈現給人們的是一個所有數據“無縫”式連線的網路。在“語義網”技術破土而出之後,目前人們對FacebookMySpace等社交網站的“痴迷”終將被“無所不連”的網路所取代。

技術挑戰

專家表示,“語義Web”現在所面臨的最大挑戰是找到一種方法來表示所有的數據。這樣一來,在連線到網路的時候,某一數據即可識別並建立與其他相關信息的連結,這與所謂的“標註”(tagging)略有相似之處。
2008.3.16 14:00
語義Web體系結構:
語義Web的實現依賴於三大關鍵技術:可擴展標記語言外語縮寫:XML)、資源描述框架外語縮寫:RDF)和本體外語Ontology)。

體系結構

下圖描述了語義Web的七層體系結構:
自描述
文檔
數據
數據
規則
信任
證明



邏輯
本體
RDF+RDF Schema
XML+NS+XML Schema 名稱空間
Unicode
URI
第一層:UnicodeURI
Unicode是一個字元集,這個字元集中所有字元都用兩個位元組表示,可以表示65536個字元,基本上包括了世界上所有語言的字元。數據格式採用Unicode的好處就是它支持世界上所有主要語言的混合,並且可以同時進行檢索。URI(Uniform ResourceIdentifier),即統一資源標識符,用於唯一標識網路上的一個概念或資源。在語義Web體系結構中,該層是整個語義Web的基礎,其中Unicode負責處理資源的編碼,URI負責資源的標識
第二層:XML+NS+xmlschema。
XML是一個精簡的標準通用標記語言,它綜合了標準通用標記語言的豐富功能與HTML的易用性,它允許用戶在文檔中加入任意的結構,而無需說明這些結構的含意。NS(NameSpace)即命名空間,由URI索引確定,目的是為了避免不同的套用使用同樣的字元描述不同的事物。XML Schema是文檔類型定義(外語縮寫:DTD)的替代品,它本身採用XML語法,但比DTD更加靈活,提供更多的數據類型,能更好地為有效的XML文檔服務並提供數據校驗機制。正是由於XML靈活的結構性、由URI索引的NS而帶來的數據可確定性以及XMLSchema所提供的多種數據類型及檢驗機制,使其成為語義Web體系結構的重要組成部分。該層負責從語法上表示數據的內容和結構,通過使用標準的語言將網路信息的表現形式、數據結構和內容分離。
第三層:RDF+rdfschema。
資源描述框架外語縮寫:RDF)是一種描述WWW上的信息資源的一種語言,其目標是建立一種供多種元數據標準共存的框架。該框架能充分利用各種元數據的優勢,進行基於Web的數據交換和再利用。RDF解決的是如何採用XML標準語法無二義性地描述資源對象的問題,使得所描述的資源的元數據信息成為機器可理解的信息。如果把XML看作為一種標準化的元數據語法規範的話,那么RDF就可以看作為一種標準化的元數據語義描述規範。Rdfschema使用一種機器可以理解的體系來定義描述資源的辭彙,其目的是提供辭彙嵌入的機制或框架,在該框架下多種辭彙可以集成在一起實現對Web資源的描述。
第四層:本體辭彙(Ontology vocabulary)。
該層是在RDF(S)基礎上定義的概念及其關係的抽象描述,用於描述套用領域的知識,描述各類資源及資源之間的關係,實現對辭彙表的擴展。在這一層,用戶不僅可以定義概念而且可以定義概念之間豐富的關係。
第五至七層:Logic、Proof、Trust。
Logic負責提供公理和推理規則,而Logic一旦建立,便可以通過邏輯推理對資源、資源之間的關係以及推理結果進行驗證,證明其有效性。通過Proof交換以及數字簽名,建立一定的信任關係,從而證明語義Web輸出的可靠性以及其是否符合用戶的要求。

套用

語義Web提供各種依靠語義的自動化服務,如天氣預報服務、航班信息服務、線上航班預定服務、資料庫查詢服務、目錄查詢服務、數字圖書館查詢服務、搜尋和分類服務、B2C交易服務、B2B交易服務等。
網際網路信息發布與搜尋:通過對內容的標註與分析從而克服了關鍵字查詢的歧義性,提高了查詢的精度。Stanford大學語義web研究組研製的查詢語言DBQ是一個比較有影響的系統,它是基於DAML的。另一個基於DAML的語義web信息檢索系統是美國Maryland設計的HOWLIR系統,它採用DAML-JESSDB-一個基於DAML的推理系統-作為推理引擎。此外,基於語義web的文檔檢索與知識管理也是當前研究的一個熱點。
Web問題解答:在用ontology對信息源進行標註的基礎上,進一步運用知識庫來解答用戶的提問。Stanford大學研製的Triple系統是一個基於邏輯程式設計的RDF查詢系統,邏輯子句的問題求解能力使它能夠解答較為複雜的問題。德國Karlsruhe大學等單位研製的SEAL是一個語義Web入口網站,它具有回答用F-邏輯表示的查詢的能力[]。F-邏輯使得ontology中的概念與問題求解規則融合於一體。

所用技術

目前的各種全球資訊網技術都有可能被套用於語義網(在語義環球網的意義上),例如:
DOM 文檔對象模型, 一組訪問XML和HTML 文檔組成部分的標準接口.
XPath、XLink、XPointer
XInclude XML fragment XML查詢語言 XHTML
XSL,XSLT Extensible Stylesheet Language
可縮放矢量圖形(外語縮寫:SVG
同步多媒體集成語言(外語縮寫:SMIL
SOAP
文檔類型定義(外語縮寫:DTD
元數據概念.

相關詞條

熱門詞條

聯絡我們