關聯數據:全球資訊網上的結構化數據

關聯數據:全球資訊網上的結構化數據

《關聯數據:全球資訊網上的結構化數據》介紹了在全球資訊網上使用關聯數據的實用技巧,並通過複雜性逐步增加的示例,循序漸進地探討HTTP URI、RDFSPARQL查詢語言等基本概念。

本書是“十三五”國家重點圖書出版規劃項目。

基本介紹

  • 書名:關聯數據:全球資訊網上的結構化數據
  • 作者:【美】David Wood, Marsha Zaidman, Luke Ruth, Michael Hausenblas
  • 原版名稱:Linked Data: Structured Data on the Web
  • 譯者:蔣楠
  • ISBN:9787115472649
  • 類別:資料庫
  • 頁數:272
  • 定價:69.00元
  • 出版社:人民郵電出版社
  • 出版時間:2018-01
  • 開本:16
關於本書,作者簡介,目錄,第1部分 關聯數據網,第1章 關聯數據簡介,第2章 RDF:關聯數據所用的數據模型,第3章 使用關聯數據,第2部分 關聯數據進階,第4章 利用FOAF創建關聯數據,第5章 SPARQL:查詢關聯數據網,第3部分 關聯數據實戰,第6章 強化搜尋引擎的結果,第7章 RDF資料庫基礎,第8章 數據集,第4部分 歸納與整合,第9章 Callimachus:關聯數據管理系統,第10章 回顧發布關聯數據,第11章 不斷發展的全球資訊網,附錄A 開發環境,附錄B SPARQL結果格式,辭彙表,

關於本書

關聯數據(Linked Data)是在全球資訊網上表示和連結結構化數據的一系列技術,旨在構建一張計算機能夠理解的語義數據網路,以便在此之上構建更智慧型的套用。
《關聯數據:全球資訊網上的結構化數據》分為4個部分。
  • 第1部分:主要介紹了關聯數據的基礎知識、RDF數據模型,以及表示關聯數據的通用標準序列化格式,旨在引導讀者識別並使用全球資訊網上的關聯數據。
  • 第2部分:重點討論了開發和發布關聯數據所用的技術,以及聚合數據所用的高級搜尋技術。
  • 第3部分:討論了如何使用RDFa對網頁進行SEO、RDF資料庫與傳統的關係資料庫的區別、在全球資訊網上共享用戶數據集和項目的最佳方式,以及對語義網搜尋結果中包含的項目和數據集進行最佳化。
  • 第4部分:將之前的內容進行了匯總,使用一個開源的關聯數據套用伺服器開發一個複雜的應用程式,並總結了從準備到發布關聯數據的全過程。
本書利用JavaScriptPython等常用工具,介紹了在全球資訊網上使用關聯數據的實用技巧,適合具備HTMLURIHTTP等基本的Web技術基礎,並且希望了解、使用和發布關聯數據的開發人員閱讀。
本書英文版(Linked Data: Structured Data on the Web)由Manning Publications於2014年1月出版,中文版由人民郵電出版社於2018年1月出版。
本書是“十三五”國家重點圖書出版規劃項目。

作者簡介

David Wood擔任全球資訊網聯盟RDF工作組共同主席,Marsha Zaidman擔任美國瑪麗華盛頓大學計算機科學系主任,Luke Ruth在Callimachus項目中負責關聯數據的開發,Michael Hausenblas領導愛爾蘭關聯數據研究中心的工作。

目錄

第1部分 關聯數據網

第1章 關聯數據簡介

1.1 關聯數據定義
1.2 關聯數據
1.3 關聯數據實戰
1.3.1 釋放數據
1.3.2 關聯數據在Google富摘要和Facebook“點讚”中的套用
1.3.3 關聯數據拯救了BBC
1.4 關聯數據原則
1.4.1 原則:使用URI命名事物
1.4.2 原則:使用HTTP URI以便於用戶查找事物名稱
1.4.3 第3原則:在用戶查找URI時提供有用的信息
1.4.4 第4原則:包含指向其他URI的連結
1.5 關聯開放數據(LOD)項目
1.6 數據描述
1.7 RDF:關聯數據所用的數據模型
1.8 關聯數據應用程式剖析
1.8.1 獲取設施的關聯數據
1.8.2 通過關聯數據創建UI
1.9 小結

第2章 RDF:關聯數據所用的數據模型

2.1 關聯數據原則讓RDF得以擴展
2.2 RDF數據模型
2.2.1 三元組
2.2.2 空節點
2.2.3 類
2.2.4 類型字面量
2.3 RDF詞表
2.3.1 通用詞表
2.3.2 自定義詞表
2.4 關聯數據所用的RDF格式
2.4.1 Turtle:人類可讀的RDF
2.4.2 RDF/XML:企業所用的RDF
2.4.3 RDFa:嵌入HTML網頁的RDF
2.4.4 JSON-LD:JavaScript開發所用的RDF
2.5 與Web伺服器和關聯數據發布有關的問題
2.6 檔案類型與Web伺服器
2.7 對Apache伺服器的控制有限時如何處理
2.8 關聯數據平台
2.9 小結

第3章 使用關聯數據

3.1 像全球資訊網一樣思考
3.2 如何使用關聯數據
3.3 查找分散式關聯數據的工具
3.3.1 Sindice
3.3.2 SameAs.org
3.3.3 Data Hub
3.4 聚合關聯數據
3.4.1 聚合已知數據集中的關聯數據
3.4.2 使用瀏覽器外掛程式獲取網頁中的關聯數據和RDF
3.5 關聯數據網的抓取與數據的聚合
3.5.1 使用Python抓取關聯數據網
3.5.2 利用聚合後的RDF輸出HTML
3.6 小結

第2部分 關聯數據進階

第4章 利用FOAF創建關聯數據

4.1 創建個人FOAF配置檔案
4.1.1 FOAF詞表簡介
4.1.2 方法I:手動創建基本的FOAF配置檔案
4.1.3 改進基本的FOAF配置檔案
4.1.4 方法II:自動生成FOAF配置檔案
4.2 為FOAF配置檔案添加更多內容
4.3 發布FOAF配置檔案
4.4 FOAF配置檔案的可視化
4.5 應用程式:採用自定義詞表連結RDF文檔
4.5.1 創建願望清單詞表
4.5.2 創建、發布並連結願望清單文檔
4.5.3 為願望清單文檔添加內容
4.5.4 小書籤程式初探
4.6 小結

第5章 SPARQL:查詢關聯數據網

5.1 典型SPARQL查詢概述
5.2 採用SPARQL查詢扁平RDF檔案
5.2.1 查詢單個RDF檔案
5.2.2 查詢多個RDF檔案
5.2.3 查詢全球資訊網上的RDF檔案
5.3 查詢SPARQL端點
5.4 SPARQL查詢類型
5.4.1 SELECT查詢
5.4.2 ASK查詢
5.4.3 DESCRIBE查詢
5.4.4 CONSTRUCT查詢
5.4.5 SPARQL 1.1 Update
5.5 SPARQL結果格式(XMLJSON
5.6 利用SPARQL查詢創建網頁
5.6.1 創建SPARQL查詢
5.6.2 創建HTML頁面
5.6.3 創建JavaScript表格
5.6.4 創建JavaScript地圖
5.7 小結

第3部分 關聯數據實戰

第6章 強化搜尋引擎的結果

6.1 通過嵌入RDFa以強化HTML
6.1.1 利用FOAF詞表添加RDFa標記
6.1.2 在HTML span屬性中使用RDFa
6.1.3 從包含FOAF的HTML文檔中提取關聯數據
6.2 採用GoodRelations詞表嵌入RDFa
6.2.1 GoodRelations概述
6.2.2 利用GoodRelations強化嵌入RDFa的HTML
6.2.3 對選擇RDFa GoodRelations的進一步觀察
6.2.4 從包含GoodRelations的HTML文檔中提取關聯數據
6.3 採用Schema.org詞表嵌入RDFa
6.3.1 Schema.org概述
6.3.2 通過Schema.org強化使用RDFa Lite的HTML
6.3.3 對利用Schema.org選擇RDFa Lite的進一步觀察
6.3.4 從包含Schema.org的HTML文檔中提取關聯數據
6.4 選擇Schema.org還是GoodRelations
6.5 從HTML中提取RDFa並執行SPARQL查詢
6.6 小結

第7章 RDF資料庫基礎

7.1 RDF資料庫分類
7.1.1 RDF資料庫的選擇
7.1.2 RDF資料庫與關係資料庫的比較
7.1.3 RDF資料庫的優點
7.2 將電子表格數據轉換為RDF
7.2.1 將MS Excel轉換為RDF的簡單示例
7.2.2 將MS Excel轉換為關聯數據
7.2.3 選擇RDF轉換工具
7.3 應用程式:在RDF資料庫中收集關聯數據
7.3.1 過程概述
7.3.2 利用Python聚合數據源
7.3.3 理解輸出
7.4 小結

第8章 數據集

8.1 DOAP詞表
8.1.1 創建DOAP檔案
8.1.2 使用DOAP詞表
8.2 利用VoID記錄數據集
8.2.1 VoID概述
8.2.2 準備VoID檔案
8.3.1 非語義站點地圖
8.3.2 語義站點地圖
8.3.3 啟用站點發現
8.4 連結到其他用戶的數據
8.5 示例:利用owl:sameAs實現數據集之間的互聯
8.6 加入Data Hub
8.7 從DBpedia請求指向用戶數據集的出站連結
8.8 小結

第4部分 歸納與整合

第9章 Callimachus:關聯數據管理系統

9.1 Callimachus入門
9.2 使用RDF類創建網頁
9.2.1 為Callimachus添加數據
9.2.2 向Callimachus通告OWL類
9.2.3 將Callimachus視圖模板與用戶的類相互關聯
9.3 創建並編輯類實例
9.3.1 新建筆記
9.3.2 為筆記創建視圖模板
9.3.3 為筆記創建編輯模板
9.4 應用程式:利用多個數據源創建網頁
9.4.1 利用NOAAEPA創建並查詢關聯數據
9.4.2 創建包含應用程式的網頁
9.4.3 創建用於檢索和顯示關聯數據的JavaScript
9.4.4 將代碼段整合在一起
9.5 小結

第10章 回顧發布關聯數據

10.1 準備數據
10.2 構建URI
10.3 選擇詞表
10.4 自定義詞表
10.5 用戶數據與其他數據集的互聯
10.6 發布數據
10.7 小結

第11章 不斷發展的全球資訊網

11.1 關聯數據和語義網之間的關係
11.2 未來展望
11.2.1 Google擴展富摘要
11.2.2 數字問責和透明度立法
11.2.3 廣告的影響
11.2.4 強化的搜尋
11.2.5 巨頭的參與
11.3 小結

附錄A 開發環境

附錄B SPARQL結果格式

辭彙表

相關詞條

熱門詞條

聯絡我們