Web知識挖掘

內容簡介

《Web知識挖掘:理論、方法與套用》是一部關於Web知識挖掘的比較系統、完整，且理論和實踐相結合的著作，共含7章：第1章與第2章是Web知識挖掘概論，其中，第1章總體上對Web知識挖掘的現狀、概念、典型方法、套用領域以及面臨的挑戰進行綜述性說明；第2章介紹了Web知識挖掘的預備知識、分類體系、基本流程等內容。第3～6章是Web知識挖掘的理論與方法，分別論述了Web爬取、Web結構挖掘、內容挖掘、日誌挖掘相關理論與方法，並系統總結了我們自己在元數據、概念、知識元等多個層次上的知識獲取以及個性化知識服務等方面的工作。第7章是Web知識挖掘的實踐與套用實例，以實例對Web結構挖掘、日誌挖掘及內容挖掘的套用進行了說明。

《Web知識挖掘:理論、方法與套用》不僅系統地介紹了Web知識挖掘領域的基礎理論與方法，也闡述了我們在該領域的創新性工作，因而適合不同類型與層次的研究人員及學生。

《Web知識挖掘:理論、方法與套用》可作為信息領域的科研與工程技術人員的參考書，也可作為計算機與相關專業的研究生和高年級本科生的教材或輔導書目。

圖書目錄

前言

第1章 Web挖掘概述

1.1 Web發展歷史與現狀

1.1.1 Web技術發展

1.1.2 Web上的信息爆炸

1.2 Web挖掘的概念

1.2.1 典型的Web挖掘定義

1.2.2 Web挖掘與數據挖掘、信息檢索、信息抽取的區別

1.3 Web挖掘面臨的挑戰

1.3.1 Web數據的高度複雜性

1.3.2 Web數據檢索的局限性

1.4 Web挖掘的研究方向

1.5 小結

第2章 Web挖掘的基礎知識

2.1 Web挖掘的主要預備知識

2.1.1 數據挖掘

2.1.2 文本挖掘

2.1.3 信息檢索

2.2 Web挖掘分類

2.2.1 Web數據的分類體系

2.2.2 Web挖掘分類

2.3 Web挖掘的主要套用

2.4 Web挖掘的基本流程

2.4.1 數據採集

2.4.2 數據預處理

2.4.3 模式挖掘

2.4.4 模式評估

2.5 Web挖掘領域的重要文獻、國際期刊與會議、標準規範

2.5.1 Web挖掘領域的重要文獻

2.5.2 Web挖掘相關的國際期刊與國際會議

2.5.3 Web挖掘相關的標準、規範及語言

2.6 小結

第3章 Web爬取與頁面組織管理

3.1 Web爬取概述

3.1.1 Web爬取的分類

3.1.2 Web爬取的基本原理

3.1.3 Web爬取面臨的挑戰

3.2 Web爬取中的主要技術問題

3.2.1 爬取次序

3.2.2爬取性能問題

3.2.3 爬取禮貌性問題

3.3隱含Web爬取

3.3.1 隱含Web爬蟲框架及工作機理

Web知識挖掘

基本介紹

內容簡介

圖書目錄

相關詞條

熱門詞條