數據倉庫與數據挖掘原理及套用

數據倉庫與數據挖掘原理及套用

《數據倉庫與數據挖掘原理及套用》是2011年清華大學出版社出版的圖書,作者是鄭岩。

基本介紹

  • 書名:數據倉庫與數據挖掘原理及套用
  • 作者:鄭岩
  • ISBN:9787302228196, 7302228191
  • 頁數:300頁
  • 出版社:清華大學出版社
  • 出版時間:2011年1月1日
  • 裝幀:平裝
  • 開本:16開
內容簡介,圖書目錄,序言,

內容簡介

《數據倉庫與數據挖掘原理及套用》從專業角度全面介紹了數據倉庫和數據挖掘的理論、方法、技術及其套用,系統地闡述了數據倉庫和數據挖掘的產生、發展和套用及其主要概念、原理和算法,並結合當前數據倉庫和數據挖掘中一些新的套用實例進一步加以說明,力求學以致用。
全書分為三篇。第一篇介紹數據倉庫的起源和演變過程,闡述數據倉庫的定義、體系結構、組成、元數據、數據粒度和數據模型以及ETL過程,論述數據倉庫設計和實現的方法。結合具體套用詳細闡述了如何構建數據倉庫及其主要套用,包括OLAP和OLAM等。第二篇介紹數據挖掘的起源和發展趨勢,以及數據挖掘與web挖掘的技術和方法,包括聚類、分類、預測和關聯分析等,詳細分析了數據挖掘在電信領域的具體套用,如客戶細分、重入網識別和WAP日誌挖掘等。第三篇討論數據、信息和知識的關係,論述知識表示的主要方法和知識管理的核心技術,介紹當前研究熱點——語義網和本體的核心技術和方法,分析了語義網和本體的主要套用。
《數據倉庫與數據挖掘原理及套用》可作為計算機專業研究生或高年級本科生教材,也可以作為計算機研究和開發人員以及相關專業人士的參考資料。

圖書目錄

第1章 數據倉庫基礎
1.1 引言
1.1.1 演變過程
1.1.2 定義
1.2 體系結構
1.2.1 兩層的體系結構
1.2.2 三層的體系結構
1.3 組成
1.4 元數據
1.4.1 定義和分類
1.4.2 標準化
1.4.3 CWM
1.4.4 UMI、MOF和XML與CWM的關係
1.5 數據粒度
1.6 數據模型
1.7 ETI
1.7.1 主要流程
1.7.2 數據抽取
1.7.3 數據轉換
1.7.4 數據載入
第2章 數據倉庫設計和實現
2.1 數據倉庫設計
2.1.1 設計方法
2.1.2 體系結構設計
2.1.3 數據模型設計
2.2 ETL設計
2.3 數據倉庫實現
第3章 數據倉庫實例
3.1 實例一
3.1.1 選擇主題
3.1.2 邏輯模型設計
3.1.3 物理模型設計
3.1.4 ETL設計
3.2 實例二
3.2.1 總體結構設計
3.2.2 概念模型設計
3.2.3 邏輯模型設計
3.2.4 物理模型設計
3.2.5 數據清洗設計
3.2.6 ETL設計
第4章 OLAP和OLAM
4.1 OLAP
4.2 OLAM
4.2.1 體系結構
4.2.2 特點
4.2.3 基於Web的OLAM
第二篇 數據挖掘
第5章 數據挖掘基礎
5.1 概述
5.1.1 定義
5.1.2 功能
5.1.3 模型
5.1.4 展望
5.2 實現
5.3 工具
5.3.1 概述
5.3.2 比較
第6章 聚類分析
6.1 硬聚類
6.1.1 算法種類
6.1.2 相似度計算
6.1.3 實現方法
6.1.4 主要算法
6.2 模糊聚類
6.2.1 概述
6.2.2 主要算法
6.3 評價
第7章 分類和預測
7.1 神經網路
7.2 決策樹
7.3 實現過程
第8章 關聯分析
8.1 概述
8.2 Apriori
8.3 FP-Growth
第9章 Web挖掘
9.1 概述
9.1.1 定義
9.1.2 自然語言理解
9.1.3 Web挖掘過程
9.2 Web文檔抽取和表示
9.2.1 Web文檔抽取
9.2.2 Web文檔表示
9.3 特徵提取
9.4 Web聚類
9.5 Web分類
9.5.1 樸素貝葉斯
9.5.2 其他方法
9.5.3 評價
第10章 數據挖掘實例
10.1 TOM和TOM
10.2 客戶細分
10.2.1 客戶生命周期
10.2.2 客戶價值
10.2.3 數據準備
10.2.4 分析過程
10.2.5 結果
10.3 重入網識別
10.3.1 定義
10.3.2 數據準備
10.3.3 分析過程
10.3.4 結果
10..4 WAF日誌挖掘
10.4.1 定義
10.4.2 數據準備
10.4.3 分析過程
10.4.4 結果
第三篇 語義網和本體
第11章 知識
11.1 概述
11.2 知識分類
11.3 知識表示
11.3.1 知識表不觀
11.3.2 知識表示方法
11.4 知識管理
11.4.1 概述
11.4.2 知識管理與信息管理的關係
11.4.3 核心技術
第12章 語義網和本體
12.1 語義網
12.1.1 概述
12.1.2 層次結構
12.1.3 元數據
12.1.4 核心技術
12.1.5 開發工具Jena
12.1.6 Web3.0
12.2 本體
12.2.1 哲學本源
12.2.2 定義
12.2.3 建模
12.2.4 分類
12.2.5 構建方法
12.2.6 描述語言
12.2.7 實例
參考文獻

序言

數據倉庫是將大量傳統資料庫數據進行抽取、清洗和轉換,並按主題進行重新組織,可比喻為隨時間推移不斷豐富的“寶藏”;而數據挖掘是從海量數據中發現人們感興趣的知識,這些知識是隱含的、事先未知的潛在有用信息,挖掘的知識表示形式為概念、規則、規律和模式等,可比喻為“淘寶”。隨著Internet的迅速普及和廣泛套用,每天都產生大量各種各樣的信息,但它們背後到底穩藏著什麼,這驅使人類不斷探索。
工欲善其事必先利其器。在當今信息爆炸的時代,數據挖掘堪比“利器”,讓我們面對海量數據時不再感到茫然和不知所措。隨著數據倉庫的發展和套用,數據挖掘將展現無限的生機和活力,可以輔助、部分代替甚至拓展人的智慧型和決策,造福人類。
數據經整合匯總為信息,信息經挖掘抽象為知識,知識是智慧型的基石。因此,信息化到知識化再到智慧型化將是人類社會發展的必然趨勢。數據倉庫和數據挖掘正逐步滲透和深人到社會的各個領域,並不斷催生新的套用。
本書主要介紹數據倉庫和數據挖掘的理論、方法、技術及其套用。此外,用較多篇幅闡述數據倉庫和數據挖掘新的套用實例。
全書分為三篇。第一篇介紹數據倉庫的起源和演變過程,闡述數據倉庫的定義、體系結構、組成、元數據、數據粒度和數據模型以及ETL過程,論述數據倉庫設計和實現的方法,並結合具體套用詳細闡述了如何構建數據倉庫及其主要套用,包括OLAP和0LAM等。第二篇介紹數據挖掘的起源和發展趨勢,以及數據挖掘與web挖掘的技術和方法,包括聚類分析、分類、預測和關聯分析等,詳細分析了數據挖掘在電信領域的具體套用,如客戶細分、重入網識別和WAP日誌挖掘等。第三篇討論數據、信息和知識的關係,論述知識表示的主要方法和知識管理的核心技術,介紹當前研究熱點——語義網和本體的核心技術和方法,分析了語義網和本體的主要套用。

相關詞條

熱門詞條

聯絡我們