數據倉庫與數據挖掘套用教程

數據倉庫與數據挖掘套用教程

《數據倉庫與數據挖掘套用教程》是2016年11月01日由清華大學出版社出版的圖書。作者分別為李春葆、蔣林、陳良臣、喻丹丹、曾平。

基本介紹

  • 書名:數據倉庫與數據挖掘套用教程 
  • 作者:李春葆、蔣林、陳良臣、喻丹丹、曾平 
  • ISBN:9787302430773
  • 定價:39.50元 
  • 出版社清華大學出版社 
  • 出版時間:2016年11月01 
圖書信息,內容簡介,目錄,

    圖書信息

    數據倉庫與數據挖掘套用教程
    作者:李春葆、蔣林、陳良臣、喻丹丹、曾平
    定價:39.50元
    印次:1-1
    ISBN:9787302430773
    出版日期:2016.10.01
    印刷日期:2016.09.23

    內容簡介

      本書以SQL Server分析服務為環境介紹數據倉庫和數據挖掘套用技術,包括數據倉庫和數據挖掘概述、OLAP和多維數據模型、數據倉庫設計和SQL Server數據倉庫開發實例、關聯分析算法、決策樹分類算法、貝葉斯分類算法、神經網路算法、回歸分析算法、時間序列分析和聚類算法。本書內容翔實,循序漸進地介紹各個知識點,並提供全面而豐富的教學資源,可作為各類高等院校計算機及相關專業“數據倉庫和數據挖掘套用技術”和“SQL Server高級套用”課程的教學用書,也適合計算機套用人員和計算機愛好者參考。

      目錄

      第1章數據倉庫和數據挖掘概述
      1.1數據倉庫概述
      1.1.1數據倉庫的定義
      1.1.2數據倉庫與操作型資料庫的關係
      1.1.3數據倉庫的套用
      1.2數據倉庫系統及開發工具
      1.2.1數據倉庫系統的組成
      1.2.2數據倉庫系統開發工具
      1.3商業智慧型和數據倉庫
      1.3.1什麼是商業智慧型
      1.3.2商業智慧型和數據倉庫的關係
      1.4數據挖掘概述
      1.4.1數據挖掘的定義
      1.4.2數據挖掘的主要任務
      1.4.3數據挖掘的對象
      1.4.4數據挖掘的知識表示
      1.4.5數據挖掘與數據倉庫及OLAP的關係
      1.4.6數據挖掘的套用
      1.5數據挖掘過程
      1.5.1數據挖掘步驟
      1.5.2數據清理
      1.5.3數據集成
      1.5.4數據變換
      1.5.5數據歸約
      1.5.6離散化和概念分層生成
      1.5.7數據挖掘的算法
      練習題
      第2章OLAP和多維數據模型
      2.1OLAP概述
      2.1.1什麼是OLAP
      2.1.2OLAP和OLTP的區別
      2.1.3數據倉庫與OLAP的關係
      2.2多維數據模型
      2.2.1多維數據模型的相關概念
      2.2.2OLAP的基本分析操作
      2.2.3多維數據模型的實現途徑
      2.3數據倉庫的維度建模
      2.3.1數據倉庫建模概述
      2.3.2星形模型
      2.3.3雪花模型
      2.3.4事實星座模型
      練習題
      第3章數據倉庫設計
      3.1數據倉庫設計概述
      3.1.1數據倉庫設計原則
      3.1.2建立數據倉庫系統的兩種模式
      3.1.3數據倉庫設計過程
      3.2數據倉庫規劃與需求分析
      3.2.1數據倉庫規劃
      3.2.2數據倉庫需求分析
      3.3數據倉庫建模
      3.3.1數據倉庫建模的主要工作
      3.3.2維表設計
      3.3.3事實表設計
      3.4數據倉庫物理模型設計
      3.4.1確定數據的存儲結構
      3.4.2確定索引策略
      3.4.3確定存儲分配
      3.5數據倉庫部署與維護
      3.5.1數據倉庫的部署
      3.5.2數據倉庫的維護
      練習題
      第4章SQLServer數據倉庫開發實例
      4.1OnRetDW系統需求分析
      4.1.1OnRetDW系統的主題
      4.1.2OnRetDW系統的功能
      4.2OnRetDW的建模
      4.2.1維表設計
      4.2.2事實表設計
      4.3數據抽取工具設計
      4.4基於SQL Server 2012設計OnRetDW
      4.4.1創建數據倉庫OnRetDW項目
      4.4.2創建數據源
      4.4.3創建數據源視圖
      4.4.4創建維表
      4.4.5創建多維數據集
      4.4.6部署SDWS
      4.4.7瀏覽已部署的多維數據集
      4.5MDX簡介*
      4.5.1MDX語言概述
      4.5.2執行MDX查詢
      4.5.3多維數據查詢
      練習題
      上機實驗題
      第5章關聯分析算法
      5.1關聯分析概述
      5.1.1什麼是關聯分析
      5.1.2事務資料庫
      5.1.3關聯規則及其度量
      5.1.4頻繁項集
      5.1.5挖掘關聯規則的基本過程
      5.2Apriori算法
      5.2.1Apriori性質
      5.2.2Apriori算法求頻繁項集
      5.2.3由頻繁項集產生強關聯規則
      5.3SQL Server挖掘關聯規則
      5.3.1創建DMK資料庫
      5.3.2建立關聯挖掘項目
      5.3.3部署關聯挖掘項目並瀏覽結果
      5.4電子商務數據的關聯規則挖掘
      5.4.1創建OnRetDMK資料庫
      5.4.2數據載入功能設計
      5.4.3建立關聯挖掘項目
      5.4.4部署關聯挖掘項目並瀏覽結果
      練習題
      上機實驗題
      第6章決策樹分類算法
      6.1分類過程
      6.1.1分類概述
      6.1.2分類過程的學習階段
      6.1.3分類過程的分類階段
      6.2決策樹分類
      6.2.1決策樹
      6.2.2建立決策樹的ID3算法
      6.3SQL Server決策樹分類
      6.3.1建立數據表
      6.3.2建立決策樹分類挖掘模型
      6.3.3瀏覽決策樹模型和分類預測
      6.4電子商務數據的決策樹分類
      6.4.1創建OnRetDMK.DST數據表
      6.4.2數據載入功能設計
      6.4.3建立決策樹分類模型
      6.4.4瀏覽決策樹
      練習題
      上機實驗題
      第7章貝葉斯分類算法
      7.1貝葉斯分類概述
      7.1.1貝葉斯定理
      7.1.2貝葉斯信念網路
      7.2樸素貝葉斯分類
      7.2.1樸素貝葉斯分類原理
      7.2.2樸素貝葉斯分類算法
      7.3SQL Server樸素貝葉斯分類
      7.3.1建立樸素貝葉斯分類挖掘模型
      7.3.2瀏覽樸素貝葉斯分類模型和分類預測
      7.4電子商務數據的貝葉斯分類
      7.4.1建立樸素貝葉斯分類挖掘模型
      7.4.2瀏覽挖掘結果及分析
      練習題
      上機實驗題
      第8章神經網路算法
      8.1人工神經網路概述
      8.1.1人工神經元
      8.1.2人工神經網路
      8.1.3神經網路套用
      8.2用於分類的前饋神經網路
      8.2.1前饋神經網路的學習過程
      8.2.2前饋神經網路用於分類的算法
      8.3SQL Server神經網路分類
      8.3.1建立神經網路分類挖掘模型
      8.3.2瀏覽神經網路分類模型和分類預測
      8.4電子商務數據的神經網路分類
      8.4.1建立神經網路分類挖掘模型
      8.4.2瀏覽挖掘結果及分析
      練習題
      上機實驗題
      第9章回歸分析算法
      9.1回歸分析概述
      9.2線性回歸分析
      9.2.1一元線性回歸分析
      9.2.2多元線性回歸分析
      9.2.3SQL Server線性回歸分析
      9.3非線性回歸分析
      9.3.1非線性回歸分析的處理方法
      9.3.2可轉換成線性回歸的非線性回歸
      9.3.3不可變換成線性回歸的非線性回歸分析*
      9.4邏輯回歸分析
      9.4.1邏輯回歸原理
      9.4.2邏輯回歸模型
      9.4.3SQL Server邏輯回歸分析
      9.5電子商務數據的邏輯回歸分析
      9.5.1建立邏輯回歸挖掘模型
      9.5.2瀏覽挖掘結果及分析
      練習題
      上機實驗題
      第10章時間序列分析
      10.1時間序列分析概述
      10.1.1什麼是時間序列和時間序列分析
      10.1.2時間序列的分類和平穩性判斷
      10.1.3時間序列建模的兩種基本假設
      10.1.4回歸分析與時間序列分析
      10.2確定性時間序列分析
      10.2.1移動平均模型
      10.2.2指數平滑模型
      10.3隨機時間序列模型*
      10.3.1隨機時間序列模型概述
      10.3.2自回歸模型AR(p)
      10.4SQL Server時間序列分析
      10.4.1建立數據表
      10.4.2建立時間序列分析模型
      10.4.3瀏覽時間序列分析模型
      10.5電子商務數據的時間序列分析
      10.5.1創建OnRetDMK.TS數據表
      10.5.2數據載入功能設計
      10.5.3建立時間序列分析模型
      10.5.4瀏覽時間序列分析模型
      練習題
      上機實驗題
      第11章聚類算法
      11.1聚類概述
      11.1.1什麼是聚類
      11.1.2相似性度量
      11.1.3聚類過程
      11.1.4常見的聚類算法
      11.1.5聚類分析的套用
      11.2k均值算法及其套用
      11.2.1k均值算法
      11.2.2SQL Server的k均值算法套用
      11.3EM算法及其套用
      11.3.1EM算法
      11.3.2SQL Server中EM算法
      11.4電子商務數據的聚類分析
      11.4.1建立聚類挖掘模型
      11.4.2兩種算法結果的比較
      11.5Microsoft順序分析和聚類分析算法*
      11.5.1Microsoft順序分析和聚類分析算法概述
      11.5.2Microsoft順序分析和聚類分析算法的套用
      練習題
      上機實驗題
      參考文獻

      相關詞條

      熱門詞條

      聯絡我們