數據倉庫與OLAP實踐教程

數據倉庫與OLAP實踐教程

《數據倉庫與OLAP實踐教程》是2008年清華大學出版社出版的圖書,作者是何玉潔、張俊超。

基本介紹

  • 書名:數據倉庫與OLAP實踐教程
  • 作者:何玉潔、張俊超
  • ISBN:9787302168102
  • 頁數:341 
  • 定價:37元
  • 出版社:清華大學出版社
  • 出版時間:2008年2月29日
  • 裝幀:平裝
  • 開本:16
內容簡介,圖書前言,圖書目錄,

內容簡介

數據倉庫在線上分析處理資料庫技術發展和套用的一個新階段,本書全面、詳細地介紹了構建數據倉庫以及進行多維數據分析的技術,並力求把數據倉庫理論以及在該理論領域的相關套用儘可能完美地融合起來,其內容涵蓋數據倉庫的構建理論、構建示例、前端多維數據的展示及分析技術、對數據倉庫及多維數據集的管理和維護等技術。本書以目前流行的Microsoft SQL Server 2000資料庫管理系統作為實踐平台,以便於讀者實踐。本書語言通俗易懂,實例豐富。
本書適合作為計算機、商科及相關專業本科學生學習數據倉庫及多維數據分析技術的教材,同時也適合作為研究生數據倉庫等課程的教材。

圖書前言

數據倉庫的概念自提出以來就備受業界的關注,其迅猛的發展勢頭和強勁的市場潛力已經為世界各大計算機研究機構和IT企業所關注。目前國際市場上也有了較為成熟的數據倉庫產品及解決方案,但國內對數據倉庫領域技術的研究和套用起步比較晚,發展也不很成熟。隨著國內大型企業規模的日趨壯大,管理的日益先進,勢必導致企業信息化和智慧型化的強烈需求,部署數據倉庫解決方案成為一種必然的選擇。而現今國內企業在這方面的套用僅限於報表階段,數據的多維分析、數據挖掘知識發現等更高級的數據處理決策支持技術還沒能普及開來。因此,在企事業單位和高等學校中講授數據倉庫領域的理論知識和套用技術就顯得十分必要了,這也是本書寫作的初衷所在。
本書著眼於理論與實踐的結合,重點探討了數據倉庫和OLAP領域技術的套用層面。全書以數據倉庫的構建流程作為整體線索,從源數據的清理轉換到數據倉庫的設計和實施,然後構建多維數據集,最後實施OLAP前端分析,書中詳細介紹了各個環節所涉及的重要概念及套用技術。《數據倉庫與OLAP實踐教程》一書區別於同類書籍的特點有以下幾個方面:
第一,實際案例驅動,面向實踐與套用。數據倉庫與OLAP實踐是一項套用性很強的技術,很多這方面的書籍都藉助Microsoft SQL Server 2000提供的示例資料庫(如Northwind)來講解這方面的套用,但這與現實的套用情況有很大的區別。示例資料庫都是相對完整和規範的,而現實中的原始資料庫則是多種多樣的,存在著噪音數據、空值數據和類型不匹配的數據等問題,因此進行完整的清理和轉換是一項重要且複雜的工作。作者在本書中使用了現實的案例,包括來自銀行、菸草公司等多種實際數據,根據不同行業的分析需求分別介紹相關的技術,這不僅有益於讀者了解套用的實際情況,同時還能幫助讀者熟悉實際經濟活動的相關背景,這也是本書獨樹一幟的一點。
第二,可操作性強,語言通俗易懂。數據倉庫與OLAP實踐實際上是一門綜合學科,它涉及了信息檢索、資料庫、人工智慧、模糊數學,甚至商科等各方面的知識,套用於現代企業經濟活動的數據分析決策支持方面,這也是國外很多著名大學商科學院也開設此類課程的原因所在。很多這方面的書籍偏重於數據倉庫的理論、算法等內容,這對很多該技術的使用者和學習者來說都是晦澀難懂的。而本書在實際案例的基礎上,穿插了豐富的圖示和操作步驟,讀者和用戶能夠利用隨書光碟中的數據,親自實際操作和實施書中的案例。這對初次涉及該領域的學習者和急於套用該技術的用戶都是十分有利的,另外對這方面技術的普及也頗具益處。
第三,技術介紹全面,套用層面廣泛。本書融入了作者豐富的實踐經驗,在數據倉庫與OLAP實踐的各環節的介紹中,作者較全面地考慮了多種套用需求以及相應的技術。例如,在本書第7章《數據準備》中,作者根據自身實際經歷的各種數據清理轉換問題,創新地提出和總結了一整套數據清理和轉換的技術方案,讀者可以獲得這方面的全面指導。此外,對於OLAP的前端分析策略的介紹,本書也提供了多種解決方案,其中Crystal Analysis的套用也是其他同類書籍所沒有的。各種不同的前端分析方案面對著不同的分析需求,讀者和用戶可以根據自身遇到的實際情況來選擇適合的方案。
本書前3章講述了數據倉庫與OLAP領域的主要理論和概念,起到提綱挈領的作用; 第4章對OLAP主要工具的介紹可以讓讀者準備好自己的計算機; 第5章是一個完整的金融案例,讓讀者對數據倉庫和OLAP的實際套用有一個整體的了解; 第6章關於設計數據倉庫和OLAP策略的介紹讓讀者更深入理解數據倉庫的實施過程和技術方法; 第7章講述了數據準備階段的實用技術; 而第8章DTS的套用則是將數據傳輸和裝載至數據倉庫的絕佳方案; 第9章細緻地討論了有關維度構建和管理的話題; 第10章則是面向多維數據分析的高級套用,讀者能結合實際的例子學習套用計算成員、計算單元和對策等高級技術; 第11章OLAP的前端分析策略選取了現今常見的幾種前端分析工具,同樣也是基於實際案例的套用; 第12章介紹了微軟Analysis Services專用的多維查詢語言——MDX,為專業的IT人士對多維數據的編程和操作提供了接口和工具; 第13章和第14章則總結了多維數據集和數據倉庫的管理和最佳化; 第15章作為本書的最後一章,對數據倉庫和商務智慧型領域的現況和前景作了描述,並概要地介紹了數據挖掘技術的定義和概念,為進一步學習該方面的知識作了鋪墊。
本書由何玉潔負責提出編寫大綱,並進行全書的統稿及最終的審定,主要由張俊超負責執筆,同時張宏旭、於小倩、范潔參加了本書部分章節的編寫工作,在此對他們的勤奮工作表示感謝。此外,本書還受到了國家審計署京津冀特派辦的大力支持和幫助,作者從中獲得了十分寶貴的實踐經驗和模擬數據,在此表示衷心的感謝!由於數據倉庫和多維數據分析技術在國內的套用還處於探索階段,更加之作者的水平和經驗有限,有些方面研究得還不夠深入和透徹,難免有錯訛之處,還有待於讀者和實踐的檢驗,真誠希望廣大讀者批評指正!

圖書目錄

第1章 數據倉庫與0LAP概述
1.1數據倉庫
1.1.1 數據倉庫的概念和特點
1.1.2 數據倉庫與傳統資料庫的比較
1.1.3 數據倉庫帶來的好處
1.2多維數據分析——0LAP
1.2.10LAP的概念和特點
1.2.20LAP與OLTP的區別
1.2.30LAP帶來的好處
1.3數據倉庫與OLAP
1.4 小結
第2章數據倉庫的構建理論
2.1 數據倉庫的體系結構
2.2 數據倉庫的構建步驟
2.2.1 概念模型設計
2.2.2 技術準備工作
2.2.3 邏輯模型設計
2.2.4 物理模型設計
2.2.5 數據倉庫的生成
2.2.6 數據倉庫的使用和維護
2.3實施數據倉庫的注意事項
2.4 小結
第3章多維數據分析基礎與方法
3.1多維數據分析基礎
3.2 多維數據分析方法
3.3 維度表事實表的連線
3.4 多維數據的存儲方式
3.4.1 三種存儲方式
3.4.2 三種存儲方式的比較
3.5小結
第4章 OLAP工具及安裝
4.1 常用的伺服器端分析工具
4.1.1MicrosoftSQLServerAnalysisServ
4.1.2IBMDB20LAPServer
4.2 常用的客戶端分析工具
4.2.1Excel和Access
4.2.2 CrystalAnalysis
4.3各種工具的準備和安裝
4.3.1 各工具需要的軟硬體環境
4.3.2 工具的安裝
4.4小結
第5章 OLAP的一個套用示例
5.1案例背景
5.2 分析需求
5.3 數據準備
5.4 構建數據倉庫和多維數據集
5.4.1 建立數據倉庫
5.4.2 連線數據源
5.4.3 建立多維數據集
5.5 瀏覽分析數據
5.5.1使用多維數據集瀏覽器查看數據
5.5.2 運用多維分析方法分析數據
5.6小結
第6章 構建一個示例數據倉庫
6.1 數據倉庫的分類
6.2 數據倉庫的開發模式
6.2.1自頂向下的模式
6.2.2自底向上的模式
6.2.3 聯合模式
6.3 兩個重要的設計因素
6.3.1 數據倉庫的粒度
6.3.2 數據的分割
……
第7章 數據準備
第8章 數據轉換服務——DTS
第9章 維度的構建和管理
第10章 多維數據分析的高級話題
第11章 OLAP的前端分析策略
第12章 多維表達式——MDX
第13章 多維數據集的管理和最佳化
第14章 數據倉庫的維護和解決方案
第15章 數據倉庫和商業智慧型
附錄A 常用MDX函式列表
附錄B 維度編輯器和多維數據集編輯器中的屬性管理
……

相關詞條

熱門詞條

聯絡我們