大數據：從基礎理論到最佳實踐

出版信息

《大數據：從基礎理論到最佳實踐》是一本於2017年1月1日清華大學出版社出版的圖書，作者是祁偉、劉冰、常志軍、趙廷濤、高俊秀。

定價：59.80元
印次：1-1
ISBN：9787302457435
出版日期：2017.01.01
印刷日期：2017.01.10

內容簡介

本書側重於大數據的實踐性技術，系統地介紹了主流大數據平台及工具的安裝部署、管理維護和套用開發。平台和工具的選擇均為當前業界主流的開源產品，因此，對於讀者來說，有很強的可操作性。

本書涉及的開源技術包括：HDFS、MapReduce、YARN、Zookeeper、HBase、Hive、Sqoop、Storm、Kafka、Flume等。除介紹一般性的背景知識、安裝部署、管理維護和套用開發技術外，還特別注重案例實踐，重要的技術點以實際工作場景或案例為依託，使讀者能快速入門，參考案例動手實踐，通過具體深入的實踐，體會大數據的技術本質特徵，領略大數據技術帶來的創新理念，更好地理解和把握信息技術的發展趨勢。

本書主要內容包括以下幾大部分。

大數據存儲篇：以HDFS為基礎，介紹分散式檔案系統的原理、安裝、fs命令的使用、編程，介紹如何用HDFS實現，並通過HTTP調用。

大數據計算篇：以MapReduce、YARN為基礎，介紹分散式計算的原理、部署，以及編程案例。

非關係型資料庫篇：以HBase為基礎，重點介紹非關係型資料庫的優勢、原理、部署，以及命令行使用，編程案例，與Sqoop配合使用等。

大數據倉庫篇：以Hive、數據倉庫等為基礎，重點介紹數據的抽取、原理、部署、分析與編程。

大數據實時計算篇：以Storm、Kafka為基礎，介紹實時計算的架構、組成、使用與開發。

本書非常適合從事大數據技術開發與使用的初學者，以及從事大數據技術研發的企事業單位工程師學習和參考，也適合高校計算機相關專業的專科生、本科生和研究生學習使用。

作者簡介

祁偉：畢業於北京師範大學，目前擔任《中國教育信息化》雜誌社總編輯，具有超過20年的IT工作經驗，在網路路由、伺服器虛擬化、資料庫等方面有深入研究和豐富的實踐經驗。
劉冰：畢業於中國科學院計算技術研究所，數據中心架構師，從事虛擬化、監測與大數據分析等方面研究，曾與祁偉總編共同著有《雲計算：從基礎架構到最佳實踐》，現就職於教育部教育管理信息中心。
常志軍：畢業於中國科學院自動化研究所，大數據平台架構師，分散式系統研究人員。先後在搜狐暢遊、中國搜尋、Opera歐朋、中科院自動化所從事大數據領域的探索與研發工作。
趙廷濤：畢業於中國傳媒大學，現就職於科技部信息中心，有多年大數據存儲研發經驗，現從事數據中心管理運維工作，專注於虛擬化、套用系統建設等相關技術研究。
高俊秀：畢業於北京航空航天大學計算機學院，數據倉庫架構師，八年網際網路大數據從業經驗。歷任百度、豌豆莢、今日頭條的數據平台和數據倉庫核心研發和負責人，對數據在業務上發揮價值有深入的理解。

大數據：從基礎理論到最佳實踐

基本介紹

出版信息

內容簡介

作者簡介

目錄

相關詞條

熱門詞條

大數據：從基礎理論到最佳實踐

基本介紹

出版信息

內容簡介

作者簡介

目 錄

相關詞條

熱門詞條

目錄