Hadoop 是目前最受注目的 Big Data(大數據、大資料、巨量資料)處理平台及解決方案,並且已經廣泛應用於生產環境中。本書主要介紹 Hadoop 的相關知識,涉及 Hadoop、MapReduce、HDFS 以及 Sqoop。深入探討 Hadoop 的維護與調校,並包含一個完整基於 Hadoop 的商務系統設計及實作。
本書以實務為導向,【基礎篇】包含了大量的實務操作,而【應用篇】則示範了一個真實且完整的專案實例。在【應用篇】中,讀者能夠實際演練在【基礎篇】中所習得的知識與技巧,並且進一步學習到有關於商務系統的開發流程。
作者簡介:
范東來是北京航空航天大學碩士,數據挖掘工程師,任職於清華大學蘇州汽車研究院大數據處理中心。對於 Apache Hadoop、Apache Spark 有豐富經驗,研究領域為分散式運算、機器學習。
目錄
• 基礎篇
• 01 緒論
• 02 環境準備
• 03 Hadoop 的基石:HDFS
• 04 分而治之的智慧:MapReduce
• 05 SQL on Hadoop:Hive
• 06 SQL to Hadoop:Sqoop
• 07 Hadoop 效能調校和運維
• 應用篇:商業智能系統專案實戰
• 08 線上圖書銷售商業智能系統
• 09 系統結構設計
• 10 在開發之前
• 11 實作資料匯入匯出模組
• 12 實作資料分析工具模組
• 13 實作業務資料的資料清洗模組
• 14 實作點擊流量日誌的資料清洗模組
• 15 實作購書轉化率分析模組
• 16 實作購書使用者聚類模組
• 17 實作調度模組
• 總結與展望
• 18 總結與展望
• 基礎篇
• 01 緒論
• 02 環境準備
• 03 Hadoop 的基石:HDFS
• 04 分而治之的智慧:MapReduce
• 05 SQL on Hadoop:Hive
• 06 SQL to Hadoop:Sqoop
• 07 Hadoop 效能調校和運維
• 應用篇:商業智能系統專案實戰
• 08 線上圖書銷售商業智能系統
• 09 系統結構設計
• 10 在開發之前
• 11 實作資料匯入匯出模組
• 12 實作資料分析工具模組
• 13 實作業務資料的資料清洗模組
• 14 實作點擊流量日誌的資料清洗模組
• 15 實作購書轉化率分析模組
• 16 實作購書使用者聚類模組
• 17 實作調度模組
• 總結...
購物須知
關於二手書說明:
商品建檔資料為新書及二手書共用,因是二手商品,實際狀況可能已與建檔資料有差異,購買二手書時,請務必檢視商品書況、備註說明及書況影片,收到商品將以書況影片內呈現為準。若有差異時僅可提供退貨處理,無法換貨或再補寄。
商品版權法律說明:
TAAZE 單純提供網路二手書託售平台予消費者,並不涉入書本作者與原出版商間之任何糾紛;敬請各界鑒察。
退換貨說明:
二手書籍商品享有10天的商品猶豫期(含例假日)。若您欲辦理退貨,請於取得該商品10日內寄回。
二手影音商品(例如CD、DVD等),恕不提供10天猶豫期退貨。
二手商品無法提供換貨服務,僅能辦理退貨。如須退貨,請保持該商品及其附件的完整性(包含書籍封底之TAAZE物流條碼)。若退回商品無法回復原狀者,可能影響退換貨權利之行使或須負擔部分費用。
訂購本商品前請務必詳閱
退換貨原則、
二手CD、DVD退換貨說明。