Hadoop 是目前最受注目的 Big Data(大數據、大資料、巨量資料)處理平台及解決方案,並且已經廣泛應用於生產環境中。本書主要介紹 Hadoop 的相關知識,涉及 Hadoop、MapReduce、HDFS 以及 Sqoop。深入探討 Hadoop 的維護與調校,並包含一個完整基於 Hadoop 的商務系統設計及實作。
本書以實務為導向,【基礎篇】包含了大量的實務操作,而【應用篇】則示範了一個真實且完整的專案實例。在【應用篇】中,讀者能夠實際演練在【基礎篇】中所習得的知識與技巧,並且進一步學習到有關於商務系統的開發流程。
作者簡介:
范東來是北京航空航天大學碩士,數據挖掘工程師,任職於清華大學蘇州汽車研究院大數據處理中心。對於 Apache Hadoop、Apache Spark 有豐富經驗,研究領域為分散式運算、機器學習。
目錄
• 基礎篇
• 01 緒論
• 02 環境準備
• 03 Hadoop 的基石:HDFS
• 04 分而治之的智慧:MapReduce
• 05 SQL on Hadoop:Hive
• 06 SQL to Hadoop:Sqoop
• 07 Hadoop 效能調校和運維
• 應用篇:商業智能系統專案實戰
• 08 線上圖書銷售商業智能系統
• 09 系統結構設計
• 10 在開發之前
• 11 實作資料匯入匯出模組
• 12 實作資料分析工具模組
• 13 實作業務資料的資料清洗模組
• 14 實作點擊流量日誌的資料清洗模組
• 15 實作購書轉化率分析模組
• 16 實作購書使用者聚類模組
• 17 實作調度模組
• 總結與展望
• 18 總結與展望
• 基礎篇
• 01 緒論
• 02 環境準備
• 03 Hadoop 的基石:HDFS
• 04 分而治之的智慧:MapReduce
• 05 SQL on Hadoop:Hive
• 06 SQL to Hadoop:Sqoop
• 07 Hadoop 效能調校和運維
• 應用篇:商業智能系統專案實戰
• 08 線上圖書銷售商業智能系統
• 09 系統結構設計
• 10 在開發之前
• 11 實作資料匯入匯出模組
• 12 實作資料分析工具模組
• 13 實作業務資料的資料清洗模組
• 14 實作點擊流量日誌的資料清洗模組
• 15 實作購書轉化率分析模組
• 16 實作購書使用者聚類模組
• 17 實作調度模組
• 總結...
購物須知
退換貨說明:
會員均享有10天的商品猶豫期(含例假日)。若您欲辦理退換貨,請於取得該商品10日內寄回。
辦理退換貨時,請保持商品全新狀態與完整包裝(商品本身、贈品、贈票、附件、內外包裝、保證書、隨貨文件等)一併寄回。若退回商品無法回復原狀者,可能影響退換貨權利之行使或須負擔部分費用。
訂購本商品前請務必詳閱退換貨原則。