您該如何釋放海量資料的力量呢?憑藉著本書的綜合資源,您可以學會如何用Apache Hadoop來打造與維護一個可靠而具擴充性的分散式系統。不論是想瞭解如何分析各種資料集的程式設計師,或者想要設定與運行Hadoop叢集的系統管理員,都合適閱讀本書。本修訂版囊括了Hadoop近期的改變,包括像是Hive、Sqoop與Avro等。本書也提供了一些使用案例,用以說明Hadoop如何被用來解決特定的問題。
.用HDFS(Hadoop Distributed File System)來儲存大型資料集,然後用MapReduce運行分散式運算。
.用Hadoop的資料與I/O組成元件來進行壓縮、資料完整性驗證、序列化(serialization)與封藏(persistence)。
.探索在現實生活中,撰寫MapReduce程式常見的陷阱,以及進階的功能。
.設計、建立與管理一座專用的Hadoop叢集,或在雲端服務上運行Hadoop。
.運用高階的查詢語言Pig來處理大量資料。
.運用Hadoop的資料倉儲系統Hive來分析資料集。
.運用HBase資料庫來儲存結構化與半結構化資料。
.使用ZooKeeper工具集打造分散式系統。
作者簡介:
Tom White自2007年起就是Apache Hadoop的提交者。他不僅是阿帕契軟體基金會的成員,同時也是Cloudera的工程師。他曾幫orielly.com、java.net與IBM的developerWorks撰寫技術文章;並在商業研討會上發表多場演講。
譯者簡介:
王耀聰
交通大學電機與控制工程碩士,任職於國家高速網路與計算中心,主要專長為分散式系統、感測網路與虛擬實境。因長期致力於自由軟體校園應用研發與推廣,榮獲2008年行政院科技貢獻獎。於2009年起維運hadoop 公用實驗叢集、台灣 hadoop 論壇與台灣 hadoop 使用者社群。目前主要負責校園雲端自由軟體研發與推廣。
辜文元
逢甲大學資訊工程所碩士,任職於逢甲大學地理資訊系統研究中心研究發展部,具有13年的系統分析及資料庫管理經驗,主要專長為系統分析及設計,目前主要負責研發海量級感測器資料解決方案。
各界推薦
名人推薦:
『現在您擁有一個絕佳機會能向大師學習Hadoop相關知識-不僅包括技術層面,還有基本的觀念,與簡單的對話!』
--Doug Cuttin, Cloudera
名人推薦:『現在您擁有一個絕佳機會能向大師學習Hadoop相關知識-不僅包括技術層面,還有基本的觀念,與簡單的對話!』
--Doug Cuttin, Cloudera
目錄
目錄:
chapter 1|遇見Hadoop
chapter 2|MapReduce
chapter 3|Hadoop分散式檔案系統
chapter 4|Hadoop的I/O
chapter 5|開發MapReduce程式
chapter 6|MapReduce如何運作
chapter 7|MapReduce的類型與格式
chapter 8|MapReduce的特性
chapter 9|建立一個Hadoop叢集
chapter 10|Hadoop的管理
chapter 11|Pig
chapter 12|Hive
chapter 13|HBase
chapter 14|ZooKeeper
chapter 15|Sqoop
chapter 16|使用案例
目錄:
chapter 1|遇見Hadoop
chapter 2|MapReduce
chapter 3|Hadoop分散式檔案系統
chapter 4|Hadoop的I/O
chapter 5|開發MapReduce程式
chapter 6|MapReduce如何運作
chapter 7|MapReduce的類型與格式
chapter 8|MapReduce的特性
chapter 9|建立一個Hadoop叢集
chapter 10|Hadoop的管理
chapter 11|Pig
chapter 12|Hive
chapter 13|HBase
chapter 14|ZooKeeper
chapter 15|Sqoop
chapter 16|使用案例
購物須知
退換貨說明:
會員均享有10天的商品猶豫期(含例假日)。若您欲辦理退換貨,請於取得該商品10日內寄回。
辦理退換貨時,請保持商品全新狀態與完整包裝(商品本身、贈品、贈票、附件、內外包裝、保證書、隨貨文件等)一併寄回。若退回商品無法回復原狀者,可能影響退換貨權利之行使或須負擔部分費用。
訂購本商品前請務必詳閱退換貨原則。