準備好釋放潛藏在您資料中的力量了嗎?透過這本綜合技術大全,您將學會如何用Apache Hadoop來打造並維運一個可靠而具擴充性的分散式系統。無論是想瞭解如何分析各種大小資料集的程式設計師,或者想要設定與運行Hadoop叢集的系統管理員,都合適閱讀本書。
您將在本書中發現許多耀眼的應用案例,用以說明Hadoop是如何被用來解決特定問題。第三版修訂囊括了近期Hadoop的一些改變,像是關於新版MapReduce API的介紹,以及MapReduce 2那極具彈性的執行模型(YARN)。
.用HDFS(Hadoop Distributed File System)來儲存大型資料集。
.用MapReduce運行分散式運算。
.用Hadoop的資料與I/O組成元件來進行壓縮、資料完整性驗證、序列化(包括Avro)與封藏(persistence)。
.探索在現實生活中,撰寫MapReduce程式常見的陷阱,以及進階的功能。
.設計、建立與管理一座專用的Hadoop叢集,或者在雲端服務上運行Hadoop
.用Sqoop將資料從關聯式資料庫載入HDFS
.運用高階查詢語言Pig來處理大量資料
.運用Hadoop的資料倉儲系統Hive來分析資料集
.善用HBase資料庫來儲存結構化與辦結構化資料
.善用ZooKeeper搭建分散式系統
作者簡介:
Tom White
現任 Cloudera 工程師,也是阿帕契基金會的成員。自2007年2月起,他就是Apache Hadoop的提交者。他曾幫oreilly.com、java.net與IBM的developerWorks撰寫多篇技術文章;此外也在多場商業研討會中發表演講。
目錄
chapter 1|遇見Hadoop
chapter 2|MapReduce
chapter 3|Hadoop分散式檔案系統
chapter 4|Hadoop的I/O
chapter 5|開發MapReduce程式
chapter 6|MapReduce如何運作
chapter 7|MapReduce的類型與格式
chapter 8|MapReduce的特性
chapter 9|建立一個Hadoop叢集
chapter 10|Hadoop的管理
chapter 11|Pig
chapter 12|Hive
chapter 13|HBase
chapter 14|ZooKeeper
chapter 15|Sqoop
chapter 16|使用案例
appendix A|安裝 Apache Hadoop
appendix B|Cloudera 的Hadoop 發行套件
appendix C|準備 NCDC 氣象資料
index
chapter 1|遇見Hadoop
chapter 2|MapReduce
chapter 3|Hadoop分散式檔案系統
chapter 4|Hadoop的I/O
chapter 5|開發MapReduce程式
chapter 6|MapReduce如何運作
chapter 7|MapReduce的類型與格式
chapter 8|MapReduce的特性
chapter 9|建立一個Hadoop叢集
chapter 10|Hadoop的管理
chapter 11|Pig
chapter 12|Hive
chapter 13|HBase
chapter 14|ZooKeeper
chapter 15|Sqoop
chapter 16|使用案例
appendix A|安裝 Apache Hadoop
appendix B|Cloudera 的Hadoop 發行套件
appendix C|準備 NCDC 氣象資料
index
購物須知
關於二手書說明:
商品建檔資料為新書及二手書共用,因是二手商品,實際狀況可能已與建檔資料有差異,購買二手書時,請務必檢視商品書況、備註說明及書況影片,收到商品將以書況影片內呈現為準。若有差異時僅可提供退貨處理,無法換貨或再補寄。
商品版權法律說明:
TAAZE 單純提供網路二手書託售平台予消費者,並不涉入書本作者與原出版商間之任何糾紛;敬請各界鑒察。
退換貨說明:
二手書籍商品享有10天的商品猶豫期(含例假日)。若您欲辦理退貨,請於取得該商品10日內寄回。
二手影音商品(例如CD、DVD等),恕不提供10天猶豫期退貨。
二手商品無法提供換貨服務,僅能辦理退貨。如須退貨,請保持該商品及其附件的完整性(包含書籍封底之TAAZE物流條碼)。若退回商品無法回復原狀者,可能影響退換貨權利之行使或須負擔部分費用。
訂購本商品前請務必詳閱
退換貨原則、
二手CD、DVD退換貨說明。