由淺入深地講解HBase概念、安裝、配置、部署
從應用角度介紹高階用法、監控和性能最佳化
HBase是Apache旗下一個高可靠性、高性能、面向列、可伸縮的分散式存儲系統。
全書共分9章,由淺入深地講解HBase概念、安裝、配置、部署,再從應用角度介紹高階用法、監控和性能最佳化。
■ 如果你還在尋找合適的環境,或想快速了解HBase功能,或你是公司的運行維護工程師,想知道如何架設HBase,「第2 章 讓HBase 跑起來」適合你。
■ 如果公司的運行維護工程師幫你架好環境,老闆催著你趕快做出專案,那麼請直接看「第4 章 用戶端API 入門」。
■ 如果你更關心HBase 是如何實現它的資料結構的,建議你直接看「第5 章 HBase 內部探險」。
■ 如果你想知道HBase如何提升效能,建議你直接看「第8章 再快一點」。
適用: HBase初學者、希望深入掌握HBase的讀者、HBase應用開發人員和系統管理人員。
作者簡介:
楊曦
任職於硅谷某上市公司,對大數據、雲端計算等技術研究深入,並具豐富的專案實務經驗。熱衷編寫開放程式碼專案、撰寫技術博客以及各種技術專案。
作者序
前 言
我們發現阻礙人們學習新技術最大的障礙不是技術的難度或條件的限制,而是學習技術時難以抵擋的睏意,所以我們的目標就是寫一本讓人看了不會睡著的HBase 技術書籍。希望大家可以透過這本書成功地入門HBase 技術。
為什麼要寫這本書?
■ 目前網上關於HBase的知識比較零碎,缺乏系統性。翻譯的作品,語言的組織又不符合國人的習慣。
■ 目前的資料都很舊。連英文的資料很多都過時了,例如現在很多的書籍和網上的資料都還在介紹三層查詢架構,可是HBase 早已經改成二層查詢架構了。實際操作到的跟書上的操作不一樣,這很讓人沮喪。
✤ 如何才能不睡著地看本書
作為本書的作者我強烈不建議大家從頭按順序地讀到尾,這不是一種好的讀書方式,而且極容易睡著。看書應該是非線性的,先掃一遍目錄,然後只看適合自己的,最後再發散式地補看別的章節。
■ 如果你手頭沒有合適的環境,或你想快速了解HBase能做什麼,或你是公司的運行維護人員,想知道怎麼架設HBase,「第2 章 讓HBase 跑起來」適合你。
■ 如果公司的運行維護幫你建置好環境,老闆催著你趕緊做出專案,那麼請直接看「第4 章 用戶端API 入門」。
■ 如果你更關心HBase 是如何實現它的資料結構的,建議你直接看「第5 章 HBase 內部探險」。
■ 如果你想知道HBase如何提升效能,建議你直接看「第8章 再快一點」。
如果你還是覺得睏,那一定不是這本書的關係,是你的確缺乏睡眠,請馬上去睡覺,有精神了再來看書。看得慢,看得少都沒有關係,千萬別睏著看!
✤ 如何才能不睡著地看所有書
為什麼我們看技術書籍總是犯睏呢?
因為技術書籍必須把方法和基礎知識都寫全面,否則容易誤導讀者,你可以把技術書籍看成是一本電話黃頁。我們總是錯誤地以為既然要學習,那麼每一個基礎知識、每一個方法都不能錯過,所以認真地精讀每一本技術書籍。你想像一下,如果你精讀一本電話黃頁,會不會感到疲勞?會不會忍不住睡去?
其實不光是讀本書,學習所有的技術書籍都應該掌握正確的方法。那就是:跳著看,具體地說就是不要針對每一個API 方法都精讀,這樣很容易迷失在一長串的API 方法列表中,感到疲勞,導致無法堅持下去;而是針對某個基礎知識精細地掌握某一個方法親自實作,然後別的方法快速略讀過去,等需要用的時候再回來查閱。我們需要把每一本技術書籍都看成入門教學 + 技術手冊,第一遍閱讀的時候把每個基礎知識挑出一個方法作為入門,把其他方法當作技術手冊來查閱,你總不會想細讀一本電話黃頁吧。
本書在很多地方都列出閱讀提示,提醒大家不要精讀,該略過的部分就要勇敢地略過。
✤ 這本書不是HBase 知識大全
這本書的目的只是讓你學會HBase。有些基礎知識並沒有有關,例如叢集備份、ACL 許可權控制、REST 用戶端等,所以想學習這些知識的讀者們可能要失望了。我只能讓讀者愉快地入門,更深層次的知識就看你們自己的努力了!
✤ 技術支援與致謝
如果你在閱讀本書時發現問題或不足之處,請發郵件到
alexyang11@qq.com 告訴我。
部分彩色圖片可到下面網址(注意數字與字母大小寫)下載:
https://pan.baidu.com/s/1slqjJnZ
最後感謝我的家人、朋友、同事對我撰寫本書的幫助,感謝清華大學出版社的夏毓彥編輯,感謝HBase Team 的Ted Yu,沒有他們的幫助,我不可能完成本書!
前 言
我們發現阻礙人們學習新技術最大的障礙不是技術的難度或條件的限制,而是學習技術時難以抵擋的睏意,所以我們的目標就是寫一本讓人看了不會睡著的HBase 技術書籍。希望大家可以透過這本書成功地入門HBase 技術。
為什麼要寫這本書?
■ 目前網上關於HBase的知識比較零碎,缺乏系統性。翻譯的作品,語言的組織又不符合國人的習慣。
■ 目前的資料都很舊。連英文的資料很多都過時了,例如現在很多的書籍和網上的資料都還在介紹三層查詢架構,可是HBase 早已經改成二層查詢架構了。實際操作到的跟書上的操作不一樣,這很讓人沮喪...
目錄
01 初識HBase
1.1 巨量資料與NoSQL
1.2 HBase 是怎麼來的
1.3 為什麼要用HBase
1.4 你必須懂的基本概念
02 讓HBase 跑起來
2.1 本書測試環境
2.2 設定
2.3 設定SSH 免密登入
2.4 安裝Hadoop
2.2 雲端運算發展動力源泉
2.3 雲端運算技術分析
2.4 平行計算與雲端運算關係
2.5 安裝HBase
03 HBase 基本操作
3.1 hbase shell 的使用
3.2 使用Hue 來檢視HBase 資料
04 用戶端API 入門
4.1 10 分鐘教學
4.2 30 分鐘教學
4.3 CRUD 一個也不能少
4.4 批次操作
4.5 BufferedMutator(選讀)
4.6 Scan 掃描
4.7 HBase 支援什麼資料格式
4.8 歸納
05 HBase 內部探險
5.1 資料模型
5.2 HBase 是怎麼儲存資料的
5.3 一個KeyValue 的歷險
5.4 Region 的定位
06 用戶端API 的高階用法
6.1 篩檢程式
6.2 輔助處理器
07 用戶端API 的管理功能
7.1 列簇管理
7.2 表管理
7.3 Region 管理
7.4 快照管理
7.5 維護工具管理
7.6 叢集狀態以及負載(ClusterStatus & ServerLoad)
7.7 Admin 的其他方法
7.8 可見性標籤管理
08 再快一點
8.1 Master 和RegionServer 的JVM 最佳化
8.2 Region 的拆分
8.3 Region 的合併
8.4 WAL 的最佳化
8.5 BlockCache 的最佳化
8.6 Memstore 的最佳化
8.7 HFile 的合併
8.8 診斷手冊
09 當HBase 遇上MapReduce
9.1 為什麼要用MapReduce
9.2 快速入門
9.3 慢速入門:撰寫自己的MapReduce
9.4 相關類別介紹
01 初識HBase
1.1 巨量資料與NoSQL
1.2 HBase 是怎麼來的
1.3 為什麼要用HBase
1.4 你必須懂的基本概念
02 讓HBase 跑起來
2.1 本書測試環境
2.2 設定
2.3 設定SSH 免密登入
2.4 安裝Hadoop
2.2 雲端運算發展動力源泉
2.3 雲端運算技術分析
2.4 平行計算與雲端運算關係
2.5 安裝HBase
03 HBase 基本操作
3.1 hbase shell 的使用
3.2 使用Hue 來檢視HBase 資料
04 用戶端API 入門
4.1 10 分鐘教學
4.2 30 分鐘教學
4.3 CRUD 一個也不能少
4.4 批次操作
4.5 BufferedMutator(選讀)
4.6 Scan 掃描
4.7 HBase 支...
購物須知
退換貨說明:
會員均享有10天的商品猶豫期(含例假日)。若您欲辦理退換貨,請於取得該商品10日內寄回。
辦理退換貨時,請保持商品全新狀態與完整包裝(商品本身、贈品、贈票、附件、內外包裝、保證書、隨貨文件等)一併寄回。若退回商品無法回復原狀者,可能影響退換貨權利之行使或須負擔部分費用。
訂購本商品前請務必詳閱退換貨原則。