Hadoop＋Spark大數據巨量分析與機器學習整合開發實戰 (二手書贈品) -TAAZE

Hadoop＋Spark大數據巨量分析與機器學習整合開發實戰(二手書贈品)

商品資料

作者：林大貴

出版社：博碩文化股份有限公司

出版日期：2015-11-03

ISBN/ISSN：9789864340545

語言：繁體中文

裝訂方式：平裝

頁數：528

書況：良好

備註：無畫線註記

書況影片(商品之附件或贈品，請以書況影片為準)

暫不供貨

內容簡介
目錄

文字字級

◆技術為金融財務、行銷分析、商業趨勢預測帶來全新的變革
◆詳實的安裝設定與程式編寫說明降低學習入門門檻
◆可單機執行或以實機／虛擬機器建立多台演算陣列
◆具備大量實務案例分析與程式碼範例實作

大數據分析與機器學習人工智慧帶來資訊科技革命的第五波新浪潮
創新產業　　　　　　大量商機　　　　　　人才需求

一般人可能會認為大數據需要很多台機器的環境才能學習，但是本書透過虛擬機器的方法，就能在自家電腦演練建立Hadoop叢集，並且建立Spark開發環境。

以實機操作介紹Hadoop MapReduce與HDFS基本概念，以及Spark RDD與MapReduce基本觀念。

以大數據分析實務案例：MoiveLens（電影喜好推薦引擎）、StumbleUpon（網頁二元分類）、CovType（林相土地演算）、Bike Sharing（Ubike類租賃預測分析）。

配合範例程式碼來介紹各種機器學習演算法，示範如何擷取資料、訓練資料、建立模型、預測結果，由淺而深介紹Spark機器學習。

大數據對每個領域都造成影響。在商業、經濟及其他領域中，將大量資料進行分析後，就可得出許多資料關聯性。可用於預測商業趨勢、行銷研究、金融財務、疾病研究、打擊犯罪等。大數據對每一個公司的決策方式將發生變革－決策方式將基於資料和分析的結果，而不是依靠經驗和直覺。
　
資訊科技浪潮第一波是大型電腦，第二波是個人電腦，第三波是網路，第四波是社群媒體，第五波科技則是「大數據」。每一波的的資訊科技浪潮，總是帶來工作與生活方式的改變，創造大量商機、新的產業、大量的工作機會。像是在網路時代，創造了Google、Amazon 等大公司，以及無數.com 公司。
　
每一波浪潮開始時，需求的相關人才最多，但是此時也是相關人才供應最少。因此對個人而言，如果能在浪潮興起時就投入，往往成果最豐碩，並且有機會占有重要職位。像是網路剛興起時，每個公司都需要建立網站，但是相對這方面的人才不夠。那時候能撰寫網頁相關程式語言的工程師就能夠獲得高薪。但是後來投入的人越來越多，這方面的工程師就沒有那麼吃香了。
　
之前的科技浪潮，也許你沒有機會躬逢其盛，或是沒有機會在浪潮初期進入。但是大數據的浪潮方興未艾，正是進入的好時機。根據IBM 調查預估，大數據目前的商機是71 億美元，並將以每年增長20％速度持續成長，預計2015 年達到180 億美元。機會是給有準備的人，學會了大數據分析的相關技能，讓你有機會獲得更好的薪資與發展前景。根據美國調查機構Robert Half Technology 2016 年趨勢報告，在美國大數據工程師，薪水年成長8.9%，年薪大約13 萬至18 萬美金（約新台幣429 萬元~594 萬元）。因為人才短缺，企業不惜重金挖角。（你可以在google 搜尋Robert Half Technology 2016 就可以下載此調查報告）
　
本書的主題是Haddop+Spark大數據分析與機器學習。Hadoop 大家已經知道是運用最多的大數據平台，然而Spark 異軍突起，與Hadoop 相容而且執行速度更快，各大公司也開始加入Spark 開發。例如IBM 加入Apache Spark 社群打算培育百萬名資料科學家。Google 與微軟也分別應用了Spark 的功能來建置服務、發展大數據分析雲端與機器學習平臺。這些大公司的加入，也意味著未來更多公司會採用Hadoop+Spark 進行大數據資料分析。
　
然而目前市面上雖然很多大數據的書，但是多半偏向理論或應用層面的介紹，網路上的資訊雖然很多，但是也很雜亂。本書介紹希望能夠用淺顯易懂原理說明，再加上實機操作、範例程式，能夠降低大數據技術的學習門檻，帶領讀者進入大數據與機器學習的領域。當然整個大數據的生態系非常龐大，需要學習的東西太多。希望讀者能透過本書有了基本概念後，比較容易踏入這門領域，能繼續深入研究其他大數據的相關技術。

作者簡介：

林大貴

作者從事IT產業多年，涉獵系統設計、網站開發、數位行銷與商業智慧等多領域，具備豐富實務開發經驗。

Chapter01 大數據與機器學習
1-1 大數據定義
1-2 Hadoop 簡介
1-3 Hadoop HDFS 分散式檔案系統
1-4 Hadoop MapReduce 介紹
1-5 Spark 介紹
1-6 機器學習介紹

Chapter02 Virtual Box 虛擬機器軟體安裝
2-1 VirtualBox 下載安裝
2-2 設定Virtual Box 儲存資料夾
2-3 在VirtualBox 建立虛擬機器

Chapter03 Ubuntu Linux 作業系統安裝
3-1 下載Ubuntu 安裝光碟檔案
3-2 在Virtual Box 設定Ubuntu 虛擬光碟檔案
3-3 開始安裝Ubuntu
3-4 啟動Ubuntu
3-5 安裝Guest Additions
3-6 設定預設輸入法
3-7 設...

顯示全部內容

內容簡介

作者簡介：

林大貴

作者從事IT產業多年，涉獵系統設計、網站開發、數位行銷與商業智慧等多領域，具備豐富實務開發經驗。

顯示全部內容

保持聯繫
- 網站認證
- 網路資安防護
- 2024專利防護中
  - 讀冊生活團隊積極優化資安防護
  - 引入世界最大安全憑證供應商Comodo，英國原廠專利防護
  - 如梭世代專業團隊滲透測試專業顧問
  - 聯眾安信專業資安顧問團隊主導執行專案

學思行數位行銷股份有限公司統一編號：24342999 台灣台北市中山區長安東路一段23號三樓之2 | 會員服務使用條款 | 隱私權政策

電腦版 | 手機版

Hadoop＋Spark大數據巨量分析與機器學習整合開發實戰(二手書贈品)

商品資料

認識TAAZE

合作提案

顧客服務