從事資料科學方面的工作時,活用各種相關函式庫、軟體框架、模組、工具包是很好的做法,但如果原本完全不懂資料科學,從頭開始也是一種不錯的做法。本書將採取土法煉鋼從頭學起的方式,帶領讀者認識與資料科學相關的許多工具與演算法。
你只要具備基本的數學能力,以及程式設計的基礎,本書就可以幫你在遇到相關的數學與統計知識時,不至於感到害怕,而且還能讓你學會一個資料科學家所需具備的相關駭客技術。如今到處充斥著各種雜亂的數據資料,其中包含許多問題的解答,但也有很多微妙之處,甚至連問題本身都還沒被提出來過。如果你真心想要挖掘問題的解答,本書將可以提供你一些相關的知識。
.首先來一堂Python速成班
.學習線性代數、統計、機率的基礎知識——並學會何時、如何在資料科學領域中靈活運用這些知識
.搜集、探索、清理、轉換、處理各種數據資料
.深入理解機器學習的基礎
.靈活運用像是k最近鄰、單純貝氏、線性與邏輯迴歸、決策樹、神經網路、集群等種種模型
.探討推薦系統、自然語言處理、網路分析、MapReduce與資料庫的相關知識
「Joel帶領我們領略探索資料科學,讓我們從一般的好奇心,進入到更深入的理解,並學會所有資料科學家都應該知道的各種實用演算法。」
——Rohit Sivaprasad, Soylent公司資料科學家
作者簡介:
Joel Grus
是一位目前任職於Google的一位軟體工程師,之前也曾在幾家新創公司擔任過資料科學家的工作。目前住在西雅圖,愉快地從事著資料科學方面的工作。他會不定期進行更新部落格joelgrus.com,推特帳號是@joelgrus。
推薦序
如果想學好駭客技術,最好的方法還是設法去找個東西來駭一下。閱讀本書之後,你就會瞭解我駭東西的做法,不過對你來說,我的做法倒不一定是最好的做法。另外,你也會對我所使用的工具有相當多的了解,但對你而言那些工具也不一定是最好用的工具。你還會相當熟悉我處理數據問題的做法,而你自己在解決數據問題時,那同樣不見得是最好的做法。我的目的(和期待),就是希望我的例子能激發你,用你自己的方式去嘗試。本書所有程式碼和數據資料,全都可以在GitHub上取得,希望你能有個好的開始。
如果想學好駭客技術,最好的方法還是設法去找個東西來駭一下。閱讀本書之後,你就會瞭解我駭東西的做法,不過對你來說,我的做法倒不一定是最好的做法。另外,你也會對我所使用的工具有相當多的了解,但對你而言那些工具也不一定是最好用的工具。你還會相當熟悉我處理數據問題的做法,而你自己在解決數據問題時,那同樣不見得是最好的做法。我的目的(和期待),就是希望我的例子能激發你,用你自己的方式去嘗試。本書所有程式碼和數據資料,全都可以在GitHub上取得,希望你能有個好的開始。
目錄
第1章 簡介
第2章 Python速成班
第3章 數據視覺化
第4章 線性代數
第5章 統計學
第6章 機率
第7章 假設與推論
第8章 梯度遞減
第9章 取得數據資料
第10章 處理數據資料
第11章 機器學習
第12章 k最近鄰
第13章 單純貝氏
第14章 簡單線性迴歸
第15章 多元迴歸
第16章 邏輯迴歸
第17章 決策樹
第18章 神經網路
第19章 集群
第20章 自然語言處理
第21章 網路分析
第22章 推薦系統
第23章 資料庫與SQL
第24章 MapReduce
第25章 勇往直前,資料科學做就對了
第1章 簡介
第2章 Python速成班
第3章 數據視覺化
第4章 線性代數
第5章 統計學
第6章 機率
第7章 假設與推論
第8章 梯度遞減
第9章 取得數據資料
第10章 處理數據資料
第11章 機器學習
第12章 k最近鄰
第13章 單純貝氏
第14章 簡單線性迴歸
第15章 多元迴歸
第16章 邏輯迴歸
第17章 決策樹
第18章 神經網路
第19章 集群
第20章 自然語言處理
第21章 網路分析
第22章 推薦系統
第23章 資料庫與SQL
第24章 MapReduce
第25章 勇往直前,資料科學做就對了
購物須知
退換貨說明:
會員均享有10天的商品猶豫期(含例假日)。若您欲辦理退換貨,請於取得該商品10日內寄回。
辦理退換貨時,請保持商品全新狀態與完整包裝(商品本身、贈品、贈票、附件、內外包裝、保證書、隨貨文件等)一併寄回。若退回商品無法回復原狀者,可能影響退換貨權利之行使或須負擔部分費用。
訂購本商品前請務必詳閱退換貨原則。