資料科學的學習指引
“對任何想要使用Python開始機器學習的人,這本書是很棒且超實用的資源。真希望當我開始使用scikit-learn時有這本書!”
-Hanna Wallach, 微軟研究院資深研究員
機器學習已成為許多商業應用程式與研究專案的精華部分,但這個領域並不是大公司中規模龐大的研究團隊所獨有。就算是使用Python的初學者,這本書也能教會你實際的方法,來建立自己的機器學習解決方案。以現今可以取得的資料量來說,只要你能想到的,機器學習應用程式都能做到。
你將學習必要的步驟,使用Python和scikit-learn函式庫,來建立成功的機器學習應用程式。作者Andreas Müller和Sarah Guido聚焦於使用機器學習演算法的實務面向,而不是它們背後的數學。熟悉NumPy和matplotlib函式庫,將幫助你能從這本書獲益更多。
透過這本書,你將學到:
‧基本概念和機器學習應用程式
‧廣泛應用機器學習演算法的優點和缺點
‧使用機器學習如何重現資料,包含資料的重點面向
‧模型評估的進階方法和參數調整
‧對鏈結模型的pipeline概念和封裝工作流程
‧運作文字資料的方法,包含特定文字的處理技術
‧對改善機器學習和資料科學技巧的建議
作者簡介:
Andreas Müller 在波昂大學取得機器學習的博士學位。畢業後在Amazon擔任電腦視覺應用程式的機器學習研究員,之後他加入紐約大學資料科學中心。他也是scikit-learn的維護者與核心貢獻者之一。
Sarah Guido 是長期在新創公司工作的資料科學家,最近在Bitly擔任首席資料科學家。Sarah從密西根大學取得資訊科學碩士。
目錄
前言
chapter 01 導讀
chapter 02 監督式學習
chapter 03 非監督式學習和前處理
chapter 04 資料重現和特徵工程
chapter 05 評估和改善模型
chapter 06 演算法 Chains 和 Pipelines
chapter 07 使用文字資料工作
chapter 08 尾聲
索引
前言
chapter 01 導讀
chapter 02 監督式學習
chapter 03 非監督式學習和前處理
chapter 04 資料重現和特徵工程
chapter 05 評估和改善模型
chapter 06 演算法 Chains 和 Pipelines
chapter 07 使用文字資料工作
chapter 08 尾聲
索引
購物須知
關於二手書說明:
商品建檔資料為新書及二手書共用,因是二手商品,實際狀況可能已與建檔資料有差異,購買二手書時,請務必檢視商品書況、備註說明及書況影片,收到商品將以書況影片內呈現為準。若有差異時僅可提供退貨處理,無法換貨或再補寄。
商品版權法律說明:
TAAZE 單純提供網路二手書託售平台予消費者,並不涉入書本作者與原出版商間之任何糾紛;敬請各界鑒察。
退換貨說明:
二手書籍商品享有10天的商品猶豫期(含例假日)。若您欲辦理退貨,請於取得該商品10日內寄回。
二手影音商品(例如CD、DVD等),恕不提供10天猶豫期退貨。
二手商品無法提供換貨服務,僅能辦理退貨。如須退貨,請保持該商品及其附件的完整性(包含書籍封底之TAAZE物流條碼)。若退回商品無法回復原狀者,可能影響退換貨權利之行使或須負擔部分費用。
訂購本商品前請務必詳閱
退換貨原則、
二手CD、DVD退換貨說明。