資料科學的學習指引
“對任何想要使用Python開始機器學習的人,這本書是很棒且超實用的資源。真希望當我開始使用scikit-learn時有這本書!”
-Hanna Wallach, 微軟研究院資深研究員
機器學習已成為許多商業應用程式與研究專案的精華部分,但這個領域並不是大公司中規模龐大的研究團隊所獨有。就算是使用Python的初學者,這本書也能教會你實際的方法,來建立自己的機器學習解決方案。以現今可以取得的資料量來說,只要你能想到的,機器學習應用程式都能做到。
你將學習必要的步驟,使用Python和scikit-learn函式庫,來建立成功的機器學習應用程式。作者Andreas Müller和Sarah Guido聚焦於使用機器學習演算法的實務面向,而不是它們背後的數學。熟悉NumPy和matplotlib函式庫,將幫助你能從這本書獲益更多。
透過這本書,你將學到:
‧基本概念和機器學習應用程式
‧廣泛應用機器學習演算法的優點和缺點
‧使用機器學習如何重現資料,包含資料的重點面向
‧模型評估的進階方法和參數調整
‧對鏈結模型的pipeline概念和封裝工作流程
‧運作文字資料的方法,包含特定文字的處理技術
‧對改善機器學習和資料科學技巧的建議
作者簡介:
Andreas Müller 在波昂大學取得機器學習的博士學位。畢業後在Amazon擔任電腦視覺應用程式的機器學習研究員,之後他加入紐約大學資料科學中心。他也是scikit-learn的維護者與核心貢獻者之一。
Sarah Guido 是長期在新創公司工作的資料科學家,最近在Bitly擔任首席資料科學家。Sarah從密西根大學取得資訊科學碩士。
目錄
前言
chapter 01 導讀
chapter 02 監督式學習
chapter 03 非監督式學習和前處理
chapter 04 資料重現和特徵工程
chapter 05 評估和改善模型
chapter 06 演算法 Chains 和 Pipelines
chapter 07 使用文字資料工作
chapter 08 尾聲
索引
前言
chapter 01 導讀
chapter 02 監督式學習
chapter 03 非監督式學習和前處理
chapter 04 資料重現和特徵工程
chapter 05 評估和改善模型
chapter 06 演算法 Chains 和 Pipelines
chapter 07 使用文字資料工作
chapter 08 尾聲
索引
購物須知
退換貨說明:
會員均享有10天的商品猶豫期(含例假日)。若您欲辦理退換貨,請於取得該商品10日內寄回。
辦理退換貨時,請保持商品全新狀態與完整包裝(商品本身、贈品、贈票、附件、內外包裝、保證書、隨貨文件等)一併寄回。若退回商品無法回復原狀者,可能影響退換貨權利之行使或須負擔部分費用。
訂購本商品前請務必詳閱退換貨原則。