資料匯入、整理、變換、視覺化與模型建立
「Hadley Wickham是資料科學領域的傳奇,發明了一種從來沒人想過的全新方式來進行資料分析。他與Garrett Grolemund合著的這本新書詳細介紹了這種創新做法,它將會成為當代資料分析師的聖經。」
─Roger D. Peng, 生物統計學教授
Johns Hopkins大學Bloomberg公共衛生學院
學習如何使用R將原始資料轉化為洞見、知識和理解。本書為你介紹R、RStudio,還有tidyverse這個R套件集合,你將學會運用其中相輔相成的套件,使資料科學變得快速,流暢和有趣。《R 資料科學》是為了讓你能夠盡快開始實作資料科學而設計,適合以前沒有程式設計經驗的讀者。
作者Hadley Wickham和Garrett Grolemund將引導你走過資料的匯入、整理、探索,以及建立模型和傳達結果這些步驟。你將全面理解資料科學的運作週期,並獲得管理其中細節所需的基本工具。
你會學到如何
■ Wrangle:將你的資料集轉為方便分析的形式
■ Program:使用強大的R工具以更清楚且輕鬆的方式解決資料問題
■ Explore:審查你的資料,產生假設,並快速地測試它們
■ Model:提供低維摘要,捕捉你資料集所含的真實「訊號」
■ Communicate:使用R Markdown來整合說明文字、程式碼以及結果
作者簡介:
Hadley Wickham 是RStudio的首席科學家,也是R Foundation的成員。他建置使資料科學更容易、更快速、更有趣的工具(用於計算和輔助認知的都有)。更多資訊在他的網站 http://hadley.nz。
Garrett Grolemund 是RStudio的統計學家、教學人員以及大師級講師。他是《Hands-On Programming with R》(O’Reilly)的作者。Garrett的許多教學影片都可在oreilly.com/safari取得。
目錄
前言
第一部 探索
第一章 使用ggplot2 的資料視覺化
第二章 工作流程:基本知識
第三章 使用dplyr 進行資料變換
第四章 工作流程:指令稿
第五章 探索式資料分析
第六章 工作流程:專案
第二部 整頓(Wrangle)
第七章 Tibbles
第八章 使用readr 匯入資料
第九章 使用tidyr 整理資料
第十章 使用dplyr 的關聯式資料
第十一章 使用stringr 處理字串
第十二章 使用forcats 的因子
第十三章 使用lubridate 處理日期與時間
第三部 程式(Program)
第十四章 使用magrittr 的管線作業
第十五章 函式
第十六章 向量
第十七章 使用purrr 的迭代作業
第四部 模型
第十八章 使用modelr 的模型基礎
第十九章 模型建置
第二十章 使用purrr 和broom 的許多模型
第五部 溝通
第二十一章 R Markdown
第二十二章 使用ggplot2 建立溝通用的圖表
第二十三章 R Markdown 格式
第二十四章 R Markdown 工作流程
索引
前言
第一部 探索
第一章 使用ggplot2 的資料視覺化
第二章 工作流程:基本知識
第三章 使用dplyr 進行資料變換
第四章 工作流程:指令稿
第五章 探索式資料分析
第六章 工作流程:專案
第二部 整頓(Wrangle)
第七章 Tibbles
第八章 使用readr 匯入資料
第九章 使用tidyr 整理資料
第十章 使用dplyr 的關聯式資料
第十一章 使用stringr 處理字串
第十二章 使用forcats 的因子
第十三章 使用lubridate 處理日期與時間
第三部 程式(Program)
第十四章 使用magrittr 的管線作業
第十五章 函式...
購物須知
退換貨說明:
會員均享有10天的商品猶豫期(含例假日)。若您欲辦理退換貨,請於取得該商品10日內寄回。
辦理退換貨時,請保持商品全新狀態與完整包裝(商品本身、贈品、贈票、附件、內外包裝、保證書、隨貨文件等)一併寄回。若退回商品無法回復原狀者,可能影響退換貨權利之行使或須負擔部分費用。
訂購本商品前請務必詳閱退換貨原則。