【大數據時代必備的資料擷取與分析技能!】
在資訊爆炸的時代,網路就是一個龐大的資源庫,不論是「想找出最便宜的商品價格」、「想知道競爭者的商品資訊」、「分析時下流行的趨勢」、「想了解歷史股價」、「分析球員的打擊率、得分率」、「分析點閱率最高的影片做為行銷決策」、……等等,都可以輕易取得各種數據。
雖然數據來源不是問題,但要抓取、整理、分析龐大的資料,就需要一些工具及方法才能有效率地完成。本書實際教您使用 Python 的 Beautiful Soup、Pandas、Selenium 及 Scrapy 來建立爬蟲程式,並依不同的網頁型態使用對應的工具來抓取資料。在取得和儲存資料後,教您利用 Python的Matplotlib、Pandas、SeaBorn、Bokeh,將資料以視覺化的方式呈現,讓決策者能快速理解資料的【模式】、【趨勢】和【關聯性】。
本書特色 :
※從網路爬蟲→資料清理→資料視覺化,有效率地完成資料的探索及呈現。
※清楚解說 Python 各套件的使用時機
.【擷取靜態網頁資料】-CSS 選擇器+Beautiful Soup 及 lxml
.【擷取 Javascript 動態網頁資料】-Selenium
.【擷取整個網站資料】-Scrapy 框架
.【資料視覺化】-Matplotlib、Pandas、Seaborn、Bokeh
※列舉多項實例,讓您應用所學,實際擷取資料
.用 Beautiful Soup 爬取股價、電影、圖書等資訊
.用 Selenium 爬取旅館、食譜資訊
.用 Scrapy 爬取 Tutsplus 教學文件及 PTT 看板資訊
目錄
【Part 1 建立 Python 爬蟲程式 - 從網頁取得資料】
CHAPTER 1 HTML、JSON 與網路爬蟲的基礎
CHAPTER 2 從網路取得資料
CHAPTER 3 擷取靜態 HTML 網頁資料
CHAPTER 4 使用 CSS 選擇器爬取資料
CHAPTER 5 走訪 HTML 網頁取出資料與資料儲存
CHAPTER 6 使用 XPath 運算式與 lxml 套件建立爬蟲程式
CHAPTER 7 Selenium 表單互動與動態網頁擷取
CHAPTER 8 Scrapy 爬蟲框架
CHAPTER 9 Python 爬蟲程式實作案例
CHAPTER 10 將爬取資料存入 MySQL 資料庫
【Part 2 Python 資料視覺化 - 大數據分析】
CHAPTER 11 認識大數據分析-資料視覺化
CHAPTER 12 使用 Pandas 掌握你的資料
CHAPTER 13 Matplotlib 與 Pandas 資料視覺化
CHAPTER 14 Seaborn 統計資料視覺化
CHAPTER 15 Bokeh 互動圖表與儀表板
CHAPTER 16 Python 資料視覺化實作案例
附錄 A Python 程式語言與開發環境建立
【Part 1 建立 Python 爬蟲程式 - 從網頁取得資料】
CHAPTER 1 HTML、JSON 與網路爬蟲的基礎
CHAPTER 2 從網路取得資料
CHAPTER 3 擷取靜態 HTML 網頁資料
CHAPTER 4 使用 CSS 選擇器爬取資料
CHAPTER 5 走訪 HTML 網頁取出資料與資料儲存
CHAPTER 6 使用 XPath 運算式與 lxml 套件建立爬蟲程式
CHAPTER 7 Selenium 表單互動與動態網頁擷取
CHAPTER 8 Scrapy 爬蟲框架
CHAPTER 9 Python 爬蟲程式實作案例
CHAPTER 10 將爬取資料存入 MySQL 資料庫
【Part 2 Python 資料視覺化 - 大數據分析】
CHAPTER 11 認...
購物須知
關於二手書說明:
商品建檔資料為新書及二手書共用,因是二手商品,實際狀況可能已與建檔資料有差異,購買二手書時,請務必檢視商品書況、備註說明及書況影片,收到商品將以書況影片內呈現為準。若有差異時僅可提供退貨處理,無法換貨或再補寄。
商品版權法律說明:
TAAZE 單純提供網路二手書託售平台予消費者,並不涉入書本作者與原出版商間之任何糾紛;敬請各界鑒察。
退換貨說明:
二手書籍商品享有10天的商品猶豫期(含例假日)。若您欲辦理退貨,請於取得該商品10日內寄回。
二手影音商品(例如CD、DVD等),恕不提供10天猶豫期退貨。
二手商品無法提供換貨服務,僅能辦理退貨。如須退貨,請保持該商品及其附件的完整性(包含書籍封底之TAAZE物流條碼)。若退回商品無法回復原狀者,可能影響退換貨權利之行使或須負擔部分費用。
訂購本商品前請務必詳閱
退換貨原則、
二手CD、DVD退換貨說明。