網站擷取：使用Python 第二版- TAAZE 讀冊生活

首頁 >
二手中文書 >
電腦 >
程式語言 >
網站擷取：使用Python 第二版

網站擷取：使用Python 第二版（二手書）

作者：Ryan Mitchell

評價

5收藏

定價：NT$ 580

二手價：71 折，NT$ 410

賣家：CY

書況(讀冊判定)：良好

備註(賣家自填)：無畫線註記

商品備註與退貨說明

限量商品已售完

其他版本：

購買新書
95折 551元

其他二手價
36折 209元起

限量商品已售完

買了這本書的人也買了

商品資料

作者：Ryan Mitchell譯者：楊尊一

出版社：歐萊禮出版日期：2018-10-09ISBN/ISSN：9789864769261

語言：繁體中文裝訂方式：平裝頁數：280頁開數：18K

類別：二手書>中文書>電腦>程式語言類別有誤？

標籤：

目前無標籤

您的標籤：

新增您自己的標籤

文字字級

內容簡介:在現代網路蒐集資料

「本書涵蓋的工具與範例，讓我輕易把好幾個重複的工作自動化，騰出時間解決更多有趣的問題。這是本重視成果、內容從實務問題與解法出發，又能很快讀完的好書。」
— Eric VanWyk, 電子計算機工程師，麻州歐林工程學院

如果程式設計是魔術，那麼網站擷取當然是一種魔法。你可以撰寫簡單的自動化程式查詢網頁伺服器、請求資料、並解析所需的資訊。本書不只介紹網頁擷取，還包含擷取各種現代網站資料的詳盡指南。

本書第一部份專注於網站擷取機制：使用Python從網頁伺服器取得資料、執行伺服器回應的基本處理工作、以及與網站的自動化互動。第二部分探索適用於不同擷取場景的各種工具與應用程式。

‧解析複雜HTML網頁
‧以Scrapy架構開發爬行程序
‧學習爬行資料的儲存方式
‧從文件讀取與提煉資料
‧清理格式不良的資料
‧以自然語言讀寫
‧透過表單與登入的爬行
‧JavaScript與API爬行
‧使用影像文字識別軟體
‧避開爬行陷阱與機器人阻擋程序
‧使用爬行程序測試你的網站

章節說明:前言

第一部建構擷取程序
第一章你的第一個擷取程序
第二章進階HTML解析
第三章撰寫網站爬行程序
第四章網站爬行模型
第五章 Scrapy
第六章儲存資料

第二部儲存資料
第七章讀取文件
第八章清理髒資料
第九章讀寫自然語言
第十章表單與登入
第十一章與擷取相關的JavaScript
第十二章透過API 爬行
第十三章影像處理與文字辨識
第十四章避開擷取陷阱
第十五章以爬行程序測試你的網站
第十六章平行擷取網站
第十七章遠端擷取
第十八章網站擷取的法規與道德

索引

顯示全部內容

購物須知

關於二手書說明：

商品建檔資料為新書及二手書共用，因是二手商品，實際狀況可能已與建檔資料有差異，購買二手書時，請務必檢視商品書況、備註說明及書況影片，收到商品將以書況影片內呈現為準。若有差異時僅可提供退貨處理，無法換貨或再補寄。

商品版權法律說明：

TAAZE 單純提供網路二手書託售平台予消費者，並不涉入書本作者與原出版商間之任何糾紛；敬請各界鑒察。

退換貨說明：

二手書籍商品享有10天的商品猶豫期（含例假日）。若您欲辦理退貨，請於取得該商品10日內寄回。

二手影音商品（例如CD、DVD等），恕不提供10天猶豫期退貨。

二手商品無法提供換貨服務，僅能辦理退貨。如須退貨，請保持該商品及其附件的完整性(包含書籍封底之TAAZE物流條碼)。若退回商品無法回復原狀者，可能影響退換貨權利之行使或須負擔部分費用。

訂購本商品前請務必詳閱退換貨原則、二手CD、DVD退換貨說明。

發表評論