本書曾經榮獲Jolt Productivity Award大獎
Facebook、Twitter和Linkedln產生了大量極具價值的社交資料,但是,要如何找出誰正在使用社群網站?他們在討論些什麼?或者他們在哪裡?這本簡潔而實用的書將告訴您答案。您可以從本書學到如何組合社群網站資料、分析這些資料的技術,以及如何將資料視覺化成為一目了然的資訊,以及您聞所未聞的有用資訊。
每個章節皆可獨立閱讀,分別介紹不同的資料探勘技術以及應用在不同的社群網站,同時還涵蓋了部落格與電子郵件。您唯一需要的就是具備程式設計的基礎以及學習基本Python工具的意願。
.對社群網站有更加深入的了解
.利用存放在Github上的腳本程式來探勘Twitter、Facebook和Linkedin等社群網站API中的資料
.學習如何使用簡單好用的Python工具來分析您取得的資料
.利用XHTML Friends Network探索微格(microformat)中的社交聯繫
.應用TF-IDF、餘弦相似性、搭配分析、文件摘要、小組辨識等先進探勘技術
.使用HTML5和JavaScript建立可視覺化資料
名人推薦
「本書提供了實際可用的方法,告訴您如何利用Python從社群網站擷取分析資料」--Jeff Hammerbacher, Cloudera首席科學家
「對於探索結構化與非結構化資料的工具、技術與理論,本書提供了翔實的介紹」--Alex Martelli, Google資深工程師
目錄
前言
第一章 緒論:Twitter 資料的處理
第二章 微格式:語義標記和常識碰撞
第三章 信箱:老套但好用
第四章 Twitter:朋友、追隨者和Setwise 操作
第五章 Twitter:tweet,tweet,全都是tweet
第六章 LinkedIn:為了樂趣(和利潤?)將職場網路分類
第七章 Google+:TF-IDF、餘弦相似性與搭配
第八章 部落格及其他:自然語言處理(等等)
第九章 Facebook:一體化的奇蹟
第十章 語義網:簡短的討論
索引
前言
第一章 緒論:Twitter 資料的處理
第二章 微格式:語義標記和常識碰撞
第三章 信箱:老套但好用
第四章 Twitter:朋友、追隨者和Setwise 操作
第五章 Twitter:tweet,tweet,全都是tweet
第六章 LinkedIn:為了樂趣(和利潤?)將職場網路分類
第七章 Google+:TF-IDF、餘弦相似性與搭配
第八章 部落格及其他:自然語言處理(等等)
第九章 Facebook:一體化的奇蹟
第十章 語義網:簡短的討論
索引
購物須知
關於二手書說明:
商品建檔資料為新書及二手書共用,因是二手商品,實際狀況可能已與建檔資料有差異,購買二手書時,請務必檢視商品書況、備註說明及書況影片,收到商品將以書況影片內呈現為準。若有差異時僅可提供退貨處理,無法換貨或再補寄。
商品版權法律說明:
TAAZE 單純提供網路二手書託售平台予消費者,並不涉入書本作者與原出版商間之任何糾紛;敬請各界鑒察。
退換貨說明:
二手書籍商品享有10天的商品猶豫期(含例假日)。若您欲辦理退貨,請於取得該商品10日內寄回。
二手影音商品(例如CD、DVD等),恕不提供10天猶豫期退貨。
二手商品無法提供換貨服務,僅能辦理退貨。如須退貨,請保持該商品及其附件的完整性(包含書籍封底之TAAZE物流條碼)。若退回商品無法回復原狀者,可能影響退換貨權利之行使或須負擔部分費用。
訂購本商品前請務必詳閱
退換貨原則、
二手CD、DVD退換貨說明。