本書曾經榮獲Jolt Productivity Award大獎
Facebook、Twitter和Linkedln產生了大量極具價值的社交資料,但是,要如何找出誰正在使用社群網站?他們在討論些什麼?或者他們在哪裡?這本簡潔而實用的書將告訴您答案。您可以從本書學到如何組合社群網站資料、分析這些資料的技術,以及如何將資料視覺化成為一目了然的資訊,以及您聞所未聞的有用資訊。
每個章節皆可獨立閱讀,分別介紹不同的資料探勘技術以及應用在不同的社群網站,同時還涵蓋了部落格與電子郵件。您唯一需要的就是具備程式設計的基礎以及學習基本Python工具的意願。
.對社群網站有更加深入的了解
.利用存放在Github上的腳本程式來探勘Twitter、Facebook和Linkedin等社群網站API中的資料
.學習如何使用簡單好用的Python工具來分析您取得的資料
.利用XHTML Friends Network探索微格(microformat)中的社交聯繫
.應用TF-IDF、餘弦相似性、搭配分析、文件摘要、小組辨識等先進探勘技術
.使用HTML5和JavaScript建立可視覺化資料
名人推薦
「本書提供了實際可用的方法,告訴您如何利用Python從社群網站擷取分析資料」--Jeff Hammerbacher, Cloudera首席科學家
「對於探索結構化與非結構化資料的工具、技術與理論,本書提供了翔實的介紹」--Alex Martelli, Google資深工程師
目錄
前言
第一章 緒論:Twitter 資料的處理
第二章 微格式:語義標記和常識碰撞
第三章 信箱:老套但好用
第四章 Twitter:朋友、追隨者和Setwise 操作
第五章 Twitter:tweet,tweet,全都是tweet
第六章 LinkedIn:為了樂趣(和利潤?)將職場網路分類
第七章 Google+:TF-IDF、餘弦相似性與搭配
第八章 部落格及其他:自然語言處理(等等)
第九章 Facebook:一體化的奇蹟
第十章 語義網:簡短的討論
索引
前言
第一章 緒論:Twitter 資料的處理
第二章 微格式:語義標記和常識碰撞
第三章 信箱:老套但好用
第四章 Twitter:朋友、追隨者和Setwise 操作
第五章 Twitter:tweet,tweet,全都是tweet
第六章 LinkedIn:為了樂趣(和利潤?)將職場網路分類
第七章 Google+:TF-IDF、餘弦相似性與搭配
第八章 部落格及其他:自然語言處理(等等)
第九章 Facebook:一體化的奇蹟
第十章 語義網:簡短的討論
索引
購物須知
退換貨說明:
會員均享有10天的商品猶豫期(含例假日)。若您欲辦理退換貨,請於取得該商品10日內寄回。
辦理退換貨時,請保持商品全新狀態與完整包裝(商品本身、贈品、贈票、附件、內外包裝、保證書、隨貨文件等)一併寄回。若退回商品無法回復原狀者,可能影響退換貨權利之行使或須負擔部分費用。
訂購本商品前請務必詳閱退換貨原則。