社交網(wǎng)站的數(shù)據(jù)挖掘與分析
Facebook、Twitter和LinkedIn產(chǎn)生了大量寶貴的社交數(shù)據(jù),但是你怎樣才能找出誰通過社交媒介正在進行聯(lián)系?他們在討論些什么?或者他們在哪兒?這本簡潔而且具有可操作性的書將揭示如何回答這些問題甚至更多的問題。你將學(xué)到如何組合社交網(wǎng)絡(luò)數(shù)據(jù)、分析技術(shù),如何通過可視化幫助你找到你一直在社交世界中尋找的內(nèi)容,以及你聞所未聞的有用信息。
每個獨立的章節(jié)介紹了在社交網(wǎng)絡(luò)的不同領(lǐng)域挖掘數(shù)據(jù)的技術(shù),這些領(lǐng)域包括博客和電子郵件。你所需要具備的就是一定的編程經(jīng)驗和學(xué)習(xí)基本的Python工具的意愿。
?獲得對社交網(wǎng)絡(luò)世界的直觀認識
?使用GitHub上靈活的腳本來獲取從諸如Twitter、Facebook和LinkedIn之類的社交網(wǎng)絡(luò)API中的數(shù)據(jù)
?學(xué)習(xí)如何應(yīng)用便捷的Python工具來交叉分析你所收集的數(shù)據(jù)
?通過XHTML朋友圈探討基于微格式的社交聯(lián)系...
Facebook、Twitter和LinkedIn產(chǎn)生了大量寶貴的社交數(shù)據(jù),但是你怎樣才能找出誰通過社交媒介正在進行聯(lián)系?他們在討論些什么?或者他們在哪兒?這本簡潔而且具有可操作性的書將揭示如何回答這些問題甚至更多的問題。你將學(xué)到如何組合社交網(wǎng)絡(luò)數(shù)據(jù)、分析技術(shù),如何通過可視化幫助你找到你一直在社交世界中尋找的內(nèi)容,以及你聞所未聞的有用信息。
每個獨立的章節(jié)介紹了在社交網(wǎng)絡(luò)的不同領(lǐng)域挖掘數(shù)據(jù)的技術(shù),這些領(lǐng)域包括博客和電子郵件。你所需要具備的就是一定的編程經(jīng)驗和學(xué)習(xí)基本的Python工具的意愿。
?獲得對社交網(wǎng)絡(luò)世界的直觀認識
?使用GitHub上靈活的腳本來獲取從諸如Twitter、Facebook和LinkedIn之類的社交網(wǎng)絡(luò)API中的數(shù)據(jù)
?學(xué)習(xí)如何應(yīng)用便捷的Python工具來交叉分析你所收集的數(shù)據(jù)
?通過XHTML朋友圈探討基于微格式的社交聯(lián)系
?應(yīng)用諸如TF-IDF、余弦相似性、搭配分析、文檔摘要、派系檢測之類的先進挖掘技術(shù)
?通過基于HTML5和JavaScript工具包的網(wǎng)絡(luò)技術(shù)建立交互式可視化
馬修·羅塞爾(Matthew A.Russell),Digital Reasoning Systems公司的技術(shù)副總裁和Zaffra公司的負責人,是熱愛數(shù)據(jù)挖掘、開源和Web應(yīng)用技術(shù)的計算機科學(xué)家。他也是《Dojo: The Dofinitive Guide》(O'Reilly出版社)的作者。在LinkedIn上聯(lián)系他或在Twitter上關(guān)注@ptwobrussell,可隨時關(guān)注他的最新動態(tài)。
