【好書推薦】數(shù)據(jù)挖掘從基礎(chǔ)到進(jìn)階
↑↑↑點(diǎn)擊上方藍(lán)字,回復(fù)資料,10個G的驚喜

“數(shù)據(jù)是新時代的石油。”
——Clive Humby

在當(dāng)今的人工智能時代,數(shù)據(jù)分析和挖掘似乎已經(jīng)是一個很古老的話題。這也難怪,對數(shù)據(jù)的分析甚至可以追溯到中國第一經(jīng)—《易經(jīng)》這部遠(yuǎn)古文明的產(chǎn)物,至少17世紀(jì)就開始的數(shù)理統(tǒng)計(jì)學(xué)為數(shù)據(jù)分析準(zhǔn)備了齊全的數(shù)學(xué)工具,而領(lǐng)域公認(rèn)的第一個數(shù)據(jù)挖掘算法也早在27年前就發(fā)表了。
?
事實(shí)上,目前的人工智能的發(fā)展是由數(shù)據(jù)驅(qū)動的。從數(shù)據(jù)中挖掘得到的知識在很大程度上成就了人工智能的奇妙,比如機(jī)器翻譯、人臉識別、對話機(jī)器人等。目前人工智能所面臨的問題是推廣,也就是需要在各行各業(yè)將人工智能的能力發(fā)揮出來。這個能力的發(fā)揮在很大程度上依賴于數(shù)據(jù)的使用能力。而數(shù)據(jù)使用的難度源于數(shù)據(jù)的復(fù)雜性和多樣性,我們需要一系列處理數(shù)據(jù)的工具,也就是數(shù)據(jù)挖掘工具,它是人工智能、機(jī)器學(xué)習(xí)任務(wù)的一個重要部分。
?
在過去二十多年中,數(shù)據(jù)挖掘領(lǐng)域取得了很大的進(jìn)步,從計(jì)算機(jī)科學(xué)的角度來看尤其明顯。盡管傳統(tǒng)的概率與統(tǒng)計(jì)領(lǐng)域?qū)?shù)據(jù)分析已經(jīng)有了廣泛和深入的研究,但數(shù)據(jù)挖掘這個術(shù)語是由計(jì)算機(jī)科學(xué)相關(guān)的社區(qū)所創(chuàng)立的。對計(jì)算機(jī)科學(xué)家來說,計(jì)算的可擴(kuò)展性、可用性和計(jì)算的執(zhí)行都是極為重要的。
?
本期老胡為大家推薦幾本經(jīng)典的數(shù)據(jù)挖掘圖書。
?

《數(shù)據(jù)挖掘:原理與實(shí)踐(基礎(chǔ)篇)》

作者:[美] 查魯·C. 阿加沃爾
譯者:王曉陽、王建勇、禹曉輝、陳世敏
?
推薦理由:大數(shù)據(jù)和人工智能時代的數(shù)據(jù)挖掘教材和工具書。從四個“超級問題”出發(fā),不僅詳解數(shù)據(jù)挖掘的基礎(chǔ)知識,而且還介紹高級數(shù)據(jù)類型,結(jié)合復(fù)雜多樣的實(shí)際數(shù)據(jù)環(huán)境,探討數(shù)據(jù)挖掘的應(yīng)用場景和使用方法。
本書中文版分為基礎(chǔ)篇和進(jìn)階篇。基礎(chǔ)篇(包括原書的第1-13章)詳細(xì)介紹了針對數(shù)據(jù)挖掘的四個主要問題(聚類、分類、關(guān)聯(lián)模式挖掘和異常分析)的各種解決方法、用于文本數(shù)據(jù)領(lǐng)域的特定挖掘方法,以及對于數(shù)據(jù)流的挖掘應(yīng)用。
?
?

《數(shù)據(jù)挖掘:原理與實(shí)踐(進(jìn)階篇)》

作者:[美] 查魯·C. 阿加沃爾
譯者:王曉陽、王建勇、禹曉輝、陳世敏
?
推薦理由:大數(shù)據(jù)和人工智能時代的數(shù)據(jù)挖掘教材和工具書。從四個“超級問題”出發(fā),不僅詳解數(shù)據(jù)挖掘的基礎(chǔ)知識,而且還介紹高級數(shù)據(jù)類型,結(jié)合復(fù)雜多樣的實(shí)際數(shù)據(jù)環(huán)境,探討數(shù)據(jù)挖掘的應(yīng)用場景和使用方法。
進(jìn)階篇(包括原書的第14-20章)主要討論了用于不同數(shù)據(jù)領(lǐng)域(例如時序數(shù)據(jù)、序列數(shù)據(jù)、空間數(shù)據(jù)、圖數(shù)據(jù))的特定挖掘方法,以及重要的數(shù)據(jù)挖掘應(yīng)用(例如Web數(shù)據(jù)挖掘、排名、推薦、社交網(wǎng)絡(luò)分析和隱私保護(hù))。
?
?

《數(shù)據(jù)挖掘?qū)д摚ㄔ瓡?/span>2版)》

???點(diǎn)擊購買
作者:[美]陳封能
邁克爾·斯坦巴赫
阿努吉·卡帕坦
維平·庫瑪爾
譯者:段磊 張?zhí)鞈c 等
推薦理由:陳封能領(lǐng)銜編寫的數(shù)據(jù)挖掘經(jīng)典暢銷教材新版,斯坦福大學(xué)、密歇根州立大學(xué)、明尼蘇達(dá)大學(xué)、得克薩斯大學(xué)等知名高校的數(shù)據(jù)挖掘課程教材。從基礎(chǔ)概念和算法的角度介紹數(shù)據(jù)挖掘所使用的主要原理與技術(shù)。
?
?

《數(shù)據(jù)挖掘:概念與技術(shù)(原書第3版)》

作者:(美)Jiawei Han
Micheline Kamber
Jian Pei?
譯者:范明、孟小峰
推薦理由:數(shù)據(jù)挖掘領(lǐng)域最具里程碑意義的經(jīng)典著作,完整全面闡述該領(lǐng)域的重要知識和技術(shù)創(chuàng)新。引入了許多算法和實(shí)現(xiàn)示例,全部以易于理解的偽代碼編寫,適用于實(shí)際的大規(guī)模數(shù)據(jù)挖掘項(xiàng)目。討論了一些高級主題,例如挖掘面向?qū)ο蟮年P(guān)系型數(shù)據(jù)庫、空間數(shù)據(jù)庫、多媒體數(shù)據(jù)庫、時間序列數(shù)據(jù)庫、文本數(shù)據(jù)庫、萬維網(wǎng)以及其他領(lǐng)域的應(yīng)用等。全面而實(shí)用地給出用于從海量數(shù)據(jù)中獲取盡可能多信息的概念和技術(shù)。
也可以加一下老胡的微信 圍觀朋友圈~~~
推薦閱讀
(點(diǎn)擊標(biāo)題可跳轉(zhuǎn)閱讀)
【清華大學(xué)王東老師】現(xiàn)代機(jī)器學(xué)習(xí)技術(shù)導(dǎo)論.pdf
機(jī)器學(xué)習(xí)中令你事半功倍的pipeline處理機(jī)制
老鐵,三連支持一下,好嗎?↓↓↓
