【經(jīng)典書】圖數(shù)據(jù)挖掘算法,安全性及應(yīng)用數(shù)據(jù)派THU關(guān)注共 1671字,需瀏覽 4分鐘 ·2022-08-25 10:54來源:專知本文為書籍推薦,建議閱讀5分鐘這本書提供了圖數(shù)據(jù)挖掘方法的最先新綜述。圖數(shù)據(jù)非常強(qiáng)大,因?yàn)樗軌驗(yàn)閷ο笾g的任意關(guān)系建模,并在生物信息學(xué)、交通網(wǎng)絡(luò)、科學(xué)協(xié)作、萬維網(wǎng)和社交網(wǎng)絡(luò)等領(lǐng)域的一系列現(xiàn)實(shí)世界應(yīng)用中遇到它。圖數(shù)據(jù)挖掘用于從圖數(shù)據(jù)中發(fā)現(xiàn)有用的信息和知識。節(jié)點(diǎn)、鏈接和半結(jié)構(gòu)形式的復(fù)雜性對節(jié)點(diǎn)分類、鏈接預(yù)測、圖分類等計算任務(wù)提出了挑戰(zhàn)。在這種背景下,各種先進(jìn)的技術(shù),包括圖嵌入和圖神經(jīng)網(wǎng)絡(luò),最近被提出來提高圖數(shù)據(jù)挖掘的性能。這本書提供了圖數(shù)據(jù)挖掘方法的最先新綜述。本文針對當(dāng)前的一個熱門話題——圖數(shù)據(jù)挖掘的安全性,提出了一系列的檢測方法來識別圖數(shù)據(jù)中的敵對樣本。此外,還向讀者介紹了圖增廣和子圖網(wǎng)絡(luò),以進(jìn)一步增強(qiáng)模型,即提高模型的準(zhǔn)確性和魯棒性。最后,本書描述了這些先進(jìn)技術(shù)在各種場景中的應(yīng)用,如交通網(wǎng)絡(luò)、社交和技術(shù)網(wǎng)絡(luò)和區(qū)塊鏈。https://link.springer.com/book/10.1007/978-981-16-2609-8萬物相互作用,我們美麗的世界出現(xiàn)了。許多真實(shí)世界的系統(tǒng),無論是自然的還是人工的,都更自然地表示為圖形/網(wǎng)絡(luò),而不是歐氏空間中的坐標(biāo),以捕捉它們的拓?fù)鋵傩?。在生物學(xué)中,蛋白質(zhì)相互調(diào)節(jié),這種生理上的相互作用構(gòu)成了所謂的生物體的相互作用組學(xué);神經(jīng)元相互連接,處理大腦中的信號,導(dǎo)致了智能的出現(xiàn);物種之間相互依存,形成了復(fù)雜的生態(tài)系統(tǒng)。此外,現(xiàn)代交通系統(tǒng)連接了不同國家的不同城市,極大地便利了我們的旅行,使整個世界成為一個真正的地球村。如今,隨著我們進(jìn)入網(wǎng)絡(luò)空間,網(wǎng)絡(luò)似乎正在崛起。人們緊密聯(lián)系在一起,通過Facebook、微信、Twitter、微博等社交媒體平臺分享他們的觀點(diǎn)和個人興趣。我們可以使用諸如谷歌、百度和Yahoo等搜索引擎來搜索我們感興趣的內(nèi)容,這些系統(tǒng)的核心是一個巨大的網(wǎng)頁網(wǎng)絡(luò)。我們還可以通過電子銀行或基于區(qū)塊鏈的平臺(如以太坊)輕松轉(zhuǎn)賬。此外,一些強(qiáng)大的數(shù)據(jù)挖掘或人工智能技術(shù),如知識圖和深度神經(jīng)網(wǎng)絡(luò),也是網(wǎng)絡(luò)!雖然這些網(wǎng)絡(luò)促進(jìn)了個人之間的信息交流,使我們的生活比以前容易得多,但它們也可能促進(jìn)病毒的傳播,導(dǎo)致隱私泄露,例如,特定類型的關(guān)系可以推斷僅僅基于個人的社交網(wǎng)絡(luò)[1]。因此,有必要和迫切地研究方法來更好地了解這些網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu),從而在一定程度上預(yù)測并進(jìn)一步影響它們的演化。幸運(yùn)的是,圖論作為數(shù)學(xué)的一個分支,自1736[2]年歐拉創(chuàng)造性地研究K?nigsberg的七座橋以來,已經(jīng)得到了很好的建立。在這個大數(shù)據(jù)時代,越來越多的系統(tǒng)被描述為網(wǎng)絡(luò),并發(fā)布相應(yīng)的捕獲其結(jié)構(gòu)的圖數(shù)據(jù)進(jìn)行研究。這些圖吸引了眾多不同領(lǐng)域的研究者貢獻(xiàn)他們的才華,通過提出一系列結(jié)構(gòu)性質(zhì)[3],從微觀(節(jié)點(diǎn)和鏈接)、中觀(motif和社區(qū))到宏觀(整個網(wǎng)絡(luò))的觀點(diǎn)來觀察和進(jìn)一步測量它們。在行業(yè)中,許多著名的搜索引擎和推薦系統(tǒng)本質(zhì)上都是根據(jù)節(jié)點(diǎn)在相應(yīng)網(wǎng)絡(luò)中的結(jié)構(gòu)重要性對節(jié)點(diǎn)進(jìn)行排序,例如著名的PageRank[4]和協(xié)同過濾算法[5]。另一方面,在學(xué)術(shù)界,Strogatz等人[6]利用小世界網(wǎng)絡(luò)的短平均距離和大平均聚類系數(shù)來刻畫小世界網(wǎng)絡(luò),Barabási等人[7]用冪律度分布定義了無標(biāo)度網(wǎng)絡(luò)。這些研究引發(fā)了復(fù)雜網(wǎng)絡(luò)的發(fā)展。隨后,人們提出了各種不同的數(shù)學(xué)模型,對流行病和同步等不同類型的動力學(xué)進(jìn)行了仔細(xì)的模擬和分析。最近,圖嵌入技術(shù)被提出,如deepwalk[9]和node2vec[10],在網(wǎng)絡(luò)空間和歐幾里得空間之間架起橋梁 ;因此,可以采用機(jī)器學(xué)習(xí)算法來自動分析圖。很快,深度學(xué)習(xí)框架,如圖卷積網(wǎng)絡(luò)(GCN)[11,12]被提出,以進(jìn)一步促進(jìn)網(wǎng)絡(luò)的分析。在這本書中,我們主要關(guān)注圖表數(shù)據(jù)上典型的監(jiān)督學(xué)習(xí)。特別地,前三章介紹了最先進(jìn)的圖數(shù)據(jù)挖掘算法,包括節(jié)點(diǎn)分類、鏈接預(yù)測和圖分類,然后一章介紹了圖增強(qiáng),以進(jìn)一步增強(qiáng)現(xiàn)有的圖數(shù)據(jù)挖掘算法。第5章和第6章分別分析了這些算法在對抗攻擊下的脆弱性以及提高其魯棒性的方法。請注意,在第5章中,我們還將社區(qū)檢測的漏洞分析為無監(jiān)督學(xué)習(xí),以進(jìn)行全面綜述。瀏覽 24點(diǎn)贊 評論 收藏 分享 手機(jī)掃一掃分享分享 舉報 評論圖片表情視頻評價全部評論推薦 十大數(shù)據(jù)挖掘算法及各自優(yōu)勢大數(shù)據(jù)科學(xué)0DataHref數(shù)據(jù)挖掘算法及工具教程mllib、scikit等數(shù)據(jù)挖掘工具的教程。隨著大數(shù)據(jù)技術(shù)的普及,對數(shù)據(jù)挖掘的需求在不斷上升,本項(xiàng)目為一些常用的數(shù)據(jù)挖掘工具提供中文文檔,并提供一部分?jǐn)?shù)據(jù)挖掘算法的教程,仍在不斷更新中。數(shù)據(jù)挖掘算法DataHref數(shù)據(jù)挖掘算法及工具教程mllib、scikit 等數(shù)據(jù)挖掘工具的教程。隨著大數(shù)據(jù)技術(shù)的普及,對數(shù)據(jù)挖掘的需求在不斷上升,本數(shù)據(jù)挖掘十大算法 : 數(shù)據(jù)挖掘十數(shù)據(jù)挖掘十大算法 : 數(shù)據(jù)挖掘十0數(shù)據(jù)挖掘十大算法 : 數(shù)據(jù)挖掘十《世界著名計算機(jī)教材精選:數(shù)據(jù)挖掘十大算法》詳細(xì)介紹了在實(shí)際中用途最廣、影響最大的十種數(shù)據(jù)挖掘算法,數(shù)據(jù)挖掘與應(yīng)用數(shù)據(jù)挖掘與應(yīng)用0數(shù)據(jù)挖掘與應(yīng)用《數(shù)據(jù)挖掘與應(yīng)用》全面地介紹了數(shù)據(jù)挖掘的相關(guān)主題.包括數(shù)據(jù)理解與數(shù)據(jù)準(zhǔn)備、關(guān)聯(lián)規(guī)則挖掘、多元統(tǒng)計中的數(shù)據(jù)挖掘原理與算法《數(shù)據(jù)挖掘原理與算法》(第2版)是一本全面介紹數(shù)據(jù)挖掘和知識發(fā)現(xiàn)技術(shù)的專業(yè)書籍,它系統(tǒng)地闡述了數(shù)據(jù)挖數(shù)據(jù)挖掘原理與算法數(shù)據(jù)挖掘原理與算法028頁P(yáng)PT詳解騰訊數(shù)據(jù)挖掘體系及應(yīng)用大數(shù)據(jù)科學(xué)0點(diǎn)贊 評論 收藏 分享 手機(jī)掃一掃分享分享 舉報