<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          用于圖神經(jīng)網(wǎng)絡(luò)研究的幾個(gè)實(shí)用的數(shù)據(jù)集

          共 1942字,需瀏覽 4分鐘

           ·

          2021-09-06 12:55

          來源:DeepHub IMBA

          本文約1500字,建議閱讀5分鐘 
          本文將為ML/DL圖網(wǎng)絡(luò)的研究提供一些實(shí)用的數(shù)據(jù)集。

          隨著人工智能的興起,機(jī)器學(xué)習(xí)(ML)和深度學(xué)習(xí)(DL)得到了迅速發(fā)展,并應(yīng)用于計(jì)算機(jī)視覺(CV)、自然語言處理(NLP)、推薦等諸多領(lǐng)域。一些研究已經(jīng)發(fā)展出將ML/DL應(yīng)用于社交網(wǎng)絡(luò)、社區(qū)分類、腦網(wǎng)絡(luò)分析等網(wǎng)絡(luò)任務(wù)的方法。在這些任務(wù)中,數(shù)據(jù)由圖G(V,E)表示,其中V是節(jié)點(diǎn)的集合,E是邊的集合:節(jié)點(diǎn)表示數(shù)據(jù)點(diǎn),邊表示節(jié)點(diǎn)之間的連接。圖數(shù)據(jù)集上的ML/DL是一項(xiàng)新的研究課題,有許多方面需要研究。因此,擁有有趣和實(shí)用的數(shù)據(jù)集將有助于研究和開發(fā)過程。本文將為ML/DL圖網(wǎng)絡(luò)的研究提供一些實(shí)用的數(shù)據(jù)集。

          Yelp數(shù)據(jù)集



          yelp是美國版的大眾點(diǎn)評(píng),這將是一個(gè)有趣的鏈接預(yù)測數(shù)據(jù)集,可以應(yīng)用于推薦任務(wù)。鏈路預(yù)測任務(wù)的目的是學(xué)習(xí)一個(gè)模型,可以預(yù)測兩個(gè)節(jié)點(diǎn)之間的鏈路在未來是否會(huì)連接。數(shù)據(jù)集包括關(guān)于用戶、業(yè)務(wù)和點(diǎn)評(píng)信息的json文件。它還包含商家的照片。該數(shù)據(jù)集可用于許多任務(wù),是ML/DL任務(wù)的理想實(shí)用數(shù)據(jù)集。

          這里下載:
          https://www.yelp.com/dataset


          亞馬遜評(píng)論數(shù)據(jù)集



          與 Yelp 數(shù)據(jù)集類似,亞馬遜評(píng)論數(shù)據(jù)集收集有關(guān)產(chǎn)品(包括照片、星級(jí)評(píng)分、元數(shù)據(jù)、產(chǎn)品描述)、用戶(元數(shù)據(jù)、好友連接、名稱、位置……)以及用戶對(duì)產(chǎn)品的評(píng)論的信息。該數(shù)據(jù)集非常適合鏈接預(yù)測和節(jié)點(diǎn)分類任務(wù):與 yelp 類似,鏈接預(yù)測將在電子商務(wù)中具有實(shí)用的推薦應(yīng)用;節(jié)點(diǎn)分類任務(wù)將應(yīng)用于對(duì)銷售服務(wù)的產(chǎn)品進(jìn)行評(píng)級(jí)。從學(xué)術(shù)角度來看,它可以用于實(shí)現(xiàn)許多實(shí)驗(yàn),包括:異構(gòu)圖、關(guān)系圖以及知識(shí)圖實(shí)驗(yàn)。評(píng)論總數(shù)為 2.331 億(從 1996 年 5 月到 2018 年 10 月)。

          可以通過 https://nijianmo.github.io/amazon/index.html 訪問數(shù)據(jù)集。


          Flickr 數(shù)據(jù)集



          這個(gè)數(shù)據(jù)集是通過在共享Flickr公共圖像之間形成鏈接來構(gòu)建的。邊是通過來自同一位置的圖片、提交到同一個(gè)圖庫、組或集合的圖片、共享共同標(biāo)簽的圖片、朋友拍攝的圖片等之間形成的。數(shù)據(jù)集從許多來源收集,圖像由 SIFT 表示 從它們中提取的特征。該數(shù)據(jù)集包括 105938 張圖像和 2316948 個(gè)圖像之間的鏈接。該數(shù)據(jù)集非常適合 CV 任務(wù):圖像分類、對(duì)象檢測和分割。我相信通過圖 ML/DL 的聚合過程,它將提高 ML/DL 模型的健壯性和可信度。

          可以通過以下連接訪問數(shù)據(jù)集。

          https://snap.stanford.edu/data/web-flickr.html

          https://lms.comp.nus.edu.sg/wp-content/uploads/2019/research/nuswide/NUS-WIDE.html


          假新聞/健康數(shù)據(jù)集



          隨著社交媒體的興起,新聞傳播得更快、更有效。但是,大多數(shù)新聞質(zhì)量低且不可信。目前已經(jīng)進(jìn)行了許多研究來解決假新聞檢測的問題。大多數(shù)工作都是通過 NLP 模型來解決這個(gè)問題的。但是我們也可以通過圖 ML/DL 來解決這個(gè)問題,因?yàn)樵夹侣労凸蚕硇侣動(dòng)泻芏喙餐c(diǎn),它們的聯(lián)系可以用來解決問題。解決問題的拓?fù)淇赡苁且环N新穎的觀點(diǎn)和方法,可以提高性能和魯棒性。數(shù)據(jù)由 FakeNewsTracker 檢索,從 Twitter 和許多其他社交媒體頁面中提取新聞。該數(shù)據(jù)集非常適合圖 ML/DL 中的許多任務(wù):節(jié)點(diǎn)分類、鏈接預(yù)測和圖分類。

          數(shù)據(jù)集地址如下:
          https://github.com/KaiDMML/FakeNewsNet
          https://zenodo.org/record/3841644#.YSGPRC1h1GM


          SNAP數(shù)據(jù)集



          斯坦福網(wǎng)絡(luò)分析平臺(tái)(SNAP)是一個(gè)通用的網(wǎng)絡(luò)分析和圖挖掘庫。它是用c++編寫的,很容易擴(kuò)展到具有數(shù)億個(gè)節(jié)點(diǎn)和數(shù)十億條邊的大規(guī)模網(wǎng)絡(luò)。它有效地操作大型圖,計(jì)算結(jié)構(gòu)屬性,生成規(guī)則和隨機(jī)圖,并支持節(jié)點(diǎn)和邊上的屬性。

          這個(gè)項(xiàng)目有很多小/中/大的圖形數(shù)據(jù)集。然而,它們中的大多數(shù)對(duì)于實(shí)際應(yīng)用程序是不實(shí)用的。但是,這些數(shù)據(jù)集可以應(yīng)用到理論研究中,從而提高應(yīng)用效率。


          地址如下:
          https://snap.stanford.edu/


          總結(jié)


          在本文中,我介紹了一些用于ML/DL實(shí)驗(yàn)的有趣且實(shí)用的數(shù)據(jù)集。希望這篇文章能對(duì)你的研究有所幫助。感謝閱讀這篇文章。

          編輯:文婧

          校對(duì):林亦霖


          瀏覽 26
          點(diǎn)贊
          評(píng)論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          評(píng)論
          圖片
          表情
          推薦
          點(diǎn)贊
          評(píng)論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  在线国产激情视频 | 操逼逼逼逼逼逼逼逼 | 99热000 | 欧美交换乱婬A片免费 | 日韩国产一级无码 |