來看看幾篇Nature上的GNN吧~
大家好!我是Charmve,
隨著該領域的成熟,圖神經(jīng)網(wǎng)絡論文的數(shù)量也在增長,作者仔細研究了一些科學應用,并收集了幾篇發(fā)表在Nature上的GNN論文。
我們周圍的很多信息都可以用圖表來表示。一個例子是城市道路網(wǎng)絡,其中交叉口是節(jié)點,道路是鏈接。另一個是調控網(wǎng)絡,它描述了不同基因如何相互作用以增強或抑制某些細胞功能。圖神經(jīng)網(wǎng)絡(GNN)可以處理基于圖的信息以進行預測。在在 2022 年 3 月 23 日的《Nature Machine Intelligence》的一篇論文中,Xue Jiawei 團隊基于全球 30 個城市的城市道路網(wǎng)絡拓撲特征,使用 GNN 研究和預測社會經(jīng)濟特征。
論文鏈接:https://www.nature.com/articles/s42256-021-00325-y在過去的二十年里,高通量測序技術與表觀遺傳和轉錄組分子數(shù)據(jù)相結合,為基因組學提供了豐富的信息,其中一些可以被挖掘來識別致癌基因。近年來,癌癥基因如何導致細胞生長的圖景變得更加復雜:癌癥可以通過DNA序列水平上基因突變以外的多種途徑發(fā)生,表觀遺傳機制或調控區(qū)域中間接激活或沉默其他基因的非編碼突變也可以發(fā)揮作用。多組學數(shù)據(jù)集可以闡明這些過程。數(shù)據(jù)可以建模為生物網(wǎng)絡或圖形,其中節(jié)點代表基因,鏈接代表基因-基因相互作用。研究人員使用了一種高級類型的 GNN——圖卷積網(wǎng)絡——它可以根據(jù)節(jié)點特征向量和網(wǎng)絡拓撲對網(wǎng)絡中未標記的節(jié)點進行分類。通過他們的方法,利用多維多組學節(jié)點特征以及蛋白質-蛋白質相互作用網(wǎng)絡的拓撲特征,不僅可以識別高度突變的癌癥基因,還可以識別包含其他類型改變的基因,或與其他癌癥基因相互作用的基因。該研究將來自 16 種癌癥類型的基因組數(shù)據(jù)輸入該方法,確定了 165 個可能導致癌癥的新候選基因。Schulte-Sasse 團隊使用的機器學習方法——帶有圖卷積網(wǎng)絡的半監(jiān)督分類——由 Kipf 和 Welling 于 2017 年的一篇開創(chuàng)性論文中被引入。
論文鏈接:https://arxiv.org/abs/1609.02907在過去的 5 年里,它刺激了基于圖的機器學習的許多進步。Haghir Chehreghani 在 2022 年 3 月 23 日的《Nature Machine Intelligence》發(fā)表的一篇新聞與觀點文章重點介紹了這篇論文,并討論了該方法的效率、可解釋性和可擴展性。
論文鏈接:https://www.nature.com/articles/s42256-022-00466-8分子預測和藥物發(fā)現(xiàn)是基于圖的方法的另一個領域。幾十年來,該領域以各種創(chuàng)造性的方式使用機器學習,與表示分子的不同方法相關聯(lián)。一種方法是將分子表示為線性字符串(也稱為「簡化的分子輸入行輸入系統(tǒng)」或「SMILES」),這適用于自然語言處理中的深度學習方法。或者說,為了保留分子的拓撲信息,可以將它們表示為圖,以原子為節(jié)點,以鍵為鏈接。Wang Yuyang 團隊最近的一篇論文。描述了一種基于自我監(jiān)督 GNN 的方法,以解決與潛在生物活性分子的巨大空間(被認為是 10^60 級)相比,分子標記數(shù)據(jù)相對稀缺的問題。研究人員的框架在一個包含大約 1000 萬個分子的大型未標記數(shù)據(jù)集上進行了訓練,并學習了可用于區(qū)分化學性質的分子表示。
論文鏈接:https://www.nature.com/articles/s42256-022-00447-x考慮到具有相同拓撲結構的分子的不同異構體可能具有不同的化學性質,可以添加到分子圖形表示中的另一個組件是它們的幾何結構。Fang xiaomin 團隊最近的一篇論文。描述了如何在幾何增強的 GNN 方法中對分子的拓撲結構和幾何結構進行編碼可以改進分子特性預測。
論文鏈接:https://www.nature.com/articles/s42256-021-00438-4正如 Chehreghani 所強調的,仍然需要為 GNN 開發(fā)一個更好的理論框架,并更好地理解它們的局限性。鑒于越來越多的復雜、高度連接的數(shù)據(jù),更基礎的理解將刺激 GNN 在許多領域的進一步令人興奮的應用。該社論以「The graph connection」為題,于 2022 年 3 月 23 日發(fā)布在《Nature Machine Intelligence》。
參考內容:https://www.nature.com/articles/s42256-022-00476-6
隨著該領域的成熟,圖神經(jīng)網(wǎng)絡論文的數(shù)量也在增長,作者仔細研究了一些科學應用,并收集了幾篇發(fā)表在Nature上的GNN論文。
我們周圍的很多信息都可以用圖表來表示。一個例子是城市道路網(wǎng)絡,其中交叉口是節(jié)點,道路是鏈接。另一個是調控網(wǎng)絡,它描述了不同基因如何相互作用以增強或抑制某些細胞功能。圖神經(jīng)網(wǎng)絡(GNN)可以處理基于圖的信息以進行預測。在在 2022 年 3 月 23 日的《Nature Machine Intelligence》的一篇論文中,Xue Jiawei 團隊基于全球 30 個城市的城市道路網(wǎng)絡拓撲特征,使用 GNN 研究和預測社會經(jīng)濟特征。
論文鏈接:https://www.nature.com/articles/s42256-022-00462-y
論文鏈接:https://www.nature.com/articles/s42256-021-00325-y在過去的二十年里,高通量測序技術與表觀遺傳和轉錄組分子數(shù)據(jù)相結合,為基因組學提供了豐富的信息,其中一些可以被挖掘來識別致癌基因。近年來,癌癥基因如何導致細胞生長的圖景變得更加復雜:癌癥可以通過DNA序列水平上基因突變以外的多種途徑發(fā)生,表觀遺傳機制或調控區(qū)域中間接激活或沉默其他基因的非編碼突變也可以發(fā)揮作用。多組學數(shù)據(jù)集可以闡明這些過程。數(shù)據(jù)可以建模為生物網(wǎng)絡或圖形,其中節(jié)點代表基因,鏈接代表基因-基因相互作用。研究人員使用了一種高級類型的 GNN——圖卷積網(wǎng)絡——它可以根據(jù)節(jié)點特征向量和網(wǎng)絡拓撲對網(wǎng)絡中未標記的節(jié)點進行分類。通過他們的方法,利用多維多組學節(jié)點特征以及蛋白質-蛋白質相互作用網(wǎng)絡的拓撲特征,不僅可以識別高度突變的癌癥基因,還可以識別包含其他類型改變的基因,或與其他癌癥基因相互作用的基因。該研究將來自 16 種癌癥類型的基因組數(shù)據(jù)輸入該方法,確定了 165 個可能導致癌癥的新候選基因。Schulte-Sasse 團隊使用的機器學習方法——帶有圖卷積網(wǎng)絡的半監(jiān)督分類——由 Kipf 和 Welling 于 2017 年的一篇開創(chuàng)性論文中被引入。
論文鏈接:https://arxiv.org/abs/1609.02907在過去的 5 年里,它刺激了基于圖的機器學習的許多進步。Haghir Chehreghani 在 2022 年 3 月 23 日的《Nature Machine Intelligence》發(fā)表的一篇新聞與觀點文章重點介紹了這篇論文,并討論了該方法的效率、可解釋性和可擴展性。
論文鏈接:https://www.nature.com/articles/s42256-022-00466-8分子預測和藥物發(fā)現(xiàn)是基于圖的方法的另一個領域。幾十年來,該領域以各種創(chuàng)造性的方式使用機器學習,與表示分子的不同方法相關聯(lián)。一種方法是將分子表示為線性字符串(也稱為「簡化的分子輸入行輸入系統(tǒng)」或「SMILES」),這適用于自然語言處理中的深度學習方法。或者說,為了保留分子的拓撲信息,可以將它們表示為圖,以原子為節(jié)點,以鍵為鏈接。Wang Yuyang 團隊最近的一篇論文。描述了一種基于自我監(jiān)督 GNN 的方法,以解決與潛在生物活性分子的巨大空間(被認為是 10^60 級)相比,分子標記數(shù)據(jù)相對稀缺的問題。研究人員的框架在一個包含大約 1000 萬個分子的大型未標記數(shù)據(jù)集上進行了訓練,并學習了可用于區(qū)分化學性質的分子表示。
論文鏈接:https://www.nature.com/articles/s42256-022-00447-x考慮到具有相同拓撲結構的分子的不同異構體可能具有不同的化學性質,可以添加到分子圖形表示中的另一個組件是它們的幾何結構。Fang xiaomin 團隊最近的一篇論文。描述了如何在幾何增強的 GNN 方法中對分子的拓撲結構和幾何結構進行編碼可以改進分子特性預測。
論文鏈接:https://www.nature.com/articles/s42256-021-00438-4正如 Chehreghani 所強調的,仍然需要為 GNN 開發(fā)一個更好的理論框架,并更好地理解它們的局限性。鑒于越來越多的復雜、高度連接的數(shù)據(jù),更基礎的理解將刺激 GNN 在許多領域的進一步令人興奮的應用。該社論以「The graph connection」為題,于 2022 年 3 月 23 日發(fā)布在《Nature Machine Intelligence》。
參考內容:https://www.nature.com/articles/s42256-022-00476-6更多細節(jié)可參考論文原文,更多精彩內容請關注邁微AI研習社,每天晚上七點不見不散!
??THE END?
投稿或尋求報道微信:MaiweiE_com
GitHub中文開源項目《計算機視覺實戰(zhàn)演練:算法與應用》,“免費”“全面“”前沿”,以實戰(zhàn)為主,編寫詳細的文檔、可在線運行的notebook和源代碼。

項目地址?https://github.com/Charmve/computer-vision-in-action
項目主頁?https://charmve.github.io/L0CV-web/
推薦閱讀
(更多“摳圖”最新成果)
微信號: MaiweiE_com
GitHub:?@Charmve
CSDN、知乎: @Charmve
主頁: github.com/Charmve
如果覺得有用,就請點贊、轉發(fā)吧!
評論
圖片
表情
