Science發(fā)布2021十大科學突破,AlphaFold居榜首!
撰文:朱哼哼
編審:王哈哈
排版:李雪薇


結(jié)構(gòu)生物學持續(xù) 50 多年的困惑
1957 年,John C. Kendrew 和 Max F. Perutz 通過 X 射線晶體學確定了第一個蛋白質(zhì)結(jié)構(gòu)。不久之后,Christian B. Anfinsen Jr. 提出蛋白質(zhì)的結(jié)構(gòu)在熱力學上是穩(wěn)定的,似乎可以根據(jù)蛋白質(zhì)的氨基酸序列來預測蛋白質(zhì)的三維結(jié)構(gòu)。
然而,蛋白質(zhì)的結(jié)構(gòu)復雜性遠超人們的想象。依據(jù)中心法則,蛋白質(zhì)主要是由 DNA 轉(zhuǎn)錄成 RNA,再翻譯成肽鏈后組裝而來,一個蛋白質(zhì)分子是由一條或幾條多肽鏈組成,多肽鏈則折疊成特有的形狀。同時,蛋白質(zhì)分子的專一形狀是由4個層次的結(jié)構(gòu)決定的,包括一級、二級、三級和四級結(jié)構(gòu),前一級結(jié)構(gòu)決定后一級結(jié)構(gòu)。
其中多肽鏈的氨基酸序列是一級結(jié)構(gòu),一級結(jié)構(gòu)中的部分肽鏈卷曲或折疊產(chǎn)生二級結(jié)構(gòu)。二級結(jié)構(gòu)經(jīng)過一系列的構(gòu)象改變形成三維結(jié)構(gòu)即三級結(jié)構(gòu),一般為球狀或纖維狀。三級結(jié)構(gòu)有特定的結(jié)構(gòu)域,形成結(jié)合位點或調(diào)節(jié)位點,可以結(jié)合特定結(jié)構(gòu)的物質(zhì),行使特定的功能。兩條或兩條以上的多肽鏈組成的蛋白質(zhì),可以形成四級結(jié)構(gòu)。
圖 | 蛋白質(zhì) 3D 結(jié)構(gòu)(來源:Nat Commun)而近年來,隨著冷凍電子顯微鏡技術(shù)的發(fā)展,可以在沒有結(jié)晶樣本的條件下觀察蛋白質(zhì)結(jié)構(gòu),使得蛋白質(zhì)結(jié)構(gòu)研究有所進展。不過,冷凍電鏡是非常昂貴的設備,只有極少數(shù)的實驗室才有條件配備,對于廣大科研工作者非常不友好。因此,生命科學界亟需新的方法解決蛋白質(zhì)折疊問題。
AI 助力解決蛋白質(zhì)結(jié)構(gòu)預測難題
在過去 25 年中,國際蛋白質(zhì)結(jié)構(gòu)預測大賽(CASP)一直關(guān)注這個領(lǐng)域的進展,試圖尋找能夠完美解決蛋白質(zhì)折疊問題的計算機模型。直到第 14 屆大賽 CASP14 大賽成功舉辦,DeepMind 旗下的 AlphaFold 系統(tǒng)在蛋白質(zhì)結(jié)構(gòu)預測方面表現(xiàn)出了無與倫比的準確性。
該比賽的評價方式是將參賽者提供的解決方案與“黃金試驗標準”進行對比,用 GDT 評分衡量準確性,范圍為 0-100,GDT 分數(shù)在 90 分左右,即可視為對人類實驗方法具備競爭力。而 DeepMind 旗下的 AlphaFold 系統(tǒng)總分竟然達到了 92.4,和實驗的誤差在 1.6,即使是在最難的沒有同源模板的蛋白質(zhì)上面,這個分數(shù)也達到了了恐怖的 87.0 。
同時,AlphaFold 的神經(jīng)網(wǎng)絡能在幾分鐘內(nèi)預測出一個典型蛋白質(zhì)的結(jié)構(gòu),還能預測較大蛋白質(zhì)(比如一個含有 2180 個氨基酸、無同源結(jié)構(gòu)的蛋白質(zhì))的結(jié)構(gòu)。該模型能根據(jù)每個氨基酸對其預測可靠性進行精確預估,方便研究人員使用其預測結(jié)果。
圖 |研究人員使用 RoseTTAFold 預測的人類白細胞介素 12 與其受體結(jié)合的 3D 視圖(來源:UW Medicine Institute for Protein Design)不僅如此,RoseTTAFold 所需的計算耗能與計算時間均比 AlphaFold2 還要低:僅用一臺游戲計算機,在短短十分鐘內(nèi)就可以可靠地計算出蛋白質(zhì)結(jié)構(gòu)。更值得注意的是,RoseTTAFold 的代碼和服務器完全免費提供給科學界!
圖 | David Baker(來源:華盛頓大學官網(wǎng))同樣在今年 7 月份,DeepMind 創(chuàng)始人兼首席執(zhí)行官 Demis Hassabis 也在 Nature 雜志上分享了AlphaFold的開源代碼,并發(fā)表了系統(tǒng)的完整方法論,詳盡細致說明 AlphaFold 是如何做到精確預測蛋白質(zhì)3D結(jié)構(gòu)的。也就是說,這款強大蛋白質(zhì)結(jié)構(gòu)預測模型已經(jīng)是完全免費的。
至此,兩種強大的基于人工智能的蛋白質(zhì)結(jié)構(gòu)預測模型全部免費開放,科研工作者可以隨時利用這兩款模型獲取蛋白質(zhì)的空間結(jié)構(gòu),而無需對蛋白質(zhì)進行結(jié)晶或使用昂貴的冷凍電鏡進行研究。
在同步配發(fā)的評論文章里,Science 雜志的主編 Holden Thorp 對此表示,“首先,它解決了困擾生命科學近 50 年的蛋白質(zhì)折疊問題,好比物理學中的引力波,科學家們數(shù)十年如一日,堅持不懈最終才攻克這一難題;其次,這一技術(shù)改變了未來結(jié)構(gòu)生物學的規(guī)則,就像冷凍電鏡那樣,加速生命科學的發(fā)展;此外,完全免費意味著它是真正適合所有人的蛋白質(zhì)預測模型?!?br>
參考資料:
https://www.eurekalert.org/news-releases/937705?
www.science.org/doi/10.1126/science.abn5795

評論
圖片
表情
