<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          ChatGPT啟發(fā),谷歌DeepMind預(yù)測(cè)7100萬(wàn)基因突變!AI破譯人類(lèi)基因遺傳密碼登Science

          共 4124字,需瀏覽 9分鐘

           ·

          2023-09-22 07:37



            新智元報(bào)道  

          編輯:編輯部
          【新智元導(dǎo)讀】AlphaFold之后,谷歌DeepMind再次震撼發(fā)布AI模型AlphaMissense,成功預(yù)測(cè)7100萬(wàn)「錯(cuò)義突變」,有望攻克人類(lèi)遺傳學(xué)難題。

          蛋白質(zhì)預(yù)測(cè)模型AlphaFold在AI界掀起海嘯級(jí)巨浪后,Alpha家族又迎來(lái)新貴。

          今天,Google DeepMind發(fā)布了全新AI模型——AlphaMissense,能夠預(yù)測(cè)出7100萬(wàn)「錯(cuò)義突變」。

          具體講,AlphaMissense成功預(yù)測(cè)出的89%「錯(cuò)義突變」中,57%是致病性,32%是良性的。

          論文地址:https://www.science.org/doi/10.1126/science.adg7492

          而僅有0.1%的變異,能被人類(lèi)專(zhuān)家確認(rèn)。

          為了研究人員更好了解其可能產(chǎn)生的影響,谷歌還將這份千萬(wàn)級(jí)「錯(cuò)義突變」所有目錄公開(kāi)。

          一直以來(lái),發(fā)現(xiàn)根本病因是人類(lèi)遺傳學(xué)面臨的最大挑戰(zhàn)之一。

          而錯(cuò)義突變是可以影響「人類(lèi)蛋白質(zhì)」功能的基因突變,會(huì)導(dǎo)致囊性纖維化、鐮狀細(xì)胞貧血、癌癥等疾病。

          AlphaMissense的誕生展示了AI在醫(yī)學(xué)領(lǐng)域,特別是在遺傳學(xué)中的巨大潛力。

          它對(duì)于理解遺傳變異與疾病關(guān)系,開(kāi)發(fā)針對(duì)性的藥物治療等都具有重要意義。

          繼AlphaFold之后,AlphaMissense或?qū)⒊蔀樽阋愿淖兪澜绲腁I,有望攻克人類(lèi)遺傳學(xué)難題!


          什么是「錯(cuò)義突變」?

          錯(cuò)義突變(missense variant),是生物醫(yī)學(xué)和分子生物學(xué)領(lǐng)域中用于描述蛋白質(zhì)編碼基因中的一種基因突變:
          DNA中單個(gè)字母的替換,會(huì)導(dǎo)致蛋白質(zhì)中產(chǎn)生不同的氨基酸。

          如果把DNA想象成一種語(yǔ)言,那么一個(gè)字母的替換就可以改變一個(gè)單詞,并完全改變句子的意思。

          在這種情況下,DNA的改變會(huì)導(dǎo)致氨基酸的變化,從而影響蛋白質(zhì)的功能。

          而普通人身上攜帶的錯(cuò)義突變超過(guò)9000多種。

          一般而言,這些錯(cuò)義突變大多是良性的,對(duì)人體幾乎沒(méi)有影響。但其余少數(shù)則具有致病性,會(huì)嚴(yán)重破壞蛋白質(zhì)的功能。

          錯(cuò)義突變可用于罕見(jiàn)遺傳病的診斷,因?yàn)樯贁?shù)甚至單個(gè)錯(cuò)義突變就可能直接致病。

          此外,它們對(duì)于研究復(fù)雜疾?。ū热鏸i型糖尿病)也很重要,這類(lèi)疾病可能是由多種不同類(lèi)型的基因變異共同引起的。

          因此,對(duì)錯(cuò)義突變進(jìn)行分類(lèi)是了解哪些蛋白質(zhì)變化可能導(dǎo)致疾病的重要一步。

          在已出現(xiàn)的人類(lèi)400多萬(wàn)個(gè)錯(cuò)義突變中,只有2%被專(zhuān)家標(biāo)注為致病性或良性。

          這僅占所有可能的7100萬(wàn)個(gè)錯(cuò)義突變的0.1%左右。

          其余的突變因?yàn)槿狈ο嚓P(guān)影響的實(shí)驗(yàn)或臨床數(shù)據(jù),被歸類(lèi)為「意義不明的突變」。

          但有了AlphaMissense,我們得到了迄今為止最清晰的突變影響圖像:

          AlphaMissense可以對(duì)89%的突變進(jìn)行分類(lèi),其閾值在已知疾病突變數(shù)據(jù)庫(kù)中的精確度為90%。


          基于AlphaFold打造,靈感來(lái)自ChatGPT大模型

          那么,AlphaMissense究竟如何構(gòu)建的?

          AlphaFold、AlphaFold 2自發(fā)布以來(lái),已經(jīng)從氨基酸序列預(yù)測(cè)了科學(xué)界已知幾乎所有蛋白質(zhì)的結(jié)構(gòu),超過(guò)2億+蛋白質(zhì)。

          對(duì)此,谷歌研究人員基于AlphaFold(以下簡(jiǎn)稱(chēng)AF),對(duì)模型進(jìn)行改編,由此可以預(yù)測(cè)改變蛋白質(zhì)單個(gè)氨基酸的錯(cuò)義突變的致病性。

          簡(jiǎn)單講,AlphaMissense整個(gè)運(yùn)作原理是:將一個(gè)氨基酸序列作為輸入,并預(yù)測(cè)序列中給定位置所有可能的單一氨基酸變化的致病性。

          為了訓(xùn)出AlphaMissense模型,需要分兩階段進(jìn)行:

          第一階段

          訓(xùn)練一個(gè)與AF一樣的神經(jīng)網(wǎng)絡(luò)。這種神經(jīng)網(wǎng)絡(luò)的靈感來(lái)自像ChatGPT這樣的大模型。

          通過(guò)預(yù)測(cè)多重序列比對(duì)(MSA)中隨機(jī)位置掩碼的氨基酸身份,能夠進(jìn)行單鏈結(jié)構(gòu)預(yù)測(cè),以及蛋白質(zhì)語(yǔ)言建模。

          研究人員對(duì)AF進(jìn)行了一些小的架構(gòu)修改,并增加了蛋白質(zhì)語(yǔ)言建模的損失權(quán)重,同時(shí)仍然實(shí)現(xiàn)了與AF相當(dāng)?shù)慕Y(jié)構(gòu)預(yù)測(cè)性能。

          在預(yù)訓(xùn)練之后,掩碼語(yǔ)言建模頭已經(jīng)可以通過(guò)計(jì)算參考氨基酸和替代氨基酸概率之間的對(duì)數(shù)似然比,來(lái)用于變異效應(yīng)預(yù)測(cè),正如MSA Transformer和進(jìn)化比例建模(EMS)中所做的那樣。

          事實(shí)證明,這些神經(jīng)網(wǎng)絡(luò)擅長(zhǎng)預(yù)測(cè)蛋白質(zhì)結(jié)構(gòu)和設(shè)計(jì)新蛋白質(zhì),尤其對(duì)變異預(yù)測(cè)很有用,因?yàn)樗鼈円呀?jīng)知道哪些序列是可信的,哪些不是。

          第二階段

          這個(gè)階段,研究人員對(duì)模型在人類(lèi)蛋白質(zhì)上進(jìn)行微調(diào),并為MSA第二行中設(shè)置突變序列,增加變異致病性分類(lèi)目標(biāo)。

          然后,按照按PrimateAI的方法,去標(biāo)注人類(lèi)和靈長(zhǎng)類(lèi)群體這種的突變。

          常見(jiàn)的突變被視為良性,從未見(jiàn)過(guò)的突變被視為致病性突變。

          一旦模型開(kāi)始在驗(yàn)證集上過(guò)度擬合(2526個(gè)ClinVar變異,每個(gè)基因良性和致病性變異數(shù)相等),研究人員就停止訓(xùn)練。

          不過(guò),AlphaMissense不會(huì)預(yù)測(cè)突變后蛋白質(zhì)結(jié)構(gòu)的變化,或?qū)Φ鞍踪|(zhì)穩(wěn)定性的其他影響。

          而是,它利用AlphaFold對(duì)結(jié)構(gòu)的「直覺(jué)」來(lái)識(shí)別蛋白質(zhì)中可能發(fā)生的致病突變。

          具體來(lái)說(shuō),利用相關(guān)蛋白質(zhì)序列數(shù)據(jù)庫(kù)和突變的結(jié)構(gòu)上下文信息,生成一個(gè)0到1之間的連續(xù)分?jǐn)?shù),來(lái)近似評(píng)估突變的致病概率。

          該連續(xù)分?jǐn)?shù)允許用戶(hù)根據(jù)自己的準(zhǔn)確性要求,選擇閾值將突變分類(lèi)為致病性或良性。

          AlphaMissense如何對(duì)人類(lèi)錯(cuò)義突變進(jìn)行分類(lèi)

          在實(shí)驗(yàn)評(píng)估中,AlphaMissense在廣泛的遺傳和實(shí)驗(yàn)基準(zhǔn)中實(shí)現(xiàn)了最先進(jìn)的預(yù)測(cè),而這一切都不需要對(duì)此類(lèi)數(shù)據(jù)進(jìn)行明確的訓(xùn)練。

          在對(duì)來(lái)自ClinVar的變異進(jìn)行分類(lèi)時(shí),AlphaMissense優(yōu)于其他計(jì)算方法。ClinVar是一個(gè)關(guān)于人類(lèi)變異與疾病關(guān)系的公共數(shù)據(jù)檔案庫(kù)。

          AlphaMissense也是預(yù)測(cè)實(shí)驗(yàn)室結(jié)果最準(zhǔn)確的方法,這表明它與衡量致病性的不同方法是一致的。

          AlphaMissense在預(yù)測(cè)錯(cuò)義變體效應(yīng)方面優(yōu)于其他計(jì)算方法

          AI改變遺傳學(xué)

          一年前,谷歌DeepMind發(fā)布了使用AlphaFold預(yù)測(cè)的2億個(gè)蛋白質(zhì)結(jié)構(gòu)。

          這一舉措幫助了全球數(shù)百萬(wàn)科學(xué)家加速研究,并為新的發(fā)現(xiàn)鋪平了道路。

          現(xiàn)在,以AlphaFold為基礎(chǔ)的AlphaMissense,通過(guò)對(duì)DNA的溯源,進(jìn)一步加深了全世界對(duì)蛋白質(zhì)的了解。

          同樣的,轉(zhuǎn)化這項(xiàng)研究的關(guān)鍵步驟是與科學(xué)界合作。

          谷歌DeenpMind一直與英格蘭基因組學(xué)組織合作,探索AlphaMissense的預(yù)測(cè)如何幫助研究罕見(jiàn)病的遺傳學(xué)。

          英格蘭基因組研究所將AlphaMissense的研究結(jié)果與之前匯總的已知人類(lèi)突變致病性數(shù)據(jù)進(jìn)行了交叉對(duì)比。

          評(píng)估結(jié)果與AlphaMissense的預(yù)測(cè)一致,這為AlphaMissense提供真實(shí)世界的基準(zhǔn)。

          谷歌DeepMind公開(kāi)了錯(cuò)義突變的查詢(xún)表,并且分享了19,000多種人類(lèi)蛋白質(zhì)中所有可能的2.16億個(gè)單氨基酸序列置換的擴(kuò)展預(yù)測(cè)。

          公開(kāi)的數(shù)據(jù)中還包含了每個(gè)基因的平均預(yù)測(cè)值,類(lèi)似于衡量一個(gè)基因的進(jìn)化限制,表明該基因?qū)ι矬w生存的重要性。

          AlphaMissense預(yù)測(cè)的示例疊加在AlphaFold預(yù)測(cè)的結(jié)構(gòu)上
          (紅色=預(yù)測(cè)為致病,藍(lán)色=預(yù)測(cè)為良性,灰色=不確定)
          左圖:β-血紅蛋白亞基(HBB 蛋白)。這種蛋白質(zhì)的變異可導(dǎo)致鐮狀細(xì)胞性貧血。

          右圖:囊性纖維化跨膜傳導(dǎo)調(diào)節(jié)蛋白(CFTR 蛋白)。這種蛋白質(zhì)的變異可導(dǎo)致囊性纖維化。

          并且,谷歌DeepMind還與EMBL-EBI進(jìn)行了合作。通過(guò)Ensembl突變效應(yīng)預(yù)測(cè)器,研究人員將更方便地應(yīng)用AlphaMissense的預(yù)測(cè)結(jié)果。

          相信在不久的未來(lái),AlphaMissense將幫助解決基因組學(xué)和整個(gè)生物科學(xué)的核心問(wèn)題。

          參考資料:
          https://www.science.org/doi/10.1126/science.adg7492
          https://www.deepmind.com/blog/alphamissense-catalogue-of-genetic-mutations-to-help-pinpoint-the-cause-of-diseases




          瀏覽 20377
          點(diǎn)贊
          評(píng)論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          評(píng)論
          圖片
          表情
          推薦
          點(diǎn)贊
          評(píng)論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  非洲婬乱a一级毛片多女 | 无码国产+白浆 | wwwjizz国产 | 91无码人妻精品一区二区三区四 | 日日躁天天躁AAAAXxXX痛 |