<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          基因與疾病百年研究進展

          共 4642字,需瀏覽 10分鐘

           ·

          2021-04-11 21:49


          來源:生信人

          本文約3900字,建議閱讀7分鐘

          本文為你介紹一篇生信分析者充電的雜志文章。


          今天我們給大家介紹一篇題為100 Years of evolving gene–disease complexities and scientific debutants的Briefings in Bioinformatics(IF:8.9)雜志文章。


          摘要


          “基因”這個詞已經(jīng)有100多年的歷史了,并在幾個科學方向上不斷發(fā)展。隨著技術的不斷進步,基因組學領域發(fā)生了重大變革,尤其是當涉及到諸如三重編碼開發(fā)、基因數(shù)命題、基因圖譜、數(shù)據(jù)庫、基因-疾病圖譜、人類基因和遺傳疾病目錄、CRISPR/Cas9、大數(shù)據(jù)和下一代測序等領域時,在這篇文章中,該研究團隊介紹了基因組學從豌豆植物遺傳學到人類基因組計劃的進展,并重點介紹了分子、技術和計算的發(fā)展。


          基因組和表觀基因組的研究為人類疾病的發(fā)生和發(fā)展提供了基礎,包括染色體疾病、單基因疾病、多因素疾病和線粒體疾病。世界衛(wèi)生組織對所有人類疾病進行了分類、標準化和維護,當時許多學術和商業(yè)在線系統(tǒng)正在共享有關基因的信息,并與相關疾病相關聯(lián)。為了有效地了解這些生物數(shù)據(jù)的豐富性,迫切需要生成適當?shù)幕蜃⑨寧旌唾Y源。


          該研究團隊的重點是全世界有多少基因疾病數(shù)據(jù)庫,哪些來源是真實的、及時更新的,并推薦用于研究和臨床目的。在本研究中,該研究團隊討論并比較了43個這樣的數(shù)據(jù)庫和生物信息學應用程序,這些應用程序使用戶能夠連接、探索并在可能的情況下下載基因疾病數(shù)據(jù)。


          背景介紹


          基因研究:幫助為每個人提供量身定制的解決方案。人類基因組序列的變異性是負責人類發(fā)育和功能的生物代碼的結(jié)果。人類基因組的大部分(約62%)由基因間區(qū)域組成,這些區(qū)域是基因組中位于基因之間的非蛋白質(zhì)編碼部分,過去被稱為“垃圾DNA”,但過去幾年的基因組研究揭示了與這些區(qū)域相關的功能,這表明基因組的每一部分都有一定的重要性。


          基因間DNA還可能包括基因調(diào)控序列,如啟動子、增強子和沉默子,這些序列尚未被鑒定。核糖核酸(RNA)是DNA的轉(zhuǎn)錄形式,信使RNA(mRNA)是RNA的蛋白質(zhì)編碼形式。非編碼RNA,如轉(zhuǎn)移RNA(tRNA)、微RNA(miRNA)、核糖體RNA(rRNA)和長非編碼RNA(lncRNA),在細胞中扮演著從蛋白質(zhì)翻譯到基因調(diào)控的各種角色。


          本文要點


          1)真實和分類的基因疾病數(shù)據(jù)在生物研究和醫(yī)療保健的各個層面都具有非常重要的意義。

          2)為了有效地挖掘基因組學和臨床數(shù)據(jù)的財富,迫切需要開發(fā)合適的基因疾病注釋庫和資源。

          3)需要很好地解決不斷演變的基因疾病復雜性,以便更好地在全球范圍內(nèi)實施精確醫(yī)學。

          4)創(chuàng)新和強大的大數(shù)據(jù)平臺對于通過智能分析和共享臨床和基因組數(shù)據(jù)來發(fā)現(xiàn)新的治療靶點和設計診斷工具來提高醫(yī)療質(zhì)量是必要的。


          基因?qū)W史:分子、技術和計算


          1869年,在德國圖賓根工作的瑞士生物化學家約翰·弗里德里?!っ仔獱?Johann Friedrich Miescher)發(fā)現(xiàn)了DNA。在Miescher發(fā)現(xiàn)之前三年,格雷戈爾·孟德爾(Gregor Mendel)已經(jīng)公布了他使用豌豆植物進行育種實驗的結(jié)果,這些實驗是在布爾諾(Brno)的修道院花園進行的,布爾諾是現(xiàn)在的捷克共和國的一個中歐城市。根據(jù)他在1865年進行的豌豆雜交實驗,遺傳性狀被定義為某些可能導致性狀差異的細胞內(nèi)物質(zhì)。顆粒遺傳概念的建立激發(fā)了人們對這種材料的本質(zhì)的思考。孟德爾在布爾諾的《自然科學學會學報》上發(fā)表的論文描述了他的假設,即遺傳是由單位因素控制的,遺傳學家今天稱之為基因的實體。1909年晚些時候,孟德爾的一個學生威廉·約翰森(Wilhelm Johannsen)終于用“基因”這個詞來描述遺傳單位。從那時起,一百多年來,人們一直在探索基因的結(jié)構、定位、數(shù)量和功能。


          表1. 數(shù)據(jù)庫和工具網(wǎng)站的訪問鏈接


          從測序到精確的基因編輯


          由于多核苷酸鏈中核酸的順序決定了遺傳信息,所以對DNA進行排序的能力對破譯密碼至關重要。隨著電泳技術的發(fā)展,Southern blotting被發(fā)明來檢測特定的DNA序列。然而,電泳只能分離不同大小的DNA片段,不能進行測序過程。在Sanger測序法的基礎上,在DNA合成過程中加入末端鏈的雙脫氧核苷酸,通過電泳進行測序。桑格測序雖然費時費力,但已經(jīng)被廣泛使用了40多年,并幫助科學家完成了人類基因組的第一個序列。雙酶系統(tǒng)(硫?;?熒光素酶)的鏈終止反應避免了繁重的電泳,并實現(xiàn)了實時測序。1955年,Arthur Kornberg分離出一種DNA復制酶--DNA聚合酶,這是邁向下一代測序(NGS)的一個重要里程碑。基于焦磷酸測序(一種光檢測方法)的NGS以更簡單的測序步驟和更少的時間消耗開啟了高通量測序的新時代。最新一代的測序技術解放了對DNA擴增的要求,并實現(xiàn)了單分子測序(SMS),從而避免了與擴增相關的偏差和錯誤。在DNA模板通過一個核苷酸堿基連接到底物上之后,適當?shù)臒晒饪赡娼K止子dNTP(所謂的“虛擬終止子”)被洗滌、成像一次、切割并循環(huán)到下一個。多年來,測序方案、分子生物學和自動化方面的創(chuàng)新提高了測序的技術能力,同時降低了成本。


          圖1.基因發(fā)現(xiàn)時間表-介紹了從1909年到2015年基因組學領域的主要發(fā)現(xiàn)和發(fā)明


          從基因組學到蛋白質(zhì)組學


          生物信息學始于蛋白質(zhì)研究,因為人們普遍認為蛋白質(zhì)攜帶遺傳信息;1952年的噬菌體感染實驗證明DNA是真正的遺傳物質(zhì)后,情況發(fā)生了變化。第一個生物信息學軟件COMPROTEIN是由margaretdayhoff開發(fā)的,用Edman測序數(shù)據(jù)來確定蛋白質(zhì)的一級結(jié)構。建立了第一個蛋白質(zhì)數(shù)據(jù)庫PDB。當研究人員確認了DNA的重要性后,研究的重點很快轉(zhuǎn)向了基因測序。第一個專門用于分析Sanger測序讀數(shù)的軟件由Roger Staden于1979年發(fā)布,用于搜索Sanger凝膠讀數(shù)之間的重疊;驗證、編輯序列讀數(shù)并將其鏈接到contigs;以及注釋和操作序列文件。1985年,richardstallman發(fā)表了GNU的notunix(GNU)宣言,后來發(fā)展成為一種自由軟件哲學,倡導用戶可以自由運行、復制、分發(fā)、研究、更改和改進軟件。在這一概念的影響下,隨著各種基因測序數(shù)據(jù)的積累,世界各地的實驗室和數(shù)據(jù)庫合作建立了大量的公共數(shù)據(jù)庫,目前仍在使用。隨著2003年人類基因組計劃的完成,這些基因數(shù)據(jù)庫的基礎數(shù)據(jù)源終于建立起來。第二代測序技術和相應處理工具的出現(xiàn),使得整個生物信息領域的功能日益強大,標志著生物大數(shù)據(jù)分析時代的到來。但隨著大數(shù)據(jù)的出現(xiàn),出現(xiàn)了新的問題,比如現(xiàn)在大量可用的工具的產(chǎn)生,使得很難確定具體任務所需的工具。此外,越來越多的實驗室需要分析大數(shù)據(jù),即使他們不專門從事生物信息學研究。在未來,生物信息學的發(fā)展將集中在統(tǒng)一性和用戶友好性上。


          表2. 基因數(shù)據(jù)庫和工具的比較(藍色表示肯定,紅色表示否定)


          基因到疾病數(shù)據(jù)庫和工具


          隨著高通量技術的發(fā)展,基因組規(guī)??茖W正變得越來越普遍。這一領域的一個關鍵挑戰(zhàn)是NGS數(shù)據(jù)的解釋??茖W家們面臨著一項艱巨的挑戰(zhàn),那就是如何確定與其感興趣的生物系統(tǒng)相關的候選基因。大多數(shù)情況下,研究人員只直接了解少數(shù)候選基因。許多復雜的疾病,如癌癥,都是伴隨著零星的基因組改變而發(fā)展起來的。這些改變可能導致功能性細胞問題或是惰性的。并不是所有的突變對發(fā)現(xiàn)它們的癌癥類型都有同樣的貢獻。與癌癥有因果關系的突變比例仍不清楚。盡管每個癌癥基因組的獨特變體數(shù)量可能非常高,但只有少數(shù)變體對腫瘤的發(fā)展至關重要。這就需要與綜合知識庫相聯(lián)系的生物信息學工具。


          圖2. 基因到疾病數(shù)據(jù)庫和工具


          ClinVar


          國家生物技術信息中心(NCBI)的ClinVar是一個免費提供的報告條件的變體檔案。該數(shù)據(jù)庫包括任何大小、類型或基因組位置的種系和體細胞變種。解釋由臨床測試實驗室、研究實驗室、位點特異性數(shù)據(jù)庫、OMIM、GeneReviewsTM、UniProt、專家小組和實踐指南提交。ClinVar目前持有超過158000份提交的解釋,代表了超過125000個變量。數(shù)據(jù)庫中的解釋影響了26000多個基因,包括可能包含許多基因的結(jié)構變體;對于影響單個基因的變體,數(shù)據(jù)庫中代表了近4800個基因。它允許用戶輸入一個基因名稱,例如BRCA1,它將按名稱檢索所有相關的變異和相關的條件,以及他們的復查狀態(tài)和上次復查的時間。在“幫助”頁面中,他們聲稱自己的復習狀態(tài)可以分為八個連續(xù)的等級,但他們不會根據(jù)這些等級顯示成績。盡管有一個選項可以根據(jù)評審狀態(tài)進行篩選,但如果結(jié)果可以按照從高到低的等級等級來呈現(xiàn),則會更有幫助。此外,他們的網(wǎng)站可以一次搜索一個基因,不能接受多個基因的輸入,這就給研究人員留下了大量的工作來收集和整合信息。他們的結(jié)果主要來自三個不同的來源:臨床試驗、研究和文獻。除了文獻外,目前還沒有足夠的方法和系統(tǒng)來衡量臨床試驗結(jié)果的準確性,研究依賴于數(shù)據(jù)提供者。因此,有些信息可能模糊不清。


          表3. 基于特征的基因疾病數(shù)據(jù)庫和工具比較


          疾病的拷貝數(shù)變異


          疾病拷貝數(shù)變異(Copy Number Variations in Disease,CNVD)是一個系統(tǒng)而全面的拷貝數(shù)變異及相關疾病數(shù)據(jù)庫,所有記錄都是從CNV相關文獻發(fā)表的實驗數(shù)據(jù)中手工提取的。因此,CNVD是研究疾病相關拷貝數(shù)變異的可靠資源。它包含251697條記錄,包含183219個CNV片段、844種相關疾病和46348個基因,這些基因是從2006年至2014年發(fā)表的文章中挖掘出來的。CNVD允許用戶通過多種方式搜索數(shù)據(jù)庫:通過基因名稱、疾病名稱、染色體位置或拷貝數(shù)變異區(qū)域。在查詢結(jié)果中,每條記錄都包含這樣的信息:物種、染色體、CNV的起始和終止位置、相關疾病、CNV區(qū)域的基因以及源文章的PubMed ID。盡管CNVD是以拷貝數(shù)變異的基因為基礎的,但結(jié)果仍然清楚地顯示了基因名稱和相關疾病。根據(jù)用戶需要,可以批量下載,也可以單獨下載。CNVD可以執(zhí)行從基因到疾病以及從疾病到基因的雙向搜索,促進基因注釋。此外,它執(zhí)行多基因搜索的能力給研究帶來了極大的便利。但是,它不會對冗余的結(jié)果進行分組,這意味著如果相同的結(jié)果有不同的來源,它們將重復出現(xiàn)。此集成步驟需要用戶自己完成,從而增加了意外的額外工作量。整個數(shù)據(jù)庫完全基于CNV相關文章中發(fā)表的實驗數(shù)據(jù),因此數(shù)據(jù)量可能太小,無法考慮。


          表4. 基于基因比較的基因疾病數(shù)據(jù)庫和工具


          結(jié)論


          盡管有許多重要的遺傳學發(fā)現(xiàn),但癌癥等復雜疾病的遺傳學仍很不清楚。隨著對分子和基因組因素在疾病中發(fā)揮作用的逐漸了解,許多疾病(如癌癥)有望得到更有效的醫(yī)療治療。科學的方法將是對個體基因組進行個性化分析,從而在醫(yī)療保健領域產(chǎn)生一種新形式的預防性和個性化醫(yī)學?;诨虻脑O計藥物的可獲得性,腫瘤分子指紋的精確定位,適當?shù)乃幬镏委?,預測個體對疾病的易感性,精神疾病的診斷和治療,這些都是未來十年預計發(fā)生的許多變革中的幾個。為了有效地理解豐富的生物數(shù)據(jù),迫切需要生成合適的基因注釋庫和資源。


          編輯:于騰凱
          校對:林亦霖
          瀏覽 104
          點贊
          評論
          收藏
          分享

          手機掃一掃分享

          分享
          舉報
          評論
          圖片
          表情
          推薦
          點贊
          評論
          收藏
          分享

          手機掃一掃分享

          分享
          舉報
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  操你逼 | 国产大黄片久久久久久 | 小骚逼操死你视频 | 操熟女| 色老板免费精品视频 |