生命科學的“登月計劃”!Science封面:20年后,人類基因組計劃終于完整了

二十多年前完成的人類基因組計劃,其實遺漏了大約 8%的 DNA 序列。這些遺漏的部分,主要是 DNA 序列高度重復(fù)的染色體中間部分的著絲粒、末端的端粒(在很大程度上之前被視為垃圾)。二十多年來,研究人員認為,這些區(qū)域可能在進化和疾病中發(fā)揮關(guān)鍵作用。
在這次發(fā)表的最新成果中,由大約 100 名科學家組成的團隊首次完成了對整個人類基因組的完整測序,并將完整結(jié)果發(fā)表在 Science 雜志上。

人類基因組計劃由美國科學家于 1985 年率先提出,于 1990 年正式啟動的。美國、英國、法國、德國、日本和我國科學家共同參與了這一預(yù)算達 30 億美元的人類基因組計劃。截止到 2003 年 4 月 14 日,人類基因組計劃的測序工作已經(jīng)完成。其中,2001 年人類基因組工作草圖的發(fā)表被認為是人類基因組計劃成功的里程碑。
人類基因組計劃與曼哈頓原子彈計劃和阿波羅計劃并稱為三大科學計劃,是人類科學史上的又一個偉大工程,被譽為生命科學的“登月計劃”。
人類基因組分布在 23 對染色體中,由超過 60 億個單獨的 DNA 堿基組成,與黑猩猩等其他靈長類動物的數(shù)量大致相同。為了讀取基因組,科學家首先將所有 DNA 切成數(shù)百到數(shù)千個字母長的片段,然后測序機器讀取每個片段中的單個字母,然后再試圖以正確的順序組裝這些字母,就像拼一個復(fù)雜的拼圖一樣。
正是由于這些DNA的重復(fù),使得在人類基因組測序時無法以正確的順序組裝一些 DNA 片段。另一個障礙是,大多數(shù)細胞包含兩個基因組——一個來自父親,一個來自母親。當研究人員試圖組裝所有片段時,來自每個親本的序列可能混合在一起,從而掩蓋了每個單獨基因組中的實際變異。
雖然人類基因組計劃在 2003 年取得了巨大成功,但實際上,離最終的勝利還差一點點。由超過 8% 的基因組并沒有被解讀,這些缺失的部分包含高度重復(fù)的序列,并在很大程度上被視為“垃圾”。
但實際上并非如此,華盛頓大學霍華德休斯醫(yī)學研究所(HHMI)研究員 Eichler 說, “事實證明,我感興趣的許多地區(qū)都在缺口中。”
于是,由美國國家人類基因組研究所、加利福尼亞大學圣克魯斯分校、華盛頓大學等機構(gòu)研究人員領(lǐng)銜的國際科研團隊組成“端粒到端粒聯(lián)盟(T2T)”,對人類基因組進行完整的、無間隙測序。
研究人員表示,人類基因組含有約 30 億個 DNA(脫氧核糖核酸)堿基對,完成這些堿基對的完整、無間隙測序?qū)τ诹私馊祟惢蚪M變異全譜、掌握基因?qū)δ承┘膊〉挠绊懼陵P(guān)重要。
(來源:Pixabay)共同領(lǐng)導(dǎo) T2T 工作的 Miga 表示,這些數(shù)據(jù)為研究著絲粒提供了新時代的基礎(chǔ),科學家們現(xiàn)在將能夠探索這些新發(fā)現(xiàn)的變異,如何導(dǎo)致疾病,以及著絲粒 DNA 如何隨著時間變化。
研究結(jié)果還揭示了基因變異的更復(fù)雜模式,這有助于解釋人類的快速進化,也有助于創(chuàng)造人類物種。研究人員解釋,完整的基因組序列表明,一些與更大的大腦相關(guān)的基因是高度可變的。一個人可能有十個特定基因的拷貝,而其他人可能只有一兩個。
研究人員表示,單個基因組的成功完成并不是硬道理。聯(lián)盟成員已經(jīng)在努力對一個基因組進行測序,該基因組具有從每個父母那里繼承的不同染色體。他們還開始了一項泛基因組工作,以讀取來自世界各地的數(shù)百人的整個 DNA 序列?!澳繕耸莿?chuàng)建盡可能完整的人類基因組,代表更多的人類多樣性?!痹擁椖柯?lián)合負責人 Jarvis 解釋道。
參考資料:
https://www.science.org/doi/10.1126/science.abj5089
https://www.science.org/doi/10.1126/science.abj6965
https://www.science.org/doi/10.1126/science.abj6987
https://www.science.org/doi/10.1126/science.abk3112
https://www.science.org/doi/10.1126/science.abl4178
https://www.science.org/doi/10.1126/science.abl3533

評論
圖片
表情
