華大智造與Illumina測(cè)序平臺(tái)比較:全基因組測(cè)序性能具有高度一致性

背景介紹
自2003年人類(lèi)基因組草圖公布以來(lái),基因組測(cè)序技術(shù)取得了巨大的進(jìn)步,多種大規(guī)模平行測(cè)序(MPS)平臺(tái)也如雨后春筍般迅猛增長(zhǎng)。其中,全基因組測(cè)序(Whole Genome Sequencing,WGS)可無(wú)偏頗地檢測(cè)各類(lèi)基因突變,以提供整個(gè)基因組的全面視圖,也是目前臨床及基礎(chǔ)研究中常用到的技術(shù)之一。
多年來(lái),大規(guī)模平行測(cè)序市場(chǎng)一直由Illumina等寡頭壟斷,大大限制了國(guó)內(nèi)相關(guān)產(chǎn)業(yè)的發(fā)展。為改變這一現(xiàn)狀,近年來(lái),以華大智造為代表的國(guó)內(nèi)基因測(cè)序企業(yè)在國(guó)產(chǎn)測(cè)序儀研發(fā)、生產(chǎn)方面作出了不懈努力,也取得了一定的進(jìn)步。華大智造在短短幾年內(nèi)相繼推出了擁有完全自主知識(shí)產(chǎn)權(quán)、具有國(guó)際先進(jìn)水平的測(cè)序儀,例如MGISEQ-200、MGISEQ-2000、DNBSEQ-T7等。該系列國(guó)產(chǎn)測(cè)序儀的優(yōu)勢(shì)是在保證相同reads讀長(zhǎng)和產(chǎn)量的同時(shí)節(jié)省成本,以DNBSEQ-T7為例,其在單次運(yùn)行產(chǎn)生6TB測(cè)序數(shù)據(jù)的背景下,成本低至4.5美元/ GB。此外,華大智造仍在持續(xù)推出一系列新的MPS設(shè)備,并且期望在提供高質(zhì)量測(cè)序數(shù)據(jù)的前提下,努力實(shí)現(xiàn)數(shù)據(jù)產(chǎn)出更快、價(jià)格更低。
目前 ,華大智造的測(cè)序儀已經(jīng)被成功應(yīng)用于多個(gè)領(lǐng)域的研究。
2021年4月17日,來(lái)自韓國(guó)的研究團(tuán)隊(duì)在Genes & Genomics雜志在線發(fā)表了題為“Comparison between MGI and Illumina sequencing platforms for whole genome sequencing”的研究文章,分析比較了華大智造MGISEQ-2000和DNBSEQ-T7平臺(tái)與Illumina的NovaSeq 6000平臺(tái)在全基因組測(cè)序?qū)用娴男阅?。通過(guò)多方面評(píng)估,研究人員發(fā)現(xiàn)各測(cè)序平臺(tái)在片段大小分布、基因覆蓋率和表達(dá)變異檢測(cè)方面的表現(xiàn)都很相似,表明了MGISEQ-2000和DNBSEQ-T7平臺(tái)的性能表現(xiàn)已經(jīng)達(dá)到了國(guó)際領(lǐng)先水平。

文章發(fā)表在Genes & Genomics
主要研究?jī)?nèi)容
研究人員選擇了Illumina的NovaSeq 6000和華大智造的MGISEQ-2000和DNBSEQ-T7,以評(píng)估MGISEQ-2000和DNBSEQ-T7測(cè)序儀器在全基因組測(cè)序上的性能表現(xiàn)。同時(shí),利用這三個(gè)平臺(tái)對(duì)來(lái)自韓國(guó)肺癌患者的正常和腫瘤組織進(jìn)行測(cè)序,并對(duì)產(chǎn)生的數(shù)據(jù)做了平行比較。
通過(guò)評(píng)估三個(gè)平臺(tái)原始數(shù)據(jù)的質(zhì)量發(fā)現(xiàn),在質(zhì)量控制層面,三個(gè)平臺(tái)均表現(xiàn)出相似的質(zhì)量和基因組覆蓋深讀。三個(gè)平臺(tái)中,Q20都大于99.7%,同時(shí),GC含量也類(lèi)似,約為41%。

圖1. 原始測(cè)序數(shù)據(jù)質(zhì)量的比較,圖片來(lái)源:Genes & Genomics
研究團(tuán)隊(duì)利用BWA-MEM方法將全基因組序列對(duì)比到參考基因組。結(jié)果顯示,所有樣品的覆蓋率均在99.9%以上。

圖2. 測(cè)序平臺(tái)的覆蓋率比較,圖片來(lái)源:Genes & Genomics
此外,研究人員利用相同的分析方法分析了三個(gè)平臺(tái)的SNVs和Indels,結(jié)果顯示,NovaSeq 6000與MGISEQ-2000測(cè)序結(jié)果最相似,重疊比率最高 (每個(gè)樣本分別為92.0%和93.0%)。

圖3. SNVs和Indels檢測(cè)的比較,圖片來(lái)源:Genes & Genomics
為了確定僅在一個(gè)平臺(tái)上被檢測(cè)到的種系變異是否為真正的變異,而不是由于平臺(tái)本身產(chǎn)生的測(cè)序誤差,研究人員分析了低分?jǐn)?shù)的種系變異,并設(shè)定當(dāng)該變異僅在一個(gè)平臺(tái)上出現(xiàn),那么就被認(rèn)為是無(wú)效的。結(jié)果發(fā)現(xiàn),NovaSeq 6000測(cè)序數(shù)據(jù)中的無(wú)效變異比例約為2.54%,MGISEQ-2000為0.45%。

圖4. 無(wú)效突變體比例的分析,圖片來(lái)源:Genes & Genomics
研究總結(jié)
該研究對(duì)三種測(cè)序平臺(tái)在全基因組測(cè)序?qū)用孢M(jìn)行了比較分析,通過(guò)多方面的數(shù)據(jù)支撐,研究團(tuán)隊(duì)認(rèn)為上述三個(gè)平臺(tái)都提供了高質(zhì)量的測(cè)序數(shù)據(jù)和足夠的基因組覆蓋率,均適用于全基因組測(cè)序分析。就變異體檢測(cè)層面,MGISEQ-2000與NovaSeq 6000性能最相似。此外,與NovaSeq 6000相比,DNBSEQ-T7還能夠檢測(cè)到更多的8 bp以上的indel。總之, NovaSeq 6000、MGISEQ-2000和DNBSEQ-T7三個(gè)平臺(tái)的測(cè)序性能具有高度的一致性。
拓展閱讀
截至目前,華大智造相繼推出了擁有完全自主知識(shí)產(chǎn)權(quán)、具有國(guó)際先進(jìn)水平的桌面型測(cè)序儀MGISEQ-2000、MGISEQ-200以及DNBSEQ-T7等。其中DNBSEQ-T7作為“全球日生產(chǎn)能力最強(qiáng)”的基因測(cè)序儀,自發(fā)布之日便備受業(yè)內(nèi)關(guān)注。2019年9月9日,DNBSEQ-T7正式交付商用,意味著中國(guó)基因測(cè)序產(chǎn)業(yè)將進(jìn)一步打破海外公司的技術(shù)壁壘,實(shí)現(xiàn)測(cè)序設(shè)備技術(shù)和性價(jià)比的全面引領(lǐng),并成為推動(dòng)全球基因產(chǎn)業(yè)發(fā)展的重要力量。值得一提的是,在疫情攻堅(jiān)的特殊時(shí)期,DNBSEQ-T7測(cè)序系統(tǒng)以其準(zhǔn)確、快速、超高通量的特點(diǎn),發(fā)揮了關(guān)鍵作用。同時(shí),正是依托DNBSEQ-T7高效、準(zhǔn)確的測(cè)序能力,華大第一時(shí)間獲得SARS-CoV-2病毒的全基因組,為后續(xù)疫情防控提供了重要依據(jù)。下面我們簡(jiǎn)要列舉幾項(xiàng)華大智造DNBSEQ測(cè)序平臺(tái)助力的國(guó)內(nèi)研究成果。
DNBSEQ平臺(tái)助力樊嘉團(tuán)隊(duì)首次全面深度剖析早期復(fù)發(fā)性肝癌的腫瘤免疫微環(huán)境
2020年12月23日,復(fù)旦大學(xué)中山醫(yī)院樊嘉院士團(tuán)隊(duì)與華大生命科學(xué)研究院研究團(tuán)隊(duì)合作在Cell上在線發(fā)表題為“Single-cell landscape of the ecosystem in early-relapse hepatocellular carcinoma”的文章。研究團(tuán)隊(duì)利用華大智造DNBSEQ平臺(tái)對(duì)來(lái)自18個(gè)原發(fā)性或早期復(fù)發(fā)性HCC(肝細(xì)胞肝癌)患者的16,498個(gè)細(xì)胞進(jìn)行了單細(xì)胞轉(zhuǎn)錄組測(cè)序,首次深度全面地剖析了早期復(fù)發(fā)性HCC的腫瘤免疫微環(huán)境。研究發(fā)現(xiàn),在早期復(fù)發(fā)性腫瘤中的惡性細(xì)胞具有更高的免疫逃逸特性,從而可能抑制樹(shù)突細(xì)胞激活CD8+T細(xì)胞的能力。這一發(fā)現(xiàn)揭示了與HCC復(fù)發(fā)相關(guān)的免疫應(yīng)答改變的獨(dú)特方面,為HCC合理的免疫治療提供了重要指導(dǎo)。

文章發(fā)表在Cell
DNBSEQ測(cè)序平臺(tái)助力超萬(wàn)例中國(guó)泛癌種患者ctDNA檢測(cè)研究
2021年1月4日,北京大學(xué)腫瘤醫(yī)院和中國(guó)人民解放軍總醫(yī)院的研究團(tuán)隊(duì)在Nature Communications在線發(fā)表了題為“Pan-cancer circulating tumor DNA detection in over 10,000 Chinese patients”的研究論文。該研究基于華大智造MGISEQ-2000測(cè)序平臺(tái),對(duì)11,525例癌癥患者(囊括41種主要癌癥類(lèi)型)的13,333份血液樣本進(jìn)行了血漿cfDNA和白細(xì)胞DNA平行測(cè)序,揭示了中國(guó)人群的ctDNA基因圖譜特征,探究了血漿和組織活檢之間的相似與差異,為進(jìn)一步探索基于ctDNA信息改善中國(guó)癌癥患者的治療方案和生存率提供了基礎(chǔ),也為臨床尋找治療靶點(diǎn)提供了新思路。

文章發(fā)表在Nature Communications
DNBSEQ測(cè)序平臺(tái)助力中國(guó)區(qū)域人群隊(duì)列腸道宏基因組研究
2021年1月14日,北京大學(xué)人民醫(yī)院、深圳華大生命科學(xué)研究院以及首都醫(yī)科大學(xué)附屬北京友誼醫(yī)院平谷醫(yī)院研究團(tuán)隊(duì)聯(lián)合在Nature Aging雜志在線發(fā)表題為“Sex- and age-related trajectories of the adult human gut microbiota shared across populations of different ethnicities”的研究成果。研究人員利用華大智造DNBSEQ測(cè)序平臺(tái),對(duì)北京平谷2,338名成年人(26~76歲)進(jìn)行高通量腸道宏基因組測(cè)序分析,首次開(kāi)展了分析數(shù)十種環(huán)境、表型(如性別、年齡、性激素、生活方式)等因素對(duì)中國(guó)北方漢族人群腸道菌群影響的研究,這也是迄今為止最大規(guī)模的中國(guó)人群腸道宏基因組研究。該研究首次揭示盡管不同種族人群在遺傳學(xué)、生活習(xí)慣、飲食、腸道菌群多樣性和結(jié)構(gòu)等方面存在巨大差異,但成人腸道菌群具有一致的性別差異,且女性比男性具有更高的菌群多樣性。

文章發(fā)表在Nature Aging
參考資料
[4] Zhang, X., Zhong, H., Li, Y. et al. Sex- and age-related trajectories of the adult human gut microbiota shared across populations of different ethnicities. Nat Aging 1, 87–100 (2021). https://doi.org/10.1038/s43587-020-00014-2
往期精品(點(diǎn)擊圖片直達(dá)文字對(duì)應(yīng)教程)
后臺(tái)回復(fù)“生信寶典福利第一波”或點(diǎn)擊閱讀原文獲取教程合集




























