單細(xì)胞轉(zhuǎn)錄組基本概念(一)
普通轉(zhuǎn)錄組的思路也可以應(yīng)用到單細(xì)胞轉(zhuǎn)錄組。普通轉(zhuǎn)錄組相當(dāng)于把一群細(xì)胞或一個器官混合到一起去提取RNA,獲得的是每個細(xì)胞中RNA表達(dá)量的平均值。單細(xì)胞是把每個細(xì)胞單獨(dú)分出來去提取RNA,然后建庫測序,獲得是是單個細(xì)胞的表達(dá)值。在每個細(xì)胞里面基因的表達(dá)具有隨機(jī)性,且存在異質(zhì)性。而且這些細(xì)胞群中會存在不同類型的細(xì)胞,尤其是當(dāng)我們對整個組織或者器官進(jìn)行測序時,它們本身就是由不同類型的細(xì)胞組成的,而我們用普通轉(zhuǎn)錄組來測序,相當(dāng)于掩蓋住了這些不同的細(xì)胞類型的差異,展示的是整個組織的平均的狀態(tài),所以說單細(xì)胞從這個來看跟普通轉(zhuǎn)錄組就不同在是用一個細(xì)胞測,不是用一堆細(xì)胞測。
既然是做單細(xì)胞,第一步就是把單個細(xì)胞分選出來。分選的方式也比較多,物理切割,酶消化,F(xiàn)ACS分選等。假如已經(jīng)分到了一個單細(xì)胞,跟常規(guī)的轉(zhuǎn)錄組步驟上是一樣的。下一步就是把單細(xì)胞里的RNA提取出來去建庫測序。但是一個細(xì)胞里的RNA含量是比較少的,難建庫成功。這個里面“量”的概念很有意思。比如說單細(xì)胞量少,需要特殊處理。到我們做計算的,量大需要特殊處理。比如微信這個工具,看上去誰都可以做,就是一個信息發(fā)送和接收的工具,技術(shù)難度不大。但如果是做成承載8億用戶的平臺,難度就大了很多了。后面講到的單細(xì)胞聚類也是,數(shù)量一大,就得先降維再聚類。建庫之前需要做一步擴(kuò)增,擴(kuò)增主要有2個方式,一個是體外轉(zhuǎn)錄,另一個是常規(guī)的PCR擴(kuò)增。因?yàn)閱渭?xì)胞的RNA量比較少,所以要擴(kuò)增的話循環(huán)數(shù)就會比較多,會引入一些PCR擴(kuò)增帶來的偏好性,為了解決這個問題,就有了現(xiàn)在的第2個技術(shù)——體外轉(zhuǎn)錄。這個技術(shù)不通過擴(kuò)增,在RNA上加一個T7的啟動子,讓它一輪一輪的轉(zhuǎn)錄出新的RNA,實(shí)現(xiàn)線性擴(kuò)增。
PCR也有對應(yīng)的線性擴(kuò)增的技術(shù),當(dāng)獲得了可以反轉(zhuǎn)錄成足夠量cDNA的RNA之后,就可以把它按照之前常規(guī)轉(zhuǎn)錄組的方式去建庫測序,后續(xù)的分析也是比較類似。
因?yàn)閱渭?xì)胞里面RNA的量少,所以說整個富集的過程中會出現(xiàn)一部分基因在一個細(xì)胞里能檢測到,在另外一個細(xì)胞里面檢測不到,而每個細(xì)胞里面的檢測存在一個隨機(jī)性,同時單細(xì)胞測序深度比較低,所以說分析時相比于普通轉(zhuǎn)錄組有一些是需要特別注意,但整體的分析思路是類似的。
單細(xì)胞轉(zhuǎn)錄組的分析流程,主要還在在后期的聚類、發(fā)育軌跡、整合分析等。
下圖是單細(xì)胞轉(zhuǎn)錄組測序技術(shù)的發(fā)展,橫軸是時間,縱軸是每一個技術(shù)所能檢測到的細(xì)胞的量的變化,基本服從指數(shù)的分布。
1992年Eberwine教授采用體內(nèi)反轉(zhuǎn)和體外轉(zhuǎn)錄技術(shù)測定了單個細(xì)胞里的數(shù)個基因的表達(dá)。后續(xù)非靶向的mRNA擴(kuò)增技術(shù)的發(fā)展為2009年湯富酬老師打響單細(xì)胞測序前兩槍提供了技術(shù)基礎(chǔ)。
湯富酬老師在國外做博后的時候,2009、2010年2篇文章拉開了單細(xì)胞轉(zhuǎn)錄組測序的序幕,現(xiàn)在他也是單細(xì)胞領(lǐng)域特別高產(chǎn)的研究者。當(dāng)時單細(xì)胞轉(zhuǎn)錄組測序主要應(yīng)用于特別難獲取的細(xì)胞,比如說胚胎發(fā)育早期,合子,二細(xì)胞,四細(xì)胞,八細(xì)胞期,這時候因?yàn)槊恳粋€階段細(xì)胞的數(shù)目都是很有限的,當(dāng)時就想著能夠開發(fā)一個技術(shù)對這種含量特別少的細(xì)胞能夠提取建庫成功,然后獲得它們的表達(dá)量,從而來研究這些常規(guī)轉(zhuǎn)錄組所研究不了的生物過程,所以當(dāng)時的發(fā)展是盡量提高測序的深度。
到了后來也還是2010年,也是目前在單細(xì)胞領(lǐng)域比較火的一個老師,郭國驥老師,他在哈佛做博后時用fluidigm的一個設(shè)備檢測了500個細(xì)胞的48個基因的單細(xì)胞的RT-qPCR結(jié)果,發(fā)現(xiàn)用這48個基因可以對500個細(xì)胞進(jìn)行很好的細(xì)胞分型,定義每個細(xì)胞的類型。所以大家看到這篇文章開始逐漸意識到,完全可以在單細(xì)胞分析上以量取勝,就是每個細(xì)胞可以測的比較淺,但是測很多細(xì)胞,這樣對鑒定細(xì)胞類型很有幫助,所以說后續(xù)技術(shù)的大部分優(yōu)化點(diǎn)都在于如何提高檢測通量上,而現(xiàn)在我們已經(jīng)可以檢測幾千或者上萬的細(xì)胞。
后續(xù)就由此發(fā)展出來很多技術(shù),比如drop-seq,indrop,10Xgenomics,這些都是基于droplets的技術(shù)。早期單細(xì)胞的分選主要靠人工,用移液管,移液槍或者顯微操作去把細(xì)胞單個單個的分出來,再放到微孔里一個一個進(jìn)行反應(yīng),或者使用fluidigm的微流控設(shè)備或者操作機(jī)器人,之后就有了更自動化的設(shè)備,使得我們用更低的成本,更少的時間來檢測出來更多的細(xì)胞。
這些技術(shù)都不能保留細(xì)胞原始的空間上的位置,而In situ barcoding或者Picowells可以讓我們得知這個細(xì)胞在原始空間上誰跟誰更近,同時可以檢測出來這些細(xì)胞里面基因的表達(dá)量,提供另外一個維度的信息。
郭國驥老師另外一篇cell中的Microwell-seq可以檢測數(shù)萬個細(xì)胞,是屬于測序成本比較低的技術(shù),后面再講它的基本應(yīng)用。
原位序列條形碼標(biāo)記(例如單細(xì)胞組合索引RNA測序(sci-RNA-seq)和基于分池連接的轉(zhuǎn)錄組測序(split-poolligation-based transcriptomesequencing, SPLiT-seq)

在SpatialTranscriptomics(美國10XGenomics公司)和Slide-seq方法中,采用寡核苷酸芯片(oligo-arrayed microarray slides)和布滿寡核苷酸的凝珠 (denselypacked oligo-coatedbeads) 直接從冷凍組織切片中捕獲RNA進(jìn)行測序。寡核苷酸包含spatialbarcode,UMI和oligo-dT引物,可唯一識別每個轉(zhuǎn)錄本及其位置。測序reads比對回玻片坐標(biāo)獲得空間基因表達(dá)信息。
已經(jīng)證明,SpatialTranscriptomics可用于多種物種的組織,包括小鼠腦和人乳腺癌組織、人心臟組織和擬南芥花序組織。Slide-seq是一項(xiàng)最新開發(fā)的技術(shù),已顯示可用于小鼠大腦的冷凍切片分析。這些直接的mRNA捕獲方法不需要專門的設(shè)備,具有相對簡單的分析方法,并且可能大規(guī)模應(yīng)用于許多組織。
但是,有兩個重要的問題有待解決。首先,該技術(shù)只能應(yīng)用于新鮮的冷凍組織。其次,分辨率受到芯片大小和寡核苷酸凝珠間距的限制;當(dāng)前應(yīng)用的芯片大小分別為6.5×7mm和3×3mm,限制了可以檢測的組織切片的大小。SpatialTranscriptomics的凝珠直徑為100μm,間隔為100μm,這意味著它們不夠小或不夠密,以致無法實(shí)現(xiàn)單細(xì)胞分辨率。Slide-seq的凝珠 (beads)小得多,直徑僅為10 μm,并且堆積致密,提供了十倍的空間分辨率,大約一半的beads可以獲得單個細(xì)胞數(shù)據(jù)。


真正想了解大腦,你還需要一個空間背景(spatial context),因?yàn)榇竽X細(xì)胞不像肝臟或其他器官那樣以對稱的方式組織,大腦的不同尋常之處在于它具有神經(jīng)元的拓?fù)浣Y(jié)構(gòu)。因此,我們希望能夠觀察大腦的一部分,看看那里有哪些細(xì)胞、它們在哪里,以及它們周圍有哪些類型的細(xì)胞。
MERFISH的主要應(yīng)用之一是原位識別細(xì)胞類型。不同的細(xì)胞類型有不同的基因表達(dá)譜。因此,這些基因表達(dá)譜為細(xì)胞類型鑒定提供了定量和系統(tǒng)的方法。由于我們可以通過MERFISH成像在完整組織中做到這一點(diǎn),我們也可提供這些細(xì)胞類型的空間結(jié)構(gòu)(spatial organization)。

極限稀釋加移液槍分離單細(xì)胞;顯微操作分選單細(xì)胞;流式分選帶有表面Marker的單細(xì)胞;激光切割實(shí)體組織;微流控技術(shù);磁珠捕獲,主要用于CTC
它的一個優(yōu)點(diǎn)是可以結(jié)合流式細(xì)胞熒光分選(FACS, fluorescent activated cell sorting)根據(jù)表面Marker分選細(xì)胞。因此特別適合分選細(xì)胞子集用于測序。它的另一個優(yōu)點(diǎn)是可以獲得細(xì)胞形態(tài)全覽圖,提供另外一個維度的信息,可用于鑒定微孔中是否有損傷的細(xì)胞或雙份細(xì)胞,主要缺點(diǎn)是通量低且每個細(xì)胞所需的工作量相當(dāng)大。
微流型平臺,比如Fluidigm’s C1,提供了一個更加整合的系統(tǒng),同時可以捕獲細(xì)胞和完成文庫構(gòu)建的準(zhǔn)備過程。比微孔型平臺通量更高,但只能捕獲10%的細(xì)胞,不適合處理稀有細(xì)胞或細(xì)胞量量很少的情況。
液滴型方法是將單獨(dú)的細(xì)胞和一個包含建庫所學(xué)酶的珠粒(bead)包裹在一個納米級液滴里面。特殊地,每個珠粒(bead)包含一段獨(dú)特的條形碼序列(barcode),會加到所有來自于液滴里面這個細(xì)胞的序列上,用于區(qū)分不同細(xì)胞的轉(zhuǎn)錄本。
采用光刻技術(shù)制作微孔矩陣硅片(微孔直徑28 um,深度35 um,100,000個微孔),以此為模具制作PDMS微柱模具。這兩個模具可以反復(fù)使用。最終用于富集的微孔板是通過傾到5%的瓊脂糖凝膠到PDMS微柱模具上生成的。細(xì)胞懸液加到凝膠微孔模具上,利用重力使細(xì)胞落入微孔,通常一個微孔只能容納一個細(xì)胞,一塊板子可以同時捕獲約10000個單細(xì)胞。每一步操作都可視、可控制,doublets可以通過鏡檢洗除。隨后每個孔加入包含107-108特定探針集的與孔徑大小匹配的磁珠,標(biāo)記每個細(xì)胞中的mRNA(每個磁珠的寡核苷酸序列中都有一段特異的序列用于標(biāo)記細(xì)胞來源),然后使用Smart-seq2方法進(jìn)行后續(xù)的反轉(zhuǎn)錄、擴(kuò)增。擴(kuò)增后的cDNA片段使用轉(zhuǎn)座酶片段化(這步倒有些類似ATAC-seq),富集3’末端轉(zhuǎn)錄本序列測序。








理論上,每個唯一的UMI-轉(zhuǎn)錄本對應(yīng)該對應(yīng)來源于一個RNA分子的所有reads。但是現(xiàn)實(shí)往往并非如此,最常見的原因是:
不同的UMI序列不一定表示它們是不同的UMI分子 由于PCR或測序錯誤,堿基替換可能導(dǎo)致新的UMI序列。較長的UMI出現(xiàn)堿基替換的機(jī)會更多。根據(jù)細(xì)胞條碼測序錯誤估計,7-10%的10 bp長度的UMI中至少有一個堿基替換。如果錯誤沒有糾正,將會過高估計轉(zhuǎn)錄本的數(shù)目。
不同的轉(zhuǎn)錄本不一定是不同的分子 比對錯誤或多個比對位置可能導(dǎo)致某些UMI對應(yīng)到錯誤的基因/轉(zhuǎn)錄本。這種類型的錯誤也會導(dǎo)致過高估計轉(zhuǎn)錄本的數(shù)目。
相同的UMI不一定意味著相同的分子UMI頻次的不同和短UMI可導(dǎo)致同一UMI和相同基因的不同mRNA分子相連,進(jìn)而可能低估轉(zhuǎn)錄本數(shù)量。


后面再繼續(xù)不同技術(shù)之間的比較
往期精品(點(diǎn)擊圖片直達(dá)文字對應(yīng)教程)
后臺回復(fù)“生信寶典福利第一波”或點(diǎn)擊閱讀原文獲取教程合集




























