Nature | 癌癥中轉(zhuǎn)錄組變化的基因組基礎(chǔ) (1)
鏈接:doi.org/10.1038/s41586-020-1970-0
摘 要

Extended Data Fig. 1 | 1,188例PCAWG捐獻者的泛癌表達譜
a,來自27種組織類型的腫瘤和正常RNA-seq數(shù)據(jù)。樣本總數(shù)顯示在柱狀圖的右邊。灰色條表示匹配的健康樣本。
b,女性和男性捐獻者的數(shù)量。
c,來自PCAWG研究的腫瘤總數(shù)和匹配的健康樣本。一組腫瘤(深紫色)已轉(zhuǎn)移。
癌癥特異性胚系順式-eQTLs
Cancer-specific germline cis-eQTLs
為了研究不同類型RNA改變的潛在機制,我們首先關(guān)注了基因表達水平的變化 (Extended Data Fig. 2)。

Extended Data Fig. 2 | 概述:在分析中考慮的遺傳變異的不同來源
所有體細(xì)胞順式eQTL分析的窗口大小為1 Mb;ASE與胚系順式eQTL分析的窗口大小為100 kb。
b,概述:不同的數(shù)據(jù)集,及其對a中所述分析的貢獻。
ASE和總表達 (Total expression/FPKM)來自腫瘤和正常RNA-seq數(shù)據(jù)。箭頭表示所執(zhí)行的單個分析之間的依賴關(guān)系。
我們最初考慮了常見的胚系變異 (次要等位基因頻率 (Minor allele frequency, MAF)≥1%)靠近單個基因 (±100 kb),并在隊列中繪制了表達定量性狀位點 (eQTL) (Extended Data Fig. 3, Supplementary Table 1)。


該泛癌分析發(fā)現(xiàn)了3,532個eQTL基因 (假發(fā)現(xiàn)率,即FDR≤5%,以下表示為eGenes) (Supplementary Table 2),富集于轉(zhuǎn)錄起始位點的近端區(qū)域 (TSSs) (Extended Data Fig. 3)。
為了識別癌癥特異性調(diào)控變異,我們將我們的eQTL與來自基因型-組織表達項目 (GTEx,數(shù)據(jù)一般來自健康組織)的eQTL進行比較,采用之前的策略來評估eQTL的Replication,并探索先導(dǎo)eQTL變異在GTEx組織中的邊緣意義 (P≤0.01, Bonferroni-adjusted)。

盡管大多數(shù)先導(dǎo)變異在GTEx樣本中都能檢測到 (3,532個eQTL變異中有3,110個),但我們鑒定出了422個 (~8.4%)與GTEx組織不對應(yīng)的eQTL,這提示了存在癌癥特異性調(diào)控 (Extended Data Fig. 4, Supplementary Table 3)。相應(yīng)的eQTL先導(dǎo)變異富集于異染色質(zhì)區(qū) (Heterochromatic region) (圖1a)。總的來說,這一分析揭示了基因表達調(diào)控的胚系框架 (Germline framework)在癌癥組織中很大程度上是保守的。

Somatic cis-eQTLs in non-coding regions
先前的其它研究已經(jīng)描述了癌癥中的非編碼突變,特別是在啟動子區(qū),及其對基因表達的調(diào)控作用。在這里,我們研究了整個基因組中,可能的體細(xì)胞DNA變化,這些變化是基因表達變化的基礎(chǔ)。

Extended Data Fig. 5 | 順式突變體細(xì)胞負(fù)擔(dān) (Cis-mutational somatic burden)
我們通過聚集 (Aggregating)基因附近 (側(cè)翼)2 kb區(qū)間 (2-kb intervals adjacent to genes, flanking)的SNV,以及處在外顯子、內(nèi)含子中的SNV (Extended Data Figs. 2, 5, 6),來估計局部突變負(fù)荷 (Estimat local mutation burden)。


接下來,我們分解 (Decomposed)了單個基因的表達變化,考慮了順式基因中常見的突變負(fù)荷,以及順式胚系變異和體細(xì)胞拷貝數(shù)改變 (SCNAs)。這表明SCNAs是表達變化的主要驅(qū)動因素 (17%),其次是基因側(cè)翼區(qū)域的體細(xì)胞SNV (1.8%)和胚系變異 (1.3%) (圖1b)。
我們還測試了所有常見突變負(fù)荷和整個基因組的基因表達之間的關(guān)聯(lián)。我們鑒定了649個具有體細(xì)胞eQTL (FDR≤5%)的基因 (Supplementary Table 5)。其中,11個關(guān)聯(lián)結(jié)果位于相應(yīng)eGene的內(nèi)含子或外顯子,包括在特定癌癥發(fā)病機制中已知存在作用的基因,如卵巢癌中的CDK12和慢性淋巴細(xì)胞白血病中的IRF4 (Extended Data Figs. 7, 8)。
大多數(shù)eQTL (68.4%)與側(cè)邊非編碼突變負(fù)荷相關(guān) (Extended Data Fig. 6e)。


Extended Data Fig. 7 | 與遺傳先導(dǎo)負(fù)荷 (Genic lead burden)相關(guān)聯(lián)的7個體細(xì)胞eGenes的曼哈頓圖


Extended Data Fig. 8 | 8個體細(xì)胞eGenes的散點圖
接下來,我們考慮了位于側(cè)翼區(qū)域 (n = 556)的eQTLs,并測試了來自Epigenetics Roadmap的細(xì)胞類型特異性注釋的富集。這確定了13個富集的注釋突變 (FDR≤10%) (Extended Data Fig. 9, Supplementary Table 6),包括待發(fā) (Poised)啟動子,弱的和活躍的增強子,以及異染色質(zhì),但明顯沒有富集到轉(zhuǎn)錄因子結(jié)合位點 (Supplementary Table 7)。轉(zhuǎn)錄不活躍區(qū)域的富集可能是由于這些區(qū)域的突變率增加 (Extended Data Fig. 9),之前在癌癥中有報道。

我們還研究了體細(xì)胞eGenes的功能特征,并觀察到癌細(xì)胞testis基因的二價 (Bivalent)啟動子中體細(xì)胞eQTLs的富集 (P = 0.04, Fisher’s exact test),如TEKT518 (Fig. 1c, Extended Data Fig. 8h)。
此外,我們發(fā)現(xiàn)了與細(xì)胞分化和發(fā)育過程相關(guān)的基因本體 (即GO)類別的整體 (Global)富集 (FDR≤10%) (Supplementary Table 8)??傮w而言,體細(xì)胞eQTL分析發(fā)現(xiàn),大多數(shù)非編碼區(qū)域與局部基因表達的變化相關(guān),與癌癥特異性胚系eQTL類似,顯示了轉(zhuǎn)錄非活性區(qū)域的富集,如異染色質(zhì)。
未完 (約剩余80%的內(nèi)容)
往期精品(點擊圖片直達文字對應(yīng)教程)
后臺回復(fù)“生信寶典福利第一波”或點擊閱讀原文獲取教程合集




























