<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          Nature | 癌癥中轉(zhuǎn)錄組變化的基因組基礎(chǔ) (1)

          共 5364字,需瀏覽 11分鐘

           ·

          2022-07-04 13:16

          文章:Genomic basis for RNA alterations in cancer
          接收: 2019-12-11
          作者:PCAWG Transcriptome Core Group

          鏈接:doi.org/10.1038/s41586-020-1970-0

          摘 要

            轉(zhuǎn)錄本的改變通常是由癌癥基因組中的體細(xì)胞變化引起的。癌癥中描述了各種形式的RNA改變 (RNA alteration),包括:過表達、剪接改變基因融合 (Overexpression/Altered splicing/Gene fusions)。然而,由于患者之間以及腫瘤類型之間的異質(zhì)性 (Heterogeneity),以及通過轉(zhuǎn)錄組全基因組測序分析樣本的相對較小的患者隊列 (Small cohort),很難將這些歸因于潛在的基因組變化。
            在這里,我們展示了迄今為止據(jù)我們所知的最全面的癌癥相關(guān)基因改變目錄,該目錄是通過描述國際癌癥基因組聯(lián)盟(ICGC)和癌癥基因組圖譜(TCGA)的泛癌全基因組分析(PCAWG)聯(lián)盟1,188名捐贈者的腫瘤轉(zhuǎn)錄組獲得的。我們利用匹配的 (Matched)全基因組測序數(shù)據(jù),將幾種類型的RNA改變胚系體細(xì)胞DNA改變相關(guān)聯(lián),并確定了可能的遺傳機制 (Genetic mechanism)。
            細(xì)胞拷貝數(shù)改變總基因 (Total gene)等位基因特異性 (Allele-specific expression, ASE)表達變化的主要驅(qū)動因素。
            我們鑒定了649個體細(xì)胞SNV與基因表達的順式 (cis)相關(guān)性,其中68.4%與基因的側(cè)翼非編碼區(qū)相關(guān) (Flanking non-coding region)。我們發(fā)現(xiàn)1,900個與體細(xì)胞突變相關(guān)的剪接改變,包括在靠近Alu元件的內(nèi)含子內(nèi)部的外顯子形成 (Formation of exons within introns in proximity to Alu elements)。此外,82%的基因融合與結(jié)構(gòu)變異相關(guān),包括75個新類別的“橋接”融合 (由第三個基因組位置連接兩個基因)。
            我們觀察到不同癌癥類型的轉(zhuǎn)錄組改變的特征不同,并且與DNA突變特征的變化相關(guān)聯(lián)。本研究所獲得的基因組背景下RNA改變的概要,為確定與癌癥功能相關(guān)的基因和機制,提供了豐富的資源。
          引 言
            為了更廣泛地研究癌癥基因組的改變,特別是在非編碼區(qū),PCAWG項目的成立是為了分析大量的全基因組樣本,這些樣本被貢獻給ICGC和TCGA項目。個別項目沒有使用相同的方法進行關(guān)鍵分析。因此,16個PCAWG工作組的一個主要重點是統(tǒng)一分析PCAWG數(shù)據(jù)。例如,PCAWG技術(shù)工作組領(lǐng)導(dǎo)了原始數(shù)據(jù)收集、全基因組測序數(shù)據(jù)的重新排列,并實施了核心體細(xì)胞突變檢測流程 (Somatic mutation calling pipeline)。PCAWG的其它工作組集中于對拷貝數(shù)變異、結(jié)構(gòu)變異、胚系變異、突變特征和驅(qū)動基因鑒定等進行統(tǒng)一分析。
            在此,我們報告了PCAWG轉(zhuǎn)錄組工作組對來自27種腫瘤類型的1,188個樣本 (每類腫瘤154~6個樣本;均值:44)的匹配可用的轉(zhuǎn)錄組和基因組圖譜的聯(lián)合分析 (Joint analysis of available matched transcriptome and genome profiling),提供了迄今為止我們所知的最大的癌癥RNA表型及其潛在的遺傳變化基礎(chǔ) (RNA phenotypes and their underlying genetic changes in cancer)資源 (Extended Data Fig. 1, Methods, Supplementary Results, Supplementary Table 23)。

          Extended Data Fig. 1 | 1,188例PCAWG捐獻者的泛癌表達譜

          a,來自27種組織類型的腫瘤和正常RNA-seq數(shù)據(jù)。樣本總數(shù)顯示在柱狀圖的右邊。灰色條表示匹配的健康樣本。

          b,女性和男性捐獻者的數(shù)量。

          c,來自PCAWG研究的腫瘤總數(shù)和匹配的健康樣本。一組腫瘤(深紫色)已轉(zhuǎn)移。

            總之,我們展示了轉(zhuǎn)錄組數(shù)據(jù)在理解特定DNA改變的不同維度如何促進癌變的重要性,并繪制出癌癥相關(guān)RNA改變的圖景 (Landscape)

           癌癥特異性胚系順式-eQTLs 

          Cancer-specific germline cis-eQTLs

            為了研究不同類型RNA改變的潛在機制,我們首先關(guān)注了基因表達水平的變化 (Extended Data Fig. 2)

          Extended Data Fig. 2 | 概述:在分析中考慮的遺傳變異的不同來源

          a, 為了分析順式調(diào)控,使用標(biāo)準(zhǔn)eQTL方法,分別檢測單等位、單核苷酸 (Mono-allelic single-nucleotide)胚系變異 (SNV,藍色)與總基因表達 (Total gene expression)的關(guān)聯(lián)。(藍色圓點SNV,在樣本中存在完全相同的基因組位置;上圖的示例有3處)
            由于體細(xì)胞SNV在隊列中復(fù)發(fā)率較低 (Low recurrence,色圓點SNV,在樣本中不存在完全相同的基因組位置;上圖的示例有0處),根據(jù)它們相對于所觀測的基因的位置 (例如啟動子、5 ' UTR或內(nèi)含子),體細(xì)胞SNV被聚集在負(fù)荷分類中 (Aggregated in burden categories) (例如上圖的“Local somatic SNV burden”)。
            然后,使用eQTL方法測試局部SNV負(fù)荷,獲取與所有基因的ASE globally關(guān)聯(lián),以及在每個基因水平上的總表達。通過檢測與突變及表觀遺傳特征相關(guān)的總基因表達,來估計反式效應(yīng) (Trans effects)。

            所有體細(xì)胞順式eQTL分析的窗口大小為1 Mb;ASE與胚系順式eQTL分析的窗口大小為100 kb。

          b,概述:不同的數(shù)據(jù)集,及其對a中所述分析的貢獻。

            胚系基因型來源于匹配的 (Matched)健康全基因組測序 (WGS)樣本。與未受影響的 (Unaffected) WGS樣本相比,來自腫瘤WGS的等位基因特異性SCNAs (體細(xì)胞拷貝數(shù)改變)、突變特征和局部SNV負(fù)荷。

            ASE和總表達 (Total expression/FPKM)來自腫瘤和正常RNA-seq數(shù)據(jù)。箭頭表示所執(zhí)行的單個分析之間的依賴關(guān)系。

            我們最初考慮了常見的胚系變異 (次要等位基因頻率 (Minor allele frequency, MAF)≥1%)靠近單個基因 (±100 kb),并在隊列中繪制了表達定量性狀位點 (eQTL) (Extended Data Fig. 3, Supplementary Table 1)。

          Extended Data Fig. 3 | 胚系eQTL中的先導(dǎo)變異 (Lead variants)

            該泛癌分析發(fā)現(xiàn)了3,532個eQTL基因 (假發(fā)現(xiàn)率,即FDR≤5%,以下表示為eGenes) (Supplementary Table 2),富集于轉(zhuǎn)錄起始位點的近端區(qū)域 (TSSs) (Extended Data Fig. 3)

            為了識別癌癥特異性調(diào)控變異,我們將我們的eQTL與來自基因型-組織表達項目 (GTEx,數(shù)據(jù)一般來自健康組織)的eQTL進行比較,采用之前的策略來評估eQTL的Replication,并探索先導(dǎo)eQTL變異在GTEx組織中的邊緣意義 (P≤0.01, Bonferroni-adjusted)。

            盡管大多數(shù)先導(dǎo)變異在GTEx樣本中都能檢測到 (3,532個eQTL變異中有3,110個),但我們鑒定出了422個 (~8.4%)與GTEx組織不對應(yīng)的eQTL,這提示了存在癌癥特異性調(diào)控 (Extended Data Fig. 4, Supplementary Table 3)。相應(yīng)的eQTL先導(dǎo)變異富集于異染色質(zhì)區(qū) (Heterochromatic region) (圖1a)。總的來說,這一分析揭示了基因表達調(diào)控的胚系框架 (Germline framework)在癌癥組織中很大程度上是保守的。


          Fig. 1 | 胚系及體細(xì)胞SNV與基因表達的關(guān)聯(lián)
          非編碼區(qū)體細(xì)胞順式eQTL

          Somatic cis-eQTLs in non-coding regions

            先前的其它研究已經(jīng)描述了癌癥中的非編碼突變,特別是在啟動子區(qū),及其對基因表達的調(diào)控作用。在這里,我們研究了整個基因組中,可能的細(xì)胞DNA變化,這些變化是基因表達變化的基礎(chǔ)

          (橫軸) Shared Aliquots (共享的整除數(shù))

          Extended Data Fig. 5 | 順式突變體細(xì)胞負(fù)擔(dān) (Cis-mutational somatic burden)

            我們通過聚集 (Aggregating)基因附近 (側(cè)翼)2 kb區(qū)間 (2-kb intervals adjacent to genes, flanking)的SNV,以及處在外顯子、內(nèi)含子中的SNV (Extended Data Figs. 2, 5, 6),來估計局部突變負(fù)荷 (Estimat local mutation burden)。

          Extended Data Fig. 6 | 按檢測區(qū)域類型劃分的體細(xì)胞突變率和負(fù)擔(dān)頻率 (Somatic mutation rate and burden frequency)

            接下來,我們分解 (Decomposed)了單個基因的表達變化,考慮了順式基因中常見的突變負(fù)荷,以及順式胚系變異和體細(xì)胞拷貝數(shù)改變 (SCNAs)。這表明SCNAs是表達變化的主要驅(qū)動因素 (17%),其次是基因側(cè)翼區(qū)域的體細(xì)胞SNV (1.8%)和胚系變異 (1.3%) (圖1b)。

            我們還測試了所有常見突變負(fù)荷和整個基因組的基因表達之間的關(guān)聯(lián)。我們鑒定了649個具有體細(xì)胞eQTL (FDR≤5%)的基因 (Supplementary Table 5)。其中,11個關(guān)聯(lián)結(jié)果位于相應(yīng)eGene的內(nèi)含子或外顯子,包括在特定癌癥發(fā)病機制中已知存在作用的基因,如卵巢癌中的CDK12和慢性淋巴細(xì)胞白血病中的IRF4 (Extended Data Figs. 7, 8)

            大多數(shù)eQTL (68.4%)與側(cè)邊非編碼突變負(fù)荷相關(guān) (Extended Data Fig. 6e)。

          Extended Data Fig. 7 | 與遺傳先導(dǎo)負(fù)荷 (Genic lead burden)相關(guān)聯(lián)的7個體細(xì)胞eGenes的曼哈頓圖

          Extended Data Fig. 8 | 8個體細(xì)胞eGenes的散點圖

            接下來,我們考慮了位于側(cè)翼區(qū)域 (n = 556)的eQTLs,并測試了來自Epigenetics Roadmap的細(xì)胞類型特異性注釋的富集。這確定了13個富集的注釋突變 (FDR≤10%) (Extended Data Fig. 9, Supplementary Table 6),包括待發(fā) (Poised)啟動子,弱的和活躍的增強子,以及異染色質(zhì),但明顯沒有富集到轉(zhuǎn)錄因子結(jié)合位點 (Supplementary Table 7)。轉(zhuǎn)錄不活躍區(qū)域的富集可能是由于這些區(qū)域的突變率增加 (Extended Data Fig. 9),之前在癌癥中有報道。

          Extended Data Fig. 9 | 表觀基因組圖譜 (Roadmap epigenome)標(biāo)記與體細(xì)胞負(fù)荷重疊的側(cè)翼間隔

            我們還研究了體細(xì)胞eGenes的功能特征,并觀察到癌細(xì)胞testis基因的二價 (Bivalent)啟動子中體細(xì)胞eQTLs的富集 (P = 0.04, Fisher’s exact test),如TEKT518 (Fig. 1c, Extended Data Fig. 8h)。

            此外,我們發(fā)現(xiàn)了與細(xì)胞分化和發(fā)育過程相關(guān)的基因本體 (即GO)類別的整體 (Global)富集 (FDR≤10%) (Supplementary Table 8)??傮w而言,體細(xì)胞eQTL分析發(fā)現(xiàn),大多數(shù)非編碼區(qū)域與局部基因表達的變化相關(guān),與癌癥特異性胚系eQTL類似,顯示了轉(zhuǎn)錄非活性區(qū)域的富集,如異染色質(zhì)。

          未完 (約剩余80%的內(nèi)容)

          往期精品(點擊圖片直達文字對應(yīng)教程)

          機器學(xué)習(xí)

          后臺回復(fù)“生信寶典福利第一波”或點擊閱讀原文獲取教程合集



          瀏覽 71
          點贊
          評論
          收藏
          分享

          手機掃一掃分享

          分享
          舉報
          評論
          圖片
          表情
          推薦
          點贊
          評論
          收藏
          分享

          手機掃一掃分享

          分享
          舉報
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  婷婷丁香激情 | 亚洲免费播放视频 | 亲子乱高潮1000部视频A片 | 婷婷高清av免费在线 | 在线欧美日本 |