<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          基于Salmon的轉(zhuǎn)錄組批量定量流程和差異分析

          共 2089字,需瀏覽 5分鐘

           ·

          2020-12-15 10:29

          繼續(xù)前文:基于Salmon的轉(zhuǎn)錄組定量流程

          循環(huán)定量多個(gè)樣品的表達(dá)量

          整理樣本信息表,命名為sampleFile,內(nèi)容如下:

          Samp    conditions    individual
          untrt_N61311 untrt N61311
          untrt_N052611 untrt N052611
          untrt_N080611 untrt N080611
          untrt_N061011 untrt N061011
          trt_N61311 trt N61311
          trt_N052611 trt N052611
          trt_N080611 trt N080611
          trt_N061011 trt N061011

          采用for循環(huán)進(jìn)行批量定量 (參考這個(gè)為生信學(xué)習(xí)打造的開源Bash教程真香?。?/a>,理解更多):

          for samp in `tail -n +2 sampleFile | cut -f 1`; do salmon quant --gcBias -l A -1 ${samp}_1.fq.gz -2 ${samp}_2.fq.gz  -i genome/GRCh38.salmon_sa_index -o ${samp}/${samp}.salmon.count -p 4 >${samp}.salmon.log 2>&1; done &

          整理Salmon定量文件用于DESeq2差異基因鑒定

          找到Salmon的輸出文件并壓縮起來(lái),用于下載到本地進(jìn)行差異分析。

          # 列出salmon的輸出文件
          find . -name quant.sf
          # 這個(gè)壓縮包下載解壓到本地
          zip quant.sf.zip `find . -name quant.sf`

          生成輔助文件,指出每個(gè)樣品對(duì)應(yīng)的自己的quant.sf文件,便于導(dǎo)入tximport包。

          # 生成一個(gè)兩列文件方便R導(dǎo)入
          # xargs接收上一步的輸出,按批次提供給下游程序作為輸入
          # -i: 用{}表示傳遞的值
          cut -f 1 sampleFile | xargs -i echo -e "{}\t{}/{}.salmon.count/quant.sf" >salmon.output
          head salmon.output

          兩列文件

          # Samp    Samp/Samp.salmon.count/quant.sf
          # untrt_N61311 untrt_N61311/untrt_N61311.salmon.count/quant.sf
          # untrt_N052611 untrt_N052611/untrt_N052611.salmon.count/quant.sf

          獲得基因和轉(zhuǎn)錄本的對(duì)應(yīng)關(guān)系,獲取基因的表達(dá)量

          # 如果沒(méi)有GTF文件,可以用其他文件,只需獲取轉(zhuǎn)錄本和基因名字對(duì)應(yīng)關(guān)系就可以
          # 如果不知道對(duì)應(yīng)關(guān)系,也可以把每個(gè)轉(zhuǎn)錄本當(dāng)做一個(gè)基因進(jìn)行分析
          # Trinity拼裝時(shí)會(huì)生成這個(gè)文件
          # 注意修改$14, $10為對(duì)應(yīng)的信息列,
          # tx2gene為一個(gè)兩列文件,第一列是轉(zhuǎn)錄本沒(méi)名字,第二列是基因名字。
          sed 's/"/\t/g' genome/GRCh38.gtf | awk 'BEGIN{OFS=FS="\t"}{if(FNR==1) print "TXname\tGene"; if($3=="transcript") print $14, $10}' >GRCh38.tx2gene
          head GRCh38.tx2gene

          轉(zhuǎn)錄本->基因

          # TXname  Gene
          # ENST00000608838 ENSG00000178591
          # ENST00000382410 ENSG00000178591
          # ENST00000382398 ENSG00000125788
          # ENST00000542572 ENSG00000125788

          至此就完成了基于Salmon的所有樣本基因和轉(zhuǎn)錄本的定量。然后下載sampleFile、GRCh38.tx2genesalmon.output、quant.sf.zip文件到本地進(jìn)行下游分析。

          具體差異基因鑒定可參考高通量數(shù)據(jù)中批次效應(yīng)的鑒定和處理 - 系列總結(jié)和更新

          往期精品(點(diǎn)擊圖片直達(dá)文字對(duì)應(yīng)教程)


          后臺(tái)回復(fù)“生信寶典福利第一波”或點(diǎn)擊閱讀原文獲取教程合集

          ?

          (請(qǐng)備注姓名-學(xué)校/企業(yè)-職務(wù)等)


          瀏覽 47
          點(diǎn)贊
          評(píng)論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          評(píng)論
          圖片
          表情
          推薦
          點(diǎn)贊
          評(píng)論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  在线观看黄色国产视频 | 五月丁香网色 | 天堂成人| A片黄色视频 | AV片网址 |