Illumina測(cè)序什么時(shí)候會(huì)測(cè)序到接頭序列?
什么是插入片段?
在NGS基礎(chǔ) - 高通量測(cè)序原理中提到過(guò)文庫(kù)的構(gòu)建,具體如下圖

圖中黑色片段即為我們的插入片段。根據(jù)測(cè)序用途不同,插入片段一般也不同。
常規(guī)轉(zhuǎn)錄組測(cè)序、重測(cè)序插入片段為
200-300 nt。擴(kuò)增子測(cè)序插入片段長(zhǎng)度取決于使用的擴(kuò)增引物,一般
400-550nt。小 RNA 測(cè)序插入片段長(zhǎng)度為
18-40 nt。
插入片段長(zhǎng)短與測(cè)序接頭是什么關(guān)系呢?
我們看下測(cè)序的過(guò)程:

測(cè)序引物錨定在序列模板上,正好與模板的Rd2 SP (SP: sequence primer測(cè)序引物)完全互補(bǔ)配對(duì),隨后開始邊合成邊測(cè)序,所以測(cè)序reads 5'端的接頭和引物序列都不會(huì)被測(cè)到,直接跳過(guò)。測(cè)序的第一個(gè)堿基是插入片段的第一個(gè)堿基。依次繼續(xù)測(cè)。
假如測(cè)序讀長(zhǎng)小于插入片段大小,那么插入片段部分都沒有測(cè)通,另一端的
Rd1 SP和P5序列都不會(huì)被測(cè)到,獲得的reads自然就不會(huì)存在與我們目標(biāo)序列無(wú)關(guān)的接頭序列部分。假如測(cè)序讀長(zhǎng)大于插入片段大小,那么插入片段全部測(cè)通之后,另一端的
Rd1 SP和P5序列可能都會(huì)被測(cè)到,獲得的reads自然就會(huì)包含接頭序列部分。
常規(guī)轉(zhuǎn)錄組測(cè)序、基因組重測(cè)序、擴(kuò)增子測(cè)序,使用模式為PE 150和PE 250,單端的讀長(zhǎng)大都不會(huì)長(zhǎng)于插入片段,通常是不會(huì)測(cè)到接頭序列的。
為什么一批數(shù)據(jù)有的序列有接頭,有的沒有接頭
常規(guī)轉(zhuǎn)錄組測(cè)序、基因組重測(cè)序 DNA 片段因?yàn)槠位绞讲煌?,如酶切或超聲打斷,獲得的片段大小不是完全一致的,大部分目標(biāo)片段長(zhǎng)度集中于200-300 nt,但也有一部分會(huì)短于150 nt甚至再短一些,這部分片段被測(cè)序時(shí)就會(huì)產(chǎn)生長(zhǎng)短不一的接頭序列部分。
往期精品(點(diǎn)擊圖片直達(dá)文字對(duì)應(yīng)教程)
后臺(tái)回復(fù)“生信寶典福利第一波”或點(diǎn)擊閱讀原文獲取教程合集

(請(qǐng)備注姓名-學(xué)校/企業(yè)-職務(wù)等)



























