bcbio-nextgen為全自動(dòng)高通量測(cè)序分析提供最佳實(shí)踐管道的工具
bcbio-nextgen是一個(gè)Python工具,它為全自動(dòng)高通量測(cè)序分析提供了最佳的實(shí)踐管道。當(dāng)用戶(hù)編寫(xiě)一個(gè)高級(jí)配置文件指定輸入和分析參數(shù)后,該用戶(hù)的輸入可以驅(qū)動(dòng)處理分布式運(yùn)算、冪等進(jìn)程重啟以及安全事務(wù)步驟的并行管道。bcbio的目標(biāo)是提供一個(gè)能夠進(jìn)行數(shù)據(jù)測(cè)序分析處理組件的資源共享社區(qū),以此能夠讓研究人員更專(zhuān)注于下游生物科學(xué)的研究。
目標(biāo)
bcbio-nextgen實(shí)現(xiàn)全自動(dòng)高通量測(cè)序數(shù)據(jù)分析的目標(biāo)主要包含以下方面:
-
可量化性:優(yōu)秀的科學(xué)研究需要能夠準(zhǔn)確地評(píng)估結(jié)果的質(zhì)量,新的算法和軟件成為可用。
-
可分析性:將結(jié)果導(dǎo)入工具使得查詢(xún)結(jié)果與可視化結(jié)果更加容易。
-
可擴(kuò)展性:在分布式異構(gòu)計(jì)算環(huán)境中處理大數(shù)據(jù)集以及樣本數(shù)據(jù)。
-
可復(fù)用性:跟蹤配置,版本,來(lái)源以及命令行以便對(duì)結(jié)果的調(diào)試、擴(kuò)展以及復(fù)用。
-
社區(qū)開(kāi)發(fā):開(kāi)發(fā)過(guò)程是完全開(kāi)放的并且由來(lái)自多個(gè)社區(qū)的貢獻(xiàn)者來(lái)共同維護(hù)。通過(guò)在共享框架上的協(xié)作,我們可以克服在迅速變化的研究領(lǐng)域維護(hù)復(fù)雜管道的挑戰(zhàn)。
-
易理解性:生物信息學(xué)家、生物學(xué)家和公眾能夠?qū)⒀芯坎牧稀€(gè)人基因組的臨床樣本數(shù)據(jù)等各種數(shù)據(jù)作為輸入來(lái)運(yùn)行整個(gè)工具。
