<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          NBT:你想成為計(jì)算生物學(xué)家?

          共 2954字,需瀏覽 6分鐘

           ·

          2021-01-09 14:42


          生物信息學(xué)習(xí)的正確姿勢(shì)

          NGS系列文章包括NGS基礎(chǔ)、高顏值在線繪圖和分析、轉(zhuǎn)錄組分析 Nature重磅綜述|關(guān)于RNA-seq你想知道的全在這、ChIP-seq分析 ChIP-seq基本分析流程、單細(xì)胞測(cè)序分析 (重磅綜述:三萬字長文讀懂單細(xì)胞RNA測(cè)序分析的最佳實(shí)踐教程)、DNA甲基化分析、重測(cè)序分析、GEO數(shù)據(jù)挖掘典型醫(yī)學(xué)設(shè)計(jì)實(shí)驗(yàn)GEO數(shù)據(jù)分析 (step-by-step)、批次效應(yīng)處理等內(nèi)容。

          1. 學(xué)生信,不是貪多的,而是求精的!

          2. 生信學(xué)習(xí)入門常見錯(cuò)誤可能的原因分類總結(jié)和求助指南

          3. 生信學(xué)習(xí)學(xué)的是什么?常識(shí)!

          1. 理解你的目標(biāo)并選擇合適的工具

          好的計(jì)算生物學(xué)家的關(guān)鍵是選擇合適的工具。就像我們不能在不理解PCR的基本原理時(shí)就去實(shí)驗(yàn)室操作這個(gè)實(shí)驗(yàn),同樣地如果我們不理解軟件的原理,就會(huì)不知道選擇的軟件是否合適、結(jié)果怎么解釋。比如轉(zhuǎn)錄組序列比對(duì)需要選擇支持Splice-map的工具,因?yàn)閙RNA成熟時(shí)經(jīng)歷了剪接;比對(duì)會(huì)基因組時(shí)會(huì)初選跨越內(nèi)含子的reads。理解算法不需要我們?nèi)プx懂源碼,但對(duì)其原理、適用性和特點(diǎn)要有個(gè)概念。

          2. 對(duì)自己和他人的腳本設(shè)置陷阱測(cè)試

          做實(shí)驗(yàn)需要正對(duì)照和負(fù)對(duì)照,運(yùn)行腳本也是。腳本不知道我們的目的是什么,只要提供的數(shù)據(jù)格式正確,就可以運(yùn)行不報(bào)錯(cuò)。但結(jié)果是否正確需要我們自己把關(guān)。通常是手寫數(shù)個(gè)小的結(jié)果已知的數(shù)據(jù)集進(jìn)行測(cè)試,涵蓋自己能想到的盡可能多的情況,已確定腳本做的事情跟自己預(yù)期一致。

          3. 記住自己是科學(xué)家不是程序員

          完美是完成的敵人。牢記自己是科學(xué)家,研究的質(zhì)量優(yōu)先級(jí)高于代碼的優(yōu)雅。在確保核心算法無誤的基礎(chǔ)上,多關(guān)注生物問題,有時(shí)間再去完善代碼和文檔。

          4. 使用版本控制工具

          采用GitHub等記錄腳本、文檔的修改,維持多個(gè)版本和協(xié)作代碼。寫好README文件記錄開發(fā)歷程,何時(shí)因何故對(duì)代碼作此修改,以備后續(xù)用到時(shí)再回想起來當(dāng)初的設(shè)計(jì)。發(fā)表文章的同時(shí)發(fā)表腳本和數(shù)據(jù),以便他人復(fù)現(xiàn)。也可以發(fā)表到這個(gè)Nature推薦的代碼海洋竟然有文章作者上傳的所有可重現(xiàn)性腳本,涉及單細(xì)胞、微生物組、轉(zhuǎn)錄組分析、機(jī)器學(xué)習(xí)等相關(guān)

          5. 凡事流程化不可取 (不過早包裝)

          Pipeline是一系列腳本的集合,可以更方便結(jié)果的重現(xiàn)和類似分析工作的快速完成。但你需要衡量形成Pipeline是否節(jié)省了時(shí)間、是否有必要。三思而后行。大家如果熟悉Makefile,倒也無妨,不外乎是把Linux命令放到Makefile中運(yùn)行。

          6. 要擁有奧巴馬般的自信

          Yes you can! 不畏懼,用于嘗試和探索,修改現(xiàn)有代碼滿足自己的需求。寫代碼其實(shí)就是怎么想的怎么寫,寫出來前幾句,路就順了。愛冒險(xiǎn),也接受會(huì)遇到坑,借助谷歌、討論群,大踏步邁過去。

          參加好的培訓(xùn)班是有意義的,可以節(jié)省很多時(shí)間,快速走上正確的道路。但切記,培訓(xùn)班只是開始,需要不斷的練習(xí)。學(xué)習(xí)沒有捷徑,但可以借力加速。

          7. 要有懷疑精神和質(zhì)疑氣魄

          生物數(shù)據(jù)集尤其是來源于高通量測(cè)序的數(shù)據(jù),龐大而有噪音干擾。即便是受過統(tǒng)計(jì)訓(xùn)練的生物學(xué)家在看到軟件或流程輸出的符合預(yù)期的結(jié)果時(shí)也會(huì)把懷疑置之腦后。通常需要多個(gè)不同角度的結(jié)果輔助一個(gè)結(jié)論。生物知識(shí)對(duì)解釋實(shí)驗(yàn)結(jié)果至關(guān)重要,生物實(shí)驗(yàn)驗(yàn)證也是必須的。

          8. 命令行下工作和編碼

          習(xí)慣在Unix/Linux命令行下工作,你會(huì)發(fā)現(xiàn)它們真的很強(qiáng)大。編程語言無優(yōu)劣,選擇在你身邊最流行的,有問題可以交流。EXCEL會(huì)改變你的數(shù)據(jù)。

          9. 做一個(gè)數(shù)據(jù)偵探

          計(jì)算生物學(xué)家很長時(shí)間都在分析和解釋數(shù)據(jù)。數(shù)據(jù)里面包含0個(gè)或多個(gè)故事,但通常不太明顯。需要我們從實(shí)驗(yàn)設(shè)計(jì)和分析過程來綜合解析。勇于識(shí)別和排除數(shù)據(jù)中的系統(tǒng)偏差和異常點(diǎn)。與項(xiàng)目中的其它科學(xué)家通力合作,討論結(jié)果,提出后續(xù)實(shí)驗(yàn)驗(yàn)證假設(shè)。也有可能你的數(shù)據(jù)什么都發(fā)現(xiàn)不了,果斷放棄。

          10. 不重復(fù)造輪子

          通常無論多么奇怪的問題都有可能在網(wǎng)上搜索到解決方案,善用搜索引擎、論壇和社交工具。加入或成立本地的交流圈是很好的互相促進(jìn)的開始。(自己衡量造輪子和搜索輪子哪個(gè)時(shí)間更劃算

          • Mick Watson is at The Roslin Institute, University of Edinburgh, Edinburgh, UK, and is Head of Bioinformatics at Edinburgh Genomics, an academic genomics facility developing bioinformatics training in next-generation sequence analysis (http://genomics.ed.ac.uk). Follow him on Twitter, @BioMickWatson, and on his blog at http://biomickwatson.wordpress.com/.

          • Nick Loman works as an independent research fellow in the Institute for Microbiology and Infection at the University of Birmingham, Birmingham, UK, sponsored by a Medical Research Council Special Training Fellowship in Biomedical Informatics. Follow him on Twitter, @pathogenomenick, and on his blog at http://pathogenomics.bham.ac.uk/blog.

          • https://www.nature.com/articles/nbt.2740

          往期精品(點(diǎn)擊圖片直達(dá)文字對(duì)應(yīng)教程)


          后臺(tái)回復(fù)“生信寶典福利第一波”或點(diǎn)擊閱讀原文獲取教程合集

           

          (請(qǐng)備注姓名-學(xué)校/企業(yè)-職務(wù)等)


          瀏覽 33
          點(diǎn)贊
          評(píng)論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          評(píng)論
          圖片
          表情
          推薦
          點(diǎn)贊
          評(píng)論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  无码性爱精品 | 先锋影音资源一区 | 青青草人妻 | 国产精品久久六区 | 天天舔天天爱 |