三大開源生信基礎(chǔ)教程(bookdown編寫,源碼可作為模板)和視頻課程
開源生信 R 教程
http://www.ehbio.com/Bioinfo_R_course/
1 思考題
2 R基礎(chǔ)
2.1 R安裝
2.2 Rstudio基礎(chǔ)
2.2.1 Rstudio版本
2.2.2 Rstudio安裝
2.2.3 Rstudio 使用
2.3 R基本語法
2.3.1 獲取幫助文檔,查看命令或函數(shù)的使用方法、事例或適用范圍
2.3.2 R中的變量及其初始化
2.3.3 變量類型和轉(zhuǎn)換
2.3.4 R中矩陣運(yùn)算
2.3.5 R中矩陣篩選合并
2.3.6
str的應(yīng)用2.3.7 R的包管理
2.4 ggplot2繪圖
2.4.1 數(shù)據(jù)格式轉(zhuǎn)換和字符串處理
2.4.2 配色
2.4.3 pheatmap繪制熱圖
3 R plots
3.1 qplot繪制圖形 (王緒寧)
3.2 熱圖繪制
3.2.1 生成測(cè)試數(shù)據(jù)
3.2.2 轉(zhuǎn)換數(shù)據(jù)格式
3.2.3 分解繪圖
3.2.4 圖形存儲(chǔ)
3.3 熱圖美化
3.3.1 對(duì)數(shù)轉(zhuǎn)換
3.3.2 Z-score轉(zhuǎn)換
3.3.3 抹去異常值
3.3.4 非線性顏色
3.3.5 調(diào)整行或列的順序
3.4 熱圖繪制 - pheatmap
3.5 聚類熱圖如何按自己的意愿調(diào)整分支順序?
3.5.1 數(shù)據(jù)示例
3.5.2 繪制一個(gè)聚類熱圖很簡(jiǎn)單
3.5.3 如何自定義分支順序呢
3.5.4 人為指定順序排序樣品
3.5.5 按某個(gè)基因的表達(dá)由小到大排序
3.5.6 按某個(gè)基因的表達(dá)由大到小排序
3.5.7 按分支名字(樣品名字)的字母順序排序
3.5.8 梯子形排序:最小的分支在右側(cè)
3.5.9 梯子形排序:最小的分支在左側(cè)
3.5.10 按特征值排序
3.6 箱線圖
3.6.1 一步步解析箱線圖繪制
3.6.2 繪制單個(gè)基因 (A)的箱線圖
3.6.3 長矩陣?yán)L制箱線圖
3.7 線圖
3.7.1 單線圖
3.7.2 多線圖
3.7.3 橫軸文本線圖
3.8 散點(diǎn)圖
3.8.1 橫縱軸都為數(shù)字的散點(diǎn)圖解析
3.8.2 橫縱軸都為字符串的散點(diǎn)圖展示
3.9 功能富集泡泡圖
3.9.1 單樣品分開繪制
3.9.2 多樣品合并繪制
3.10 韋恩圖
3.10.1 韋恩圖三個(gè)圈
3.10.2 韋恩圖五個(gè)圈
3.10.3 UpSetView展示
3.11 柱狀圖繪制
3.11.1 常規(guī)矩陣柱狀圖繪制
3.11.2 長矩陣分面繪制
3.12 圖形支持中文字體
3.12.1 修改圖形的字體
3.12.2 ggplot2支持中文字體輸出PDF
3.12.3 系統(tǒng)可用字體
3.12.4 合并字體支持中英文
3.12.5 一個(gè)示例
3.13 PCA原理解析和圖形繪制
3.13.1 主成分分析簡(jiǎn)介
3.13.2 主成分分析的意義
3.13.3 示例展示原始變量對(duì)樣品的分類
3.13.4 PCA的實(shí)現(xiàn)原理
3.13.5 簡(jiǎn)單的PCA實(shí)現(xiàn)
3.13.6 PCA結(jié)果解釋
3.13.7 PCA應(yīng)用于測(cè)試數(shù)據(jù)
3.13.8 PCA注意事項(xiàng)
3.13.9 參考資料
3.14 生存分析
3.14.1 R做生存分析
3.15 一步作圖的優(yōu)勢(shì)
3.16 不改腳本的熱圖繪制
3.16.1 箱線圖 - 一步繪制
3.16.2 線圖 - 一步繪制
3.16.3 一網(wǎng)打進(jìn)散點(diǎn)圖繪制
4 網(wǎng)絡(luò)圖
4.0.4 基本操作
4.0.5 miRNA-mRNA調(diào)控網(wǎng)絡(luò)
4.0.6 不同的布局的調(diào)試和修改
5 圖形排版
6 高通量數(shù)據(jù)中批次效應(yīng)的鑒定和處理
6.1 什么是批次效應(yīng)?
6.2 批次效應(yīng)會(huì)有什么影響?
6.3 怎么確認(rèn)數(shù)據(jù)有無受到批次效應(yīng)影響
6.4 怎么避免批次效應(yīng)呢?
6.5 如何在差異基因鑒定過程中移除批次效應(yīng)
6.5.1 不考慮批次因素直接進(jìn)行差異基因分析
6.5.2 考慮已知的批次因素進(jìn)行差異基因分析
6.5.3 比較批次校正前后差異基因變化
6.6 批次效應(yīng)未知時(shí)如何判斷和在差異基因鑒定過程中移除批次效應(yīng)
6.6.1 預(yù)測(cè)混雜因素(cofounding factors)并在差異基因分析中移除這些因素
6.6.2 預(yù)測(cè)可能存在的混雜因素
6.6.3 比較批次校正前、已知批次校正后和預(yù)測(cè)的批次校正后差異基因變化
6.6.4 直接校正表達(dá)矩陣
6.6.5 ComBat_seq直接校正Count matrix
6.6.6 怎么從FASTQ數(shù)據(jù)中獲得測(cè)序設(shè)備和批次相關(guān)信息
6.6.7 如何合并人的表達(dá)數(shù)據(jù)和小鼠的表達(dá)數(shù)據(jù)?
6.6.8 質(zhì)控中的GC含量和Overrepresented sequences
6.6.9 樣品是否在某種屬性中存在偏好性
6.6.10 為什么聚類結(jié)果不可靠
6.6.11 sampleFile文件的生成
7 易生信-數(shù)據(jù)可視化
7.1 加載需要的包
7.2 讀入數(shù)據(jù)
7.2.1 Duplicate row names
7.2.2 行名唯一化處理
7.3 熱圖繪制
7.3.1 提取差異基因繪制熱圖
7.4 箱線圖和統(tǒng)計(jì)比較
7.4.1 單基因箱線圖
7.4.2 多基因箱線圖 (combine)
7.4.3 多基因箱線圖 (merge)
7.4.4 數(shù)據(jù)對(duì)數(shù)轉(zhuǎn)換后繪制箱線圖
7.4.5 用ggplot2實(shí)現(xiàn)ggpubr
7.4.6 配色
7.4.7 箱線圖加統(tǒng)計(jì)分析
7.5 通路內(nèi)基因的比較
7.5.1 密度圖
7.6 ggstatsplot繪圖和統(tǒng)計(jì)分析
7.6.1 散點(diǎn)圖
7.6.2 相關(guān)性圖
8 高顏值免費(fèi)在線繪圖(提供繪圖源碼)
8.1 高顏值免費(fèi)在線繪圖基礎(chǔ)版視頻
8.2 高顏值免費(fèi)在線繪圖進(jìn)階版視頻
9 參考
開源生信 Linux Bash教程
http://www.ehbio.com/Bioinfo_Bash_course/
1 Linux初探,打開新世界的大門
1.1 Linux系統(tǒng)簡(jiǎn)介和目錄理解
1.1.1 為什么要用Linux系統(tǒng)
1.1.2 Linux系統(tǒng)無處不在
1.1.3 免費(fèi)的Linux系統(tǒng)來一套
1.1.4 Linux系統(tǒng)登錄-聯(lián)系遠(yuǎn)方的她
1.1.5 初識(shí)Linux系統(tǒng) - 黑夜中的閃爍是你的落腳點(diǎn)
1.1.6 我的電腦在哪?
1.1.7 系統(tǒng)配置怎樣?來看看256M硬盤的服務(wù)器
1.1.8 看下目錄下都有什么
1.1.9 新建一個(gè)目錄
1.1.10 訪問文件
1.1.11 查看幫助,獲取可用命令行參數(shù)
1.1.12 小結(jié)
1.1.13 做個(gè)小測(cè)試1.2 Linux下文件操作
1.2.1 文件按行翻轉(zhuǎn)和按列翻轉(zhuǎn)
1.2.2 新建文件的n種方式
1.2.3 文件拷貝、移動(dòng)、重命名、軟鏈
1.2.4 Linux下命令的一些突發(fā)事故
1.2.5 了解和操作你的文件
1.2.6 小結(jié)和練習(xí)1.3 Linux終端常用快捷操作
1.4 Linux下的標(biāo)準(zhǔn)輸入、輸出、重定向、管道
1.5 Linux文件內(nèi)容操作
1.5.1 命令組合生成文件
1.5.2 文件排序原來有暗倉1.6 Linux下的查找命令 - 文件哪里跑
1.6.1 命令/可執(zhí)行程序查找 - 定位腳本的位置
1.6.2 locate普通文件快速定位
1.6.3 find讓文件無處可逃 find
按時(shí)間查找
限制查找深度
1.6.4 按文件內(nèi)容查找 grep1.7 一句話加速grep近30倍
1.7.1 獲取單基因表達(dá)量
1.7.2 那如果獲取多個(gè)基因怎么操作呢?1.8 監(jiān)控程序的運(yùn)行時(shí)間和資源占用
2 Linux下軟件安裝相關(guān)
2.1 文件屬性和可執(zhí)行屬性
2.1.1 文件屬性
2.1.2 可執(zhí)行屬性2.2 PATH和path,傻傻分不清
2.2.1 小事也不能忽略2.3 軟件安裝的幾種傳統(tǒng)方式
2.3.1 系統(tǒng)包管理器安裝
2.3.2 下載二進(jìn)制文件
2.3.3 源碼編譯安裝
2.3.4 Python包的安裝
2.3.5 Anaconda的兩個(gè)福利
2.3.6 R和R包的安裝
2.3.7 Perl包的安裝2.4 Conda安裝配置生物信息軟件
2.4.1 Conda安裝和配置
2.4.2 Conda基本使用
2.4.3 Conda的channel
2.4.4 創(chuàng)建不同的軟件運(yùn)行環(huán)境
2.4.5 移除某個(gè)conda環(huán)境
2.4.6 Conda配置R
2.4.7 Conda環(huán)境簡(jiǎn)化運(yùn)行
2.4.8 Conda環(huán)境備份
2.4.9 Conda環(huán)境導(dǎo)出和導(dǎo)入
2.4.10 Conda軟件安裝 core dump error/Segment fault/段錯(cuò)誤 怎么辦
2.4.11 Conda為什么越來越慢?
2.4.12 Conda是如何工作的
2.4.13 Conda哪一步慢?
2.4.14 如何提速Conda
2.4.15 下載提速
2.4.16 使用conda-pack直接從已經(jīng)安裝好的地方拷貝一份 (同一操作系統(tǒng))2.5 Docker安裝
2.5.1 Docker能做什么
2.5.2 Docker的幾個(gè)基本概念
2.5.3 安裝和配置
2.5.4 Docker用戶權(quán)限
2.5.5 Docker試用
2.5.6 Docker系統(tǒng)基本操作
2.5.7 使用Dockerfile自動(dòng)構(gòu)建鏡像
2.5.8 Docker的特征
2.5.9 Docker使用注意2.6 Makefile知識(shí)
2.6.1 參考3 Linux神器
3.1 正則表達(dá)式替換文本隨心所欲
3.2 awk-生信分析不可缺少
3.2.1 awk基本參數(shù)解釋
3.2.2 awk基本常見操作
3.2.3 awk糅合操作 - 命令組合體現(xiàn)魅力3.3 SED命令 - 文本替換舍我其誰
3.3.1 sed基本參數(shù)解釋
3.3.2 常見操作3.4 VIM的使用
3.4.1 初識(shí)VIM
3.4.2 VIM中使用正則表達(dá)式3.5 有了這些,文件批量重命名還需要求助其它工具嗎?
3.5.1 簡(jiǎn)單重命名
rename演示
3.5.2 復(fù)雜重命名
假如已經(jīng)有對(duì)應(yīng)關(guān)系
組合文件名,使用mv重命名
使用rename會(huì)不會(huì)稍微簡(jiǎn)單一點(diǎn)?
從原文件名獲取對(duì)應(yīng)關(guān)系
基于paste3.6 耗時(shí)很長的程序忘加nohup就運(yùn)行了怎么辦?
4 Bash 字符串處理
4.1 Bash特殊字符
4.2 Bash變量
4.3 Bash操作符
4.4 Shell中條件和test命令
4.5 Shell流控制
4.6 Shell函數(shù)
4.7 輸入輸出
4.8 命令行處理 命令行處理命令
4.9 進(jìn)程和作業(yè)控制
4.10 尋找Cas9的同源基因并進(jìn)行進(jìn)化分析
4.11 如何獲取目標(biāo)基因的轉(zhuǎn)錄因子(上)——biomart下載基因和motif位置信息
4.11.1 文件準(zhǔn)備
4.11.2 什么是bed文件?
4.11.3 BioMart數(shù)據(jù)下載4.12 如何獲取目標(biāo)基因的轉(zhuǎn)錄因子(下)——Linux命令獲取目標(biāo)基因TF
4.12.1 基礎(chǔ)回顧
4.12.2 文件格式處理
4.12.3 計(jì)算基因的啟動(dòng)子區(qū)
4.12.4 取兩文件的交集
4.12.5 提取我們關(guān)注的基因
4.12.6 重點(diǎn)總結(jié)4.13 emboss的使用
4.14 使用samtools計(jì)算SNP
4.15 Bedtools使用
4.16 SRA toolkit使用
4.17 生信流程開發(fā)
4.18 數(shù)據(jù)同步和備份
4.18.1 原創(chuàng)拷貝scp
4.18.2 鏡像備份和增量同步 rsync
4.18.3 增量備份,記錄各個(gè)版本 rdiff-backup5 生物信息中Linux命令練習(xí)
5.1 統(tǒng)計(jì)GTF文件中染色體數(shù)目?
5.2 統(tǒng)計(jì)GTF文件中基因數(shù)目?
5.3 計(jì)算GTF中外顯子總長度?
5.4 計(jì)算GTF文件中基因所擁有的平均轉(zhuǎn)錄本數(shù)目
5.5 生成一個(gè)多行Fasta測(cè)試序列供后續(xù)運(yùn)算 (也可使用我們前面提供的腳本生成)
5.6 test.fa中的序列全轉(zhuǎn)成大寫
5.7 計(jì)算多行FASTA文件test.fa中每條序列長度
5.8 多行FASTA轉(zhuǎn)單行FASTA序列
5.9 取出單行FASTA文件中序列長度大于40的序列的名字
5.10 分別用awk和grep從test.fa中提取給定ID對(duì)應(yīng)的序列
5.11 利用AWK對(duì)基因表達(dá)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化
5.12 寫出3種寫法,去掉上一題test.expr矩陣中的第一行?
5.13 分別用awk和sed給test.expr矩陣加上標(biāo)題行?
5.14 給定一個(gè)BAM文件,怎么計(jì)算有多少基因組區(qū)域被測(cè)到了?平均測(cè)序深度是多少?
5.15 如何使用bedtools的其它工具或其它Linux命令實(shí)現(xiàn)bedtools jaccard子功能?
5.16 如何使用命令生成這次課程的目錄
開源生信 Python教程
目錄
背景介紹
編程開篇
為什么學(xué)習(xí)Python
如何安裝Python
如何運(yùn)行Python命令和腳本
使用什么編輯器寫Python腳本
Python程序事例
Python基本語法
數(shù)值變量操作
字符串變量操作
列表操作
集合操作
Range使用
字典操作
層級(jí)縮進(jìn)
變量、數(shù)據(jù)結(jié)構(gòu)、流程控制
輸入輸出
交互式輸入輸出
文件讀寫
實(shí)戰(zhàn)練習(xí)(一)
背景知識(shí)
作業(yè)(一)
函數(shù)操作
函數(shù)操作
作業(yè)(二)
模塊
命令行參數(shù)
命令行參數(shù)
作業(yè)(三)
更多Python內(nèi)容
單語句塊
列表綜合,生成新列表的簡(jiǎn)化的for循環(huán)
lambda, map, filer, reduce (保留節(jié)目)
exec, eval (執(zhí)行字符串python語句, 保留節(jié)目)
正則表達(dá)式
Python畫圖
Reference
文字版本開源 (鏈接在本文每一部分開頭)
視頻講解優(yōu)惠
點(diǎn)擊閱讀原文直達(dá)視頻 http://bioinfo.ke.qq.com/
源碼在:https://github.com/Tong-Chen
