OpenBioMed面向生物醫(yī)學(xué)的 Python 深度學(xué)習(xí)工具包
OpenBioMed是一個(gè)生物醫(yī)學(xué)的Python深度學(xué)習(xí)工具包。
OpenBioMed提供了多模態(tài)生物醫(yī)學(xué)數(shù)據(jù)的處理接口,包括小分子、蛋白質(zhì)和單細(xì)胞的分子結(jié)構(gòu)、轉(zhuǎn)錄組學(xué)、知識(shí)圖譜和生物醫(yī)學(xué)文本數(shù)據(jù)。
OpenBioMed支持廣泛的下游應(yīng)用,包括AI藥物發(fā)現(xiàn)任務(wù)和更具挑戰(zhàn)性的多模態(tài)理解生成任務(wù)。
OpenBioMed為研究者提供了易用的接口,以支持:
- 針對(duì)小分子、蛋白質(zhì)和單細(xì)胞的三種模態(tài)的數(shù)據(jù),包括分子結(jié)構(gòu)或轉(zhuǎn)錄組學(xué)數(shù)據(jù)、生物醫(yī)學(xué)文本數(shù)據(jù)和知識(shí)圖譜。 OpenBioMed為研究人員提供了一個(gè)統(tǒng)一的架構(gòu)來訪問、處理和融合多模態(tài)數(shù)據(jù)。
- 10個(gè)下游任務(wù),包括以藥物-靶點(diǎn)親和力預(yù)測(cè)、分子性質(zhì)預(yù)測(cè)為代表的AI藥物研發(fā) (AIDD) 任務(wù),以及以分子描述生成、基于文本的分子生成位代表的多模態(tài)任務(wù)。
- 超過20個(gè)深度學(xué)習(xí)模型,包括BioMedGPT-10B,MolFM,CellLM等。 研究人員可以靈活地組合不同的組件來構(gòu)建自己的模型。
- 超過20個(gè)AI與生物醫(yī)藥交叉領(lǐng)域的熱門數(shù)據(jù)集。我們?cè)谶@些數(shù)據(jù)集上針對(duì)大量模型進(jìn)行了全面且可復(fù)現(xiàn)的評(píng)估。
OpenBioMed的核心特色如下:
- 統(tǒng)一的數(shù)據(jù)處理框架,能輕松加載不同生物醫(yī)學(xué)實(shí)體、不同模態(tài)的數(shù)據(jù),并將其轉(zhuǎn)換為統(tǒng)一的格式。
- 現(xiàn)成的模型預(yù)測(cè)模塊。我們公開了預(yù)訓(xùn)練的模型的參數(shù),并提供了使用案例,能夠簡便的遷移到其他數(shù)據(jù)或任務(wù)中。
- 可復(fù)現(xiàn)的模型庫,以幫助研究者現(xiàn)有和新的下游任務(wù)上快速復(fù)現(xiàn)或擴(kuò)展最先進(jìn)的模型。
下表顯示了OpenBioMed中支持的下游任務(wù)與對(duì)應(yīng)的數(shù)據(jù)集和模型,它們?cè)谖磥頃?huì)被進(jìn)一步擴(kuò)展。
| 下游任務(wù) | 數(shù)據(jù)集 | 模型 |
|---|---|---|
| 跨模態(tài)抽取 | PCdes | KV-PLM, SciBERT, MoMu, GraphMVP, MolFM |
| 分子描述生成 | ChEBI-20 | MolT5, MoMu, GraphMVP, MolFM, BioMedGPT |
| 基于文本的分子生成 | ChEBI-20 | MolT5, SciBERT, MoMu, MolFM |
| 分子問答 | ChEMBL-QA | MolT5, MolFM, BioMedGPT |
| 蛋白質(zhì)問答 | UniProtQA | BioMedGPT |
| 細(xì)胞類型注釋 | Zheng68k, Baron | scBERT, CellLM |
| 單細(xì)胞藥物敏感性預(yù)測(cè) | GDSC | DeepCDR, TGSA, CellLM |
| 分子性質(zhì)預(yù)測(cè) | MoleculeNet | MolCLR, GraphMVP, MolFM, DeepEIK, BioMedGPT |
| 藥物-靶點(diǎn)親和力預(yù)測(cè) | Yamanishi08, BMKG-DTI, DAVIS, KIBA | DeepDTA, MGraphDTA, DeepEIK |
| 蛋白質(zhì)關(guān)系預(yù)測(cè) | SHS27k, SHS148k, STRING | PIPR, GNN-PPI, OntoProtein |
評(píng)論
圖片
表情
