關(guān)于深度學習、NLP和計算機視覺的30個頂級Python庫
導語
雙語原文:Top Python Libraries……
深度學習框架排名:TensorFlow第一,PyTorch第二
譯者:話左
請注意,下面的圖示由Gregory Piatetsky繪制,每個庫都有其類別,按星標和貢獻者對其進行繪制,符號大小則以該庫在Github上的提交次數(shù)的對數(shù)表示。

圖1:深度學習,自然語言處理和計算機視覺的頂級Python庫
深度學習
1. TensorFlow
星標:149000,提交數(shù):97741,貢獻者:754。TensorFlow是針對機器學習的端對端開源平臺。它具備綜合靈活的工具、庫和社區(qū)資源,可以幫助研究者推動先進的機器學習技術(shù)的發(fā)展以及開發(fā)者更輕松地開發(fā)和發(fā)布由機器學習支持的應用。
2. Keras
星標:50000,提交數(shù):5349,貢獻者:864 。Keras是由python編寫的機器學習API,其運行在機器學習的頂級平臺TensorFlow上。
3. PyTorch
星標:43200,提交數(shù):30696,貢獻者:1619。使用Python實現(xiàn)的張量和動態(tài)神經(jīng)網(wǎng)絡,并帶有強大的GPU加速。
4. fastai
星標:19800,提交數(shù):1450,貢獻者:607。通過利用當下最佳的技術(shù)實踐,fastai極快地簡化了訓練過程也加速了神經(jīng)網(wǎng)絡。
5. PyTorch Lightning
星標:9600,提交數(shù):3594,貢獻者:317。針對高性能AI研究的封裝輕量版PyTorch。可縮小你的模型,而不是提供小的樣板。
6. JAX
星標:10000,提交數(shù):5708,貢獻者:221 ?。Python+NumPy程序的組合變換:區(qū)分、向量化、在GPU/TPU上的JIT等等。
7. MXNet
星標:19100,提交數(shù):11387,貢獻者:839 。帶有動態(tài)和突變感知的數(shù)據(jù)流管理調(diào)度程序的輕量、便捷、靈活的分布式/移動機器學習庫:支持Python、R、Julia、Scala、Go、JavaScript等等。
8. Ignite
星標:3100,提交數(shù):747,貢獻者:112。可靈活透明地訓練評估PyTorch神經(jīng)網(wǎng)絡的高級別庫。
自然語言處理
9. FastText
星標:21700,提交數(shù):379,貢獻者:47。fastText是一個可高效學習單詞表意和句子分類的庫。
10. spaCy
星標:17400,提交數(shù):11628,貢獻者:482 。使用Python和Cython實現(xiàn)的工業(yè)級自然語言處理庫(NLP)
11. gensim
星標:11200,提交數(shù):4024,貢獻者:361。gensim通過使用大型語料庫進行主題建模、文檔索引和相似性檢索。目標受眾是自然語言處理(NLP)和信息檢索(IR)社區(qū)。
12. NLTK
星標:9300,提交數(shù):13990,貢獻者:319。NLTK——自然語言工具箱——是一整套針對自然語言處理研究和開發(fā)的開源Python模塊、數(shù)據(jù)集和教程。
13. Datasets(Huggingface)
星標:4300,提交數(shù):568,貢獻者:64。用于自然語言處理的使用PyTorch,TensorFlow,NumPy和Pandas工具的快速,高效,開放式數(shù)據(jù)集和評估指標。
?14. Tokenizers(Huggingface)
星標:3800,提交數(shù):1252,貢獻者:30。針對研究和生產(chǎn)的快速頂級的分詞器。
15. Transformers(Huggingface)
星標:3500,提交數(shù):5480,貢獻者:585。Transformers:針對Pytorch和TensorFlow 2.0 的頂級自然語言處理庫。
16. Stanza
星標:4800,提交數(shù):1514,貢獻者:19。針對很多人類語言的正式標準NLP Python庫。
17. TextBlob
星標:7300,提交數(shù):542,貢獻者:24。簡單,Python風格,文本處理-情感分析,詞性標記,名詞短語提取,翻譯等等。?
18. PyTorch-NLP
星標:1800,提交數(shù):442,貢獻者:15。用于PyTorch自然語言處理(NLP)的基礎實用工具。
19. Textacy
星標:1500,提交數(shù):1324,貢獻者:23 。用于執(zhí)行各種自然語言處理(NLP)任務的Python庫,構(gòu)建在一個高性能spaCy庫之上。??
20. Finetune
星標:626,提交數(shù):1405,貢獻者:13。Finetune是一個庫,它允許用戶利用最新的預訓練NLP模型來執(zhí)行各種下游任務。?
21. TextHero
星標:1900,提交數(shù):266,貢獻者:17。文本預處理、表示和可視化,從零到精通。
22. Spark NLP
星標:1700,提交數(shù):4363,貢獻者:50。Spark NLP是建立在Apache Spark ML之上的自然語言處理庫。
23. GluonNLP
星標:2200,提交數(shù):712,貢獻者:72。GluonNLP這個工具包,可簡化文本預處理,數(shù)據(jù)集加載和神經(jīng)模型構(gòu)建,以幫助您加快對自然語言處理(NLP)的研究。
計算機視覺
24. Pillow
星標:7800,提交數(shù):10799,貢獻者:303。Pillow是個對用戶十分友好的PIL分支。PIL是Python圖像庫。
25. OpenCV
星標:49600,提交數(shù):29453,貢獻者:1234 。開源計算機視覺庫。
26. scikit-image
星標:4000,提交數(shù):12352,貢獻者:403 。用Python做圖像處理。
27. Mahotas
星標:644,提交數(shù):1273,貢獻者:25。Mahotas是個包含了最快的計算機視覺算法(所有算法用C++實現(xiàn)保證運行速度)的庫,針對numpy數(shù)組運行。
28. Simple-CV
星標:2400,提交數(shù):2625,貢獻者:69。SimpleCV是一個針對開源機器視覺的架構(gòu),使用了OpenCV和Python編程語言。
29. GluonCV
星標:4300,提交數(shù):774,貢獻者:101。GluonCV提供了計算機視覺中最先進(SOTA)的深度學習模型。
30. Torchvision
星標:7500,提交數(shù):1286,貢獻者:334。Torchvision包包含了流行的數(shù)據(jù)集、模型架構(gòu)和計算機視覺中常用的圖像轉(zhuǎn)換方法。
↓交流學習↓
↓掃描關(guān)注本號↓

