那些被低估了的 Python 庫(kù)
譯文:頭條號(hào):機(jī)器學(xué)習(xí)與數(shù)據(jù)分析 原文:
https://towardsdatascience.com/the-most-underrated-python-packages-e22bf6049b5e?gi=f9ed1a098270
在這篇文章中,我們想展示一些不同于流行的東西。這些都是深夜瀏覽GitHub的感悟,以及同事們分享的壓箱底東西。這些軟件包中的一些是非常獨(dú)特的,使用起來很有趣的Python包。
混合派
-
Knock Knock:從Python發(fā)送通知到移動(dòng)設(shè)備、桌面或電子郵件。 -
tqdm:可擴(kuò)展的Python和CLI進(jìn)度條,內(nèi)置對(duì)pandas的支持。 -
Colorama:簡(jiǎn)單的跨平臺(tái)彩色終端文本。 -
pandas -log:提供熊貓基本操作的反饋。非常適合調(diào)試長(zhǎng)管道鏈。 -
Pandas-flavor:擴(kuò)展pandas DataFrame/Series的簡(jiǎn)單方法。 -
More-Itertools:增加了類似于itertools的額外功能。 -
streamlit:為機(jī)器學(xué)習(xí)項(xiàng)目創(chuàng)建應(yīng)用程序的簡(jiǎn)單方法。
數(shù)據(jù)清理和操作
-
ftfy:修復(fù)mojibake和Unicode文本中的其他故障。 -
janitor:有很多很酷的功能來清理數(shù)據(jù)。 -
Optimus:另一個(gè)數(shù)據(jù)清理包。 -
Great-experctations:一個(gè)檢查數(shù)據(jù)是否符合預(yù)期的好工具。
數(shù)據(jù)探索和建模
-
Pandas-profile:創(chuàng)建一個(gè)包含來自pandas DataFrame的統(tǒng)計(jì)數(shù)據(jù)的HTML報(bào)告。 -
dabl:允許使用可視化和預(yù)處理進(jìn)行數(shù)據(jù)探索。 -
pydqc:允許比較兩個(gè)數(shù)據(jù)集之間的統(tǒng)計(jì)數(shù)據(jù)。 -
pandas-summary:對(duì)panda DataFrames描述功能的擴(kuò)展。 -
pivottable-js:pands在jupyter notebook的拖放功能。
數(shù)據(jù)結(jié)構(gòu)
-
Bounter:有效的計(jì)數(shù)器,使用有限(有界)的數(shù)量的內(nèi)存,無論數(shù)據(jù)大小。 -
Python -bloomfilter:可擴(kuò)展的Bloom Filter,使用Python實(shí)現(xiàn)。 -
datasketch:提供概率數(shù)據(jù)結(jié)構(gòu),如LSH、加權(quán)MinHash、HyperLogLog等。 -
ranges:Python的連續(xù)范圍、范圍集和范圍令數(shù)據(jù)結(jié)構(gòu)
性能檢查和優(yōu)化
-
Py-spy: Python程序的采樣分析器。 -
pyperf:用于運(yùn)行Python基準(zhǔn)測(cè)試的工具箱。 -
snakeviz:一個(gè)瀏覽器內(nèi)的Python配置文件查看器,對(duì)jupyter notebook有很大的支持。 -
Cachier: Python函數(shù)的持久、無延遲、本地和跨機(jī)緩存。 -
Faiss:用于高效的相似性搜索和密集向量聚類的庫(kù)。
— 完 —
回復(fù)下方「關(guān)鍵詞」,獲取優(yōu)質(zhì)資源
回復(fù)關(guān)鍵詞「簡(jiǎn)明python」,立即獲取入門必備書籍《簡(jiǎn)明python教程》電子版
回復(fù)關(guān)鍵詞「爬蟲」,立即獲取 爬蟲學(xué)習(xí)資料
推薦閱讀
-
美國(guó)要求字節(jié)跳動(dòng)放棄TikTok所有權(quán),微軟考慮收購(gòu),網(wǎng)友:明搶? -
分分鐘甩Word幾條街,Python編輯公式竟可以如此簡(jiǎn)單 -
適合 Python 入門的 8 款強(qiáng)大工具! -
開源!北大研究生把《統(tǒng)計(jì)學(xué)習(xí)方法》書中全部算法都實(shí)現(xiàn)了!

評(píng)論
圖片
表情
