天秀!一張圖就能徹底搞定Pandas!
點(diǎn)擊關(guān)注上方“SQL數(shù)據(jù)庫(kù)開(kāi)發(fā)”,
設(shè)為“置頂或星標(biāo)”,第一時(shí)間送達(dá)干貨
大家好,在三月初,我曾給大家分享過(guò)一份Matplotlib繪圖小抄,詳見(jiàn)收下這份來(lái)自GitHub的神器,一圖搞定Matplotlib!
昨天在面向GitHub編程時(shí),無(wú)意發(fā)現(xiàn)了Pandas官方竟提供了同款小抄,項(xiàng)目地址如下
https://github.com/pandas-dev/pandas/blob/master/doc/cheatsheet/Pandas_Cheat_Sheet.pdf
可以看到這份小抄提供了PPT和PDF兩個(gè)版本,雖然最新一條更新記錄為兩年前,但是并不影響我們拿來(lái)學(xué)習(xí),下面我們來(lái)看看這份小抄(速查表) 的強(qiáng)大!
這份速查表一共有兩頁(yè),我已經(jīng)將它轉(zhuǎn)換為圖片?發(fā)在公眾號(hào)可能會(huì)被壓縮,你可以在文末下載高清大圖

經(jīng)過(guò)一番研究,這兩張圖片一共覆蓋了12個(gè)常用的Pandas操作?
1、數(shù)據(jù)創(chuàng)建
介紹了幾種常用的DataFrame創(chuàng)建語(yǔ)法
2、數(shù)據(jù)重塑
這部分主要是一些在數(shù)據(jù)清洗中常用的方法,比如數(shù)據(jù)連接、數(shù)據(jù)排序、數(shù)據(jù)刪除等,并且還對(duì)四個(gè)常用的操作給出了圖示,理解起來(lái)簡(jiǎn)直不要太方便!
3、數(shù)據(jù)篩選
這一塊區(qū)域主要是分別用行/列來(lái)講解一些常用的數(shù)據(jù)查看、抽樣、切片等操作,包含了tail、head、loc、iloc等非常重要的方法,并且同樣給出了部分動(dòng)畫(huà)便于理解
4、數(shù)據(jù)探索
這一塊主要給出了一些在進(jìn)行探索性分析時(shí)常用的方法,比如max、min、count等,不過(guò)官方將apply放在這里,并沒(méi)有展開(kāi)講解
5、數(shù)據(jù)修改
這兩個(gè)區(qū)域?yàn)槿笔е堤幚砗蛣?chuàng)建新的列,重點(diǎn)用動(dòng)畫(huà)示例了assign和qcut方法,缺失值處理部分僅給出了兩個(gè)方法,應(yīng)該是偷懶了
6、數(shù)據(jù)分組
主要就是groupby和相關(guān)方法
7、數(shù)據(jù)連接
這里介紹的還是非常詳細(xì)!用圖片例子來(lái)展示pd.merge中的各種參數(shù)變化的不同,一看就懂
以上就是我對(duì)這份小抄的基本概括,其實(shí)大家應(yīng)該清楚,僅僅靠靠?jī)蓮垐D片根本沒(méi)法把整個(gè)Pandas學(xué)明白,所以官方也有選擇性的對(duì)一些重要的方法給出了詳細(xì)的講解,而有些功能則一筆帶過(guò),比如我之前?花很大力氣介紹的pandas繪圖功能僅給出了區(qū)區(qū)一角
所以你應(yīng)該這樣用這份小抄,把它當(dāng)成速查表,「用于了解哪些操作可以用Pandas完成」,在你不確定或者不明白如何處理數(shù)據(jù)時(shí),通過(guò)這份速查表快速查到Pandas中的哪個(gè)方法可以完成,之后再進(jìn)一步通過(guò)搜索學(xué)習(xí)對(duì)應(yīng)的方法!
好了,以上就是本文全部?jī)?nèi)容,因?yàn)槲⑿艜?huì)對(duì)圖片進(jìn)行壓縮,所以你可以在后臺(tái)回復(fù)Pandas獲取高清、完整、可復(fù)制文字版本Pandas速查表!


