【Python】30個Pandas高頻使用技巧
公眾號:尤而小屋
作者:Peter
編輯:Peter
本文主要是介紹的自己在平時使用Pandas處理數(shù)據(jù)過程中接觸到的高頻技巧。以前的Pandas文章有對不同知識點的拆解,歡迎閱讀。

Pandas連載文章
圖解Pandas數(shù)據(jù)合并:concat、join、append

高頻技巧
使用的技巧主要是下圖涉及到的:

import?pandas?as?pd
import?numpy?as?np
導入文件
Pandas能夠讀取很多文件:Excel、CSV、數(shù)據(jù)庫、TXT,甚至是在線的文件都是OK的

創(chuàng)建DataFrame
在以前的文章中介紹過10種DataFrame的方法

查看頭尾數(shù)據(jù)
頭尾都是默認5行數(shù)據(jù),可以指定行數(shù)
#?df2.head()??默認頭部5行
df2.head(3)??#?指定3行
#?df2.tail()??默認尾部5行
df2.tail(2)??#?指定尾部2行
顯示全部列名

顯示索引

查看列的數(shù)據(jù)類型

查看行列數(shù)

查看數(shù)據(jù)大小

查看缺失值

修改列名
兩種方式:使用rename函數(shù)和直接使用columns屬性


統(tǒng)計元素
統(tǒng)計每個元素的個數(shù)

轉(zhuǎn)成列表數(shù)據(jù)

提取列中數(shù)據(jù)

提取文本數(shù)據(jù)

數(shù)值范圍數(shù)據(jù)提取

提取整列數(shù)據(jù)


缺失值填充
指定填充的值 用計算值 用其他值

數(shù)據(jù)去重

計算統(tǒng)計值
計算統(tǒng)計值,比如最值和均值等

計算中位數(shù)

提取最值所在的行

Pandas切片
df2.iloc[22]??#?提取某個行的數(shù)據(jù)
df2.iloc[:,1:6]??#?行和列上的切片

大小排序

分組聚合
使用groupby分組之后,對不同的字段可以使用不同的聚合函數(shù)

索引重排
注意和上面例子的比較。使用的是reset_index函數(shù)

去掉原索引
使用索引重排之后我們需要去掉原來的索引;比較上下兩個結(jié)果的區(qū)別。通過drop=True來實現(xiàn)

apply函數(shù)

兩個列相加


DataFrame合并
1、先看看兩個原始數(shù)據(jù)

2、默認情況:求的兩個DF的交集

3、保留左邊全部數(shù)據(jù)

4、保留右邊全部數(shù)據(jù)

how="inner"其實就是默認情況:

導出數(shù)據(jù)
導出數(shù)據(jù)的時候通常是不需要索引的

往期精彩回顧 本站qq群851320808,加入微信群請掃碼:
評論
圖片
表情
