Pandas中的幾個不常用的函數(shù)功能
Pandas 是我們常用的一個Python數(shù)據(jù)分析庫。其中有不少操作是我們平時很少用到的。如下:
數(shù)據(jù)源:
df
一、 獲取最大或最小值所對應對象的名稱
獲取某列的最小值:
df["數(shù)量"].min()
獲取最小值所對應的汽車品牌:
df[df["數(shù)量"] == df["數(shù)量"].min()]["品牌"].values[0]
獲取最大值同理。
????????然而,我們可以使用.idxmax() 或 idxmin() 函數(shù)來更優(yōu)雅得實現(xiàn)以上功能:
df.loc[df["數(shù)量"].idxmin()]["品牌"]
可見,所得結果一致,并且語句顯得更加簡短優(yōu)雅。
二、 數(shù)據(jù)切片
用 .cut() 函數(shù)將數(shù)據(jù)區(qū)間 [10,80] 均等地分成10份,等差為 (80 - 10) / 10 = 7.
pd.cut(df["數(shù)量"],10)
查看當前數(shù)據(jù)所屬的劃分區(qū)間:
pd.cut(df["數(shù)量"],10,labels = False)
三、 用 .nsmallest() 或 .nlargest() 獲取前幾的最小或最大值。
比如獲取數(shù)量最小的前3條記錄:
df[["國家", "品牌", "數(shù)量"]].nsmallest(3, "數(shù)量")
再跟常用的方法對比一下,如下:
df.sort_values(by = "數(shù)量",ascending = True).head(3)
注意事項:.nsmallest() 或 .nlargest() 參數(shù)里的篩選條件一定要包好在所抽取出來的DataFrame里面。
四、 數(shù)據(jù)透視表
4.1 普通的篩選求和:
df[(df["國家"] == "中國") & (df["品牌"] == "五菱")]["數(shù)量"].sum()
4.2 pivot_table
pd.pivot_table(df, values = "數(shù)量", index = "品牌", columns = "國家", aggfunc = "sum").fillna(0)
4.2 pivot_table + unstack
pd.pivot_table(df, values = "數(shù)量", index = "品牌", columns = "國家", aggfunc = "sum").fillna(0).unstack()

相關閱讀:
評論
圖片
表情
