10分鐘帶你學(xué)會Pandas多層級索引
Pandas庫的名字來源于其中3種主要數(shù)據(jù)結(jié)構(gòu)開頭字母的縮寫:
Panel,Dataframe,Series。
其中Series表示一維數(shù)據(jù),Dataframe表示二維數(shù)據(jù),Panel表示三維數(shù)據(jù)。
但實際上,當數(shù)據(jù)高于二維時,我們一般用包含多層級索引的Dataframe進行表示,而不是使用Panel。
原因是使用多層級索引展示數(shù)據(jù)更加直觀,操作數(shù)據(jù)更加靈活,并且可以表示3維,4維乃至任意維度的數(shù)據(jù)。
一,多層級索引的創(chuàng)建
1,指定多維列表作為columns

2,使用pd.MultiIndex中的方法顯式生成多層級索引
可以使用pd.MultiIndex中的from_tuples等方法生成多層級索引。

3,使用set_index方法將普通列轉(zhuǎn)成多層級索引
這種方法只能生成多層級行索引。



4,groupby和pivot_table等方法也可以生成帶有多層級索引的結(jié)果



二,多層級索引的取值
多層級索引Series或多層級DataFrame支持方括號直接取值,loc取值,和pd.IndexSlice切片取值等方法。
1,多層級Series的取值




2,多層級DataFrame的取值







三,多層級索引相關(guān)操作
多層級索引相關(guān)操作包括stack和unstack,set_index和reset_index,以及指定level的相關(guān)方法。
1,stack和unstack



2,set_index和reset_index


3,指定level的相關(guān)方法




評論
圖片
表情
