數(shù)據(jù)分析中最常用的pandas21模塊操作
點(diǎn)擊上方藍(lán)色字體關(guān)注我們
Pandas 是 Python 的核心數(shù)據(jù)分析支持庫,提供了快速、靈活、明確的數(shù)據(jù)結(jié)構(gòu),旨在簡(jiǎn)單、直觀地處理關(guān)系型、標(biāo)記型數(shù)據(jù)。Pandas 的目標(biāo)是成為 Python 數(shù)據(jù)分析實(shí)踐與實(shí)戰(zhàn)的必備高級(jí)工具,其長(zhǎng)遠(yuǎn)目標(biāo)是成為最強(qiáng)大、最靈活、可以支持任何語言的開源數(shù)據(jù)分析工具。經(jīng)過多年不懈的努力,Pandas 離這個(gè)目標(biāo)已經(jīng)越來越近了。
下面對(duì)pandas常用的功能進(jìn)行一個(gè)可視化的介紹,希望能讓大家更容易理解和學(xué)習(xí)pandas。
1、Series序列

2、從ndarray創(chuàng)建一個(gè)系列
如果數(shù)據(jù)是ndarray,則傳遞的索引必須具有相同的長(zhǎng)度。如果沒有傳遞索引值,那么默認(rèn)的索引將是范圍(n),其中n是數(shù)組長(zhǎng)度,即[0,1,2,3…. range(len(array))-1] - 1]。

3、從字典創(chuàng)建一個(gè)系列

4、序列數(shù)據(jù)的訪問
通過各種方式訪問Series數(shù)據(jù),系列中的數(shù)據(jù)可以使用類似于訪問numpy中的ndarray中的數(shù)據(jù)來訪問。

5、序列的聚合統(tǒng)計(jì)
Series有很多的聚會(huì)函數(shù),可以方便的統(tǒng)計(jì)最大值、求和、平均值等

6、DataFrame(數(shù)據(jù)幀)
DataFrame是帶有標(biāo)簽的二維數(shù)據(jù)結(jié)構(gòu),列的類型可能不同。你可以把它想象成一個(gè)電子表格或SQL表,或者 Series 對(duì)象的字典。它一般是最常用的pandas對(duì)象。


7、從列表創(chuàng)建DataFrame
從列表中很方便的創(chuàng)建一個(gè)DataFrame,默認(rèn)行列索引從0開始。

8、從字典創(chuàng)建DataFrame
從字典創(chuàng)建DataFrame,自動(dòng)按照字典進(jìn)行列索引,行索引從0開始。

9、列選擇
在剛學(xué)Pandas時(shí),行選擇和列選擇非常容易混淆,在這里進(jìn)行一下整理常用的列選擇。

10、行選擇
整理多種行選擇的方法,總有一種適合你的。



11、返回指定行列
pandas的DataFrame非常方便的提取數(shù)據(jù)框內(nèi)的數(shù)據(jù)。

12、條件查詢
對(duì)各類數(shù)值型、文本型,單條件和多條件進(jìn)行行選擇


13、聚合
可以按行、列進(jìn)行聚合,也可以用pandas內(nèi)置的describe對(duì)數(shù)據(jù)進(jìn)行操作簡(jiǎn)單而又全面的數(shù)據(jù)聚合分析。


14、聚合函數(shù)
data.function(axis=0) 按列計(jì)算
data.function(axis=1) 按行計(jì)算

15、分類匯總
可以按照指定的多列進(jìn)行指定的多個(gè)運(yùn)算進(jìn)行匯總。

16、透視表
透視表是pandas的一個(gè)強(qiáng)大的操作,大量的參數(shù)完全能滿足你個(gè)性化的需求。

17、處理缺失值
pandas對(duì)缺失值有多種處理辦法,滿足各類需求。

18、查找替換
pandas提供簡(jiǎn)單的查找替換功能,如果要復(fù)雜的查找替換,可以使用map(), apply()和applymap()

19、數(shù)據(jù)合并
兩個(gè)DataFrame的合并,pandas會(huì)自動(dòng)按照索引對(duì)齊,可以指定兩個(gè)DataFrame的對(duì)齊方式,如內(nèi)連接外連接等,也可以指定對(duì)齊的索引列。

20、更改列名(columns index)
更改列名我認(rèn)為pandas并不是很方便,但我也沒有想到一個(gè)好的方案。

21、apply函數(shù)
這是pandas的一個(gè)強(qiáng)大的函數(shù),可以針對(duì)每一個(gè)記錄進(jìn)行單值運(yùn)算而不需要像其他語言一樣循環(huán)處理。


整理這個(gè)pandas可視化資料不易,
如果你覺得本文對(duì)其他人有幫助,
請(qǐng)分享給你的朋友,或點(diǎn)個(gè)在看,感謝感謝。
掃描下方二維碼關(guān)注我們,
你的關(guān)注是我寫作的動(dòng)力,
下次再整理更多的pandas可視化教程。
使用pyecharts進(jìn)行數(shù)據(jù)可視化
