PandasGUI:使用圖形用戶界面分析 Pandas 數(shù)據(jù)幀

數(shù)據(jù)預(yù)處理是數(shù)據(jù)科學(xué)管道的重要組成部分,需要找出數(shù)據(jù)中的各種不規(guī)則性,操作您的特征等。Pandas 是我們經(jīng)常使用的一種工具,用于處理數(shù)據(jù),還有 seaborn 和 matplotlib用于數(shù)據(jù)可視化。PandasGUI 是一個庫,通過提供可用于制作
安裝 PandasGUI
使用pip 命令像安裝任何其他 python 庫一樣安裝 PandasGUI。相同的命令是:
pip?install?pandasgui
要在 PandasGUI 中讀取 文件,我們需要使用show()函數(shù)。讓我們從將它與 pandas 一起導(dǎo)入開始。數(shù)據(jù)集是titanic
import?pandas?as?pd
from?pandasgui?import?show
from?pandasgui.datasets?import?titanic
show(titanic)
這是我們的數(shù)據(jù)框,我們可以滾動查看數(shù)據(jù)??梢钥吹奖硎?NaN 值的空單元格??梢酝ㄟ^單擊單元格并編輯其值來編輯數(shù)據(jù)。只需單擊特定列即可根據(jù)特定列對數(shù)據(jù)框進(jìn)行排序。在下圖中,我們可以通過單擊fare
列對數(shù)據(jù)框進(jìn)行排序。
PandasGUI 中的過濾器
假設(shè)我們想查看 MSSubClass 的值大于或等于 120 的行。在 Pandas 中,我們可以使用以下命令:
titanic[titanic['age']?>=?20]
PandasGUI 為我們提供了過濾器,可以在其中編寫查詢表達(dá)式來過濾數(shù)據(jù)。上述查詢表達(dá)式將是:
Pandas GUI 中的統(tǒng)計信息
匯總統(tǒng)計數(shù)據(jù)為您提供了數(shù)據(jù)分布的概覽。在pandas中,我們使用describe()方法來獲取數(shù)據(jù)的統(tǒng)計信息。
titanic.describe()
在 PandasGUI 中,可以轉(zhuǎn)到統(tǒng)計部分并獲取每列的統(tǒng)計信息。
PandasGUI 中的數(shù)據(jù)可視化
數(shù)據(jù)可視化通常不是 Pandas 的用途,我們使用 matplotlib、seaborn、plotly 等庫。但 PandasGUI 在 Grapher 部分下提供了使用 plotly 繪制的交互式圖形。
我們通過將fare拖放到x下來創(chuàng)建fare的直方圖。
除了這些,還可以創(chuàng)建箱線圖、3d 散點圖、線圖等。如果您想快速概覽數(shù)據(jù),從檢查匯總統(tǒng)計數(shù)據(jù)到繪制數(shù)據(jù),PandasGUI 是一個很好的工具,可以輕松完成,無需代碼。
推薦閱讀
牛逼!Python常用數(shù)據(jù)類型的基本操作(長文系列第①篇)
牛逼!Python的判斷、循環(huán)和各種表達(dá)式(長文系列第②篇)
推薦閱讀
牛逼!Python常用數(shù)據(jù)類型的基本操作(長文系列第①篇)
牛逼!Python的判斷、循環(huán)和各種表達(dá)式(長文系列第②篇)




