2000字精華總結(jié),安利一個超好用的Pandas數(shù)據(jù)挖掘分析神器
在繼上一次給大家推薦了兩個數(shù)據(jù)分析工具之后:
推薦2個十分好用的pandas數(shù)據(jù)探索分析神器!
大家可以將其理解為是Pandas的GUI擴展工具,所具備的功能有
查看DataFrame數(shù)據(jù)集與Series數(shù)據(jù)集
過濾數(shù)據(jù)
數(shù)據(jù)的統(tǒng)計分析
繪制交互式圖表
文本數(shù)據(jù)的操作
數(shù)據(jù)清洗與類型轉(zhuǎn)換
合并數(shù)據(jù)集
安裝模塊
在使用之前,我們先需要通過pip install進行該模塊的安裝
pip?install?bamboolib?
Jupyter Notebook以及JupyterLab上面用到該工具,因此還要安裝額外的插件#?Jupyter?Notebook?extensions
python?-m?bamboolib?install_nbextensions
#?JupyterLab?extensions
python?-m?bamboolib?install_labextensions
查看DataFrame數(shù)據(jù)集
bamboolib,導(dǎo)入我們需要用到的模塊import?bamboolib?as?bam
import?pandas?as?pd
讀取數(shù)據(jù)
df?=?pd.read_excel(
????io="supermarkt_sales.xlsx",
????engine="openpyxl",
????sheet_name="Sales",
????skiprows=3,
????usecols="B:R",
????nrows=1000,
)
df
會彈出如下所示的界面,

我們先來簡單介紹一下界面上的各個按鈕,
Explore DataFrame:對數(shù)據(jù)集進行探索性分析的按鈕 Create plot: 繪制交互性圖表的按鈕 Search Transformations:包含對數(shù)據(jù)集進行各項操作 Update: 過濾出指定的列 Export: 可以將處理完的數(shù)據(jù)集以及代碼導(dǎo)出
Explore DataFrame按鈕來對數(shù)據(jù)先來一個大致的印象
Correlation Matrix按鈕
過濾數(shù)據(jù)
要是我們想要指定某一列數(shù)據(jù)的話,點擊下拉框,選中select or drop columns,

或者我們想要刪掉某一列的話,也是相類似的操作

filter rows按鈕,然后我們給出特定的條件,在Bamboolib模塊當中有多種方式來過濾數(shù)據(jù),有has values、contains、startswith、endswith等等,類似于Pandas模塊當中對于文本數(shù)據(jù)處理的方法,例如我們想要挑選出“省份”這一列當中的“浙江省”的數(shù)據(jù),就這么來做
sort rows,例如我們以“毛利率”的大小來排序,并且是降序排序,就這么來做
要是我們想要對某一列的列名進行重命名,點擊rename columns

數(shù)據(jù)的清洗與類型轉(zhuǎn)換
change column data dtype
drop missing values或者是drop columns with missing values
find and replace missing values
數(shù)據(jù)的統(tǒng)計分析
bamboolib模塊來對數(shù)據(jù)進行統(tǒng)計分析,例如計算數(shù)值的變化(percent change),我們在下拉框中找到percent change的選項,然后對指定的列計算當中數(shù)值的變化百分比
cumulative product或者是cumulative sum
group by and aggregate按鈕,例如我們以“省份”來分組,計算“總收入”的平均值,可以這么來操作
合并數(shù)據(jù)集
join/merge dataframes選項,當中有四種合并的方式,分別是inner join、left join、right join和outer join,然后我們選擇合并的
文本數(shù)據(jù)的操作
convert to lowercase/convert to uppercase
Remove leading and trailing whitespaces
而要是我們需要對字符串做一個分割,就在下拉框中選中split text column

繪制交互式的圖表


END
各位伙伴們好,詹帥本帥搭建了一個個人博客和小程序,匯集各種干貨和資源,也方便大家閱讀,感興趣的小伙伴請移步小程序體驗一下哦!(歡迎提建議)
推薦閱讀
牛逼!Python常用數(shù)據(jù)類型的基本操作(長文系列第①篇)
牛逼!Python的判斷、循環(huán)和各種表達式(長文系列第②篇)
評論
圖片
表情
