【Python】Autoviz: 一行代碼搞定數(shù)據(jù)集探索并可視化
數(shù)據(jù)集各個特征有什么變化趨勢、各個特征之間有何關(guān)系,我們可以借助Matplotlib、Seaborn等諸多工具來可視化展示,那么有沒有一種工具能一次展示所有的關(guān)系了?
本文要介紹的Python工具Autoviz,一行代碼即可完成對數(shù)據(jù)集所有關(guān)系的探索 (Exploratory Data Analysis,EDA)。
安裝
pip?install?autoviz
一行代碼搞定數(shù)據(jù)探索
本次以探索鳶尾花 (iris)數(shù)據(jù)集為例子,數(shù)據(jù)集詳細(xì)介紹????鳶尾花數(shù)據(jù)集詳細(xì)介紹,大概是這樣
autoviz使用,
from?autoviz.AutoViz_Class?import?AutoViz_Class
#AutoViz實(shí)例化
AV?=?AutoViz_Class()
#一行代碼實(shí)現(xiàn)數(shù)據(jù)探索
dft?=?AV.AutoViz(
????filename='/Users/xmy/Desktop/jobs/py/iris.csv',??#讀入數(shù)據(jù)集,注意和dfte的區(qū)別
????sep=",",??#設(shè)置數(shù)據(jù)集分隔符,默認(rèn)為逗號
????depVar="species",??#設(shè)置因變量
????dfte=None,??#傳入一個pandas.DataFrame,如果filename已設(shè)置,此處為None,反之亦然
????header=0,
????verbose=0,??#可選0,?1或者2,設(shè)置圖形的保存形式
????lowess=False,??#是否啟用lowess回歸,適合小數(shù)據(jù)量數(shù)據(jù)集,100,000行以上數(shù)據(jù)不建議用
????chart_format="svg",??#設(shè)置圖形保存格式
????max_rows_analyzed=150000,??#設(shè)置數(shù)據(jù)集待分析的行數(shù)
????max_cols_analyzed=30,??#設(shè)置數(shù)據(jù)集待分析的列數(shù)
)
結(jié)果輸出一部分為Dataset的簡單介紹,
結(jié)果輸出另一部分為大量可視化圖表,?




以上整個過程僅僅需要4.226秒
No categorical or boolean vars in data set. Hence no pivot plots...
No categorical or numeric vars in data set. Hence no bar charts.Time to run AutoViz \(in seconds\) = 4.226
###################### VISUALIZATION Completed ########################
參考:https://github.com/AutoViML/AutoViz
-END-
往期精彩回顧 本站qq群851320808,加入微信群請掃碼:
評論
圖片
表情
