太硬核!只需一行代碼就可以在Python中創(chuàng)建數(shù)據(jù)可視化!
相信每個人都聽說過這句話:一圖勝千言,這就是為什么數(shù)據(jù)可視化對于任何項目或報告都是一個重要的環(huán)節(jié)。但是我們都知道,創(chuàng)建數(shù)據(jù)可視化有時候可能很耗時都。
今天本篇文章會介紹一個 Python 工具包:QuickDA,它可以很容易解決這個問題。
安裝
要安裝 QuickDA,在終端并輸入如下命令
pip install QuickDA
就這么簡單。你現(xiàn)在可以使用它了。
現(xiàn)在我們把我們需要的都導(dǎo)入
# Importing libraries
from quickda.explore_data import *
from quickda.clean_data import *
from quickda.explore_numeric import *
from quickda.explore_categoric import *
from quickda.explore_numeric_categoric import *
from quickda.explore_time_series import *
創(chuàng)建可視化數(shù)字特征
正如我在標(biāo)題中提到的,你可以用一行代碼創(chuàng)建可視化。有幾種方法都可以做到,我們會檢查每一種方法。第一個是為數(shù)值數(shù)據(jù)創(chuàng)建多個可視化。代碼如下:
eda_num(data)

如上圖所見,使用一行代碼,我創(chuàng)建了多個數(shù)據(jù)可視化。QuickDA 為每個特征創(chuàng)建箱線圖和直方圖。通常,只有一個或兩個數(shù)據(jù)可視化就可以完成這項工作。幸運(yùn)的是,QuickDA 能夠使用以下代碼為選定的數(shù)據(jù)創(chuàng)建可視化效果:
eda_num(data[['column_1', 'columns_2', 'column_n']])
相關(guān)矩陣
需要相關(guān)矩陣嗎?沒問題。你可以鍵入以下代碼,并檢查功能的關(guān)聯(lián)程度。
eda_num(data, method="correlation")
說實話,我不喜歡 QuickDA 的相關(guān)矩陣的風(fēng)格,但它確實起到了作用。我們可以很容易地看到哪些特征與紅色高度相關(guān)。
分類特征可視化
現(xiàn)在,讓我們看一下如何為分類特性創(chuàng)建一些可視化效果。對于這個,你需要選擇要學(xué)習(xí)的功能。
eda_cat(data, x='column_name')
我們可以看到 QuickDA 創(chuàng)建了一個好看的可視化功能,用于顯示每個值的計數(shù)和一個帶有數(shù)字描述的表。很酷,對吧?現(xiàn)在,假設(shè)你想了解數(shù)據(jù)是如何為每個性別分布的。你也可以這樣做,只需添加一個y值。
eda_cat(data, x='column_name', y='column_name')
特征重要性
QuickDA 可以做的另一件很酷的事情是,我們可以快速獲得特征的重要性以及特征如何預(yù)測特定目標(biāo)。它對于機(jī)器學(xué)習(xí)非常方便,并且可以幫助你消除不相關(guān)的特性。
eda_numcat(data, method='pps', x='target_feature')
相關(guān)性
QuickDA 可以輕松地創(chuàng)建相關(guān)可視化。通常,使用 Matplotlib 很容易創(chuàng)建相關(guān)可視化,但是有其他方法可以很好地實現(xiàn)。
eda_numcat(data, x='x_value', y='y_value', hue='color_setup', method='relationship')
時間序列
時間序列可視化也可以很容易地完成。有趣的是,QuickDA 使用不同的庫進(jìn)行可視化,如 Matplotlib、Seaborn 和 plotlyexpress 。例如,對于時間序列,使用Plotly Express。
數(shù)據(jù)透視表
最后但并非最不重要的一點是,QuickDA 有一個很酷的特性,它不是一個很好的數(shù)據(jù)可視化,但是它非常酷。它使創(chuàng)建數(shù)據(jù)透視表成為可能。如果你已經(jīng)工作或?qū)W習(xí)數(shù)據(jù)分析,那么你已經(jīng)知道透視表的重要性。
eda_numcat(data, x=['column_1, column_2'], y=None, method='pivot')
結(jié)論
QuickDA 還可以做很多比較酷的事情。我建議你使用數(shù)據(jù)集進(jìn)行嘗試,我相信你會看到它有多么強(qiáng)大。你可以在這個筆記本上找到更多的代碼。
https://github.com/ismael-araujo/Testing-Libraries/tree/main/QuickEDA

1. 關(guān)注下方公眾號,點擊右上角;
2. 在下方后臺回復(fù)關(guān)鍵詞「數(shù)據(jù)科學(xué)」快速下載:
