可視化分類型變量,我一般使用這6種圖形。
你好,我是zhenguo
上一篇文章如何選用最合適的圖形表達(dá)數(shù)據(jù)?我的一個(gè)思路,我們探討了數(shù)值型變量如何選圖的一些技巧,今天討論分類型變量選圖策略。
那么,什么是分類型變量,很好理解,像這樣的:

第一個(gè),最先想到的應(yīng)該是柱狀圖:

第二個(gè),一個(gè)很有意思的、特殊的柱狀圖:棒棒糖圖,柱狀圖被轉(zhuǎn)換成一條線和一個(gè)點(diǎn)。它顯示了數(shù)字變量和分類變量之間的關(guān)系,下圖是基本的棒棒圖:

第三個(gè),熱力圖也能表達(dá)分類變量和數(shù)字的關(guān)系,上篇文章我們提到熱力圖,在此不詳細(xì)展開:

第四個(gè),詞云圖(Wordcloud)也能可視化分類變量,顯示一個(gè)單詞列表中每個(gè)單詞的重要性,用字體大小或顏色顯示:
第五個(gè),餅圖是一個(gè)分為多個(gè)部分的圓,每個(gè)部分代表一個(gè)整體的比例,也能用來(lái)表達(dá)分類變量:

第六個(gè),樹狀圖將層次數(shù)據(jù)顯示為一組嵌套的矩形。每組由一個(gè)矩形表示,矩形的面積與其值成比例。樹形圖的優(yōu)點(diǎn)是能夠有效地表示大量的數(shù)據(jù)。如果有多個(gè)層次結(jié)構(gòu)(>2),建議構(gòu)建一個(gè)交互式圖形:?jiǎn)螕羯蠈訉@示下一層。
import matplotlib.pyplot as plt
import squarify
squarify.plot(sizes=[13,22,35,5], label=["group A", "group B", "group C", "group D"], color=["red","green","blue", "grey"], alpha=.4 )
plt.axis('off')
plt.show()

后面你再遇到分類變量可視化時(shí),可以找出這篇文章,應(yīng)該對(duì)你有一定參考價(jià)值。所以,建議收藏,點(diǎn)贊支持。
近期我創(chuàng)建了一個(gè)從零學(xué)Python數(shù)據(jù)分析的知識(shí)星球,專門分享Python和數(shù)據(jù)分析的寶書、最精華的學(xué)習(xí)路線、問(wèn)答和打卡,現(xiàn)在加入,還可以免費(fèi)加入另一個(gè)我的算法刷題日記星球??梢哉f(shuō),超級(jí)劃算。
長(zhǎng)按圖中二維碼加入
以后別每天為找不到方向而彷徨了,也別淹沒(méi)在浩瀚的資料中而迷失自己了,這兩個(gè)星球是專門解決這兩個(gè)問(wèn)題的。我在背后的付出是巨大的,希望我的用心,能夠真正幫助到你,干凈地解決你的痛點(diǎn)
