機(jī)器學(xué)習(xí)基礎(chǔ):決策樹的可視化
↑↑↑點擊上方藍(lán)字,回復(fù)資料,10個G的驚喜
目前無論是機(jī)器學(xué)習(xí)競賽還是工業(yè)界,最流行、應(yīng)用最廣泛的xgboost其實是優(yōu)化后的GBDT(LightGBM里面的boosting比較經(jīng)典穩(wěn)定的也是GBDT哦!),而GBDT的基分類器最常用的就是CART決策樹!掌握決策樹,對理解之后的GBDT、LightGBM都有大有裨益。
決策樹原理及案例我們之前已經(jīng)講過很多,感興趣的同學(xué)在上面搜索框搜索‘決策樹’即可,本文我們僅介紹可視化工具包的安裝配置方法和決策樹可視化方法/解析,讓大家對決策樹有更形象的理解。
GraphViz配置指南
GraphViz是AT&T Lab開發(fā)的開源工具包,用于繪制dot語言腳本描述的圖形,我們只需要關(guān)心點和邊的關(guān)系,不需考慮布局、位置等,用來結(jié)合Python繪制圖模型真是再好不過。
Graphviz 應(yīng)用程序中有多種工具可以生成各種類型的圖表(dot、neato、circo、twopi 等)。本文將重點介紹用于生成層級圖的dot工具。
環(huán)境配置步驟:
1、首先下載安裝包graphviz-2.38.msi,下載地址為graphviz官網(wǎng)
2、雙擊msi文件,然后一直選擇next(默認(rèn)安裝路徑為C:\Program Files (x86)\Graphviz2.38\),安裝完成之后,會在windows開始菜單創(chuàng)建快捷信息。
3、配置環(huán)境變量:計算機(jī)→屬性→高級系統(tǒng)設(shè)置→高級→環(huán)境變量→系統(tǒng)變量→path,在path中加入路徑:
4、驗證:在windows命令行界面,輸入dot -version,然后按回車,如果顯示如下圖所示的graphviz相關(guān)版本信息,則安裝配置成功。
5、在C:/Users/H.X.X/anaconda3/Lib/site-packages找到pydot.py這個文件,在spyder里面用Ctrl+F搜索self.prog,把self.prog=‘dot’改成’dot.exe’,保存。一共會搜出六個結(jié)果,只需要改這一處就好。
6、安裝graphviz和pydotplus的python模塊, 它的安裝和安裝普通的模塊一樣, 就是使用pip:
7、在Python終端測試,配置完畢
CART@GraphViz可視化
from sklearn.datasets import load_irisfrom sklearn import treeimport pydotplusimport sysimport osiris = load_iris()clf = tree.DecisionTreeClassifier()clf = clf.fit(iris.data, iris.target)from IPython.display import Imagedot_data = tree.export_graphviz(clf, out_file=None,feature_names=iris.feature_names,class_names=iris.target_names,filled=True, rounded=True,special_characters=True)graph = pydotplus.graph_from_dot_data(dot_data)Image(graph.create_png())
除葉節(jié)點(終端節(jié)點)之外的所有節(jié)點都有 5 部分
基于一個特征的值的有關(guān)數(shù)據(jù)的問題。每個問題的答案要么是 True,要么就是 False。數(shù)據(jù)點會根據(jù)該問題的答案在該決策樹中移動。
gini:節(jié)點的基尼不純度。當(dāng)沿著樹向下移動時,平均加權(quán)的基尼不純度必須降低。
samples:節(jié)點中觀察的數(shù)量。
value:每一類別中樣本的數(shù)量。比如,頂部節(jié)點中有 2 個樣本屬于類別 0,有 4 個樣本屬于類別 1。
class:節(jié)點中大多數(shù)點的類別(持平時默認(rèn)為 0)。在葉節(jié)點中,這是該節(jié)點中所有樣本的預(yù)測結(jié)果。
—END— 歡迎添加我的微信,更多精彩,盡在我的朋友圈。 ↓掃描二維碼添加好友↓ 推薦閱讀
(點擊標(biāo)題可跳轉(zhuǎn)閱讀)
當(dāng) 當(dāng) 網(wǎng),花160買400的書!








