<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          機(jī)器學(xué)習(xí)基礎(chǔ):決策樹的可視化

          共 2040字,需瀏覽 5分鐘

           ·

          2020-08-31 12:34

          ↑↑↑點擊上方藍(lán)字,回復(fù)資料,10個G的驚喜

          目前無論是機(jī)器學(xué)習(xí)競賽還是工業(yè)界,最流行、應(yīng)用最廣泛的xgboost其實是優(yōu)化后的GBDT(LightGBM里面的boosting比較經(jīng)典穩(wěn)定的也是GBDT哦!),而GBDT的基分類器最常用的就是CART決策樹!掌握決策樹,對理解之后的GBDT、LightGBM都有大有裨益。

          決策樹原理及案例我們之前已經(jīng)講過很多,感興趣的同學(xué)在上面搜索框搜索‘決策樹’即可,本文我們僅介紹可視化工具包的安裝配置方法和決策樹可視化方法/解析,讓大家對決策樹有更形象的理解。

          GraphViz配置指南

          GraphViz是AT&T Lab開發(fā)的開源工具包,用于繪制dot語言腳本描述的圖形,我們只需要關(guān)心點和邊的關(guān)系,不需考慮布局、位置等,用來結(jié)合Python繪制圖模型真是再好不過。

          Graphviz 應(yīng)用程序中有多種工具可以生成各種類型的圖表(dot、neato、circo、twopi 等)。本文將重點介紹用于生成層級圖的dot工具。

          環(huán)境配置步驟:

          1、首先下載安裝包graphviz-2.38.msi,下載地址為graphviz官網(wǎng)

          2、雙擊msi文件,然后一直選擇next(默認(rèn)安裝路徑為C:\Program Files (x86)\Graphviz2.38\),安裝完成之后,會在windows開始菜單創(chuàng)建快捷信息。

          3、配置環(huán)境變量:計算機(jī)→屬性→高級系統(tǒng)設(shè)置→高級→環(huán)境變量→系統(tǒng)變量→path,在path中加入路徑:

          4、驗證:在windows命令行界面,輸入dot -version,然后按回車,如果顯示如下圖所示的graphviz相關(guān)版本信息,則安裝配置成功。

          5、在C:/Users/H.X.X/anaconda3/Lib/site-packages找到pydot.py這個文件,在spyder里面用Ctrl+F搜索self.prog,把self.prog=‘dot’改成’dot.exe’,保存。一共會搜出六個結(jié)果,只需要改這一處就好。

          6、安裝graphviz和pydotplus的python模塊, 它的安裝和安裝普通的模塊一樣, 就是使用pip:

          7、在Python終端測試,配置完畢

          CART@GraphViz可視化

          from sklearn.datasets import load_irisfrom sklearn import treeimport pydotplusimport sysimport os       iris = load_iris()clf = tree.DecisionTreeClassifier()clf = clf.fit(iris.data, iris.target)from IPython.display import Image  dot_data = tree.export_graphviz(clf, out_file=None,                          feature_names=iris.feature_names,                           class_names=iris.target_names,                           filled=True, rounded=True,                           special_characters=True)  graph = pydotplus.graph_from_dot_data(dot_data)  Image(graph.create_png())

          除葉節(jié)點(終端節(jié)點)之外的所有節(jié)點都有 5 部分

          • 基于一個特征的值的有關(guān)數(shù)據(jù)的問題。每個問題的答案要么是 True,要么就是 False。數(shù)據(jù)點會根據(jù)該問題的答案在該決策樹中移動。

          • gini:節(jié)點的基尼不純度。當(dāng)沿著樹向下移動時,平均加權(quán)的基尼不純度必須降低。

          • samples:節(jié)點中觀察的數(shù)量。

          • value:每一類別中樣本的數(shù)量。比如,頂部節(jié)點中有 2 個樣本屬于類別 0,有 4 個樣本屬于類別 1。

          • class:節(jié)點中大多數(shù)點的類別(持平時默認(rèn)為 0)。在葉節(jié)點中,這是該節(jié)點中所有樣本的預(yù)測結(jié)果。

          END
          歡迎添加我的微信,更多精彩,盡在我的朋友圈。
          掃描二維碼添加好友↓

          推薦閱讀

          (點擊標(biāo)題可跳轉(zhuǎn)閱讀)

          當(dāng) 當(dāng) 網(wǎng),花160買400的書!

          囤書福利 | 數(shù)學(xué)篇(10本好書)

          Python文本預(yù)處理:步驟、使用工具及示例

          機(jī)器學(xué)習(xí)基礎(chǔ):詳解 5 大常用特征選擇方法

          NumPy庫入門教程:基礎(chǔ)知識總結(jié)

          【機(jī)器學(xué)習(xí)與Python福利群】成立了↓↓


          瀏覽 89
          點贊
          評論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報
          評論
          圖片
          表情
          推薦
          點贊
          評論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  五月婷综合 | 黄色色片在线观看 | 影音先锋中文字幕一区二区 | 99免费在线观看 | 天天爽天天爽成人A片影院 |