機器學(xué)習(xí)算法終極對比:樹模型VS神經(jīng)網(wǎng)絡(luò)
選自towardsdatascience
樹模型和神經(jīng)網(wǎng)絡(luò),像一枚硬幣的兩面。在某些情況下,樹模型的性能甚至優(yōu)于神經(jīng)網(wǎng)絡(luò)。

基于樹的方法通過垂直線和水平線逐段解決問題,以最小化熵(優(yōu)化器和損失)。神經(jīng)網(wǎng)絡(luò)通過激活函數(shù)來逐段解決問題。
基于樹的方法是確定性的,而不是概率性的。這帶來了一些不錯的簡化,如自動特征選擇。
決策樹中被激活的條件節(jié)點類似于神經(jīng)網(wǎng)絡(luò)中被激活的神經(jīng)元(信息流)。
神經(jīng)網(wǎng)絡(luò)通過擬合參數(shù)對輸入進行變換,間接指導(dǎo)后續(xù)神經(jīng)元的激活。決策樹則顯式地擬合參數(shù)來指導(dǎo)信息流。(這是確定性與概率性相對應(yīng)的結(jié)果。)

我以前在這個平臺上有過愉快的購物經(jīng)歷嗎?如果有,繼續(xù)。
我現(xiàn)在需要這件商品嗎?(例如,冬天我應(yīng)該買太陽鏡和泳褲嗎?)如果是,繼續(xù)。
根據(jù)我的用戶統(tǒng)計信息,這是我有興趣購買的產(chǎn)品嗎?如果是,繼續(xù)。
這個東西太貴嗎?如果沒有,繼續(xù)。
其他顧客對這個產(chǎn)品的評價是否足夠高,讓我可以放心地購買它?如果是,繼續(xù)。
最好將基于樹的方法視為神經(jīng)網(wǎng)絡(luò)的縮小版本,以更簡單的方式進行特征分類、優(yōu)化、信息流傳遞等。
基于樹的方法和神經(jīng)網(wǎng)絡(luò)方法在用途的主要區(qū)別在于確定性(0/1)與概率性數(shù)據(jù)結(jié)構(gòu)。使用確定性模型可以更好地對結(jié)構(gòu)化(表格)數(shù)據(jù)進行建模。
不要低估樹方法的威力。
往期精彩:
【原創(chuàng)首發(fā)】機器學(xué)習(xí)公式推導(dǎo)與代碼實現(xiàn)30講.pdf
【原創(chuàng)首發(fā)】深度學(xué)習(xí)語義分割理論與實戰(zhàn)指南.pdf

