【收藏】機器學(xué)習(xí)回歸模型相關(guān)重要知識點總結(jié)!
回歸分析為許多機器學(xué)習(xí)算法提供了堅實的基礎(chǔ)。在這篇文章中,我們將總結(jié) 10 個重要的回歸問題和5個重要的回歸問題的評價指標(biāo)。
一、線性回歸的假設(shè)是什么?
線性:自變量(x)和因變量(y)之間應(yīng)該存在線性關(guān)系,這意味著x值的變化也應(yīng)該在相同方向上改變y值。 獨立性:特征應(yīng)該相互獨立,這意味著最小的多重共線性。 正態(tài)性:殘差應(yīng)該是正態(tài)分布的。 同方差性:回歸線周圍數(shù)據(jù)點的方差對于所有值應(yīng)該相同。
二、什么是殘差,它如何用于評估回歸模型?

三、如何區(qū)分線性回歸模型和非線性回歸模型?

殘差圖; 散點圖; 假設(shè)數(shù)據(jù)是線性的,訓(xùn)練一個線性模型并通過準(zhǔn)確率進行評估。
四、什么是多重共線性,它如何影響模型性能?
五、異常值如何影響線性回歸模型的性能?

六、什么是 MSE 和 MAE 有什么區(qū)別?
七、L1 和 L2 正則化是什么,應(yīng)該在什么時候使用?
八、異方差是什么意思?
九、方差膨脹因子的作用是什么的作用是什么?
十、逐步回歸(stepwise regression)如何工作?
十一、除了MSE 和 MAE 外回歸還有什么重要的指標(biāo)嗎?


指標(biāo)一:平均絕對誤差(MAE)

指標(biāo)二:均方誤差(MSE)

指標(biāo)三:均方根誤差 (RMSE)

指標(biāo)四:R2 score



如果 R2 得分為 0,則意味著我們的模型與平均線的結(jié)果是相同的,因此需要改進我們的模型。 如果 R2 得分為 1,則等式的右側(cè)部分變?yōu)?0,這只有在我們的模型適合每個數(shù)據(jù)點并且沒有出現(xiàn)誤差時才會發(fā)生。 如果 R2 得分為負,則表示等式右側(cè)大于 1,這可能發(fā)生在 SSR > SSM 時。這意味著我們的模型比平均線最差,也就是說我們的模型還不如取平均數(shù)進行預(yù)測。
指標(biāo)五:Adjusted R2 score


評論
圖片
表情
