綜述論文:機(jī)器學(xué)習(xí)中的模型評(píng)價(jià)、模型選擇與算法選擇!
本論文回顧了用于解決模型評(píng)估、模型選擇和算法選擇三項(xiàng)任務(wù)的不同技術(shù),并參考理論和實(shí)證研究討論了每一項(xiàng)技術(shù)的主要優(yōu)勢(shì)和劣勢(shì)。進(jìn)而,給出建議以促進(jìn)機(jī)器學(xué)習(xí)研究與應(yīng)用方面的最佳實(shí)踐。

評(píng)估模型的泛化性能,即模型泛化到未見過數(shù)據(jù)的能力;
通過調(diào)整學(xué)習(xí)算法和在給定的假設(shè)空間中選擇性能最優(yōu)的模型,以提升預(yù)測(cè)性能;
確定最適用于待解決問題的機(jī)器學(xué)習(xí)算法。因此,我們可以比較不同的算法,選擇其中性能最優(yōu)的模型;或者選擇算法的假設(shè)空間中的性能最優(yōu)模型。
雖然上面列出的三個(gè)子任務(wù)都是為了評(píng)估模型的性能,但是它們需要使用的方法是不同的。本文將概述解決這些子任務(wù)需要的不同方法。

我們想評(píng)估泛化準(zhǔn)確度,即模型在未見數(shù)據(jù)上的預(yù)測(cè)性能。
我們想通過調(diào)整學(xué)習(xí)算法、從給定假設(shè)空間中選擇性能最好的模型,來改善預(yù)測(cè)性能。
我們想確定手頭最適合待解決問題的機(jī)器學(xué)習(xí)算法。因此,我們想對(duì)比不同的算法,選出性能最好的一個(gè);或從算法的假設(shè)空間中選出性能最好的模型。




我們想評(píng)估泛化準(zhǔn)確度,即模型在未見數(shù)據(jù)上的預(yù)測(cè)性能。
我們想通過調(diào)整學(xué)習(xí)算法、從給定假設(shè)空間中選擇性能最好的模型,來改善預(yù)測(cè)性能。
我們想確定最適合待解決問題的機(jī)器學(xué)習(xí)算法。因此,我們想對(duì)比不同的算法,選出性能最好的一個(gè),從算法的假設(shè)空間中選出性能最好的模型。



