論文推薦:在早期訓(xùn)練階段預(yù)測下游模型性能

來源:DeepHub IMBA 本文約1000字,建議閱讀5分鐘
本文提出了一種針對下游任務(wù)的有效神經(jīng)網(wǎng)絡(luò)選擇的新框架。

將神經(jīng)網(wǎng)絡(luò)訓(xùn)練看作是一個基于突觸連接的動態(tài)系統(tǒng),并首次從微觀角度研究突觸連接的相互作用。 提出了用于神經(jīng)網(wǎng)絡(luò)模型選擇的神經(jīng)電容度量βeff。 基于5個基準(zhǔn)數(shù)據(jù)集的17個預(yù)訓(xùn)練模型的實(shí)驗(yàn)結(jié)果表明,我們的βeff方法優(yōu)于現(xiàn)有的學(xué)習(xí)曲線預(yù)測方法。 在CIFAR10/CIFAR100/SVHN/Fashion MNIST/Birds上,根據(jù)訓(xùn)練前模型的性能,論文的方法比最佳基線提高了9.1/38.3/12.4/65.3/40.1%。



評論
圖片
表情
