谷歌AI發(fā)布稀疏模型高效設(shè)計指南!
點(diǎn)藍(lán)色字關(guān)注“機(jī)器學(xué)習(xí)算法工程師”
設(shè)為星標(biāo),干貨直達(dá)!
本文轉(zhuǎn)自機(jī)器之心公眾號
編輯:張倩、杜偉
稀疏模型在深度學(xué)習(xí)領(lǐng)域發(fā)揮著越來越重要的作用。對于給定的 token 或樣本,它可以只激活模型的一小部分,從而在擁有很大的參數(shù)量的同時也能做到計算友好。但是,如何可靠地訓(xùn)練這類模型依然是一個需要解決的問題。在這篇文章中,來自谷歌的 Barret Zoph、Irwan Bello、William Fedus 、Jeff Dean 等研究者給出了一份「高效稀疏專家模型設(shè)計指南」。





推薦閱讀
輔助模塊加速收斂,精度大幅提升!移動端實時的NanoDet-Plus來了!
機(jī)器學(xué)習(xí)算法工程師
? ??? ? ? ? ? ? ? ? ? ? ????????? ??一個用心的公眾號

評論
圖片
表情
