175篇論文告訴你深度學習er能從NeurIPS 2020論文學到什么?

??新智元推薦?
??新智元推薦?
來源:AMiner科技
作者:戚路北
【新智元導讀】在Medium上,一位名為Prabhu Prakash Kagitha的博主,根據NeurIPS 2020上的論文發(fā)表了一篇題為“NeurIPS 2020 Papers: Takeaways for a Deep Learning Engineer”的文章,閱讀了NeurIPS 2020中的175篇論文的摘要,匯總了與深度學習有關的見解。
1、加速基于Transformer的語言模型的逐層下降訓練
與標準翻譯器相比,可切換翻譯器(ST)的預訓練速度快2.5倍。
配備可切換門(G在fg。下面),一些層是根據伯努利分布抽樣0或1隨機跳過的,每個抽樣的時間效率為25%。

2、用于神經網絡抗噪聲標簽的Robust訓練的核心集

3、基于預訓練BERT網絡模型的彩票假設



4、MPNet:語言理解預先訓練的掩蔽和排列

5、使用邊緣排名下的區(qū)域識別錯誤標記的數(shù)據
6、重新思考標簽對于改善課堂不平衡學習的價值
7、Big Bird:長序列翻譯

不同類型的注意在稀疏注意(a)隨機注意(b)窗口鄰域注意(c)添加CLS令牌后的全局注意。(圖片摘自本論文的pdf版本。)8、通過權重共享來改進自動增重
9、集中注意力的快速翻譯
10、自我關注的深度限制和效率

評論
圖片
表情
