北大計(jì)算機(jī)博士生先于OpenAI發(fā)表預(yù)訓(xùn)練語(yǔ)言模型求解數(shù)學(xué)題論文,曾被頂會(huì)拒絕
日期?:?2021年11月25日?? ? ??
正文共?:2805字
【導(dǎo)讀】北大博士生沈劍豪同學(xué)一篇關(guān)于「用語(yǔ)言模型來(lái)解決數(shù)學(xué)應(yīng)用題」的EMNLP投稿在綜合評(píng)審時(shí)被認(rèn)為不夠重要,收錄于Findings而沒(méi)有被主會(huì)接收。有趣的是,OpenAI的最新工作與該論文的方法不謀而合,并表示非常好用。



拓展了特定任務(wù)的SOTA,但是對(duì)EMNLP社區(qū)而言,沒(méi)有新的見(jiàn)解或更廣泛的適用性; 有良好的、新穎的實(shí)驗(yàn),并提出了全面的分析和結(jié)論,但使用的方法不夠「新穎」。




沈劍豪,尹伊淳,李琳,尚利峰,蔣欣,張銘, 劉群,《生成&排序:一種數(shù)學(xué)文字問(wèn)題的多任務(wù)框架》,EMNLP 2020 Findings。該工作由北大計(jì)算機(jī)學(xué)院和華為諾亞方舟實(shí)驗(yàn)室合作完成。



我們的工作與他們的方法有許多基本相似之處,盡管我們?cè)趲讉€(gè)關(guān)鍵方面有所不同。






先把模型的「生成器」在訓(xùn)練集上進(jìn)行2個(gè)epoch的微調(diào)。 從生成器中為每個(gè)訓(xùn)練問(wèn)題抽取100個(gè)解答,并將每個(gè)解答標(biāo)記為正確或不正確。 在數(shù)據(jù)集上,驗(yàn)證器再訓(xùn)練單個(gè)epoch。
—?THE END —

評(píng)論
圖片
表情
