OpenAI新發(fā)現(xiàn):GPT-3做小學(xué)數(shù)學(xué)題能得55分,驗(yàn)證勝過微調(diào)!
大數(shù)據(jù)文摘授權(quán)轉(zhuǎn)載在AI科技評論
論文地址:https://arxiv.org/pdf/2110.14168.pdf
數(shù)據(jù)集地址:https://github.com/openai/grade-school-math

訓(xùn)練驗(yàn)證器:從錯(cuò)誤中學(xué)習(xí)的模型
訓(xùn)練驗(yàn)證器:從錯(cuò)誤中學(xué)習(xí)的模型
高質(zhì)量:GSM8K中的問題都是人工設(shè)計(jì)的,避免了錯(cuò)誤問題的出現(xiàn)。
高多樣性:GSM8K中的問題都被設(shè)計(jì)得相對獨(dú)特,避免了來自相同語言模板或僅在表面細(xì)節(jié)上有差異的問題。
中等難度:GSM8K中的問題分布對大型SOTA語言模型是有挑戰(zhàn)的,但又不是完全難以解決的。這些問題不需要超出早期代數(shù)水平的概念,而且絕大多數(shù)問題都可以在不明確定義變量的情況下得到解決。
自然語言解決方案:GSM8K中的解決方案是以自然語言而不是純數(shù)學(xué)表達(dá)式的形式編寫的。模型由此生成的解決方案也可以更容易被人理解。此外,OpenAI也期望它能闡明大型語言模型內(nèi)部獨(dú)白的特性。






新方法是如何驗(yàn)證的
新方法是如何驗(yàn)證的

先把模型的「生成器」在訓(xùn)練集上進(jìn)行2個(gè)epoch的微調(diào)。
從生成器中為每個(gè)訓(xùn)練問題抽取100個(gè)解答,并將每個(gè)解答標(biāo)記為正確或不正確。
在數(shù)據(jù)集上,驗(yàn)證器再訓(xùn)練單個(gè)epoch。

寫在最后
寫在最后
參考鏈接:

評論
圖片
表情
