OpenAI新發(fā)現(xiàn):GPT-3做小學(xué)數(shù)學(xué)題能得55分,驗證勝過微調(diào)!

來源:AI科技評論 本文約2700字,建議閱讀5分鐘?
近日,OpenAI訓(xùn)練了一個新系統(tǒng),可解決小學(xué)數(shù)學(xué)題,稱其提升了GPT-3的邏輯推理問題。


論文地址: https://arxiv.org/pdf/2110.14168.pdf 數(shù)據(jù)集地址: https://github.com/openai/grade-school-math

訓(xùn)練驗證器:從錯誤中學(xué)習(xí)的模型
高質(zhì)量:GSM8K中的問題都是人工設(shè)計的,避免了錯誤問題的出現(xiàn)。
高多樣性:GSM8K中的問題都被設(shè)計得相對獨特,避免了來自相同語言模板或僅在表面細節(jié)上有差異的問題。
中等難度:GSM8K中的問題分布對大型SOTA語言模型是有挑戰(zhàn)的,但又不是完全難以解決的。這些問題不需要超出早期代數(shù)水平的概念,而且絕大多數(shù)問題都可以在不明確定義變量的情況下得到解決。
自然語言解決方案:GSM8K中的解決方案是以自然語言而不是純數(shù)學(xué)表達式的形式編寫的。模型由此生成的解決方案也可以更容易被人理解。此外,OpenAI也期望它能闡明大型語言模型內(nèi)部獨白的特性。






新方法是如何驗證的

先把模型的「生成器」在訓(xùn)練集上進行2個epoch的微調(diào)。 從生成器中為每個訓(xùn)練問題抽取100個解答,并將每個解答標記為正確或不正確。 在數(shù)據(jù)集上,驗證器再訓(xùn)練單個epoch。

寫在最后
參考鏈接:
https://openai.com/blog/grade-school-math/
https://zhuanlan.zhihu.com/p/427877874
評論
圖片
表情
