OpenAI科學(xué)家震驚TED大會(huì):讓AI模型思考20秒,提升10萬(wàn)倍性能!
共 1888字,需瀏覽 4分鐘
·
2024-10-25 13:34
專注AIGC領(lǐng)域的專業(yè)社區(qū),關(guān)注微軟&OpenAI、百度文心一言、訊飛星火等大語(yǔ)言模型(LLM)的發(fā)展和應(yīng)用落地,聚焦LLM的市場(chǎng)研究和AIGC開(kāi)發(fā)者生態(tài),歡迎關(guān)注!
今天凌晨,知名科技媒體Venturebeat消息,OpenAI高級(jí)研究科學(xué)家、德?lián)銩I之父Noam Brown,在美國(guó)舊金山舉辦的TED AI大會(huì)上提出了一個(gè)震驚的理論——讓AI模型思考 20 秒所帶來(lái)的性能提升,相當(dāng)于將模型擴(kuò)大100,000倍并訓(xùn)練100,000倍的時(shí)間。
最初,Brown也被這個(gè)結(jié)果嚇到了,還寫了多篇論文來(lái)驗(yàn)證其真實(shí)性。他發(fā)現(xiàn)“系統(tǒng)二思維”( System 2 thinking)才是讓AI模型性能大幅度提升的關(guān)鍵所在。而OpenAI最新發(fā)布的o1模型同樣引入了這個(gè)技術(shù)概念,并且獲得了非常出色的性能提升。
Brown在演講中表示,過(guò)去5年AI能獲得巨大提升可以用一個(gè)詞來(lái)概括——規(guī)模。但如今的前沿AI模型仍基于 2017年推出的Transformer架構(gòu),主要區(qū)別在于數(shù)據(jù)規(guī)模和計(jì)算能力。
現(xiàn)在是時(shí)候進(jìn)行訓(xùn)練、推理范式轉(zhuǎn)變了,AI模型需要超越單純的數(shù)據(jù)預(yù)處理,進(jìn)入 “系統(tǒng)二思維”模式,以一種更慢、更審慎的擬人化推理形式來(lái)解決超復(fù)雜的難題。
系統(tǒng)二思維介紹
“系統(tǒng)二思維”是一個(gè)心理學(xué)概念,描述了人類處理復(fù)雜問(wèn)題時(shí)所采用的深度思考方式。這個(gè)概念最初由心理學(xué)家Daniel Kahneman在他的著作《思考,快與慢》中提出,用來(lái)解釋人類大腦的兩種不同的思考模式。
在Kahneman的理論中,系統(tǒng)一思維是快速、直覺(jué)、自動(dòng)的,它處理日常的、熟悉的任務(wù),比如識(shí)別熟悉的面孔或者理解簡(jiǎn)單的句子。
這種思維方式不需要我們有意識(shí)地思考,它依賴于我們的直覺(jué)和經(jīng)驗(yàn),但有時(shí)也可能導(dǎo)致錯(cuò)誤,因?yàn)樗簧婕吧钊氲倪壿嬐评怼?
而系統(tǒng)二思維則是緩慢、邏輯、努力的,它涉及到深思熟慮、計(jì)算和推理。當(dāng)我們面對(duì)復(fù)雜的、新穎的或者需要深入分析的問(wèn)題時(shí),就會(huì)啟動(dòng)系統(tǒng)二思維。這種思維方式需要我們集中注意力,消耗更多的認(rèn)知資源,但它可以幫助我們做出更準(zhǔn)確和深思熟慮的決策。
Brown直接將這個(gè)概念應(yīng)用到AI領(lǐng)域,提出了一個(gè)革命性的想法:通過(guò)模擬人類的系統(tǒng)二思維,AI模型可以在不增加大量數(shù)據(jù)或計(jì)算資源的情況下顯著提升性能。
以他開(kāi)發(fā)的戰(zhàn)勝人類的德?lián)銩I Libratus為例,僅讓AI在每手牌中思考20秒,就能獲得與將模型擴(kuò)大100,000倍相同的性能提升。這種方法的核心在于讓AI模型在做出決策前進(jìn)行更深入的分析和推理,而不是僅僅依賴于大規(guī)模數(shù)據(jù)和計(jì)算。
而OpenAI最新發(fā)布的o1模型同樣引入了系統(tǒng)二思維,能夠進(jìn)行深度推理,模仿人類逐步解決問(wèn)題的過(guò)程,通過(guò)自我對(duì)弈等強(qiáng)化學(xué)習(xí)訓(xùn)練方式提升推理能力。
例如,在國(guó)際數(shù)學(xué)奧林匹克資格考試中,o1 模型憑借系統(tǒng)二思維準(zhǔn)確推理復(fù)雜數(shù)學(xué)公式取得 83%的準(zhǔn)確率,遠(yuǎn)高于GPT - 4o的13%。這對(duì)于金融、醫(yī)療、科研、編碼等對(duì)數(shù)據(jù)要求嚴(yán)謹(jǐn)?shù)男袠I(yè)來(lái)說(shuō)非常重要。
所以,系統(tǒng)二思維對(duì)于增強(qiáng)大模型的能力有很多好處,使其能夠更好地適應(yīng)新的、未見(jiàn)過(guò)的任務(wù)和環(huán)境。在面對(duì)錯(cuò)誤、不確定性和異常情況時(shí),系統(tǒng)二思維還可以幫助大模型變得更加魯棒,因?yàn)樗膭?lì)模型采取更加謹(jǐn)慎和保守的策略。而在人機(jī)交互方面,模擬系統(tǒng)二思維能幫助大模型可以更好地理解和預(yù)測(cè)人類用戶的需求和意圖,從而改善交互體驗(yàn)。
關(guān)于Noam Brown
Brown曾就職于FAIR(Meta)在那里他和同事共同開(kāi)發(fā)了 CICERO,這是首個(gè)在策略游戲外交中達(dá)到人類水平表現(xiàn)的AI。他還與卡內(nèi)基梅隆大學(xué)的導(dǎo)師一起創(chuàng)建了 Libratus 和 Pluribus,這兩個(gè)AI在人機(jī)對(duì)戰(zhàn)比賽中戰(zhàn)勝了頂尖人類德?lián)渎殬I(yè)選手。
Libratus獲得了AI杰出成就馬文?明斯基大獎(jiǎng),Pluribus 則登上了《科學(xué)》雜志封面,并成為 2019 年《科學(xué)》年度突破獎(jiǎng)的亞軍。Brown還被評(píng)為麻省理工科技評(píng)論 35 位 35 歲以下創(chuàng)新者之一。
目前,Brown是OpenAI的高級(jí)研究科學(xué)家主要方向是超復(fù)雜推理、AI Agent以及自我對(duì)弈。
本文素材來(lái)源venturebeat,如有侵權(quán)請(qǐng)聯(lián)系刪除
END
