關(guān)于深度學(xué)習(xí)發(fā)展的必然及未來(lái)的思考
點(diǎn)擊上方“程序員大白”,選擇“星標(biāo)”公眾號(hào)
重磅干貨,第一時(shí)間送達(dá)
來(lái)自 | 知乎
作者 | Flood Sung
地址 | https://zhuanlan.zhihu.com/p/375226190
編輯 | 機(jī)器學(xué)習(xí)算法與自然語(yǔ)言處理公眾號(hào)
本文僅作學(xué)術(shù)分享,若侵權(quán),請(qǐng)聯(lián)系后臺(tái)刪文處理
1 前言
凱文凱利的《必然》相信很多朋友都有讀過(guò),里面描述了很多科技發(fā)展的必然趨勢(shì)。那么這里,我們想僅對(duì)深度學(xué)習(xí)領(lǐng)域的發(fā)展進(jìn)行思考,看是不是里面也存在著必然。我們會(huì)先探討一些已知的必然,然后再聊聊一些未來(lái)的必然。
下面的觀點(diǎn)僅代表個(gè)人看法,如有不足敬請(qǐng)批評(píng)指正
2 深度學(xué)習(xí)是AI的必然
在過(guò)去,人們對(duì)于符號(hào)主義還是連接主義是有爭(zhēng)論的,但現(xiàn)在深度學(xué)習(xí)取得成功讓連接主義取得了勝利。
這里的必然在于人寫不出所有的規(guī)則和特征,所以用神經(jīng)網(wǎng)絡(luò)作為載體,通過(guò)數(shù)據(jù)去擬合。
未來(lái)要實(shí)現(xiàn)AGI還需要很多新的技術(shù),但如OpenAI的首席科學(xué)家ilya sutskever 在一次訪談中說(shuō)的,AGI一定會(huì)是以深度神經(jīng)網(wǎng)絡(luò)的形式產(chǎn)生。
3 深度學(xué)習(xí)的特性讓大數(shù)據(jù),大網(wǎng)絡(luò),高算力的發(fā)展成為必然
這一條在現(xiàn)在看來(lái)是毋庸置疑的。早在深度學(xué)習(xí)剛火起來(lái)的那幾年,吳恩達(dá)就已經(jīng)宣傳了這三點(diǎn)的重要性。

但就算如此,恐怕大多數(shù)人仍然會(huì)對(duì)網(wǎng)絡(luò)模型的爆炸式增長(zhǎng)產(chǎn)生的效果感到震驚,比如去年的GPT-3。
而接下來(lái)的幾年,網(wǎng)絡(luò)模型的大小仍然會(huì)繼續(xù)加大,直到神經(jīng)網(wǎng)絡(luò)的連接數(shù)超過(guò)人腦神經(jīng)元的連接數(shù),至于會(huì)產(chǎn)生什么效果,我們拭目以待。
為什么是這樣?
因?yàn)樯疃葘W(xué)習(xí)本質(zhì)是基于統(tǒng)計(jì)學(xué),深度學(xué)習(xí)做的事情就是對(duì)所有的數(shù)據(jù)進(jìn)行統(tǒng)計(jì),只是神經(jīng)網(wǎng)絡(luò)能夠?qū)Ω呔S數(shù)據(jù)進(jìn)行復(fù)雜的統(tǒng)計(jì),從而輸出最優(yōu)的概率統(tǒng)計(jì)結(jié)果。所以,數(shù)據(jù)越多越全面,效果就有可能越好。
并且,神經(jīng)網(wǎng)絡(luò)還具備泛化能力,看到相似的場(chǎng)景也能輸出相似的概率,從而讓深度學(xué)習(xí)進(jìn)入實(shí)用化階段。
那么,這個(gè)時(shí)候,如何產(chǎn)生巨量的數(shù)據(jù)進(jìn)行訓(xùn)練呢?
監(jiān)督學(xué)習(xí)需要對(duì)數(shù)據(jù)進(jìn)行標(biāo)注,而標(biāo)注需要靠人工,這是需要成本的。這就意味著標(biāo)注的數(shù)據(jù)是無(wú)法爆炸式增長(zhǎng)的,也因此,圖靈獎(jiǎng)得主Yann Lecun在幾年前就提出:
2 無(wú)監(jiān)督/自監(jiān)督學(xué)習(xí)的發(fā)展是必然

這幾年學(xué)術(shù)界的發(fā)展完全印證了這一點(diǎn),為什么大模型率先在NLP上取得成功,因?yàn)镹LP使用的語(yǔ)言數(shù)據(jù)可以不需要標(biāo)注。
不過(guò)Yann Lecun對(duì)強(qiáng)化學(xué)習(xí)的判斷并不完全對(duì)。在現(xiàn)實(shí)世界,要獲取有用的樣本很難,但是在虛擬環(huán)境,樣本是可以無(wú)盡獲取的,所以這幾年強(qiáng)化學(xué)習(xí)依然取得了巨大的進(jìn)步。無(wú)論是AlphaStar還是OpenAI Dota Five,都是在虛擬環(huán)境下每天訓(xùn)練幾百萬(wàn),幾千萬(wàn)局。
我們只能說(shuō)強(qiáng)化學(xué)習(xí)的樣本利用低是對(duì)的(Sample Inefficiency)。
雖然強(qiáng)化學(xué)習(xí)有這樣的問(wèn)題,但依然無(wú)法阻止它成為下一個(gè)必然!
3 決策系統(tǒng)必然要使用深度強(qiáng)化學(xué)習(xí)
這一條和深度學(xué)習(xí)是AI的必然是一樣的道理。
人是無(wú)法手工寫出所有的規(guī)則和特征的!
以自動(dòng)駕駛為例,目前的自動(dòng)駕駛主要還是以人工規(guī)則為主,只是在視覺(jué)感知端使用了深度學(xué)習(xí)。但是由于人工規(guī)則的局限性,就算使用了幾萬(wàn)個(gè)if語(yǔ)句,也仍然無(wú)法保證自動(dòng)駕駛系統(tǒng)能夠處理所有的corner case。對(duì)于自動(dòng)駕駛來(lái)說(shuō),如果這個(gè)系統(tǒng)無(wú)法達(dá)到99.9999999%的有效性,就無(wú)法真正意義上的脫離人工讓其完全自己托管。這可以很容易計(jì)算,就算自動(dòng)駕駛1000公里需要人介入一次,那每1000公里可能就有造成一次事故,這就很可怕了。
如何解決?只能最終將希望寄托在深度強(qiáng)化學(xué)習(xí)+模仿學(xué)習(xí)上,讓AI在虛擬環(huán)境中去試錯(cuò),去遍歷所有的可能,去跑個(gè)1億億公里來(lái)學(xué)習(xí)。
自動(dòng)駕駛只是機(jī)器人的一種形態(tài),其他機(jī)器人的應(yīng)用也類似,比如機(jī)械臂的抓取,需要99.99%的準(zhǔn)確率才有使用的價(jià)值,根本上還是要讓人工介入的次數(shù)足夠少,從而真正意義上不需要人工,降低成本。
基于這樣的判斷,我們有了下面的必然:
4 Sim2Real是通往完全自動(dòng)駕駛及其他通用機(jī)器人的必然
現(xiàn)實(shí)世界不可能提供足夠的數(shù)據(jù),所以我們只能通過(guò)在虛擬環(huán)境中訓(xùn)練,再遷移到現(xiàn)實(shí)環(huán)境。
虛擬環(huán)境好處很多,比如可以加速,可以大規(guī)模并行,可以不擔(dān)心安全問(wèn)題。
但要實(shí)現(xiàn)Sim2Real,卻對(duì)虛擬環(huán)境的真實(shí)性提出了極高的要求。
比如自動(dòng)駕駛的訓(xùn)練,我們需要能夠構(gòu)建出和真實(shí)別無(wú)二致的場(chǎng)景,去覆蓋所有的場(chǎng)景!
所以,這帶來(lái)了下一個(gè)必然!
5 AI在虛擬世界的應(yīng)用要領(lǐng)先于現(xiàn)實(shí)世界
這里的原因不僅僅是因?yàn)楝F(xiàn)實(shí)世界的應(yīng)用依賴于虛擬世界,同時(shí)也是深度學(xué)習(xí)本身的內(nèi)在缺陷。
什么缺陷呢?
深度學(xué)習(xí)受益于數(shù)據(jù),也依賴于數(shù)據(jù),導(dǎo)致它存在的問(wèn)題是無(wú)法自己推導(dǎo)出規(guī)則,從而在完全的ood(Out of Distribution)上work!
也就是如果測(cè)試的時(shí)候樣本從來(lái)沒(méi)見(jiàn)過(guò),也不是之前的樣本能組合出來(lái)的,那么神經(jīng)網(wǎng)絡(luò)就會(huì)傻掉!
這和人很不一樣,人形成了一套符號(hào)系統(tǒng),所以給出規(guī)則就懂得使用規(guī)則。目前的深度學(xué)習(xí)還無(wú)法自己基于樣本產(chǎn)生有效的符號(hào)系統(tǒng)來(lái)實(shí)現(xiàn)這種泛化。
也就是說(shuō)深度學(xué)習(xí)要成功,其實(shí)就只有走大數(shù)據(jù)這條路,并且是要盡可能的窮盡所有可能,才能讓效果達(dá)到很好,讓corner case出錯(cuò)的概率降到足夠低。
所以
6 凡是對(duì)Corner Case要求很高的AI應(yīng)用,都很難落地
簡(jiǎn)單點(diǎn)說(shuō)就是出點(diǎn)錯(cuò)也沒(méi)事的AI好落地,否則很難落地。
自動(dòng)駕駛,機(jī)器人這些現(xiàn)實(shí)應(yīng)用就是,出個(gè)錯(cuò)影響很大。
而NLP,虛擬世界中的游戲AI,特效這些則影響沒(méi)有那么大。
這也就印證了第5條的必然。我們可以看到AI已經(jīng)廣泛的應(yīng)用到搜索,游戲,視頻特效等領(lǐng)域,并帶來(lái)了巨大的商業(yè)價(jià)值。
以深度強(qiáng)化學(xué)習(xí)為例,在游戲AI中得到了真正意義上的落地,如果把所有使用了深度強(qiáng)化學(xué)習(xí)Agent的游戲算上,估計(jì)每天被調(diào)用上億次,這是難以想象的。
同樣,GAN在視頻特效上得到了巨大的應(yīng)用,一個(gè)火的特效可以被觀看幾十億次。
基于前面的幾點(diǎn),虛擬世界的發(fā)展非常重要,現(xiàn)實(shí)世界的AI應(yīng)用,特別是機(jī)器人上的應(yīng)用,極度依賴于虛擬世界,因此
7 Metaverse將先于機(jī)器人革命出現(xiàn)
下面兩圖概括了Metaverse和機(jī)器人所需的AI技術(shù):


幾乎是共通的,相信很多朋友會(huì)有不同意見(jiàn),上圖完全建立在Sim2Real的必然上!
這樣的技術(shù)路線和西部世界里的做法是一模一樣的。西部世界真是一部前瞻性極強(qiáng)的硬核科幻。
這里多聊幾句Metaverse!
Metaverse是永恒的虛擬世界,除了逼真的虛擬環(huán)境給予其外在,大量智能的虛擬人/機(jī)器人才是其內(nèi)核。這和目前游戲里的NPC一個(gè)道理。在3A游戲如GTA V中,NPC是一個(gè)必不可少的角色,在虛擬世界中充斥著大量的NPC來(lái)形成整個(gè)虛擬世界觀與故事線。一個(gè)僅有人類的虛擬世界無(wú)法構(gòu)造真正的Metaverse!
(當(dāng)然,當(dāng)前每個(gè)人對(duì)Metaverse的看法都不盡相同,這里僅一家之言)
鑒于Metaverse和機(jī)器人都對(duì)AI有著全方位的需求,我們可以得到下一個(gè)必然:
8 AGI將在Metaverse的發(fā)展中誕生,然后作用于現(xiàn)實(shí)世界
這里的AGI我們定義為具備完全擬人的語(yǔ)言,姿態(tài),動(dòng)作,行為,能夠通過(guò)圖靈測(cè)試。我們依然可以以西部世界里的機(jī)器人作為AGI的代表。
在發(fā)展Metaverse的NPC的時(shí)候,我們需要一步一步的改進(jìn)里面的Vision,Language,Motion,Mind,這都是AGI的核心組件,有些組件也可以直接作用于現(xiàn)實(shí)世界比如Language,有些則需要更多的發(fā)展來(lái)實(shí)現(xiàn)sim2real。
9 小結(jié)
有了上面的分析,我們會(huì)越來(lái)越明白機(jī)器人革命道阻且長(zhǎng),需要很多組件的逐步完成。雖然目前我們也已經(jīng)看到了很多機(jī)器人基于cv的應(yīng)用,但離完成更復(fù)雜任務(wù)還很遠(yuǎn)。
但這也許不是什么壞事。
Metaverse才是下一個(gè)世代的主題,擁抱它并發(fā)展它。也許這里面對(duì)的社會(huì)問(wèn)題比機(jī)器人革命到來(lái)面對(duì)的問(wèn)題更大,但似乎技術(shù)是無(wú)法阻擋的,人類在不斷的將自己推進(jìn)深淵或者通往下一個(gè)前所未有的光明!
推薦閱讀
國(guó)產(chǎn)小眾瀏覽器因屏蔽視頻廣告,被索賠100萬(wàn)(后續(xù))
年輕人“不講武德”:因看黃片上癮,把網(wǎng)站和786名女主播起訴了
關(guān)于程序員大白
程序員大白是一群哈工大,東北大學(xué),西湖大學(xué)和上海交通大學(xué)的碩士博士運(yùn)營(yíng)維護(hù)的號(hào),大家樂(lè)于分享高質(zhì)量文章,喜歡總結(jié)知識(shí),歡迎關(guān)注[程序員大白],大家一起學(xué)習(xí)進(jìn)步!


