<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          關(guān)于深度學(xué)習(xí)發(fā)展的必然及未來(lái)的思考

          共 3544字,需瀏覽 8分鐘

           ·

          2021-05-28 05:03

          點(diǎn)擊上方“程序員大白”,選擇“星標(biāo)”公眾號(hào)

          重磅干貨,第一時(shí)間送達(dá)

          來(lái)自 | 知乎

          作者 | Flood Sung

          址 | https://zhuanlan.zhihu.com/p/375226190

          編輯 | 機(jī)器學(xué)習(xí)算法與自然語(yǔ)言處理公眾號(hào)

          本文僅作學(xué)術(shù)分享,若侵權(quán),請(qǐng)聯(lián)系后臺(tái)刪文處理


          1 前言

          凱文凱利的《必然》相信很多朋友都有讀過(guò),里面描述了很多科技發(fā)展的必然趨勢(shì)。那么這里,我們想僅對(duì)深度學(xué)習(xí)領(lǐng)域的發(fā)展進(jìn)行思考,看是不是里面也存在著必然。我們會(huì)先探討一些已知的必然,然后再聊聊一些未來(lái)的必然。

          下面的觀點(diǎn)僅代表個(gè)人看法,如有不足敬請(qǐng)批評(píng)指正

          2 深度學(xué)習(xí)是AI的必然

          在過(guò)去,人們對(duì)于符號(hào)主義還是連接主義是有爭(zhēng)論的,但現(xiàn)在深度學(xué)習(xí)取得成功讓連接主義取得了勝利。

          這里的必然在于人寫不出所有的規(guī)則和特征,所以用神經(jīng)網(wǎng)絡(luò)作為載體,通過(guò)數(shù)據(jù)去擬合。

          未來(lái)要實(shí)現(xiàn)AGI還需要很多新的技術(shù),但如OpenAI的首席科學(xué)家ilya sutskever 在一次訪談中說(shuō)的,AGI一定會(huì)是以深度神經(jīng)網(wǎng)絡(luò)的形式產(chǎn)生。

          3 深度學(xué)習(xí)的特性讓大數(shù)據(jù),大網(wǎng)絡(luò),高算力的發(fā)展成為必然

          這一條在現(xiàn)在看來(lái)是毋庸置疑的。早在深度學(xué)習(xí)剛火起來(lái)的那幾年,吳恩達(dá)就已經(jīng)宣傳了這三點(diǎn)的重要性。

          但就算如此,恐怕大多數(shù)人仍然會(huì)對(duì)網(wǎng)絡(luò)模型的爆炸式增長(zhǎng)產(chǎn)生的效果感到震驚,比如去年的GPT-3。

          而接下來(lái)的幾年,網(wǎng)絡(luò)模型的大小仍然會(huì)繼續(xù)加大,直到神經(jīng)網(wǎng)絡(luò)的連接數(shù)超過(guò)人腦神經(jīng)元的連接數(shù),至于會(huì)產(chǎn)生什么效果,我們拭目以待。

          為什么是這樣?

          因?yàn)樯疃葘W(xué)習(xí)本質(zhì)是基于統(tǒng)計(jì)學(xué),深度學(xué)習(xí)做的事情就是對(duì)所有的數(shù)據(jù)進(jìn)行統(tǒng)計(jì),只是神經(jīng)網(wǎng)絡(luò)能夠?qū)Ω呔S數(shù)據(jù)進(jìn)行復(fù)雜的統(tǒng)計(jì),從而輸出最優(yōu)的概率統(tǒng)計(jì)結(jié)果。所以,數(shù)據(jù)越多越全面,效果就有可能越好。

          并且,神經(jīng)網(wǎng)絡(luò)還具備泛化能力,看到相似的場(chǎng)景也能輸出相似的概率,從而讓深度學(xué)習(xí)進(jìn)入實(shí)用化階段。

          那么,這個(gè)時(shí)候,如何產(chǎn)生巨量的數(shù)據(jù)進(jìn)行訓(xùn)練呢?

          監(jiān)督學(xué)習(xí)需要對(duì)數(shù)據(jù)進(jìn)行標(biāo)注,而標(biāo)注需要靠人工,這是需要成本的。這就意味著標(biāo)注的數(shù)據(jù)是無(wú)法爆炸式增長(zhǎng)的,也因此,圖靈獎(jiǎng)得主Yann Lecun在幾年前就提出:

          2 無(wú)監(jiān)督/自監(jiān)督學(xué)習(xí)的發(fā)展是必然

          這幾年學(xué)術(shù)界的發(fā)展完全印證了這一點(diǎn),為什么大模型率先在NLP上取得成功,因?yàn)镹LP使用的語(yǔ)言數(shù)據(jù)可以不需要標(biāo)注。

          不過(guò)Yann Lecun對(duì)強(qiáng)化學(xué)習(xí)的判斷并不完全對(duì)。在現(xiàn)實(shí)世界,要獲取有用的樣本很難,但是在虛擬環(huán)境,樣本是可以無(wú)盡獲取的,所以這幾年強(qiáng)化學(xué)習(xí)依然取得了巨大的進(jìn)步。無(wú)論是AlphaStar還是OpenAI Dota Five,都是在虛擬環(huán)境下每天訓(xùn)練幾百萬(wàn),幾千萬(wàn)局。

          我們只能說(shuō)強(qiáng)化學(xué)習(xí)的樣本利用低是對(duì)的(Sample Inefficiency)。

          雖然強(qiáng)化學(xué)習(xí)有這樣的問(wèn)題,但依然無(wú)法阻止它成為下一個(gè)必然!

          3 決策系統(tǒng)必然要使用深度強(qiáng)化學(xué)習(xí)

          這一條和深度學(xué)習(xí)是AI的必然是一樣的道理。

          人是無(wú)法手工寫出所有的規(guī)則和特征的!

          以自動(dòng)駕駛為例,目前的自動(dòng)駕駛主要還是以人工規(guī)則為主,只是在視覺(jué)感知端使用了深度學(xué)習(xí)。但是由于人工規(guī)則的局限性,就算使用了幾萬(wàn)個(gè)if語(yǔ)句,也仍然無(wú)法保證自動(dòng)駕駛系統(tǒng)能夠處理所有的corner case。對(duì)于自動(dòng)駕駛來(lái)說(shuō),如果這個(gè)系統(tǒng)無(wú)法達(dá)到99.9999999%的有效性,就無(wú)法真正意義上的脫離人工讓其完全自己托管。這可以很容易計(jì)算,就算自動(dòng)駕駛1000公里需要人介入一次,那每1000公里可能就有造成一次事故,這就很可怕了。

          如何解決?只能最終將希望寄托在深度強(qiáng)化學(xué)習(xí)+模仿學(xué)習(xí)上,讓AI在虛擬環(huán)境中去試錯(cuò),去遍歷所有的可能,去跑個(gè)1億億公里來(lái)學(xué)習(xí)。

          自動(dòng)駕駛只是機(jī)器人的一種形態(tài),其他機(jī)器人的應(yīng)用也類似,比如機(jī)械臂的抓取,需要99.99%的準(zhǔn)確率才有使用的價(jià)值,根本上還是要讓人工介入的次數(shù)足夠少,從而真正意義上不需要人工,降低成本。

          基于這樣的判斷,我們有了下面的必然:

          4 Sim2Real是通往完全自動(dòng)駕駛及其他通用機(jī)器人的必然

          現(xiàn)實(shí)世界不可能提供足夠的數(shù)據(jù),所以我們只能通過(guò)在虛擬環(huán)境中訓(xùn)練,再遷移到現(xiàn)實(shí)環(huán)境。

          虛擬環(huán)境好處很多,比如可以加速,可以大規(guī)模并行,可以不擔(dān)心安全問(wèn)題。

          但要實(shí)現(xiàn)Sim2Real,卻對(duì)虛擬環(huán)境的真實(shí)性提出了極高的要求。

          比如自動(dòng)駕駛的訓(xùn)練,我們需要能夠構(gòu)建出和真實(shí)別無(wú)二致的場(chǎng)景,去覆蓋所有的場(chǎng)景!

          所以,這帶來(lái)了下一個(gè)必然!

          5 AI在虛擬世界的應(yīng)用要領(lǐng)先于現(xiàn)實(shí)世界

          這里的原因不僅僅是因?yàn)楝F(xiàn)實(shí)世界的應(yīng)用依賴于虛擬世界,同時(shí)也是深度學(xué)習(xí)本身的內(nèi)在缺陷。

          什么缺陷呢?

          深度學(xué)習(xí)受益于數(shù)據(jù),也依賴于數(shù)據(jù),導(dǎo)致它存在的問(wèn)題是無(wú)法自己推導(dǎo)出規(guī)則,從而在完全的ood(Out of Distribution)上work!

          也就是如果測(cè)試的時(shí)候樣本從來(lái)沒(méi)見(jiàn)過(guò),也不是之前的樣本能組合出來(lái)的,那么神經(jīng)網(wǎng)絡(luò)就會(huì)傻掉!

          這和人很不一樣,人形成了一套符號(hào)系統(tǒng),所以給出規(guī)則就懂得使用規(guī)則。目前的深度學(xué)習(xí)還無(wú)法自己基于樣本產(chǎn)生有效的符號(hào)系統(tǒng)來(lái)實(shí)現(xiàn)這種泛化。

          也就是說(shuō)深度學(xué)習(xí)要成功,其實(shí)就只有走大數(shù)據(jù)這條路,并且是要盡可能的窮盡所有可能,才能讓效果達(dá)到很好,讓corner case出錯(cuò)的概率降到足夠低。

          所以

          6 凡是對(duì)Corner Case要求很高的AI應(yīng)用,都很難落地

          簡(jiǎn)單點(diǎn)說(shuō)就是出點(diǎn)錯(cuò)也沒(méi)事的AI好落地,否則很難落地

          自動(dòng)駕駛,機(jī)器人這些現(xiàn)實(shí)應(yīng)用就是,出個(gè)錯(cuò)影響很大。

          而NLP,虛擬世界中的游戲AI,特效這些則影響沒(méi)有那么大。

          這也就印證了第5條的必然。我們可以看到AI已經(jīng)廣泛的應(yīng)用到搜索,游戲,視頻特效等領(lǐng)域,并帶來(lái)了巨大的商業(yè)價(jià)值。

          以深度強(qiáng)化學(xué)習(xí)為例,在游戲AI中得到了真正意義上的落地,如果把所有使用了深度強(qiáng)化學(xué)習(xí)Agent的游戲算上,估計(jì)每天被調(diào)用上億次,這是難以想象的。

          同樣,GAN在視頻特效上得到了巨大的應(yīng)用,一個(gè)火的特效可以被觀看幾十億次。

          基于前面的幾點(diǎn),虛擬世界的發(fā)展非常重要,現(xiàn)實(shí)世界的AI應(yīng)用,特別是機(jī)器人上的應(yīng)用,極度依賴于虛擬世界,因此

          7 Metaverse將先于機(jī)器人革命出現(xiàn)

          下面兩圖概括了Metaverse和機(jī)器人所需的AI技術(shù):


          幾乎是共通的,相信很多朋友會(huì)有不同意見(jiàn),上圖完全建立在Sim2Real的必然上!

          這樣的技術(shù)路線和西部世界里的做法是一模一樣的。西部世界真是一部前瞻性極強(qiáng)的硬核科幻。

          這里多聊幾句Metaverse!

          Metaverse是永恒的虛擬世界,除了逼真的虛擬環(huán)境給予其外在,大量智能的虛擬人/機(jī)器人才是其內(nèi)核。這和目前游戲里的NPC一個(gè)道理。在3A游戲如GTA V中,NPC是一個(gè)必不可少的角色,在虛擬世界中充斥著大量的NPC來(lái)形成整個(gè)虛擬世界觀與故事線。一個(gè)僅有人類的虛擬世界無(wú)法構(gòu)造真正的Metaverse!

          (當(dāng)然,當(dāng)前每個(gè)人對(duì)Metaverse的看法都不盡相同,這里僅一家之言)

          鑒于Metaverse和機(jī)器人都對(duì)AI有著全方位的需求,我們可以得到下一個(gè)必然:

          8 AGI將在Metaverse的發(fā)展中誕生,然后作用于現(xiàn)實(shí)世界

          這里的AGI我們定義為具備完全擬人的語(yǔ)言,姿態(tài),動(dòng)作,行為,能夠通過(guò)圖靈測(cè)試。我們依然可以以西部世界里的機(jī)器人作為AGI的代表。

          在發(fā)展Metaverse的NPC的時(shí)候,我們需要一步一步的改進(jìn)里面的Vision,Language,Motion,Mind,這都是AGI的核心組件,有些組件也可以直接作用于現(xiàn)實(shí)世界比如Language,有些則需要更多的發(fā)展來(lái)實(shí)現(xiàn)sim2real。

          9 小結(jié)

          有了上面的分析,我們會(huì)越來(lái)越明白機(jī)器人革命道阻且長(zhǎng),需要很多組件的逐步完成。雖然目前我們也已經(jīng)看到了很多機(jī)器人基于cv的應(yīng)用,但離完成更復(fù)雜任務(wù)還很遠(yuǎn)。

          但這也許不是什么壞事。

          Metaverse才是下一個(gè)世代的主題,擁抱它并發(fā)展它。也許這里面對(duì)的社會(huì)問(wèn)題比機(jī)器人革命到來(lái)面對(duì)的問(wèn)題更大,但似乎技術(shù)是無(wú)法阻擋的,人類在不斷的將自己推進(jìn)深淵或者通往下一個(gè)前所未有的光明!

          國(guó)產(chǎn)小眾瀏覽器因屏蔽視頻廣告,被索賠100萬(wàn)(后續(xù))

          年輕人“不講武德”:因看黃片上癮,把網(wǎng)站和786名女主播起訴了

          中國(guó)聯(lián)通官網(wǎng)被發(fā)現(xiàn)含木馬腳本,可向用戶推廣色情APP

          張一鳴:每個(gè)逆襲的年輕人,都具備的底層能力


          關(guān)


          學(xué)西學(xué)學(xué)運(yùn)營(yíng)護(hù)號(hào)樂(lè)質(zhì)結(jié)識(shí)關(guān)[]學(xué)習(xí)進(jìn)


          瀏覽 75
          點(diǎn)贊
          評(píng)論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          評(píng)論
          圖片
          表情
          推薦
          點(diǎn)贊
          評(píng)論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  中文字幕艹逼 | 午夜性福利| 国产视频综合在线 | 天天插综合 | 91久久久精品 |