<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          【深度學(xué)習(xí)】發(fā)展的必然及未來的思考

          共 3400字,需瀏覽 7分鐘

           ·

          2021-08-05 14:56

          來源:知乎 本文經(jīng)過作者同意轉(zhuǎn)載

          https://zhuanlan.zhihu.com/p/375226190


          1 前言

          凱文凱利的《必然》相信很多朋友都有讀過,里面描述了很多科技發(fā)展的必然趨勢。那么這里,我們想僅對深度學(xué)習(xí)領(lǐng)域的發(fā)展進(jìn)行思考,看是不是里面也存在著必然。我們會(huì)先探討一些已知的必然,然后再聊聊一些未來的必然。

          下面的觀點(diǎn)僅代表個(gè)人看法,如有不足敬請批評指正

          2 深度學(xué)習(xí)是AI的必然

          在過去,人們對于符號(hào)主義還是連接主義是有爭論的,但現(xiàn)在深度學(xué)習(xí)取得成功讓連接主義取得了勝利。

          這里的必然在于人寫不出所有的規(guī)則和特征,所以用神經(jīng)網(wǎng)絡(luò)作為載體,通過數(shù)據(jù)去擬合。

          未來要實(shí)現(xiàn)AGI還需要很多新的技術(shù),但如OpenAI的首席科學(xué)家ilya sutskever 在一次訪談中說的,AGI一定會(huì)是以深度神經(jīng)網(wǎng)絡(luò)的形式產(chǎn)生。

          3 深度學(xué)習(xí)的特性讓大數(shù)據(jù),大網(wǎng)絡(luò),高算力的發(fā)展成為必然

          這一條在現(xiàn)在看來是毋庸置疑的。早在深度學(xué)習(xí)剛火起來的那幾年,吳恩達(dá)就已經(jīng)宣傳了這三點(diǎn)的重要性。

          但就算如此,恐怕大多數(shù)人仍然會(huì)對網(wǎng)絡(luò)模型的爆炸式增長產(chǎn)生的效果感到震驚,比如去年的GPT-3。

          而接下來的幾年,網(wǎng)絡(luò)模型的大小仍然會(huì)繼續(xù)加大,直到神經(jīng)網(wǎng)絡(luò)的連接數(shù)超過人腦神經(jīng)元的連接數(shù),至于會(huì)產(chǎn)生什么效果,我們拭目以待。

          為什么是這樣?

          因?yàn)樯疃葘W(xué)習(xí)本質(zhì)是基于統(tǒng)計(jì)學(xué),深度學(xué)習(xí)做的事情就是對所有的數(shù)據(jù)進(jìn)行統(tǒng)計(jì),只是神經(jīng)網(wǎng)絡(luò)能夠?qū)Ω呔S數(shù)據(jù)進(jìn)行復(fù)雜的統(tǒng)計(jì),從而輸出最優(yōu)的概率統(tǒng)計(jì)結(jié)果。所以,數(shù)據(jù)越多越全面,效果就有可能越好。

          并且,神經(jīng)網(wǎng)絡(luò)還具備泛化能力,看到相似的場景也能輸出相似的概率,從而讓深度學(xué)習(xí)進(jìn)入實(shí)用化階段。

          那么,這個(gè)時(shí)候,如何產(chǎn)生巨量的數(shù)據(jù)進(jìn)行訓(xùn)練呢?

          監(jiān)督學(xué)習(xí)需要對數(shù)據(jù)進(jìn)行標(biāo)注,而標(biāo)注需要靠人工,這是需要成本的。這就意味著標(biāo)注的數(shù)據(jù)是無法爆炸式增長的,也因此,圖靈獎(jiǎng)得主Yann Lecun在幾年前就提出:

          2 無監(jiān)督/自監(jiān)督學(xué)習(xí)的發(fā)展是必然

          這幾年學(xué)術(shù)界的發(fā)展完全印證了這一點(diǎn),為什么大模型率先在NLP上取得成功,因?yàn)镹LP使用的語言數(shù)據(jù)可以不需要標(biāo)注。

          不過Yann Lecun對強(qiáng)化學(xué)習(xí)的判斷并不完全對。在現(xiàn)實(shí)世界,要獲取有用的樣本很難,但是在虛擬環(huán)境,樣本是可以無盡獲取的,所以這幾年強(qiáng)化學(xué)習(xí)依然取得了巨大的進(jìn)步。無論是AlphaStar還是OpenAI Dota Five,都是在虛擬環(huán)境下每天訓(xùn)練幾百萬,幾千萬局。

          我們只能說強(qiáng)化學(xué)習(xí)的樣本利用低是對的(Sample Inefficiency)。

          雖然強(qiáng)化學(xué)習(xí)有這樣的問題,但依然無法阻止它成為下一個(gè)必然!

          3 決策系統(tǒng)必然要使用深度強(qiáng)化學(xué)習(xí)

          這一條和深度學(xué)習(xí)是AI的必然是一樣的道理。

          人是無法手工寫出所有的規(guī)則和特征的!

          以自動(dòng)駕駛為例,目前的自動(dòng)駕駛主要還是以人工規(guī)則為主,只是在視覺感知端使用了深度學(xué)習(xí)。但是由于人工規(guī)則的局限性,就算使用了幾萬個(gè)if語句,也仍然無法保證自動(dòng)駕駛系統(tǒng)能夠處理所有的corner case。對于自動(dòng)駕駛來說,如果這個(gè)系統(tǒng)無法達(dá)到99.9999999%的有效性,就無法真正意義上的脫離人工讓其完全自己托管。這可以很容易計(jì)算,就算自動(dòng)駕駛1000公里需要人介入一次,那每1000公里可能就有造成一次事故,這就很可怕了。

          如何解決?只能最終將希望寄托在深度強(qiáng)化學(xué)習(xí)+模仿學(xué)習(xí)上,讓AI在虛擬環(huán)境中去試錯(cuò),去遍歷所有的可能,去跑個(gè)1億億公里來學(xué)習(xí)。

          自動(dòng)駕駛只是機(jī)器人的一種形態(tài),其他機(jī)器人的應(yīng)用也類似,比如機(jī)械臂的抓取,需要99.99%的準(zhǔn)確率才有使用的價(jià)值,根本上還是要讓人工介入的次數(shù)足夠少,從而真正意義上不需要人工,降低成本。

          基于這樣的判斷,我們有了下面的必然:

          4 Sim2Real是通往完全自動(dòng)駕駛及其他通用機(jī)器人的必然

          現(xiàn)實(shí)世界不可能提供足夠的數(shù)據(jù),所以我們只能通過在虛擬環(huán)境中訓(xùn)練,再遷移到現(xiàn)實(shí)環(huán)境。

          虛擬環(huán)境好處很多,比如可以加速,可以大規(guī)模并行,可以不擔(dān)心安全問題。

          但要實(shí)現(xiàn)Sim2Real,卻對虛擬環(huán)境的真實(shí)性提出了極高的要求。

          比如自動(dòng)駕駛的訓(xùn)練,我們需要能夠構(gòu)建出和真實(shí)別無二致的場景,去覆蓋所有的場景!

          所以,這帶來了下一個(gè)必然!

          5 AI在虛擬世界的應(yīng)用要領(lǐng)先于現(xiàn)實(shí)世界

          這里的原因不僅僅是因?yàn)楝F(xiàn)實(shí)世界的應(yīng)用依賴于虛擬世界,同時(shí)也是深度學(xué)習(xí)本身的內(nèi)在缺陷。

          什么缺陷呢?

          深度學(xué)習(xí)受益于數(shù)據(jù),也依賴于數(shù)據(jù),導(dǎo)致它存在的問題是無法自己推導(dǎo)出規(guī)則,從而在完全的ood(Out of Distribution)上work!

          也就是如果測試的時(shí)候樣本從來沒見過,也不是之前的樣本能組合出來的,那么神經(jīng)網(wǎng)絡(luò)就會(huì)傻掉!

          這和人很不一樣,人形成了一套符號(hào)系統(tǒng),所以給出規(guī)則就懂得使用規(guī)則。目前的深度學(xué)習(xí)還無法自己基于樣本產(chǎn)生有效的符號(hào)系統(tǒng)來實(shí)現(xiàn)這種泛化。

          也就是說深度學(xué)習(xí)要成功,其實(shí)就只有走大數(shù)據(jù)這條路,并且是要盡可能的窮盡所有可能,才能讓效果達(dá)到很好,讓corner case出錯(cuò)的概率降到足夠低。

          所以

          6 凡是對Corner Case要求很高的AI應(yīng)用,都很難落地

          簡單點(diǎn)說就是出點(diǎn)錯(cuò)也沒事的AI好落地,否則很難落地。

          自動(dòng)駕駛,機(jī)器人這些現(xiàn)實(shí)應(yīng)用就是,出個(gè)錯(cuò)影響很大。

          而NLP,虛擬世界中的游戲AI,特效這些則影響沒有那么大。

          這也就印證了第5條的必然。我們可以看到AI已經(jīng)廣泛的應(yīng)用到搜索,游戲,視頻特效等領(lǐng)域,并帶來了巨大的商業(yè)價(jià)值。

          以深度強(qiáng)化學(xué)習(xí)為例,在游戲AI中得到了真正意義上的落地,如果把所有使用了深度強(qiáng)化學(xué)習(xí)Agent的游戲算上,估計(jì)每天被調(diào)用上億次,這是難以想象的。

          同樣,GAN在視頻特效上得到了巨大的應(yīng)用,一個(gè)火的特效可以被觀看幾十億次。

          基于前面的幾點(diǎn),虛擬世界的發(fā)展非常重要,現(xiàn)實(shí)世界的AI應(yīng)用,特別是機(jī)器人上的應(yīng)用,極度依賴于虛擬世界,因此

          7 Metaverse將先于機(jī)器人革命出現(xiàn)

          下面兩圖概括了Metaverse和機(jī)器人所需的AI技術(shù):


          幾乎是共通的,相信很多朋友會(huì)有不同意見,上圖完全建立在Sim2Real的必然上!

          這樣的技術(shù)路線和西部世界里的做法是一模一樣的。西部世界真是一部前瞻性極強(qiáng)的硬核科幻。

          這里多聊幾句Metaverse!

          Metaverse是永恒的虛擬世界,除了逼真的虛擬環(huán)境給予其外在,大量智能的虛擬人/機(jī)器人才是其內(nèi)核。這和目前游戲里的NPC一個(gè)道理。在3A游戲如GTA V中,NPC是一個(gè)必不可少的角色,在虛擬世界中充斥著大量的NPC來形成整個(gè)虛擬世界觀與故事線。一個(gè)僅有人類的虛擬世界無法構(gòu)造真正的Metaverse!

          (當(dāng)然,當(dāng)前每個(gè)人對Metaverse的看法都不盡相同,這里僅一家之言)

          鑒于Metaverse和機(jī)器人都對AI有著全方位的需求,我們可以得到下一個(gè)必然:

          8 AGI將在Metaverse的發(fā)展中誕生,然后作用于現(xiàn)實(shí)世界

          這里的AGI我們定義為具備完全擬人的語言,姿態(tài),動(dòng)作,行為,能夠通過圖靈測試。我們依然可以以西部世界里的機(jī)器人作為AGI的代表。

          在發(fā)展Metaverse的NPC的時(shí)候,我們需要一步一步的改進(jìn)里面的Vision,Language,Motion,Mind,這都是AGI的核心組件,有些組件也可以直接作用于現(xiàn)實(shí)世界比如Language,有些則需要更多的發(fā)展來實(shí)現(xiàn)sim2real。

          9 小結(jié)

          有了上面的分析,我們會(huì)越來越明白機(jī)器人革命道阻且長,需要很多組件的逐步完成。雖然目前我們也已經(jīng)看到了很多機(jī)器人基于cv的應(yīng)用,但離完成更復(fù)雜任務(wù)還很遠(yuǎn)。

          但這也許不是什么壞事。

          Metaverse才是下一個(gè)世代的主題,擁抱它并發(fā)展它。也許這里面對的社會(huì)問題比機(jī)器人革命到來面對的問題更大,但似乎技術(shù)是無法阻擋的,人類在不斷的將自己推進(jìn)深淵或者通往下一個(gè)前所未有的光明!



          推薦閱讀

          (點(diǎn)擊標(biāo)題可跳轉(zhuǎn)閱讀)

          神經(jīng)網(wǎng)絡(luò)入門

          統(tǒng) 計(jì) 學(xué) 無 用 了 ???

          現(xiàn)代統(tǒng)計(jì)的思想飛躍:過去、現(xiàn)在到未來(伯克利丁鵬博士萬字長文)

          神經(jīng)網(wǎng)絡(luò)的可解釋性綜述!

          測評:《機(jī)器學(xué)習(xí)中的數(shù)學(xué)》

          統(tǒng)治世界的 10 大算法,你知道幾個(gè)?

          清華大學(xué)出版!《機(jī)器學(xué)習(xí)導(dǎo)論》PDF下載

          老鐵,三連支持一下,好嗎?↓↓↓


          瀏覽 46
          點(diǎn)贊
          評論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          評論
          圖片
          表情
          推薦
          點(diǎn)贊
          評論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  天天干天天操天天射 | 中文电视剧字幕在线播放网站 | 学生妹A级片 | 国产又猛又黄又爽 | 啊啊啊啊操我在线动漫 |