国内精品视频播放,99re视频在线播放,国产九一在线视频,99热热99,AV天天堂亚洲,9l视频自拍蝌蚪9l自拍蝌蚪9l在线,韩国一区视频在线观看,亚洲韩日中文

點(diǎn)擊上方“程序員大白”，選擇“星標(biāo)”公眾號(hào)
重磅干貨，第一時(shí)間送達(dá)

來(lái)自 | 知乎

作者 | Flood Sung

地址 | https://zhuanlan.zhihu.com/p/375226190

編輯 | 機(jī)器學(xué)習(xí)算法與自然語(yǔ)言處理公眾號(hào)

本文僅作學(xué)術(shù)分享，若侵權(quán)，請(qǐng)聯(lián)系后臺(tái)刪文處理

1 前言

凱文凱利的《必然》相信很多朋友都有讀過(guò)，里面描述了很多科技發(fā)展的必然趨勢(shì)。那么這里，我們想僅對(duì)深度學(xué)習(xí)領(lǐng)域的發(fā)展進(jìn)行思考，看是不是里面也存在著必然。我們會(huì)先探討一些已知的必然，然后再聊聊一些未來(lái)的必然。

下面的觀點(diǎn)僅代表個(gè)人看法，如有不足敬請(qǐng)批評(píng)指正

2 深度學(xué)習(xí)是AI的必然

在過(guò)去，人們對(duì)于符號(hào)主義還是連接主義是有爭(zhēng)論的，但現(xiàn)在深度學(xué)習(xí)取得成功讓連接主義取得了勝利。

這里的必然在于人寫不出所有的規(guī)則和特征，所以用神經(jīng)網(wǎng)絡(luò)作為載體，通過(guò)數(shù)據(jù)去擬合。

未來(lái)要實(shí)現(xiàn)AGI還需要很多新的技術(shù)，但如OpenAI的首席科學(xué)家ilya sutskever 在一次訪談中說(shuō)的，AGI一定會(huì)是以深度神經(jīng)網(wǎng)絡(luò)的形式產(chǎn)生。

3 深度學(xué)習(xí)的特性讓大數(shù)據(jù)，大網(wǎng)絡(luò)，高算力的發(fā)展成為必然

這一條在現(xiàn)在看來(lái)是毋庸置疑的。早在深度學(xué)習(xí)剛火起來(lái)的那幾年，吳恩達(dá)就已經(jīng)宣傳了這三點(diǎn)的重要性。

但就算如此，恐怕大多數(shù)人仍然會(huì)對(duì)網(wǎng)絡(luò)模型的爆炸式增長(zhǎng)產(chǎn)生的效果感到震驚，比如去年的GPT-3。

而接下來(lái)的幾年，網(wǎng)絡(luò)模型的大小仍然會(huì)繼續(xù)加大，直到神經(jīng)網(wǎng)絡(luò)的連接數(shù)超過(guò)人腦神經(jīng)元的連接數(shù)，至于會(huì)產(chǎn)生什么效果，我們拭目以待。

為什么是這樣？

因?yàn)樯疃葘W(xué)習(xí)本質(zhì)是基于統(tǒng)計(jì)學(xué)，深度學(xué)習(xí)做的事情就是對(duì)所有的數(shù)據(jù)進(jìn)行統(tǒng)計(jì)，只是神經(jīng)網(wǎng)絡(luò)能夠?qū)Ω呔S數(shù)據(jù)進(jìn)行復(fù)雜的統(tǒng)計(jì)，從而輸出最優(yōu)的概率統(tǒng)計(jì)結(jié)果。所以，數(shù)據(jù)越多越全面，效果就有可能越好。

并且，神經(jīng)網(wǎng)絡(luò)還具備泛化能力，看到相似的場(chǎng)景也能輸出相似的概率，從而讓深度學(xué)習(xí)進(jìn)入實(shí)用化階段。

那么，這個(gè)時(shí)候，如何產(chǎn)生巨量的數(shù)據(jù)進(jìn)行訓(xùn)練呢？

監(jiān)督學(xué)習(xí)需要對(duì)數(shù)據(jù)進(jìn)行標(biāo)注，而標(biāo)注需要靠人工，這是需要成本的。這就意味著標(biāo)注的數(shù)據(jù)是無(wú)法爆炸式增長(zhǎng)的，也因此，圖靈獎(jiǎng)得主Yann Lecun在幾年前就提出：

2 無(wú)監(jiān)督/自監(jiān)督學(xué)習(xí)的發(fā)展是必然

這幾年學(xué)術(shù)界的發(fā)展完全印證了這一點(diǎn)，為什么大模型率先在NLP上取得成功，因?yàn)镹LP使用的語(yǔ)言數(shù)據(jù)可以不需要標(biāo)注。

不過(guò)Yann Lecun對(duì)強(qiáng)化學(xué)習(xí)的判斷并不完全對(duì)。在現(xiàn)實(shí)世界，要獲取有用的樣本很難，但是在虛擬環(huán)境，樣本是可以無(wú)盡獲取的，所以這幾年強(qiáng)化學(xué)習(xí)依然取得了巨大的進(jìn)步。無(wú)論是AlphaStar還是OpenAI Dota Five，都是在虛擬環(huán)境下每天訓(xùn)練幾百萬(wàn)，幾千萬(wàn)局。

我們只能說(shuō)強(qiáng)化學(xué)習(xí)的樣本利用低是對(duì)的（Sample Inefficiency）。

雖然強(qiáng)化學(xué)習(xí)有這樣的問(wèn)題，但依然無(wú)法阻止它成為下一個(gè)必然！

3 決策系統(tǒng)必然要使用深度強(qiáng)化學(xué)習(xí)

這一條和深度學(xué)習(xí)是AI的必然是一樣的道理。

人是無(wú)法手工寫出所有的規(guī)則和特征的！

以自動(dòng)駕駛為例，目前的自動(dòng)駕駛主要還是以人工規(guī)則為主，只是在視覺(jué)感知端使用了深度學(xué)習(xí)。但是由于人工規(guī)則的局限性，就算使用了幾萬(wàn)個(gè)if語(yǔ)句，也仍然無(wú)法保證自動(dòng)駕駛系統(tǒng)能夠處理所有的corner case。對(duì)于自動(dòng)駕駛來(lái)說(shuō)，如果這個(gè)系統(tǒng)無(wú)法達(dá)到99.9999999%的有效性，就無(wú)法真正意義上的脫離人工讓其完全自己托管。這可以很容易計(jì)算，就算自動(dòng)駕駛1000公里需要人介入一次，那每1000公里可能就有造成一次事故，這就很可怕了。

如何解決？只能最終將希望寄托在深度強(qiáng)化學(xué)習(xí)+模仿學(xué)習(xí)上，讓AI在虛擬環(huán)境中去試錯(cuò)，去遍歷所有的可能，去跑個(gè)1億億公里來(lái)學(xué)習(xí)。

自動(dòng)駕駛只是機(jī)器人的一種形態(tài)，其他機(jī)器人的應(yīng)用也類似，比如機(jī)械臂的抓取，需要99.99%的準(zhǔn)確率才有使用的價(jià)值，根本上還是要讓人工介入的次數(shù)足夠少，從而真正意義上不需要人工，降低成本。

基于這樣的判斷，我們有了下面的必然：

4 Sim2Real是通往完全自動(dòng)駕駛及其他通用機(jī)器人的必然

現(xiàn)實(shí)世界不可能提供足夠的數(shù)據(jù)，所以我們只能通過(guò)在虛擬環(huán)境中訓(xùn)練，再遷移到現(xiàn)實(shí)環(huán)境。

虛擬環(huán)境好處很多，比如可以加速，可以大規(guī)模并行，可以不擔(dān)心安全問(wèn)題。

但要實(shí)現(xiàn)Sim2Real，卻對(duì)虛擬環(huán)境的真實(shí)性提出了極高的要求。

比如自動(dòng)駕駛的訓(xùn)練，我們需要能夠構(gòu)建出和真實(shí)別無(wú)二致的場(chǎng)景，去覆蓋所有的場(chǎng)景！

所以，這帶來(lái)了下一個(gè)必然！

5 AI在虛擬世界的應(yīng)用要領(lǐng)先于現(xiàn)實(shí)世界

這里的原因不僅僅是因?yàn)楝F(xiàn)實(shí)世界的應(yīng)用依賴于虛擬世界，同時(shí)也是深度學(xué)習(xí)本身的內(nèi)在缺陷。

什么缺陷呢？

深度學(xué)習(xí)受益于數(shù)據(jù)，也依賴于數(shù)據(jù)，導(dǎo)致它存在的問(wèn)題是無(wú)法自己推導(dǎo)出規(guī)則，從而在完全的ood（Out of Distribution）上work！

也就是如果測(cè)試的時(shí)候樣本從來(lái)沒(méi)見(jiàn)過(guò)，也不是之前的樣本能組合出來(lái)的，那么神經(jīng)網(wǎng)絡(luò)就會(huì)傻掉！

這和人很不一樣，人形成了一套符號(hào)系統(tǒng)，所以給出規(guī)則就懂得使用規(guī)則。目前的深度學(xué)習(xí)還無(wú)法自己基于樣本產(chǎn)生有效的符號(hào)系統(tǒng)來(lái)實(shí)現(xiàn)這種泛化。

也就是說(shuō)深度學(xué)習(xí)要成功，其實(shí)就只有走大數(shù)據(jù)這條路，并且是要盡可能的窮盡所有可能，才能讓效果達(dá)到很好，讓corner case出錯(cuò)的概率降到足夠低。

所以

6 凡是對(duì)Corner Case要求很高的AI應(yīng)用，都很難落地

簡(jiǎn)單點(diǎn)說(shuō)就是出點(diǎn)錯(cuò)也沒(méi)事的AI好落地，否則很難落地。

自動(dòng)駕駛，機(jī)器人這些現(xiàn)實(shí)應(yīng)用就是，出個(gè)錯(cuò)影響很大。

而NLP，虛擬世界中的游戲AI，特效這些則影響沒(méi)有那么大。

這也就印證了第5條的必然。我們可以看到AI已經(jīng)廣泛的應(yīng)用到搜索，游戲，視頻特效等領(lǐng)域，并帶來(lái)了巨大的商業(yè)價(jià)值。

以深度強(qiáng)化學(xué)習(xí)為例，在游戲AI中得到了真正意義上的落地，如果把所有使用了深度強(qiáng)化學(xué)習(xí)Agent的游戲算上，估計(jì)每天被調(diào)用上億次，這是難以想象的。

同樣，GAN在視頻特效上得到了巨大的應(yīng)用，一個(gè)火的特效可以被觀看幾十億次。

基于前面的幾點(diǎn)，虛擬世界的發(fā)展非常重要，現(xiàn)實(shí)世界的AI應(yīng)用，特別是機(jī)器人上的應(yīng)用，極度依賴于虛擬世界，因此

7 Metaverse將先于機(jī)器人革命出現(xiàn)

下面兩圖概括了Metaverse和機(jī)器人所需的AI技術(shù)：

幾乎是共通的，相信很多朋友會(huì)有不同意見(jiàn)，上圖完全建立在Sim2Real的必然上！

這樣的技術(shù)路線和西部世界里的做法是一模一樣的。西部世界真是一部前瞻性極強(qiáng)的硬核科幻。

這里多聊幾句Metaverse！

Metaverse是永恒的虛擬世界，除了逼真的虛擬環(huán)境給予其外在，大量智能的虛擬人/機(jī)器人才是其內(nèi)核。這和目前游戲里的NPC一個(gè)道理。在3A游戲如GTA V中，NPC是一個(gè)必不可少的角色，在虛擬世界中充斥著大量的NPC來(lái)形成整個(gè)虛擬世界觀與故事線。一個(gè)僅有人類的虛擬世界無(wú)法構(gòu)造真正的Metaverse！

（當(dāng)然，當(dāng)前每個(gè)人對(duì)Metaverse的看法都不盡相同，這里僅一家之言）

鑒于Metaverse和機(jī)器人都對(duì)AI有著全方位的需求，我們可以得到下一個(gè)必然：

8 AGI將在Metaverse的發(fā)展中誕生，然后作用于現(xiàn)實(shí)世界

這里的AGI我們定義為具備完全擬人的語(yǔ)言，姿態(tài)，動(dòng)作，行為，能夠通過(guò)圖靈測(cè)試。我們依然可以以西部世界里的機(jī)器人作為AGI的代表。

在發(fā)展Metaverse的NPC的時(shí)候，我們需要一步一步的改進(jìn)里面的Vision，Language，Motion，Mind，這都是AGI的核心組件，有些組件也可以直接作用于現(xiàn)實(shí)世界比如Language，有些則需要更多的發(fā)展來(lái)實(shí)現(xiàn)sim2real。

9 小結(jié)

有了上面的分析，我們會(huì)越來(lái)越明白機(jī)器人革命道阻且長(zhǎng)，需要很多組件的逐步完成。雖然目前我們也已經(jīng)看到了很多機(jī)器人基于cv的應(yīng)用，但離完成更復(fù)雜任務(wù)還很遠(yuǎn)。

但這也許不是什么壞事。

Metaverse才是下一個(gè)世代的主題，擁抱它并發(fā)展它。也許這里面對(duì)的社會(huì)問(wèn)題比機(jī)器人革命到來(lái)面對(duì)的問(wèn)題更大，但似乎技術(shù)是無(wú)法阻擋的，人類在不斷的將自己推進(jìn)深淵或者通往下一個(gè)前所未有的光明！

推薦閱讀
國(guó)產(chǎn)小眾瀏覽器因屏蔽視頻廣告，被索賠100萬(wàn)（后續(xù)）
年輕人“不講武德”：因看黃片上癮，把網(wǎng)站和786名女主播起訴了
中國(guó)聯(lián)通官網(wǎng)被發(fā)現(xiàn)含木馬腳本，可向用戶推廣色情APP
張一鳴：每個(gè)逆襲的年輕人，都具備的底層能力

關(guān)于程序員大白

程序員大白是一群哈工大，東北大學(xué)，西湖大學(xué)和上海交通大學(xué)的碩士博士運(yùn)營(yíng)維護(hù)的號(hào)，大家樂(lè)于分享高質(zhì)量文章，喜歡總結(jié)知識(shí)，歡迎關(guān)注[程序員大白]，大家一起學(xué)習(xí)進(jìn)步！

關(guān)于深度學(xué)習(xí)發(fā)展的必然及未來(lái)的思考