<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          張亞勤院士談“智能計(jì)算新趨勢(shì)”

          共 5497字,需瀏覽 11分鐘

           ·

          2021-11-24 00:31

          大家好,特別高興參加人工智能計(jì)算大會(huì),我今天分享的是有關(guān)于產(chǎn)業(yè)發(fā)展的新趨勢(shì),包括人工智能在生命科學(xué)、雙碳趨勢(shì)下的綠色計(jì)算、自動(dòng)駕駛等領(lǐng)域中扮演的一些角色。




          AI計(jì)算趨勢(shì)


          在過去30年中,如果說有一件事是最重要的,那無疑是“數(shù)字化”,在80年代、90年代我們所做的是把內(nèi)容和企業(yè)數(shù)字化。從當(dāng)時(shí)的語音、圖像、視頻、文本,后來到企業(yè)ERP、CRM,包括云計(jì)算,其實(shí)是數(shù)字化的1.0和2.0階段。




          現(xiàn)在,我們進(jìn)入了新一輪的數(shù)字化3.0,這包括兩個(gè)世界的數(shù)字化。




          ■ 一是物理世界數(shù)字化,我們的路、車、交通燈,家庭、車間車床工廠,甚至整個(gè)城市都在數(shù)字化。


          ■ 二是生物世界,即我們的生命世界也在數(shù)字化,我們的大腦、身體器官、DNA基因、蛋白質(zhì)等正在走向數(shù)字化,同時(shí)各種新的生物電子芯片、腦機(jī)接口技術(shù)也在不斷發(fā)展。




          麻省理工學(xué)院多媒體實(shí)驗(yàn)室主任Nicholas Negroponte寫的《數(shù)字化生存》,談的就是數(shù)字化1.0,他認(rèn)為這是從原子到信息再到比特的變革過程。至于數(shù)字3.0階段,我認(rèn)為是從比特回到原子、分子的過程,可以說是原子、分子和比特的雙方映射。




          第三次數(shù)字化和第一輪、第二輪有完全不同的一些特點(diǎn)。一方面是指數(shù)級(jí)的數(shù)據(jù),比如在無人車領(lǐng)域,每天一輛車產(chǎn)生的數(shù)據(jù)量是5T;在基因測(cè)序領(lǐng)域,每一次測(cè)序產(chǎn)生的數(shù)據(jù)是3T,蛋白質(zhì)三維結(jié)構(gòu)的數(shù)據(jù)10300,所以數(shù)據(jù)在海量地增長。另一方面,這些數(shù)據(jù)主要不是給人而是給機(jī)器做決策的,是機(jī)器到機(jī)器的環(huán)節(jié)。




          人工智能經(jīng)過了很多發(fā)展階段,最早是更多依靠知識(shí)的符號(hào)邏輯推理,但知識(shí)并不完備,所以造成了AI的第一個(gè)冬天。而現(xiàn)在,更多是數(shù)據(jù)驅(qū)動(dòng)的深度學(xué)習(xí);未來,我認(rèn)為是知識(shí)和數(shù)據(jù)的融合,包括關(guān)于大腦的知識(shí),以及大量的現(xiàn)實(shí)世界數(shù)據(jù),同時(shí)也包括第一性原理方程式,比如薛定諤方程、分子動(dòng)力學(xué)方程等等




          深度學(xué)習(xí)可以說是這十年來的主流,從RNN、LSTM、CNN,到現(xiàn)在的GAN和Transformer,其經(jīng)歷了豐富的發(fā)展階段,當(dāng)下的方向是預(yù)訓(xùn)練、多模態(tài)、大模型。其中有不少挑戰(zhàn),包括因果性、可解釋性、透明性,但也有新的解決方案。




          目前,在感知方面,機(jī)器已經(jīng)達(dá)到和人類相當(dāng)?shù)乃剑踔猎谀承┓矫孢€要更好,雖然認(rèn)知能力還有一定的差距,但我認(rèn)為在未來十年左右也將縮小。




          人工智能發(fā)展中很重要的一點(diǎn),就是三要素里面的“算力”,也即“計(jì)算”。摩爾定律已經(jīng)遇到瓶頸,因此,現(xiàn)在的深度學(xué)習(xí),特別是大模型、大計(jì)算,其算力不僅僅要達(dá)到摩爾定律,而且要超越摩爾定律。它們每年的計(jì)算需求幾乎達(dá)到10倍增長。




          例如GPT-3,它是1000多億參數(shù)的大模型。OpenAI團(tuán)隊(duì)后面沒有資金繼續(xù)做,微軟投資把GPT-3模型訓(xùn)練出來。




          中國和美國在這個(gè)領(lǐng)域你追我趕。鵬城的盤古、智源的悟道、浪潮的“源1.0”、微軟-AMD的圖靈,不管是算力還是參數(shù)、數(shù)據(jù),都比GPT-3大很多。在此方面,GPT-4可能也會(huì)馬上出現(xiàn),一旦出現(xiàn),我認(rèn)為中國的企業(yè)、科研機(jī)構(gòu)也會(huì)超越GPT-4。這是一個(gè)好現(xiàn)象,中美兩國在這個(gè)行業(yè)的科技、產(chǎn)業(yè)方面形成良性競(jìng)爭,對(duì)整個(gè)行業(yè)的發(fā)展都是有益的。




          IT產(chǎn)業(yè)有三個(gè)定律,一個(gè)是香農(nóng)定律,一個(gè)是馮·諾依曼架構(gòu),另外一個(gè)是摩爾定律。我們現(xiàn)在所做的,就是突破這三個(gè)極限,特別是馮·諾依曼架構(gòu),它已經(jīng)被使用了將近60年,依然是目前計(jì)算的主流架構(gòu)。在人工智能時(shí)代,它有諸多局限,現(xiàn)在很多科研、產(chǎn)業(yè)都在想怎么去突破它。比如,在聽覺、視覺、觸覺、味覺之外打造新的感知,如激光雷達(dá)、三維結(jié)構(gòu)、光傳感、生物的傳感;另外,我們有新的數(shù)據(jù)流,需要海量的并行計(jì)算,包括AI的一些算法,如矩陣、算子、波爾代數(shù)等,都需要超越馮·諾依曼架構(gòu)。我們看到,很多新興科研產(chǎn)品出現(xiàn),一些非傳統(tǒng)的芯片公司現(xiàn)在也都進(jìn)入了芯片和程序庫領(lǐng)域。




          長期來看,我們需要突破計(jì)算的范式。目前類腦計(jì)算、量子計(jì)算、光計(jì)算、生物計(jì)算都有重大進(jìn)展;在空間分布方面,我們的計(jì)算也有很大變化:最早IBM大型機(jī)是完全的中央計(jì)算,PC階段則變?yōu)橥耆植际降模皆朴?jì)算時(shí)又回到中央式的,現(xiàn)在我們正走向云+邊+端的協(xié)同智能。未來,許多計(jì)算將走向邊緣,我相信,在未來十年中,90%以上的計(jì)算能力可能會(huì)到邊緣,整個(gè)計(jì)算會(huì)更動(dòng)態(tài)化、分布化。



          AI+生命科學(xué)


          下面我簡單講人工智能在三個(gè)領(lǐng)域的應(yīng)用,也是我們主要在做的一些科研工作。


          在生命科學(xué)領(lǐng)域,一是剛才講過生物世界在數(shù)字化,產(chǎn)生了天文級(jí)的組學(xué)數(shù)據(jù),基因組學(xué),蛋白質(zhì)組學(xué),轉(zhuǎn)錄組學(xué),細(xì)胞組學(xué),這些組學(xué)數(shù)據(jù)再加上各種組合帶來的數(shù)量是天文級(jí)的。二是,整個(gè)生物的實(shí)驗(yàn),干實(shí)驗(yàn)和濕實(shí)驗(yàn)完全閉合會(huì)走向自動(dòng)化,未來越來越少的人介入,這是在實(shí)驗(yàn)范式上很大的突破。三是,人工智能科學(xué)計(jì)算,我們現(xiàn)在生物世界里面更多的是分子動(dòng)力學(xué),未來AI將走進(jìn)科學(xué)計(jì)算。




          簡單看一下,AI在生命科學(xué)方面的進(jìn)展,第一個(gè)是基因編輯,編輯的基底清楚之后,AI的算法可以更精準(zhǔn)的找到治病基因,治療的方式讓靶點(diǎn)更加準(zhǔn)確。其實(shí)就是把這個(gè)搜索空間大大的減少了。




          另外,我們不僅僅可以做小分子的制藥,也可以做大分子,抗體,以及TCR個(gè)性化的疫苗和藥物,還有我們看到最近AlphaFold在蛋白質(zhì)解析方面的進(jìn)展,從一維的序列到三維的結(jié)構(gòu)到功能,都會(huì)加速發(fā)展。其次,隨著高通量自動(dòng)化的實(shí)驗(yàn)發(fā)展,新的范式正在構(gòu)成。最近新冠疫苗的研發(fā)就是一個(gè)例子,從2020年1月基因的序列被發(fā)布之后,可以看到3個(gè)月之后,蛋白質(zhì)的結(jié)構(gòu)很快就解析出來了,1個(gè)月之后,病毒和人的交互方式就被解析了,很快滅活疫苗研發(fā)成果,這在人類歷史上是最快的一個(gè)周期,僅不到一年時(shí)間,我們的疫苗就出來了。




          另外一個(gè)工作是我們彭健教授所做的,根據(jù)目前我們已有的腫瘤細(xì)胞系上藥物數(shù)據(jù),加上動(dòng)物的模型、老鼠的模型產(chǎn)生的數(shù)據(jù)來預(yù)測(cè)藥效。因?yàn)槿祟惖倪@些數(shù)據(jù)比較少,可解釋型的機(jī)器學(xué)習(xí)能夠很快的去遷移到人體內(nèi)藥效預(yù)測(cè)上。右邊是乳腺癌患者的實(shí)例,可以看到用這樣的方式不僅僅加快研發(fā)速度而且對(duì)于藥物推薦使用的準(zhǔn)確度也提高了5倍。另外一個(gè)例子是我們最近也是彭健教授團(tuán)隊(duì),用幾何深度學(xué)習(xí),先把蛋白質(zhì)表面的幾何表征訓(xùn)練起來,然后用深度的圖網(wǎng)絡(luò)來做抗體親和力預(yù)測(cè)。我們抗體設(shè)計(jì)不僅僅在過程上加速了很多,也已經(jīng)成功的應(yīng)用到新冠的中和抗體藥物的開發(fā)上。




          還有我們?cè)诨虼髷?shù)據(jù)方面的工作,由蘭艷艷教授帶領(lǐng)學(xué)生完成,我們現(xiàn)在知道基因10%是已經(jīng)編碼的,90%是沒有編碼的,這些開放區(qū)域與轉(zhuǎn)錄因子的結(jié)合以及和目標(biāo)基因的調(diào)控關(guān)系,最終會(huì)影響生物的性狀。但這些數(shù)據(jù)過去大家都不用,也不知道怎么用。那我們現(xiàn)在通過人工智能最前沿的預(yù)訓(xùn)練技術(shù),通過構(gòu)造一個(gè)全新的模態(tài),建立基因數(shù)據(jù)的有效表達(dá),繼而對(duì)下游的基因表達(dá)預(yù)測(cè),剪切預(yù)測(cè),治病性預(yù)測(cè)等任務(wù)都有顯著的幫助。這個(gè)工作剛剛開始,未來還有很大的發(fā)展空間。




          很重要的是,我們發(fā)現(xiàn)這里面有非常大的挑戰(zhàn),我們做人工智能或者說計(jì)算機(jī)科學(xué),和生命科學(xué),是兩個(gè)不同的語言體系。過去的合作方式都是比較機(jī)械的,或者是生物科學(xué)家去調(diào)程序包,或者把算法用到生命科學(xué)領(lǐng)域。為了打通兩個(gè)領(lǐng)域,我們做了一系列的工作,從硬件層到數(shù)據(jù)層,然后到算法層,這些工作叫“破壁計(jì)劃”。




          這方面很好的例子是AlphaFold。首先第一點(diǎn)問題——從蛋白質(zhì)一維序列到三維結(jié)構(gòu),它是一個(gè)科學(xué)的問題;第二點(diǎn)的話,就是每次破解蛋白質(zhì)的結(jié)構(gòu)之后,大家把數(shù)據(jù)拿出來共享,就可以看到積累的數(shù)據(jù)越來越多。




          隨著數(shù)據(jù)更多、算力更大、算法更新,我們希望做的是,把這樣的一種方法論用到更廣闊的領(lǐng)域,不僅是蛋白質(zhì),還有抗體、基因預(yù)測(cè)等方面。


          AI+綠色計(jì)算


          人工智能在綠色計(jì)算雙碳領(lǐng)域也有重要的的應(yīng)用。當(dāng)環(huán)境與氣候已經(jīng)成為一種挑戰(zhàn),碳中和是可持續(xù)發(fā)展的必然選擇,同時(shí)也是能源結(jié)構(gòu)調(diào)整的大機(jī)遇。




          人工智能在這個(gè)領(lǐng)域也有很多應(yīng)用。一個(gè)方向是物聯(lián)網(wǎng),做AIOT,重要的是要感知這個(gè)世界,知道碳排放、能源從哪里來、怎么消耗的;第二,有了數(shù)據(jù)之后,就可以用算法進(jìn)行智能決策,然后配制資源、進(jìn)行資源循環(huán)。比如在能源融合方面,怎樣讓火電、核電、水電、風(fēng)電、太陽能更好地融合到電網(wǎng)里去,在供電、儲(chǔ)能、用電各環(huán)節(jié)都進(jìn)行數(shù)據(jù)監(jiān)控、優(yōu)化、感知和均衡,這是大問題,人工智能算法會(huì)在其中扮演不同角色。




          講到雙碳排放,IT行業(yè)和ICT行業(yè)也是一個(gè)大的排放源。我和團(tuán)隊(duì)講,先把我們自己的排放問題解決了:數(shù)據(jù)中心運(yùn)行的大數(shù)據(jù)、大計(jì)算產(chǎn)生了很多排放;5G本身是特別好的技術(shù),但由于需要很多基站、天線,所以功耗也比較高;另外大的算法、模型也有很多排放。




          我們近期的一個(gè)工作是5G基站。眾所周知,5G用的Massive MIMO里面有很多基站,這樣計(jì)算一下,比如50個(gè)基站就有64個(gè)MIMO,組合數(shù)就很高了,正常應(yīng)用的時(shí)候還要做最優(yōu)的布陣、部署,有很多種可能性,數(shù)量絕對(duì)會(huì)達(dá)到天文級(jí)。我們最近做了一些工作,是真實(shí)的基站加上一些模擬的場(chǎng)景,用多Multi-agent cooperative Contextual Bandits這個(gè)算法,其實(shí)也不是特別復(fù)雜,也包括一些離散正向?qū)W習(xí)算法,使得功耗降低了15%左右、5G網(wǎng)絡(luò)覆蓋質(zhì)量提高了5%左右。這個(gè)工作其實(shí)才剛剛開始,我想告訴大家,人工智能算法在很多領(lǐng)域都會(huì)有應(yīng)用,應(yīng)用之后可以起到很好的效果。




          另一個(gè)工作更理論化:現(xiàn)在的大模型、大數(shù)據(jù)、大計(jì)算,能否也走向另一端,即小模型、小計(jì)算、小功耗,在邊緣處用傳感器或手機(jī)就可以做類似的計(jì)算。當(dāng)然精度可以低一點(diǎn),比如80%、90%,但功耗、計(jì)算量、模型可能是百分之一、甚至是千分之一。其中很多大家可能都比較熟悉,像蒸餾、壓縮、量化,對(duì)模型本身進(jìn)行重新優(yōu)化和部署。


          AI+自動(dòng)駕駛


          最后是人工智能在自動(dòng)駕駛方面的應(yīng)用,這也是我自己研究時(shí)間比較多的領(lǐng)域。




          汽車產(chǎn)業(yè)已有上百年的歷史,這個(gè)產(chǎn)業(yè)最近在經(jīng)歷百年未有之大變局,無論產(chǎn)業(yè)結(jié)構(gòu)還是技術(shù)要素都進(jìn)入了新階段。其中,智能化是無人駕駛最關(guān)鍵的環(huán)節(jié)。為什么這么說?首先是更安全,90%以上的交通事故是人為事故,而自動(dòng)駕駛可以把它降到最低;其次是更綠色,它的效率更高,可以節(jié)能減排。




          我認(rèn)為自動(dòng)駕駛也是人工智能領(lǐng)域目前最有挑戰(zhàn)、最難、最復(fù)雜的一個(gè)技術(shù)問題,但同時(shí)可以解決。它是一個(gè)復(fù)雜的大系統(tǒng),但可以解剖成子問題,逐個(gè)解決;但如果沒有邊界的話可能就沒法解決。最具挑戰(zhàn)、但又有邊界的是AI垂直領(lǐng)域問題。




          自動(dòng)駕駛領(lǐng)域有一些關(guān)鍵的議題。這個(gè)領(lǐng)域有市場(chǎng)的力量,也有非市場(chǎng)的力量;市場(chǎng)力量包括技術(shù)是否可行、用戶是否有需求、產(chǎn)業(yè)生態(tài)、商業(yè)模式等,非市場(chǎng)的力量包括政策法規(guī)、倫理隱私等。在技術(shù)方面,完全無人的L4級(jí)別自動(dòng)駕駛,究竟是夢(mèng)想還是現(xiàn)實(shí)?究竟是以視覺為主,還是采取激光雷達(dá)多傳感器的模式?究竟是以單車智能為主,還是需要車和路、車和車協(xié)同?是漸進(jìn)式跳躍,L2、L3走上去,還是直接跳躍到L4?是像安卓一樣開源,還是像Apple一樣封閉?到底是現(xiàn)在的汽車OEM會(huì)贏得這場(chǎng)競(jìng)爭,還是造車新勢(shì)力?我注意到有很多的問題。要真正實(shí)現(xiàn)大規(guī)模無人駕駛,還需要一些時(shí)間。




          我們開車的時(shí)候,是在用最安全且實(shí)時(shí)的方式,加上對(duì)時(shí)間的預(yù)測(cè),構(gòu)建一個(gè)三維環(huán)境場(chǎng)景,做這件事是很難的。其中很重要的是,要有大量的數(shù)據(jù)、做很多測(cè)試、不斷改進(jìn)算法。實(shí)際駕駛中永遠(yuǎn)都會(huì)遇到此前訓(xùn)練中沒有的場(chǎng)景。圖片上就是這輛特斯拉撞上一輛白色卡車,當(dāng)時(shí)天氣特別好,藍(lán)天白云,它用視覺一看,以為前面沒有東西,就直接撞上去了。很多時(shí)候AI必須能預(yù)測(cè),泛化的能力是人工智能的一個(gè)大挑戰(zhàn),對(duì)自動(dòng)駕駛、無人駕駛更加重要,因?yàn)橐坏┏霈F(xiàn)問題,就關(guān)乎生命安全。


          ?


          關(guān)于視覺與多傳感器的問題,我的觀點(diǎn)是能拿到多少數(shù)據(jù)就拿多少數(shù)據(jù)。新的傳感給我們提供了新的數(shù)據(jù)和新維度的信息,AI的感知能力是唯一可以超過人類的點(diǎn)。攝像頭、激光雷達(dá)或各種不同傳感器可以看到人類眼睛看不到的東西,這是AI的優(yōu)勢(shì),必須加以利用。運(yùn)用視覺也可以實(shí)現(xiàn)無人駕駛,但其本身的魯棒性及安全性受限;而用激光雷達(dá)加上算法,就可以檢測(cè)出深度的信息,分辨車、行人,分辨運(yùn)動(dòng)或不動(dòng)的物體,這就是有深度、有結(jié)構(gòu)的物體信息。所以視覺攝像頭和激光雷達(dá)相結(jié)合是最佳的方式。大家有顧慮,認(rèn)為激光雷達(dá)太貴了,其實(shí)現(xiàn)在混合雷達(dá)價(jià)格已是可接受的。我想,固態(tài)雷達(dá)一定會(huì)是未來的趨勢(shì),L2、L3的車上也會(huì)用到。




          自動(dòng)駕駛本身需要很強(qiáng)的智能,交通燈和道路配合也可以提供更高維的數(shù)據(jù),車端和路端完全可以互補(bǔ)。有些東西車是看不到的,車只能看到100多米,而且經(jīng)常會(huì)被遮擋,交通燈則可以提供新的信息,這對(duì)自動(dòng)駕駛安全提供了很重要的保障。




          現(xiàn)在車的分級(jí)是從L0一直到L5,L5就是完全無人,可以在所有的場(chǎng)景、所有的氣候中行駛。最近清華大學(xué)智能產(chǎn)業(yè)研究院(AIR)和百度有個(gè)聯(lián)合項(xiàng)目,把路也分成C0-C5,到C4就是任何車都能無人駕駛,但這是比較極端的情況,我們希望最終的結(jié)果是車和路的融合。




          我們做的物理模型和數(shù)學(xué)模型也顯示,車和路協(xié)同能夠大幅度提高安全性。在超距離跟車、換道、左轉(zhuǎn)這三個(gè)不同場(chǎng)景中,都可以看到路、燈的信息大幅度提高了車的安全程度。




          ?


          總結(jié)

          最后總結(jié)一下:在前三次工業(yè)革命中,蒸汽機(jī)時(shí)代、電氣時(shí)代、信息時(shí)代,我們都是跟隨者、旁觀者,而現(xiàn)在進(jìn)入第四次工業(yè)革命,到了智能時(shí)代,我們國家的體量、政策的優(yōu)勢(shì)、大量的科研人才,一定能讓我們成為第四次工業(yè)革命的領(lǐng)軍者!感謝大家。

          瀏覽 69
          點(diǎn)贊
          評(píng)論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          評(píng)論
          圖片
          表情
          推薦
          點(diǎn)贊
          評(píng)論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  99久久人妻精品无码二区 | 三级片夜夜爽 | 日韩无码久久电影 | 日本黄色链接 | 久久成人 久久鬼色 |