來(lái)源:網(wǎng)絡(luò)
編輯:su
【新智元導(dǎo)讀】上周特斯拉舉辦AI日,除了發(fā)布機(jī)器人,還公布了其自研的D1芯片。憑借這款芯片,特斯拉打造出了最快的 AI 訓(xùn)練計(jì)算機(jī)ExaPOD。
外媒稱,「特斯拉Dojo是全球最先進(jìn)的可擴(kuò)展AI訓(xùn)練機(jī)器?!?/span>自研AI訓(xùn)練芯片,超算ExaPod算力全球最高!在上周的AI日,特斯拉公布了為 Dojo 超級(jí)計(jì)算機(jī)打造的D1 芯片。Dojo 是一種通過(guò)網(wǎng)絡(luò)結(jié)構(gòu)連接的分布式計(jì)算架構(gòu),特點(diǎn)包括:具有大型計(jì)算平面、極高帶寬、低延遲和可擴(kuò)展性極強(qiáng)。D1 芯片采用 7納米制造工藝,僅 645 平方毫米,包含 500 億個(gè)晶體管、354 個(gè)訓(xùn)練節(jié)點(diǎn),內(nèi)部的電路長(zhǎng)達(dá)17.7公里。所有區(qū)域都用于機(jī)器學(xué)習(xí)訓(xùn)練和帶寬,沒(méi)有暗硅。該芯片具有 CPU 級(jí)別的計(jì)算能力和靈活性, I/O 帶寬是網(wǎng)絡(luò)芯片的2倍。處理能力達(dá)到每秒 1024 億次。單芯片 BF16 精度下的算力高達(dá)362 TOPs,F(xiàn)P32算力則為22.6 TOPs。最重要的是,D1芯片之間可以「無(wú)縫連接,無(wú)需任何膠水」。利用這一特性,特斯拉將 25 個(gè) D1 芯片組成了一個(gè)「訓(xùn)練模塊」,再結(jié)合了 UI、電源和熱管理,最終可以達(dá)到9 Petaflops的算力。集合120個(gè)訓(xùn)練模塊,包含3000個(gè)D1芯片。全球最快的AI訓(xùn)練計(jì)算機(jī)ExaPOD就誕生啦!其算力高達(dá)1.1 EFLOP,超過(guò)日本富士通。而且,從理論上來(lái)說(shuō),Dojo的性能拓展可以無(wú)限擴(kuò)張,沒(méi)有上限。其實(shí),特斯拉在2019年就發(fā)布了一款名為 Full Self-Driving(FSD,全自動(dòng)駕駛)的芯片。Dojo項(xiàng)目負(fù)責(zé)人加內(nèi)什·文卡塔拉馬南(Ganesh Venkataramanan)介紹說(shuō),「人們對(duì)神經(jīng)網(wǎng)絡(luò)的速度和容量的需求是無(wú)止境的,馬斯克也要求設(shè)計(jì)一臺(tái)超高速訓(xùn)練計(jì)算機(jī)?!?/span>研發(fā)人員的目標(biāo)是:實(shí)現(xiàn)最好的AI訓(xùn)練性能、更大更復(fù)雜的神級(jí)網(wǎng)絡(luò)模型、組裝出節(jié)能又劃算的超算。Dojo這個(gè)名字取得也很有深意。它在日語(yǔ)中的意思是「道場(chǎng)」,指冥想或練習(xí)武術(shù)的地方。很明顯,特斯拉研發(fā)超算的目的是解決自動(dòng)駕駛的問(wèn)題。Ganesh 也表示,超算將會(huì)用于訓(xùn)練包括Autopilot在內(nèi)的的自動(dòng)駕駛系統(tǒng)。不過(guò),除此之外,MIT研究員Lex Fridman認(rèn)為,Dojo 訓(xùn)練系統(tǒng)還可運(yùn)用到云服務(wù)中,未來(lái)三年,直接與亞馬遜AWS、谷歌云競(jìng)爭(zhēng)。最后,特斯拉官方稱,芯片還有很大的改進(jìn)空間。參考資料:
https://www.nextbigfuture.com/2021/08/tesla-ai-dojo-training-as-a-service-could-compete-with-amazon-and-google-cloud.html
