耗資4億美元!Meta將采購2000套DGX A100,打造全球最強AI超算

1月25日消息,近日,Meta(Facebook母公司)宣布建造全球最強大的AI超算,名為AI Research SuperCluster(RSC)。其目標是最終運算速度(Linpack)達到220 petaflops(每秒22億億次)。實際上,RSC已經投入運行,但后續(xù)還會追加運算節(jié)點。
目前,RSC的配置是760套NVIDIA DGX A100 AI系統(tǒng),也就是1520顆AMD 64核EPYC處理器(第二代,代號Rome)、6080顆NVIDIA A100 GPU。

DGX A100
I/O方面,網絡帶寬200Gbps、175PB FlashArray、10PB FlashBlade以及46PB緩存。

根據(jù)初期測試顯示,其在進行視覺運算時,工作速度較之前的AI 運算系統(tǒng)提升20 倍,運行NVIDIA NCCL 的速度則提升9 倍以上,且在訓練大規(guī)模的語言模型上則提升3倍。這也意味著SRC 可在三周內完成擁有數(shù)百億參數(shù)的模型,而之前的系統(tǒng)需花費九周的時間。

Meta指出,其研究團隊目前正在使用這臺超級計算機訓練AI 模型,進行自然語言處理和電腦視覺研究;目標是希望SRC 有朝一日能在1 艾字節(jié)的數(shù)據(jù)集上訓練包含超過1萬億個參數(shù)的模型(1 艾字節(jié)大約相當于3.6 萬年的高畫質影片)。
Meta也強調,盡管SRC 已開始運行,不過其仍在開發(fā)中,Meta 將努力提升SRC 中的GPU 數(shù)量,預計未來會再追加1240套DGX A100系統(tǒng),單GPU規(guī)模就多達16000顆(單顆顯存40GB)。這將使AI 訓練性能提高2.5 倍以上。當今年夏天SRC 完全建置完成后,將成為世上最快的AI 超級電腦。
資料顯示,NVIDIA DGX A100發(fā)布于2020年,單套系統(tǒng)售價高達19.9萬美元。也就是說,RSC最終完工時,單采購DGX A100就需要花費3.98億美元(約合人民幣25億)。
編輯:芯智訊-林子
53億美元收購世創(chuàng)獲中國有條件通過!環(huán)球晶圓需剝離區(qū)熔法晶圓業(yè)務!
應屆生年薪可達60萬?國內芯片人才緊缺的背后:今年芯片行業(yè)薪酬漲幅將超50%
單價超3億美元!Intel拿下首批第二代High-NA光刻機,2nm將搶先量產!
同比增長78%!展銳2021年營收達117億元,或將進入全球十大IC設計公司榜單
行業(yè)交流、合作請加微信:icsmart01
芯智訊官方交流群:221807116
