來源:NVIDIA
編輯:小勻、LQ、yaxin
【新智元導(dǎo)讀】英偉達(dá)凡爾賽一號玩家黃仁勛來了!他帶著自家ARM架構(gòu)CPU從加速器輔路殺進(jìn)了CPU三環(huán)主路,戰(zhàn)火直接燒到了英特爾后院,帕特·基辛格同志要小心了!
黃仁勛、皮衣、自家廚房。
這一次,老黃的頭發(fā)有點(diǎn)長。

今日凌晨,NVIDIA GTC2021開幕。
今年,「GPU大哥」英偉達(dá)居然「不講武德」,發(fā)布一個(gè)基于Arm架構(gòu)的新數(shù)據(jù)中心CPU Nvidia Grace,它將直接挑戰(zhàn)英特爾在服務(wù)器和數(shù)據(jù)中心計(jì)算領(lǐng)域的主導(dǎo)地位。

毫不奇怪,英特爾和AMD的股價(jià)在這一消息上下跌了幾個(gè)百分點(diǎn)。

隨著英偉達(dá)進(jìn)軍CPU領(lǐng)域,且能大大超越Intel和AMD的處理器,英特爾和AMD或?qū)⒃谶@一技術(shù)領(lǐng)域輸?shù)舾偁帲?/span>
先來看看英偉達(dá)的CPU有多強(qiáng)。
英偉達(dá)CPU:因AI而生,進(jìn)擊英特爾最賺錢的領(lǐng)域
對英特爾和AMD來說,這是個(gè)壞消息。
英偉達(dá)宣布出算力強(qiáng)大的CPU, 把戰(zhàn)火燒到了英特爾后院。

十年前在英特爾試圖狙擊Nvidia GPU殺進(jìn)HPC異構(gòu)并行的努力,畫了一張圖,今天隨手在手機(jī)上指頭畫了一下,CPU和GPU分別從高浮點(diǎn)算力和高通量處理的南北山頭向頂端攀登,
現(xiàn)在看,借助AI興起,英偉達(dá)勢頭更猛一些,帕特基辛格同志要小心了。
專攻GPU的英偉達(dá)在這次GTC大會上推出了基于Arm架構(gòu)的中央處理器(CPU)—— Grace,用于大規(guī)模人工智能和高性能計(jì)算應(yīng)用。
黃仁勛表示,「這是英偉達(dá)第一個(gè)數(shù)據(jù)中心CPU,專為大型應(yīng)用建立」。

這款CPU以美國海軍少將、計(jì)算機(jī)編程先驅(qū)Grace Hopper的名字命名。
Grace Hopper是計(jì)算機(jī)科學(xué)的先驅(qū)之一,也是哈佛Mark 1的第一批程序員和第一個(gè)鏈接器的發(fā)明者。
她在20世紀(jì)50年代開創(chuàng)了計(jì)算機(jī)編程,發(fā)明了世界上第一個(gè)編譯器,被稱為「計(jì)算機(jī)軟件工程第一夫人」。

GPU用于運(yùn)行視頻游戲和數(shù)據(jù)中心的數(shù)據(jù)密集型計(jì)算任務(wù)。而CPU更像是「通才芯片」,可以執(zhí)行諸如運(yùn)行操作系統(tǒng)之類的基本任務(wù)。
這款名為Grace的CPU使用了節(jié)能 Arm 核心—— Neoverse,為系統(tǒng)訓(xùn)練大型人工智能模型提供了巨大的性能飛躍。
具體講,基于Grace的系統(tǒng)與NVIDIA GPU緊密結(jié)合,性能將比目前最先進(jìn)的NVIDIA DGX系統(tǒng)(在x86 CPU上運(yùn)行)高出10倍。
它能夠滿足世界上最先進(jìn)應(yīng)用的計(jì)算需求,包括自然語言處理、推薦系統(tǒng)和人工智能超級計(jì)算,這些應(yīng)用分析需要超快計(jì)算性能和大容量內(nèi)存中的巨大數(shù)據(jù)集。
Grace還是一款高度專用型處理器,主要面向大型數(shù)據(jù)密集型HPC和AI應(yīng)用。新一代NLP模型的訓(xùn)練會有超過一萬億的參數(shù)。
?
這款CPU的基本性能是第四代Nvidia NVLink互連技術(shù),該技術(shù)在Grace和Nvidia圖形處理單元之間提供每秒900 GB的連接,使總帶寬比目前領(lǐng)先的服務(wù)器高出30倍。英偉達(dá)表示,新產(chǎn)品將于2023年初上市。黃表示,使用經(jīng)過授權(quán)的 ARM IP,英偉達(dá)將 Grace 設(shè)計(jì)成專門用于大規(guī)模人工智能和高性能計(jì)算的 CPU。「加上 GPU 和 DPU,Grace 為我們提供了計(jì)算的第三個(gè)基礎(chǔ)技術(shù),以及重新構(gòu)建數(shù)據(jù)中心的能力,以推進(jìn)人工智能。英偉達(dá)現(xiàn)在是一家三芯片公司?!?/span>英偉達(dá)新推出CPU將會在明年兩臺性能強(qiáng)大的AI超算上實(shí)現(xiàn)首次應(yīng)用。黃表示,「這是世界上第一個(gè)為 TB 級計(jì)算設(shè)計(jì)的 CPU」。作為首批客戶,瑞士超級計(jì)算中心(CSCS)和美國洛斯阿拉莫斯國家實(shí)驗(yàn)室(Los Alamos National Laboratory)將是第一個(gè)使用由惠普打造的Grace驅(qū)動的超級計(jì)算機(jī)的機(jī)構(gòu)。Grace將為世界上最快的超級計(jì)算機(jī)提供驅(qū)動力。這臺被稱為阿爾卑斯山的超算將具有20億次浮點(diǎn)運(yùn)算的能力。這比當(dāng)今領(lǐng)先的人工智能超級計(jì)算機(jī)——2.8億次運(yùn)算的 Nvidia Seline 超級計(jì)算機(jī)的計(jì)算能力高出約7倍。GTC 2021推出的第一款服務(wù)器微處理器Grace,代表了英偉達(dá)想要在CPU領(lǐng)域一展宏圖,搶占英特爾最賺錢的市場領(lǐng)域。
黃仁勛宣布NVIDIA BlueField-3 DPU將為構(gòu)建超大規(guī)模數(shù)據(jù)中心、工作站和超級計(jì)算機(jī)所需的基礎(chǔ)設(shè)施提供進(jìn)一步的加速。這款新一代數(shù)據(jù)處理器將提供最強(qiáng)大的軟件定義網(wǎng)絡(luò)、存儲和網(wǎng)絡(luò)安全加速功能。BlueField-2能夠卸載相當(dāng)于30個(gè)CPU核的工作負(fù)載,而BlueField-3實(shí)現(xiàn)了「10倍」的性能飛躍,能夠替代300個(gè)CPU核,以400Gbps的速率,對網(wǎng)絡(luò)流量進(jìn)行保護(hù)、卸載和加速。
數(shù)據(jù)中心路線圖包括CPU、GPU和DPU這三類芯片,Grace和BlueField是其中必不可少的關(guān)鍵組成部分。每個(gè)芯片架構(gòu)歷經(jīng)兩年的打磨周期(周期內(nèi)可能出現(xiàn)轉(zhuǎn)變),一年專注于 x86 平臺,另一年專注于 Arm 平臺。「我們每年都會發(fā)布激動人心的新品。三類芯片,逐年飛躍,一個(gè)架構(gòu)。」Arm是全球最受歡迎的CPU,黃仁勛解釋:「理由很充分,因?yàn)樗壒?jié)能,而且其開放式授權(quán)許可模式激勵(lì)了全世界的創(chuàng)新者?!?/span>在云計(jì)算、企業(yè)和邊緣數(shù)據(jù)中心、超級計(jì)算、PC等其他市場中,Arm也開始嶄露頭角。黃仁勛宣布與多家重要的Arm合作伙伴展開合作,包括云計(jì)算領(lǐng)域的AWS、科學(xué)和云計(jì)算領(lǐng)域的Ampere Computing、超融合邊緣服務(wù)器領(lǐng)域的Marvel、以及將打造Chrome OS和Linux PC SDK與參考系統(tǒng)的聯(lián)發(fā)科。
軟硬件雙管齊下,黃仁勛宣布升級NVIDIA專為工作組打造的「便攜式AI數(shù)據(jù)中心」——NVIDIA DGX Station,以及NVIDIA專為密集型AI研發(fā)打造的AI數(shù)據(jù)中心產(chǎn)品——NVIDIA DGX SuperPod。全新DGX Station 320G借助320GB超快速HBM2e連接至4個(gè)NVIDIA A100 GPU,內(nèi)存帶寬達(dá)到每秒8TB。然而,僅需將其插入普通的壁裝電源插座即可使用,耗電量只有1500瓦。DGX SuperPOD使用全新80GB NVIDIA A100,將其HBM2e內(nèi)存提升至90TB。目前它已經(jīng)升級至采用NVIDIA BlueField-2,且NVIDIA如今還為該產(chǎn)品提供配套的NVIDIA Base Command DGX管理和編排工具。
Omniverse:還原尼爾·斯蒂芬森的《雪崩》世界
人類與AI和機(jī)器人共存的虛擬實(shí)時(shí)3D世界不再只是科幻小說中的故事情節(jié)。NVIDIA Omniverse是一個(gè)云原生平臺,其特點(diǎn)包括:可以擴(kuò)展至多個(gè)GPU、具有高物理精度、能夠充分運(yùn)用RTX實(shí)時(shí)路徑追蹤和DLSS、可以使用NVIDIA MDL模擬材料、可以使用NVIDIA PhysX模擬物理學(xué)并且與NVIDIA AI完全集成。黃仁勛表示:「Omniverse旨在創(chuàng)建共享虛擬3D世界,就像尼爾·斯蒂芬森在1990年代早期的小說《雪崩》中所描述的科幻虛擬空間那樣。」黃仁勛還宣布將從今年夏季開始提供Omniverse企業(yè)授權(quán)許可。自公測版發(fā)布以來,建筑領(lǐng)域的福斯特建筑事務(wù)所(Foster and Partners)、娛樂領(lǐng)域的ILM、游戲領(lǐng)域的Activision以及大型廣告公司W(wǎng)PP等合作伙伴都將Omniverse運(yùn)用到了其工作中。
此次NVIDIA還發(fā)布了用于訓(xùn)練Transformers的框架—— NVIDIA Megatron。在keynote中,黃仁勛詳細(xì)介紹了NVIDIA用于計(jì)算藥物研發(fā)加速庫Clara Discovery的一些新模型,以及與Schrodinger的合作。Schrodinger是一個(gè)基于物理學(xué)和機(jī)器學(xué)習(xí)的頂尖藥物研發(fā)與材料科學(xué)計(jì)算平臺。為加快有賴于量子比特的量子計(jì)算研究,黃仁勛發(fā)布了cuQuantum,其能夠?yàn)榱孔与娐纺M器提供加速,以助力研究人員設(shè)計(jì)出更完善的量子計(jì)算機(jī)。為加快對話式AI的發(fā)展,黃仁勛宣布先進(jìn)的深度學(xué)習(xí)AI——NVIDIA Jarvis已經(jīng)可用,其能夠?qū)崿F(xiàn)語音識別、語言理解、翻譯和表達(dá)性語音。為幫助客戶將自身專業(yè)知識應(yīng)用于AI領(lǐng)域,黃仁勛發(fā)布了NVIDIA TAO,其可以運(yùn)用客戶和合作伙伴的數(shù)據(jù),對NVIDIA預(yù)訓(xùn)練模型進(jìn)行微調(diào)和適配,同時(shí)保護(hù)數(shù)據(jù)隱私。最后出場的是推理服務(wù)器NVIDIA Triton,它可以從進(jìn)入客戶EGX服務(wù)器或云實(shí)例的連續(xù)數(shù)據(jù)流中獲取洞察。黃仁勛說:「這包括任何在cuDNN上運(yùn)行的AI模型,也就是幾乎所有的AI ,包括來自TensorFlow、Pytorch、ONNX、OpenVINO、TensorRT或自定義C++/python后臺等的任何框架?!?/span>
NVIDIA Drive Orin:汽車的中央大腦
黃仁勛表示,自動駕駛汽車領(lǐng)域是「機(jī)器學(xué)習(xí)和機(jī)器人技術(shù)所面對的最嚴(yán)峻的挑戰(zhàn)之一,同時(shí)也是最棘手、影響最大的挑戰(zhàn)之一。」NVIDIA正在為價(jià)值「10萬億美元」的交通運(yùn)輸行業(yè)構(gòu)建模塊化的端到端解決方案,使合作伙伴能夠充分利用所需要的部件。黃仁勛表示,將于2022年投產(chǎn)的NVIDIA自動駕駛汽車計(jì)算系統(tǒng)級芯片——NVIDIA DRIVE Orin,旨在成為汽車的「中央電腦」。沃爾沃從2016年開始應(yīng)用NVIDIA DRIVE的算力,基于NVIDIA DRIVE Xavier,為新車型開發(fā)AI輔助駕駛功能,軟件則由沃爾沃汽車旗下的自動駕駛軟件開發(fā)公司Zenseact自主研發(fā)。沃爾沃新一代汽車的自動駕駛計(jì)算機(jī)將配備NVIDIA DRIVE Orin。?
? 這也是英偉達(dá)和合作伙伴致力推廣的「軟件定義車型」的概念。與此同時(shí),黃仁勛宣布了NVIDIA新一代車載系統(tǒng)級芯片NVIDIA DRIVE Atlan,為汽車帶來真正的數(shù)據(jù)中心。Atlan可以達(dá)到每秒超過1000萬億次(TOPS)運(yùn)算次數(shù),這是DRIVE平臺首次集成DPU,通過Arm核為自動駕駛汽車帶來數(shù)據(jù)中心級的網(wǎng)絡(luò),致力于應(yīng)用到2025年的車型。Atlan約是上一代Orin處理器的4倍,超過了絕大多數(shù)現(xiàn)有無人駕駛出租車的計(jì)算能力。NVIDIA DRIVE Orin - 2019年年底公布但至今沒有出貨的芯片方案算力254 TOPS;2020年的Xavier方案有30 TOPS,而2018年的Parker僅可以提供1 TOPS。黃仁勛表示:「Atlan集NVIDIA在AI、汽車、機(jī)器人、安全和BlueField安全數(shù)據(jù)中心領(lǐng)域的所有技術(shù)之大成,堪稱一項(xiàng)技術(shù)奇跡。」黃仁勛還發(fā)布了NVIDIA第八代Hyperion汽車平臺,包括參考傳感器、自動駕駛汽車和中央計(jì)算機(jī)、3D地面真實(shí)數(shù)據(jù)記錄儀、網(wǎng)絡(luò)以及所有必要的軟件。黃仁勛還宣布DRIVE Sim將于今年夏季開放供業(yè)界使用。正如Omniverse能夠構(gòu)建汽車生產(chǎn)工廠的數(shù)字孿生一樣,DRIVE Sim也可用于創(chuàng)建自動駕駛汽車的「數(shù)字孿生」,并將其用于自動駕駛汽車的開發(fā)。In a word, 黃仁勛表示:「幾乎可以說,NVIDIA將助力您成就畢生的事業(yè)。」https://blogs.nvidia.com/blog/2021/04/12/nvidia-drive-atlan-autonomous-vehicle-platform/https://venturebeat.com/2021/04/12/nvidia-unveils-grace-arm-based-cpu-for-giant-scale-ai-and-hpc-apps/https://nvidianews.nvidia.com/news/nvidia-unveils-nvidia-drive-atlan-an-ai-data-center-on-wheels-fornext-gen-autonomous-vehicles

