英偉達CPU面世!基于Arm,性能超過英特爾為核心的自家系統(tǒng)10倍,連客戶都找好了

大數(shù)據(jù)文摘出品
作者:Caleb
是的,那個男人又“下廚房”了!
就在今天凌晨,黃仁勛黃教主又在自家廚房發(fā)表了NVIDIA GPU技術(shù)大會演講。
這次的演講和之前有所不同,可以從下圖明顯看到,黃教主的臉逐漸圓潤、頭發(fā)也越留越長了。

咳咳跑題了……
在以400億美元收購Arm的6個月后,這次的大會上,英偉達宣布推出三款基于Arm IP打造的處理器,即全球首款專為TB級加速計算而設(shè)計的CPU NVIDIA Grace、全新BlueField-3 DPU,以及業(yè)界首款1000TOPS算力的自動駕駛汽車SoC。
是的,你沒有看錯,作為全球GPU的絕對霸主,就在蘋果M1芯片向英特爾發(fā)起挑戰(zhàn)的時候,英偉達CPU正式問世。

和蘋果一樣,英偉達或許是看到了英特爾硬件已經(jīng)接近當前的極限,想要突破,就只能自己動手打造芯片了。
“最前端的AI數(shù)據(jù)科學(xué)已經(jīng)將當今的電腦架構(gòu)推到了極限,處理著數(shù)量不可想像的龐大數(shù)據(jù)量,”黃仁勛如此說,“搭配上GPU與DPU(數(shù)據(jù)處理器),英偉達的CPU將能提供NVIDIA所需的第三個基礎(chǔ)計算芯片,讓數(shù)據(jù)中心能以最先進的AI技術(shù)為核心,重心進行架構(gòu)。英偉達現(xiàn)在是個三芯片公司了”。
黃教主在演講中說到:“英偉達正在為當今時代的每一位‘達芬奇’推進他們的各項研究工作,包括語言理解、藥物研發(fā)或量子計算等。英偉達將助力成就他們畢生的事業(yè)。”
“我們每年都會發(fā)布激動人心的新品。三類芯片,逐年飛躍,一個架構(gòu)?!秉S仁勛說,數(shù)據(jù)中心路線圖包括CPU、GPU和DPU這三類芯片,每個芯片架構(gòu)歷經(jīng)兩年的打磨周期(周期內(nèi)可能出現(xiàn)轉(zhuǎn)變),一年專注于x86平臺,另一年專注于Arm平臺。
英偉達CPU來了!“能充分彰顯出Arm的強大”
根據(jù)黃教主介紹,英偉達首款數(shù)據(jù)中心CPU取名為Grace,以美國海軍少將、計算機編程先驅(qū)Grace Hopper的名字命名。
Grace主要是瞄準了AI超級計算和自然語言處理等大規(guī)模計算工作。由于它是以Arm核心為基礎(chǔ),因此可預(yù)期會比以英特爾Xeon核心為基礎(chǔ)的NVIDIA DGX系統(tǒng)更省能源,且與英偉達自家最新的GPU技術(shù)更加緊密結(jié)合。
具體來說,基于Grace的系統(tǒng)與英偉達GPU緊密結(jié)合,性能將比目前最先進的NVIDIA DGX系統(tǒng)(在x86 CPU上運行)高出10倍。

Grace在創(chuàng)新性上,可以總結(jié)為以下三點:
內(nèi)置下一代Arm Neoverse內(nèi)核,每個CPU能在SPECrate2017_int_base基準測試中單位時間運行超過300個實例;
采用第四代NVIDIA NVLink,從CPU到GPU連接速度超過900GB/s,相當于目前服務(wù)器14倍的帶寬速度;從CPU到CPU的速度超過600GB/s。
擁有最高的內(nèi)存帶寬,采用的新內(nèi)存LPDDR5x技術(shù),帶寬是LPDDR4的2倍,能源效率提高了10倍,能提供更多計算能力。
目前,絕大多數(shù)的數(shù)據(jù)中心仍將繼續(xù)使用現(xiàn)有的CPU,而Grace主要將用于計算領(lǐng)域的細分市場。
“Grace能充分彰顯出Arm的強大?!?黃仁勛如此總結(jié)到。

不僅如此,英偉達已經(jīng)為Grace找到了至少兩個客戶。
黃仁勛宣布,瑞士國家超級計算中心(CSCS)將構(gòu)建的一臺名為Alps的超級計算機,其算力可達20Exaflops,以及美國洛斯阿拉莫斯國家實驗室(Los Alamos National Laboratory)即將推出的超級計算機,都都將采用Grace。
CPU+GPU+DPU,未來計算的三大支柱
除了備受矚目的英偉達CPU,英偉達的DPU同樣值得關(guān)注。
黃教主表示,CPU和GPU,以及負責在數(shù)據(jù)中心傳輸和處理數(shù)據(jù)的數(shù)據(jù)處理單元(DPU),將共同組成“未來計算的三大支柱”。
英偉達全新BlueField-3 DPU包含220億個晶體管,采用16個Arm A78 CPU核心、18M IOPs彈性塊存儲,加密速度是上一代的4倍,并完全向下兼容BlueField-2。
BlueField-2能夠卸載相當于30個CPU核的工作負載,而BlueField-3實現(xiàn)了10倍的加速計算性能提升,能夠替代300個CPU核,以400Gbps的速率,對網(wǎng)絡(luò)流量進行保護、卸載和加速。

BlueField-3通過NVIDIA DOCA(集數(shù)據(jù)中心于芯片的架構(gòu))軟件開發(fā)包,為開發(fā)者提供了一個完整、開放的軟件平臺,開發(fā)在BlueField DPU上開發(fā)軟件定義和硬件加速的網(wǎng)絡(luò)、存儲、安全和管理等應(yīng)用。DOCA已于今日發(fā)布并提供下載。
同時該處理器也是首款支持第五代PCIe總線并提供數(shù)據(jù)中心時間同步加速的DPU。
在自動駕駛方面,英偉達將于2022年投產(chǎn)自動駕駛汽車計算系統(tǒng)級芯片——NVIDIA DRIVE Orin,該芯片旨在成為覆蓋自動駕駛和智能車機的汽車中央電腦。
NVIDIA DRIVE Atlan是新一代AI自動駕駛汽車處理器,將采用Grace下一代CPU和下一代安培架構(gòu)GPU,同時也集成數(shù)據(jù)處理單元 (DPU),最終其算力將達到1000TOPS,約是上一代Orin處理器的4倍。
“對于汽車而言,更高的算力意味著更加智能化,開發(fā)者們也能讓產(chǎn)品更快迭代。TOPS就是新的馬力?!秉S仁勛表示。
除此之外,本次NVIDIA GPU技術(shù)大會,黃教主還分享了NVIDIA Megatron的最新進展、發(fā)布了NVIDIA Jarvis的新版本、發(fā)布了發(fā)布了量子計算模擬環(huán)境cuQUANTUM,詳情可戳官網(wǎng)查看:

