<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          DPU崛起,詳談?dòng)?jì)算體系變革

          共 9346字,需瀏覽 19分鐘

           ·

          2021-10-30 06:40



          導(dǎo)讀:最近DPU概念異?;鸨?,從Mellanox、Fungible、NVIDIA到Intel,各路諸侯紛紛加入戰(zhàn)場(chǎng),各種概念Smart NIC、DPU、IPU層出不窮,各種SDK,F(xiàn)unOS、DOCA、IPDK令人眼花繚亂,比當(dāng)年AI還要火爆。


          邊緣計(jì)算正在重構(gòu)數(shù)據(jù)中心產(chǎn)業(yè)鏈,本文圍繞為什么數(shù)據(jù)中心要變革、數(shù)據(jù)中心面臨的問(wèn)題和技術(shù)發(fā)展趨勢(shì)、DPU的技術(shù)細(xì)節(jié)以及為什么芯片會(huì)催生新的計(jì)算架構(gòu)等方面進(jìn)行了系統(tǒng)分析系統(tǒng)分析。推薦給大家。

          下載鏈接:

          中國(guó)數(shù)據(jù)處理器行業(yè)概覽(2021)

          DPU在數(shù)據(jù)中心和邊緣云上的應(yīng)用

          英偉達(dá)DPU集數(shù)據(jù)中心于芯片



          為什么現(xiàn)在數(shù)據(jù)中心要變革?

          ?


          數(shù)據(jù)中心的核心支柱服務(wù)器是一個(gè)非常有意思和殘酷的產(chǎn)業(yè),容易壟斷,淘汰又非常快,一不留神就退出了歷史的舞臺(tái)。

          和20年前x86通過(guò)占領(lǐng)個(gè)人PC市場(chǎng)反攻數(shù)據(jù)中心/大型機(jī)市場(chǎng)這種“農(nóng)村包圍城市”的打法一樣,今天的arm/risc-v架構(gòu)通過(guò)占領(lǐng)手機(jī),物聯(lián)網(wǎng)等終端設(shè)備,開始進(jìn)入數(shù)據(jù)中心市場(chǎng)。但和20年前不一樣的是,Intel面對(duì)的競(jìng)爭(zhēng)不是來(lái)自同行,而是客戶“自下而上”的競(jìng)爭(zhēng)。例如2020年蘋果宣布2年內(nèi)替換Intel CPU到自研Apple Silicon;AWS云服務(wù)中新增服務(wù)器中自研arm架構(gòu)比例也已經(jīng)超過(guò)10%了。這種“不對(duì)稱”競(jìng)爭(zhēng)將加速x86架構(gòu)的衰落,所以ARK預(yù)測(cè)這次架構(gòu)的變革可能只需要10年。如果按照兩三年一代的迭代速度,留給Intel的機(jī)會(huì)可能也就3代產(chǎn)品的時(shí)間了。

          在這次服務(wù)器架構(gòu)變革還有一個(gè)非常有意思的地方,通常大家忽視的一個(gè)地方,未來(lái)10年服務(wù)器的增量大頭會(huì)發(fā)生在邊緣計(jì)算領(lǐng)域,預(yù)計(jì)2029年邊緣服務(wù)器將達(dá)到700-900億美元規(guī)模,將占據(jù)服務(wù)器市場(chǎng)規(guī)模的50%左右。所以我們認(rèn)為“第三顆”大芯片的機(jī)會(huì)應(yīng)該更快的在邊緣計(jì)算領(lǐng)域發(fā)生。


          數(shù)據(jù)為中心的計(jì)算時(shí)代


          ? ?????



          最早提出“數(shù)據(jù)為中心”Data-centric計(jì)算時(shí)代這個(gè)概念的是硅谷創(chuàng)業(yè)公司Fungible。在數(shù)據(jù)為中心的架構(gòu)中,計(jì)算更加靠近網(wǎng)絡(luò),即流量產(chǎn)生或者到達(dá)的地方,通過(guò)增加一個(gè)SoC的方式卸載host CPU對(duì)流量處理的開銷。

          根據(jù)Fungible和AWS的統(tǒng)計(jì),在大型數(shù)據(jù)中心中,流量處理占到了計(jì)算的30%左右,即數(shù)據(jù)中心中30%的計(jì)算是在作流量處理,這個(gè)開銷被形象的叫做數(shù)據(jù)中心稅(Datacenter Tax)。借用某某資本的總結(jié),數(shù)據(jù)為中心的計(jì)算架構(gòu)的好處是降低了CPU到加速卡的路徑,是數(shù)據(jù)傳輸效率更高,性能更好。

          最早提出這個(gè)概念的Fungible同時(shí)給自己的芯片取了一個(gè)特有的名字“DPU”,同時(shí)認(rèn)為DPU將成為計(jì)算機(jī)僅次于CPU、GPU的“第三顆”大芯片出現(xiàn)。Fungible認(rèn)為自己的使命是解決數(shù)據(jù)為中心的時(shí)代的網(wǎng)絡(luò)流量問(wèn)題。DPU的出現(xiàn)是為了解決數(shù)據(jù)中心中存在三個(gè)方面共五大問(wèn)題:

          按照技術(shù)出現(xiàn)的時(shí)間順序和特點(diǎn),我們將DPU的發(fā)展分為三個(gè)階段:


          第一階段:Smart NIC(智能設(shè)備)

          這個(gè)可以稱為DPU的史前時(shí)代。解決節(jié)點(diǎn)間流量問(wèn)題的最簡(jiǎn)單的方式是增加網(wǎng)卡的處理能力,通過(guò)在網(wǎng)卡上面引入SoC或者FPGA的方式加速某些特定流量應(yīng)用,從而加強(qiáng)網(wǎng)絡(luò)的可靠性,降低網(wǎng)絡(luò)延遲,提升網(wǎng)絡(luò)性能。其中Xilinx和Mellanox在這個(gè)領(lǐng)域進(jìn)行的比較早,可惜由于戰(zhàn)略能力不足,錯(cuò)失了進(jìn)一步發(fā)展的機(jī)會(huì),逐漸被DPU取代,最終被淘汰。其中Mellanox被Nvidia收購(gòu),Xilinx被AMD拿下。智能網(wǎng)卡成為DPU的應(yīng)用產(chǎn)品而存在。(Marvell會(huì)如何選擇我們拭目以待)

          第二階段:DPU(數(shù)據(jù)處理芯片)

          這個(gè)階段是數(shù)據(jù)芯片真正開始被重視的階段。最開始由Fungible在2019年提出,但沒(méi)有引起太多反響。Nvidia將收購(gòu)來(lái)的Mellanox重新包裝之后,2020年10月重新定義了DPU這個(gè)概念,DPU這個(gè)概念一炮而紅。有意思的是Nvidia對(duì)DPU的定義完全不同于Fungible,在Nvidia的博客上有一段非常有意思的評(píng)價(jià)。

          雖然Fungible號(hào)稱DPU是要解決很多網(wǎng)絡(luò)問(wèn)題。但回歸本質(zhì),一個(gè)性能強(qiáng)大的x86都沒(méi)有解決的問(wèn)題,為什么一個(gè)嵌入式SoC可以干得更加好呢?這個(gè)是一個(gè)非常嚴(yán)肅也是一個(gè)需要正面回答的問(wèn)題。顯然Fungible回避了這個(gè)本質(zhì)問(wèn)題,而是用了一個(gè)120瓦的SoC來(lái)處理流量問(wèn)題。然而Nvidia卻從另一個(gè)緯度回答了這個(gè)問(wèn)題,那就是DPU只應(yīng)該處理網(wǎng)絡(luò)路徑(network data path initialization)和異常(exception processing),而不是其他的(nothing more)。

          Nvidai的做法非常簡(jiǎn)單同時(shí)也非常容易理解,畢竟賣GPU比賣DPU更加賺錢,而Nvidia不會(huì)放過(guò)一切增加GPU銷量的機(jī)會(huì)。但仔細(xì)看一下這句話,其實(shí)暗含了一個(gè)Nvidia的技術(shù)路線exception processing!

          第三階段:IPU(基礎(chǔ)設(shè)施芯片)

          對(duì)于“第三顆”芯片這么重要的戰(zhàn)場(chǎng),自然少不了Intel的加入。Intel的解決方案非常簡(jiǎn)單粗暴。DPU的存在不就是為了解決流量卸載問(wèn)題么,我用FPGA就好了!DPU不就是想管理云平臺(tái)么?那好,我再送一個(gè)CPU就好了。于是乎Intel的方案變成了FPGA+Xeon-D的模式,通過(guò)PCB版的方式放在一個(gè)智能網(wǎng)卡上(估計(jì)功耗要超過(guò)200瓦)。


          同時(shí)Intel給這個(gè)方案取了一個(gè)非常有意思的名字“基礎(chǔ)設(shè)施處理器”。顯然Intel將IPU定位成host CPU上面一個(gè)“外掛”的小CPU,而且未來(lái)這個(gè)“外掛”CPU和FPGA會(huì)封裝到一個(gè)芯片中,形成一個(gè)奇怪的通過(guò)PCIe總線互聯(lián)的兩個(gè)CPU系統(tǒng)。這種一個(gè)總線多個(gè)CPU的架構(gòu),Intel在GPU Phi中已經(jīng)用過(guò)。

          從系統(tǒng)上來(lái)看,這個(gè)架構(gòu)非常簡(jiǎn)潔,我們覺得應(yīng)該也是DPU應(yīng)該發(fā)展的方向。但同時(shí)IPU引發(fā)了一個(gè)架構(gòu)性的問(wèn)題,“這個(gè)架構(gòu)中到底IPU是中心,還是host CPU是中心?”。目前Intel只給出了一個(gè)非常模棱兩可的介紹,回避了這個(gè)問(wèn)題。我們認(rèn)為真正解決了這個(gè)問(wèn)題的芯片才能成為未來(lái)真正的“第三顆”大芯片,甚至是主要芯片。?

          顯然Intel和Nvidia都看到了這個(gè)機(jī)會(huì),DPU/IPU真正有價(jià)值而且極具價(jià)值的在于,誰(shuí)處理exception?到底是host CPU還是DPU?如果是DPU?那么其他設(shè)備比如GPU的exception誰(shuí)處理呢?

          經(jīng)過(guò)幾年的發(fā)展,數(shù)據(jù)芯片(DPU/IPU)的地位一直在提升,正在成為“第三顆”大芯片。

          對(duì)比一下當(dāng)前Fungible、Nvidia和Intel的技術(shù)路線我們總結(jié)如下:

          DPU/IPU的重要性已經(jīng)達(dá)成了共識(shí)。但圍繞DPU的定位存在一些爭(zhēng)論,不同的公司根據(jù)自己技術(shù)特點(diǎn)選擇不同技術(shù)路線。


          數(shù)據(jù)中心的問(wèn)題和技術(shù)發(fā)展的趨勢(shì)需求


          ? ?????


          01 數(shù)據(jù)中心有什么問(wèn)題?

          數(shù)據(jù)中心作為當(dāng)前信息化的基石,在過(guò)去50年發(fā)展相當(dāng)迅猛。隨著算力的提升,數(shù)據(jù)中心的能耗也越來(lái)越大,通常從廣義上講,數(shù)據(jù)中心面對(duì)三個(gè)核心問(wèn)題:


          • 性能問(wèn)題(scale-up):如何提升計(jì)算性能,簡(jiǎn)單說(shuō)就是單臺(tái)服務(wù)器越算越快,這個(gè)有點(diǎn)難度,目前性能最強(qiáng)大的CPU應(yīng)該是ARM架構(gòu)的富岳(Fugaku);
          • 規(guī)模問(wèn)題(scale-out):第二個(gè)問(wèn)題就是系統(tǒng)效率問(wèn)題,如果一臺(tái)服務(wù)器算力不夠(大部分?jǐn)?shù)據(jù)中心應(yīng)用一臺(tái)服務(wù)器是不夠的),那么我們就需要多臺(tái)服務(wù)器組成集群進(jìn)行集群計(jì)算。如何接入更加多的服務(wù)器?并高效率的統(tǒng)籌各個(gè)服務(wù)器的運(yùn)行狀態(tài)和效率也是一個(gè)非常復(fù)雜和需要解決的問(wèn)題,通常這個(gè)問(wèn)題是一個(gè)系統(tǒng)架構(gòu)和網(wǎng)絡(luò)問(wèn)題;
          • 能耗問(wèn)題(power):第三個(gè)問(wèn)題是能耗問(wèn)題。如何降低能耗、提升計(jì)算效率,從傳統(tǒng)追求性能的技術(shù)路線,變成追求效能的技術(shù)路線?中國(guó)在這一方面戰(zhàn)略上遠(yuǎn)遠(yuǎn)領(lǐng)先其他國(guó)家,特別是“碳達(dá)峰、碳中和3060”基本方針的提出。如果中國(guó)能早日實(shí)現(xiàn)計(jì)算上的“碳中和”,讓CPU可以僅僅消耗極小的能耗即可運(yùn)轉(zhuǎn)的話,對(duì)能源安全和信息格局將發(fā)生巨大影響。

          性能和能耗問(wèn)題是一個(gè)非常復(fù)雜又有趣的問(wèn)題,但不是我們DPU的重點(diǎn),未來(lái)我們將介紹一篇如何用DPU和低功耗CPU也可以達(dá)到高性能高吞吐量計(jì)算的架構(gòu),今天我們接著DPU的技術(shù)路線繼續(xù)。

          按照DPU開始的定義,DPU核心是解決數(shù)據(jù)中心第二問(wèn)題:“如何解決多節(jié)點(diǎn)服務(wù)器互聯(lián)效率問(wèn)題”。按照Fungible的結(jié)論,當(dāng)前數(shù)據(jù)中心互聯(lián)架構(gòu)無(wú)法適應(yīng)超大型數(shù)據(jù)中心(mega datacenter)和超小型數(shù)據(jù)中心(edge datacenter),所以Fungible提出用DPU和TrueFabric技術(shù)解決這個(gè)問(wèn)題。?的確有些數(shù)據(jù)中心非常大,幾萬(wàn)臺(tái)甚至十幾萬(wàn)臺(tái)服務(wù)器互聯(lián)組成集群;有些特別小,可能只有十幾臺(tái)服務(wù)器互聯(lián)。那么Fungible這種技術(shù)路線是不是可以解決這個(gè)問(wèn)題呢?有沒(méi)有更加友好的技術(shù)路線呢?


          02 數(shù)據(jù)中互聯(lián)面臨的題?

          數(shù)據(jù)中心互聯(lián)通常采用光通信方式,隨著容量的提升在100T當(dāng)量下,光模塊的功耗占比超過(guò)了互聯(lián)整體成本的50%,并且光模塊成本也已經(jīng)超過(guò)了通道成本(也就是說(shuō)光模塊加起來(lái)比交換機(jī)盒子貴了),但是隨著吞吐率的激增,互聯(lián)延遲缺沒(méi)有明顯降低。

          來(lái)源:互聯(lián)技術(shù)工作小組

          03 云計(jì)算產(chǎn)業(yè)下游的需求是什么?

          那一方面數(shù)據(jù)中心的用戶,下游云計(jì)算產(chǎn)業(yè)的需求是對(duì)設(shè)備越來(lái)越顆?;墓芾砗唾Y源調(diào)配。在云計(jì)算3.0架構(gòu)下,云管理平臺(tái)(IaaS)希望對(duì)設(shè)備(CPU、GPU、FPGA、AI、NIC等)繼續(xù)更加細(xì)致的管理,最好可以對(duì)每個(gè)設(shè)備進(jìn)行獨(dú)立操作(遠(yuǎn)程替換、升級(jí)、資源分配)。當(dāng)然這種管理最好基于TCP/IP協(xié)議的Restful API接口。如果進(jìn)一步,希望每個(gè)微服務(wù)(CPU運(yùn)行應(yīng)用)之間的TCP/IP通訊也可以在新型網(wǎng)絡(luò)架構(gòu)中加速。


          云計(jì)算2.0以服務(wù)器為單元,實(shí)現(xiàn)計(jì)算資源的軟件定義,IaaS軟件通過(guò)對(duì)服務(wù)器CPU的控制,實(shí)現(xiàn)CPU、內(nèi)存、儲(chǔ)存、網(wǎng)絡(luò)的資源分配。而云計(jì)算3.0時(shí)代,設(shè)備單元將以“個(gè)體”、“獨(dú)立”的方式被云平臺(tái)(IaaS)管理和控制,整個(gè)設(shè)備單元以機(jī)柜(rackscale disaggregated hardware)方式存在。同時(shí)一切以API調(diào)用為主!


          04 DPU需要解決的問(wèn)題

          在Fungible的基礎(chǔ)上,我們總結(jié)了數(shù)據(jù)中心互聯(lián)DPU芯片需要解決的幾大問(wèn)題如下:



          DPU的技術(shù)細(xì)節(jié)

          ? ?????


          接下來(lái)我們將從系統(tǒng)角度分析當(dāng)前DPU做的什么事情,解決了哪些問(wèn)題。

          01?傳統(tǒng)云計(jì)算的網(wǎng)絡(luò)模型

          服務(wù)器互聯(lián)和網(wǎng)絡(luò)架構(gòu)是一個(gè)非常復(fù)雜并且涉及到非常多的環(huán)節(jié),為了簡(jiǎn)化問(wèn)題,我只將DPU會(huì)涉及到的環(huán)節(jié)顯示出來(lái),如下圖:


          計(jì)算模塊:主要由host CPU承擔(dān)(部分由網(wǎng)卡上面的DMA小芯片承擔(dān))。當(dāng)一個(gè)微服務(wù)(APP應(yīng)用)和另外一個(gè)微服務(wù)(APP應(yīng)用)通訊的時(shí)候,按照節(jié)點(diǎn)內(nèi)(同一個(gè)host CPU上),和節(jié)點(diǎn)間(不同host CPU)上,數(shù)據(jù)流涉及的環(huán)節(jié)分別如下:

          01.1 節(jié)點(diǎn)間數(shù)據(jù)流動(dòng):

          這是傳統(tǒng)服務(wù)器和服務(wù)器互聯(lián)的應(yīng)用場(chǎng)景,這種場(chǎng)景中數(shù)據(jù)主要經(jīng)歷用戶空間、內(nèi)核空間、hypervisor、總線、網(wǎng)卡、PHY、交換機(jī)等一些列路徑。在這些路徑中:

          • host CPU環(huán)節(jié):現(xiàn)代CPU計(jì)算非??欤舆t一般由計(jì)算量確定。如果協(xié)議復(fù)雜、延遲就高,主頻高,延遲就低。由于大部分協(xié)議都在host CPU上處理,所以傳統(tǒng)意義上提高主頻可以降低延遲;
          • HyperVisor路徑:HyperVisor和系統(tǒng)OS一般深度耦合,是IaaS計(jì)算平臺(tái)的核心,計(jì)算量不大,主要工作是資源調(diào)度和計(jì)算切換(context switch)。一般云計(jì)算應(yīng)用場(chǎng)景,資源(CPU、內(nèi)存等)存在一定量的超售(也就是一個(gè)CPU賣了2-4個(gè)用戶,用戶通過(guò)分時(shí)間使用CPU)。由于內(nèi)存的速率和CPU存在一個(gè)數(shù)量級(jí)的差異,頻繁的計(jì)算切換將嚴(yán)重影響CPU的效率,使得CPU處于等待數(shù)據(jù)讀取和寫入階段。同時(shí)因?yàn)榫W(wǎng)絡(luò)需要考慮狀態(tài)(TCP時(shí)序等),一旦切換發(fā)生很有可能需要重新開始計(jì)算一部分?jǐn)?shù)據(jù),導(dǎo)致了無(wú)形中浪費(fèi)了計(jì)算資源,也增加了延遲;
          • 系統(tǒng)總線模塊:這個(gè)模塊開始就是純硬件模塊了,一般的軟件架構(gòu)師不關(guān)注這一塊,一般的網(wǎng)絡(luò)芯片架構(gòu)師也不設(shè)計(jì)這一塊,是被忽視的部分。我們列出來(lái)是因?yàn)槲覀僁PU+將在這一塊上做文章,同時(shí)在DPU中也得包含這個(gè)部分。技術(shù)提升比較簡(jiǎn)單,提升總線頻率即可;
          • 網(wǎng)卡模塊:這個(gè)是重頭戲,工作內(nèi)容卻非常簡(jiǎn)單,就是將網(wǎng)絡(luò)報(bào)文轉(zhuǎn)化成光電信號(hào)發(fā)出去。由于CPU需要處理大量的工作,所以增加一個(gè)DMA(一個(gè)小的MCU做簡(jiǎn)單的網(wǎng)絡(luò)協(xié)議處理功能)協(xié)助CPU干活?;旧犀F(xiàn)在Smart NIC和DPU就是對(duì)這個(gè)模塊進(jìn)行升級(jí),讓一個(gè)MCU干更多復(fù)雜的事情;
          • PHY、網(wǎng)絡(luò)交換機(jī)部分:這一塊就是以太網(wǎng)協(xié)議的設(shè)備了。
          01.2 節(jié)點(diǎn)內(nèi)數(shù)據(jù)流動(dòng):

          這種數(shù)據(jù)模式是微服務(wù)的基本通訊方式?;韭窂胶凸?jié)點(diǎn)間互聯(lián)一樣,唯一的區(qū)別是路由由Hypervisor(NAT或者端口,軟路由)或者網(wǎng)卡(Bridge,硬路由)處理,即網(wǎng)絡(luò)報(bào)文不需要額外交換機(jī)設(shè)備即可處理。這種方式是云計(jì)算的基本處理方式。

          01.3 云計(jì)算資源池:

          在分布式系統(tǒng)中(云計(jì)算、分布式數(shù)據(jù)庫(kù)、分布式存儲(chǔ)等),微服務(wù)同時(shí)存在多節(jié)點(diǎn)上,所以節(jié)點(diǎn)間、節(jié)點(diǎn)內(nèi)通訊共存。在這種模式上,每個(gè)微服務(wù)相當(dāng)于一個(gè)跨服務(wù)器間的“進(jìn)程”。這種情況下,多臺(tái)服務(wù)器互聯(lián)成為一個(gè)“大服務(wù)器”。其中網(wǎng)絡(luò)形成一個(gè)網(wǎng)絡(luò)拓?fù)?,稱為Fabric。所以DPU的目標(biāo)就是構(gòu)建一個(gè)快速的Fabric網(wǎng)絡(luò),用于云計(jì)算應(yīng)用。

          圖:網(wǎng)絡(luò)Fabric、計(jì)算池、微服務(wù)構(gòu)成云計(jì)算技術(shù)IaaS

          綜上可以看到當(dāng)前數(shù)據(jù)中心(包括小型集群)都構(gòu)建在一個(gè)網(wǎng)絡(luò)Fabric基礎(chǔ)上,在這個(gè)Fabric上提供統(tǒng)一基于TCP/IP協(xié)議的微服務(wù)架構(gòu)。構(gòu)成這個(gè)網(wǎng)絡(luò)Fabric的基礎(chǔ)就是以太網(wǎng)技術(shù),而技術(shù)發(fā)展目標(biāo)就是提升吞吐率和降低延遲。


          02 DPU構(gòu)建下的云計(jì)算架構(gòu)

          上面已經(jīng)介紹了網(wǎng)絡(luò)Fabric是微服務(wù)和云計(jì)算發(fā)展的必然趨勢(shì)。這個(gè)網(wǎng)絡(luò)Fabric就像一張數(shù)據(jù)網(wǎng),數(shù)據(jù)在中間流動(dòng)。所以Fungible和Nvidia把組成這個(gè)Fabric的芯片命名為DPU,數(shù)據(jù)處理芯片。那DPU如何構(gòu)建這個(gè)Fabric?如何降低網(wǎng)絡(luò)延遲呢?

          02.1 DPU的創(chuàng)新

          DPU如何創(chuàng)新?剛剛介紹了在數(shù)據(jù)流中,內(nèi)核協(xié)議處理部分和微服務(wù)應(yīng)用相關(guān)性很小。所以一個(gè)想法就是將內(nèi)核模塊下沉到DMA上,這樣就需要一個(gè)更加強(qiáng)大的MCU。最開始Xillinx和Intel都用FPGA來(lái)替代傳統(tǒng)的DMA(網(wǎng)絡(luò)芯片),達(dá)到應(yīng)用加速的目的。在這種架構(gòu)下,數(shù)據(jù)處理發(fā)生在host CPU之前,所以可以改善應(yīng)用通訊的延遲,主要原因是:

          • 網(wǎng)絡(luò)處理發(fā)生在中斷前,這個(gè)沒(méi)有改進(jìn)延遲,但節(jié)省了CPU的等待時(shí)間
          • FPGA是獨(dú)占式處理網(wǎng)絡(luò)任務(wù),不需要context switch,極大降低了高負(fù)載應(yīng)用情況下的切換帶來(lái)的延遲,極大的降低了網(wǎng)絡(luò)抖動(dòng)
          • 可以把一些需要硬件加速的通用計(jì)算用FPGA加速,進(jìn)一步釋放CPU

          通過(guò)DPU互聯(lián)我們可以有效的降低網(wǎng)絡(luò)延遲和抖動(dòng),構(gòu)建一個(gè)網(wǎng)絡(luò)Fabric。


          02.2 當(dāng)前DPU的問(wèn)題:過(guò)熱

          由于上述創(chuàng)新和Nvidia的大V效應(yīng),DPU很快熱了起來(lái)?,F(xiàn)在DPU最大的問(wèn)題就是“過(guò)熱”,功耗太高了。以前一個(gè)網(wǎng)絡(luò)DMA芯片功耗才5瓦左右,現(xiàn)在一個(gè)DPU動(dòng)則100瓦以上(Fungible F1 120瓦)。大部分應(yīng)用場(chǎng)景無(wú)法用承受這么大功耗的網(wǎng)絡(luò)設(shè)備。尤其是在100/200G以上,光模塊功耗已經(jīng)超過(guò)網(wǎng)絡(luò)設(shè)備的情況下,再增加一個(gè)100瓦的網(wǎng)絡(luò)DPU,會(huì)極大的提升網(wǎng)絡(luò)的能源消耗。所以必須解決DPU功耗問(wèn)題。

          02.3 當(dāng)前DPU的問(wèn)題:架構(gòu)臃腫

          另外一個(gè)問(wèn)題和架構(gòu)有關(guān),如果仔細(xì)看看DPU的架構(gòu)不難發(fā)現(xiàn),基本上DPU包括三個(gè)模塊:1)網(wǎng)絡(luò)模塊,2)計(jì)算模塊,3)總線模塊。其中計(jì)算模塊可以理解為以前網(wǎng)絡(luò)DMA芯片的升級(jí)版本,從一個(gè)簡(jiǎn)單的ASIC升級(jí)成了一個(gè)強(qiáng)大的CPU或者網(wǎng)絡(luò)處理器;網(wǎng)絡(luò)模塊是NIC的核心部件,接口為100/200G,同時(shí)提供網(wǎng)絡(luò)交換功能,本質(zhì)是一個(gè)小型的網(wǎng)絡(luò)交換芯片;而總線模塊是因?yàn)樾枰ヂ?lián)host CPU進(jìn)行協(xié)議轉(zhuǎn)換,也需要互聯(lián)DPU內(nèi)置CPU,一般采取PCIe 4.0/5.0為主。

          如果不是Fungible把F1叫做DPU用于智能網(wǎng)絡(luò),我覺得把這顆芯片當(dāng)作一個(gè)路由器或者防火墻芯片也是綽綽有余的??紤]到Fungible具備強(qiáng)大的路由器、防火墻背景,這就不難理解了。我感覺Fungible的技術(shù)路線就是將防火墻芯片變成小放在網(wǎng)卡設(shè)備上,給每一臺(tái)服務(wù)器提供一個(gè)防火墻芯片。但120瓦的功耗的確有點(diǎn)高。個(gè)人覺得這條技術(shù)路線不是DPU應(yīng)該做的事情。

          Nvidia很快就發(fā)現(xiàn)了這個(gè)問(wèn)題,他們覺得如果用DPU處理CPU的任務(wù)是不可能的。DPU的CPU只應(yīng)該做路徑初始化和異常處理,有點(diǎn)類似L2/L3層交換機(jī)的意思。所以Nvidia的DPU就只放了幾顆arm cpu,增加可編程能力而已。功耗也明顯降低了下來(lái)。

          02.4 當(dāng)前DPU的問(wèn)題:成本太高

          和功耗一樣現(xiàn)在的DPU成本太高了,基于DPU的解決方案變沒(méi)有降低網(wǎng)絡(luò)互聯(lián)的成本。

          02.5 當(dāng)前DPU的問(wèn)題:應(yīng)用場(chǎng)景

          目前DPU都是面向數(shù)據(jù)中心的應(yīng)用場(chǎng)景。但服務(wù)器增長(zhǎng)空間更多在邊緣計(jì)算中心,而且未來(lái)邊緣計(jì)算互聯(lián)將成為網(wǎng)絡(luò)技術(shù)趨勢(shì),所以DPU必須考慮邊緣計(jì)算場(chǎng)景。

          下一代數(shù)據(jù)中心(集群)將以Data Fabric作為支撐,而DPU是這個(gè)新Fabric的核心。



          為什么芯片會(huì)催生新的計(jì)算架構(gòu)


          ? ?????


          01 DPU和Smart NIC

          DPU區(qū)別于Smart NIC最顯著的特點(diǎn),DPU本身構(gòu)建了一個(gè)新的網(wǎng)絡(luò)拓?fù)?,而不是?jiǎn)單的數(shù)據(jù)處理卸載計(jì)算。最開始Fungible就是因?yàn)榘l(fā)展了自己的TCP協(xié)議,極大的降低了以太網(wǎng)互聯(lián)的延遲和抖動(dòng)問(wèn)題,從而定義了DPU芯片。



          DPU和Smart NIC的區(qū)別如下:
          • DPU可以構(gòu)建新的協(xié)議,Smart NIC一般只是加速協(xié)議處理
          • DPU可以構(gòu)建總線拓?fù)?,Smart NIC是一個(gè)設(shè)備,無(wú)法構(gòu)建新的總線拓?fù)?/span>
          • DPU可以作為中心芯片(可以直接控制SSD等設(shè)備),而Smart NIC無(wú)法直接控制SSD、GPU等

          Nvidia對(duì)DPU和Smart NIC做了一個(gè)非常詳細(xì)的介紹,但沒(méi)有到核心架構(gòu)上。DPU可以脫離host CPU存在,而Smart NIC不行。這個(gè)本質(zhì)的區(qū)別就是DPU可以構(gòu)建自己的總線系統(tǒng),從而控制和管理其他設(shè)備,也就是一個(gè)真正意義上的中心芯片,第三顆芯片。這個(gè)也是為什么Smart NIC出來(lái)這么多年,只有Fungible可以說(shuō)他們的芯片是DPU!

          02 “神奇”的DPU復(fù)用

          總線是一個(gè)非常珍貴的資源,可以做很多事情!Fungible的架構(gòu)師明顯意思到了這一點(diǎn),做了非常有意思的解決方案。DPU復(fù)用!我們見過(guò)利用SR-IOV技術(shù)在一個(gè)服務(wù)器中虛擬化多個(gè)網(wǎng)卡VF的技術(shù)來(lái)實(shí)現(xiàn)多張網(wǎng)卡的,但很少見到一張網(wǎng)卡被多個(gè)服務(wù)器使用的?當(dāng)然回到Fungbile DPU功耗達(dá)到120瓦的實(shí)際情況下,我們必須多“復(fù)用”這個(gè)DPU達(dá)到降低使用成本的目的。Fungible的架構(gòu)師還真的就這么干了一個(gè)系統(tǒng)。


          在DPU復(fù)用架構(gòu)中,DPU實(shí)際上起到了交換ASIC作用,也就是說(shuō)DPU可以互聯(lián)一個(gè)小集群。目前Fungible是支持8個(gè),Nvidia的BlueFiled應(yīng)該也不會(huì)超過(guò)8個(gè)。

          03 DPU復(fù)用開創(chuàng)的“芯”計(jì)算架構(gòu)

          DPU的復(fù)用看似是Fungible一個(gè)無(wú)奈的選擇(功耗和成本太高、需要降低TCO),但卻創(chuàng)造了一個(gè)全新的計(jì)算架構(gòu)。傳統(tǒng)的以CPU為中心的計(jì)算體系,要讓位給DPU為了。未來(lái)我們將單獨(dú)從架構(gòu)上分析為什么這個(gè)趨勢(shì)是不可避免的。


          傳統(tǒng)服務(wù)器架構(gòu)中,服務(wù)器設(shè)計(jì)以CPU為中心,CPU通過(guò)初始化總線樹,給每一個(gè)設(shè)備分配ID,然后所有設(shè)備按照總線協(xié)議進(jìn)行協(xié)作。網(wǎng)卡通過(guò)SR-IOV技術(shù)可以通過(guò)軟硬件協(xié)同的方式加速虛擬化環(huán)境中的網(wǎng)絡(luò)性能,這種網(wǎng)絡(luò)處理方式中,Mellonax的ConnectX性能比較突出。如果需要多路CPU,就通過(guò)CPU總線的方式擴(kuò)展一路、雙路、四路、甚至八路CPU加強(qiáng)計(jì)算能力。這種架構(gòu)通用計(jì)算能力強(qiáng)悍,但重復(fù)計(jì)算較多(每個(gè)VM都需要處理相似的網(wǎng)絡(luò)計(jì)算),對(duì)CPU的開銷比較大,成本非常高。這個(gè)就是30% Datacenter tax的來(lái)源。

          在DPU復(fù)用架構(gòu)中,DPU相當(dāng)于一個(gè)網(wǎng)絡(luò)交換機(jī),互聯(lián)多個(gè)CPU服務(wù)器,形成一個(gè)計(jì)算集群。由于網(wǎng)絡(luò)協(xié)議棧和一些公共計(jì)算由DPU提前處理完成,在這個(gè)集群中,CPU和CPU通訊減少了很多開銷,達(dá)到了降低延遲的效果?;蛘叻催^(guò)來(lái)說(shuō),就是不需要強(qiáng)大的CPU了。這樣可以極大降低8路互聯(lián)集群的CPU成本,同時(shí)增強(qiáng)網(wǎng)絡(luò)數(shù)據(jù)處理能力。在云計(jì)算領(lǐng)域具備非常明顯的競(jìng)爭(zhēng)優(yōu)勢(shì)。所以成為當(dāng)前技術(shù)發(fā)展最熱門的方向。

          04 DPU到底是什么?

          目前DPU是沒(méi)有一個(gè)明確的定義的。雖然大家都強(qiáng)調(diào)以數(shù)據(jù)處理為主,但實(shí)際上做的都是Smart NIC的事情。同時(shí)明顯Fungbile的出發(fā)是以網(wǎng)絡(luò)架構(gòu)為中心,以網(wǎng)絡(luò)安全為手段的技術(shù)路線,本質(zhì)上是一個(gè)L4(協(xié)議層)的公司在試圖解決L2/L3(Fabric和路由)的問(wèn)題,而Nvidia是以設(shè)備為中心,以GPU數(shù)據(jù)加速為手段,本質(zhì)上是一個(gè)L1(設(shè)備層)的公司在解決L2/L3(Fabric和路由)的問(wèn)題,兩個(gè)公司的技術(shù)背景和技術(shù)路線也存在明顯的差別。其他公司就只能算是一個(gè)Smart NIC公司了,打著DPU的旗號(hào)干加速的事情。

          05?DPU的未來(lái)

          雖然Fungible和Nvidia都意識(shí)到了DPU的重要性,時(shí)間上具備領(lǐng)先優(yōu)勢(shì),也做出了新架構(gòu)的解決方案。但I(xiàn)ntel發(fā)布的IPU進(jìn)一步強(qiáng)調(diào)了在基礎(chǔ)架構(gòu)上數(shù)據(jù)芯片的重要性,干脆把IaaS模塊全部下沉到了DPU上,將這個(gè)DPU重新命名為IPU。雖然Intel目前還沒(méi)有明確表明自己IPU的架構(gòu),但可以預(yù)見Intel將整合網(wǎng)絡(luò)、軟件平臺(tái)、總線技術(shù)的技術(shù)力量。


          雖然目前DPU/IPU的定義沒(méi)有標(biāo)準(zhǔn),但數(shù)據(jù)芯片作為未來(lái)計(jì)算架構(gòu)的支撐已經(jīng)成為必然趨勢(shì)。

          來(lái)源:全棧云技術(shù)架構(gòu)

          下載鏈接:

          中國(guó)數(shù)據(jù)處理器行業(yè)概覽(2021)

          DPU在數(shù)據(jù)中心和邊緣云上的應(yīng)用

          英偉達(dá)DPU集數(shù)據(jù)中心于芯片





          轉(zhuǎn)載申明:轉(zhuǎn)載本號(hào)文章請(qǐng)注明作者來(lái)源,本號(hào)發(fā)布文章若存在版權(quán)等問(wèn)題,請(qǐng)留言聯(lián)系處理,謝謝。


          推薦閱讀

          更多架構(gòu)相關(guān)技術(shù)知識(shí)總結(jié)請(qǐng)參考“架構(gòu)師全店鋪技術(shù)資料打包”相關(guān)電子書(37本技術(shù)資料打包匯總詳情可通過(guò)“閱讀原文”獲取)。

          全店內(nèi)容持續(xù)更新,現(xiàn)下單“全店鋪技術(shù)資料打包(全)”,后續(xù)可享全店內(nèi)容更新“免費(fèi)”贈(zèng)閱,價(jià)格僅收198元(原總價(jià)350元)。



          溫馨提示:

          掃描二維碼關(guān)注公眾號(hào),點(diǎn)擊閱讀原文鏈接獲取架構(gòu)師技術(shù)全店資料打包匯總(全)電子書資料詳情。


          瀏覽 36
          點(diǎn)贊
          評(píng)論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          評(píng)論
          圖片
          表情
          推薦
          點(diǎn)贊
          評(píng)論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  AV性爱网站 | 欧美黄片免费 | 四虎影院怡红院麻豆 | 国产AV 无码 乱噜噜 | 操国产嫩逼美女 |