91av免费看,日韩产的人妻AV在线网,国产日皮视频,麻豆成人久久,影音先锋成人资源AV在线观看,69视频在线观看,国产桃色视频这里只有精品,免费亲子乱婬一级A片

導(dǎo)讀：最近DPU概念異?；鸨?，從Mellanox、Fungible、NVIDIA到Intel，各路諸侯紛紛加入戰(zhàn)場(chǎng)，各種概念Smart NIC、DPU、IPU層出不窮，各種SDK，F(xiàn)unOS、DOCA、IPDK令人眼花繚亂，比當(dāng)年AI還要火爆。

邊緣計(jì)算正在重構(gòu)數(shù)據(jù)中心產(chǎn)業(yè)鏈，本文圍繞為什么數(shù)據(jù)中心要變革、數(shù)據(jù)中心面臨的問(wèn)題和技術(shù)發(fā)展趨勢(shì)、DPU的技術(shù)細(xì)節(jié)以及為什么芯片會(huì)催生新的計(jì)算架構(gòu)等方面進(jìn)行了系統(tǒng)分析系統(tǒng)分析。推薦給大家。

下載鏈接：

中國(guó)數(shù)據(jù)處理器行業(yè)概覽（2021）

DPU在數(shù)據(jù)中心和邊緣云上的應(yīng)用

英偉達(dá)DPU集數(shù)據(jù)中心于芯片

為什么現(xiàn)在數(shù)據(jù)中心要變革？

數(shù)據(jù)中心的核心支柱服務(wù)器是一個(gè)非常有意思和殘酷的產(chǎn)業(yè)，容易壟斷，淘汰又非常快，一不留神就退出了歷史的舞臺(tái)。

和20年前x86通過(guò)占領(lǐng)個(gè)人PC市場(chǎng)反攻數(shù)據(jù)中心/大型機(jī)市場(chǎng)這種“農(nóng)村包圍城市”的打法一樣，今天的arm/risc-v架構(gòu)通過(guò)占領(lǐng)手機(jī)，物聯(lián)網(wǎng)等終端設(shè)備，開始進(jìn)入數(shù)據(jù)中心市場(chǎng)。但和20年前不一樣的是，Intel面對(duì)的競(jìng)爭(zhēng)不是來(lái)自同行，而是客戶“自下而上”的競(jìng)爭(zhēng)。例如2020年蘋果宣布2年內(nèi)替換Intel CPU到自研Apple Silicon；AWS云服務(wù)中新增服務(wù)器中自研arm架構(gòu)比例也已經(jīng)超過(guò)10%了。這種“不對(duì)稱”競(jìng)爭(zhēng)將加速x86架構(gòu)的衰落，所以ARK預(yù)測(cè)這次架構(gòu)的變革可能只需要10年。如果按照兩三年一代的迭代速度，留給Intel的機(jī)會(huì)可能也就3代產(chǎn)品的時(shí)間了。

在這次服務(wù)器架構(gòu)變革還有一個(gè)非常有意思的地方，通常大家忽視的一個(gè)地方，未來(lái)10年服務(wù)器的增量大頭會(huì)發(fā)生在邊緣計(jì)算領(lǐng)域，預(yù)計(jì)2029年邊緣服務(wù)器將達(dá)到700-900億美元規(guī)模，將占據(jù)服務(wù)器市場(chǎng)規(guī)模的50%左右。所以我們認(rèn)為“第三顆”大芯片的機(jī)會(huì)應(yīng)該更快的在邊緣計(jì)算領(lǐng)域發(fā)生。

數(shù)據(jù)為中心的計(jì)算時(shí)代

? ?????

最早提出“數(shù)據(jù)為中心”Data-centric計(jì)算時(shí)代這個(gè)概念的是硅谷創(chuàng)業(yè)公司Fungible。在數(shù)據(jù)為中心的架構(gòu)中，計(jì)算更加靠近網(wǎng)絡(luò)，即流量產(chǎn)生或者到達(dá)的地方，通過(guò)增加一個(gè)SoC的方式卸載host CPU對(duì)流量處理的開銷。

根據(jù)Fungible和AWS的統(tǒng)計(jì)，在大型數(shù)據(jù)中心中，流量處理占到了計(jì)算的30%左右，即數(shù)據(jù)中心中30%的計(jì)算是在作流量處理，這個(gè)開銷被形象的叫做數(shù)據(jù)中心稅（Datacenter Tax）。借用某某資本的總結(jié)，數(shù)據(jù)為中心的計(jì)算架構(gòu)的好處是降低了CPU到加速卡的路徑，是數(shù)據(jù)傳輸效率更高，性能更好。

最早提出這個(gè)概念的Fungible同時(shí)給自己的芯片取了一個(gè)特有的名字“DPU”，同時(shí)認(rèn)為DPU將成為計(jì)算機(jī)僅次于CPU、GPU的“第三顆”大芯片出現(xiàn)。Fungible認(rèn)為自己的使命是解決數(shù)據(jù)為中心的時(shí)代的網(wǎng)絡(luò)流量問(wèn)題。DPU的出現(xiàn)是為了解決數(shù)據(jù)中心中存在三個(gè)方面共五大問(wèn)題：

按照技術(shù)出現(xiàn)的時(shí)間順序和特點(diǎn)，我們將DPU的發(fā)展分為三個(gè)階段：

第一階段：Smart NIC（智能設(shè)備）

這個(gè)可以稱為DPU的史前時(shí)代。解決節(jié)點(diǎn)間流量問(wèn)題的最簡(jiǎn)單的方式是增加網(wǎng)卡的處理能力，通過(guò)在網(wǎng)卡上面引入SoC或者FPGA的方式加速某些特定流量應(yīng)用，從而加強(qiáng)網(wǎng)絡(luò)的可靠性，降低網(wǎng)絡(luò)延遲，提升網(wǎng)絡(luò)性能。其中Xilinx和Mellanox在這個(gè)領(lǐng)域進(jìn)行的比較早，可惜由于戰(zhàn)略能力不足，錯(cuò)失了進(jìn)一步發(fā)展的機(jī)會(huì)，逐漸被DPU取代，最終被淘汰。其中Mellanox被Nvidia收購(gòu)，Xilinx被AMD拿下。智能網(wǎng)卡成為DPU的應(yīng)用產(chǎn)品而存在。（Marvell會(huì)如何選擇我們拭目以待）

第二階段：DPU（數(shù)據(jù)處理芯片）

這個(gè)階段是數(shù)據(jù)芯片真正開始被重視的階段。最開始由Fungible在2019年提出，但沒(méi)有引起太多反響。Nvidia將收購(gòu)來(lái)的Mellanox重新包裝之后，2020年10月重新定義了DPU這個(gè)概念，DPU這個(gè)概念一炮而紅。有意思的是Nvidia對(duì)DPU的定義完全不同于Fungible，在Nvidia的博客上有一段非常有意思的評(píng)價(jià)。

雖然Fungible號(hào)稱DPU是要解決很多網(wǎng)絡(luò)問(wèn)題。但回歸本質(zhì)，一個(gè)性能強(qiáng)大的x86都沒(méi)有解決的問(wèn)題，為什么一個(gè)嵌入式SoC可以干得更加好呢？這個(gè)是一個(gè)非常嚴(yán)肅也是一個(gè)需要正面回答的問(wèn)題。顯然Fungible回避了這個(gè)本質(zhì)問(wèn)題，而是用了一個(gè)120瓦的SoC來(lái)處理流量問(wèn)題。然而Nvidia卻從另一個(gè)緯度回答了這個(gè)問(wèn)題，那就是DPU只應(yīng)該處理網(wǎng)絡(luò)路徑（network data path initialization）和異常（exception processing），而不是其他的（nothing more）。

Nvidai的做法非常簡(jiǎn)單同時(shí)也非常容易理解，畢竟賣GPU比賣DPU更加賺錢，而Nvidia不會(huì)放過(guò)一切增加GPU銷量的機(jī)會(huì)。但仔細(xì)看一下這句話，其實(shí)暗含了一個(gè)Nvidia的技術(shù)路線exception processing！

第三階段：IPU（基礎(chǔ)設(shè)施芯片）

對(duì)于“第三顆”芯片這么重要的戰(zhàn)場(chǎng)，自然少不了Intel的加入。Intel的解決方案非常簡(jiǎn)單粗暴。DPU的存在不就是為了解決流量卸載問(wèn)題么，我用FPGA就好了！DPU不就是想管理云平臺(tái)么？那好，我再送一個(gè)CPU就好了。于是乎Intel的方案變成了FPGA+Xeon-D的模式，通過(guò)PCB版的方式放在一個(gè)智能網(wǎng)卡上（估計(jì)功耗要超過(guò)200瓦）。

同時(shí)Intel給這個(gè)方案取了一個(gè)非常有意思的名字“基礎(chǔ)設(shè)施處理器”。顯然Intel將IPU定位成host CPU上面一個(gè)“外掛”的小CPU，而且未來(lái)這個(gè)“外掛”CPU和FPGA會(huì)封裝到一個(gè)芯片中，形成一個(gè)奇怪的通過(guò)PCIe總線互聯(lián)的兩個(gè)CPU系統(tǒng)。這種一個(gè)總線多個(gè)CPU的架構(gòu),Intel在GPU Phi中已經(jīng)用過(guò)。

從系統(tǒng)上來(lái)看，這個(gè)架構(gòu)非常簡(jiǎn)潔，我們覺得應(yīng)該也是DPU應(yīng)該發(fā)展的方向。但同時(shí)IPU引發(fā)了一個(gè)架構(gòu)性的問(wèn)題，“這個(gè)架構(gòu)中到底IPU是中心，還是host CPU是中心？”。目前Intel只給出了一個(gè)非常模棱兩可的介紹，回避了這個(gè)問(wèn)題。我們認(rèn)為真正解決了這個(gè)問(wèn)題的芯片才能成為未來(lái)真正的“第三顆”大芯片，甚至是主要芯片。?

顯然Intel和Nvidia都看到了這個(gè)機(jī)會(huì)，DPU/IPU真正有價(jià)值而且極具價(jià)值的在于，誰(shuí)處理exception？到底是host CPU還是DPU？如果是DPU？那么其他設(shè)備比如GPU的exception誰(shuí)處理呢？

經(jīng)過(guò)幾年的發(fā)展，數(shù)據(jù)芯片（DPU/IPU）的地位一直在提升，正在成為“第三顆”大芯片。

對(duì)比一下當(dāng)前Fungible、Nvidia和Intel的技術(shù)路線我們總結(jié)如下：

DPU/IPU的重要性已經(jīng)達(dá)成了共識(shí)。但圍繞DPU的定位存在一些爭(zhēng)論，不同的公司根據(jù)自己技術(shù)特點(diǎn)選擇不同技術(shù)路線。

數(shù)據(jù)中心的問(wèn)題和技術(shù)發(fā)展的趨勢(shì)需求

? ?????

01 數(shù)據(jù)中心有什么問(wèn)題？

數(shù)據(jù)中心作為當(dāng)前信息化的基石，在過(guò)去50年發(fā)展相當(dāng)迅猛。隨著算力的提升，數(shù)據(jù)中心的能耗也越來(lái)越大，通常從廣義上講，數(shù)據(jù)中心面對(duì)三個(gè)核心問(wèn)題：

性能問(wèn)題（scale-up）：如何提升計(jì)算性能，簡(jiǎn)單說(shuō)就是單臺(tái)服務(wù)器越算越快，這個(gè)有點(diǎn)難度，目前性能最強(qiáng)大的CPU應(yīng)該是ARM架構(gòu)的富岳（Fugaku）；
規(guī)模問(wèn)題（scale-out）：第二個(gè)問(wèn)題就是系統(tǒng)效率問(wèn)題，如果一臺(tái)服務(wù)器算力不夠（大部分?jǐn)?shù)據(jù)中心應(yīng)用一臺(tái)服務(wù)器是不夠的），那么我們就需要多臺(tái)服務(wù)器組成集群進(jìn)行集群計(jì)算。如何接入更加多的服務(wù)器？并高效率的統(tǒng)籌各個(gè)服務(wù)器的運(yùn)行狀態(tài)和效率也是一個(gè)非常復(fù)雜和需要解決的問(wèn)題，通常這個(gè)問(wèn)題是一個(gè)系統(tǒng)架構(gòu)和網(wǎng)絡(luò)問(wèn)題；
能耗問(wèn)題（power）：第三個(gè)問(wèn)題是能耗問(wèn)題。如何降低能耗、提升計(jì)算效率，從傳統(tǒng)追求性能的技術(shù)路線，變成追求效能的技術(shù)路線？中國(guó)在這一方面戰(zhàn)略上遠(yuǎn)遠(yuǎn)領(lǐng)先其他國(guó)家，特別是“碳達(dá)峰、碳中和3060”基本方針的提出。如果中國(guó)能早日實(shí)現(xiàn)計(jì)算上的“碳中和”，讓CPU可以僅僅消耗極小的能耗即可運(yùn)轉(zhuǎn)的話，對(duì)能源安全和信息格局將發(fā)生巨大影響。

性能和能耗問(wèn)題是一個(gè)非常復(fù)雜又有趣的問(wèn)題，但不是我們DPU的重點(diǎn)，未來(lái)我們將介紹一篇如何用DPU和低功耗CPU也可以達(dá)到高性能高吞吐量計(jì)算的架構(gòu)，今天我們接著DPU的技術(shù)路線繼續(xù)。

按照DPU開始的定義，DPU核心是解決數(shù)據(jù)中心第二問(wèn)題：“如何解決多節(jié)點(diǎn)服務(wù)器互聯(lián)效率問(wèn)題”。按照Fungible的結(jié)論，當(dāng)前數(shù)據(jù)中心互聯(lián)架構(gòu)無(wú)法適應(yīng)超大型數(shù)據(jù)中心（mega datacenter）和超小型數(shù)據(jù)中心（edge datacenter），所以Fungible提出用DPU和TrueFabric技術(shù)解決這個(gè)問(wèn)題。?的確有些數(shù)據(jù)中心非常大，幾萬(wàn)臺(tái)甚至十幾萬(wàn)臺(tái)服務(wù)器互聯(lián)組成集群；有些特別小，可能只有十幾臺(tái)服務(wù)器互聯(lián)。那么Fungible這種技術(shù)路線是不是可以解決這個(gè)問(wèn)題呢？有沒(méi)有更加友好的技術(shù)路線呢？

02 數(shù)據(jù)中互聯(lián)面臨的題？

數(shù)據(jù)中心互聯(lián)通常采用光通信方式，隨著容量的提升在100T當(dāng)量下，光模塊的功耗占比超過(guò)了互聯(lián)整體成本的50%，并且光模塊成本也已經(jīng)超過(guò)了通道成本（也就是說(shuō)光模塊加起來(lái)比交換機(jī)盒子貴了），但是隨著吞吐率的激增，互聯(lián)延遲缺沒(méi)有明顯降低。

來(lái)源：互聯(lián)技術(shù)工作小組

03 云計(jì)算產(chǎn)業(yè)下游的需求是什么？

那一方面數(shù)據(jù)中心的用戶，下游云計(jì)算產(chǎn)業(yè)的需求是對(duì)設(shè)備越來(lái)越顆?；墓芾砗唾Y源調(diào)配。在云計(jì)算3.0架構(gòu)下，云管理平臺(tái)（IaaS）希望對(duì)設(shè)備（CPU、GPU、FPGA、AI、NIC等）繼續(xù)更加細(xì)致的管理，最好可以對(duì)每個(gè)設(shè)備進(jìn)行獨(dú)立操作（遠(yuǎn)程替換、升級(jí)、資源分配）。當(dāng)然這種管理最好基于TCP/IP協(xié)議的Restful API接口。如果進(jìn)一步，希望每個(gè)微服務(wù)（CPU運(yùn)行應(yīng)用）之間的TCP/IP通訊也可以在新型網(wǎng)絡(luò)架構(gòu)中加速。

云計(jì)算2.0以服務(wù)器為單元，實(shí)現(xiàn)計(jì)算資源的軟件定義，IaaS軟件通過(guò)對(duì)服務(wù)器CPU的控制，實(shí)現(xiàn)CPU、內(nèi)存、儲(chǔ)存、網(wǎng)絡(luò)的資源分配。而云計(jì)算3.0時(shí)代，設(shè)備單元將以“個(gè)體”、“獨(dú)立”的方式被云平臺(tái)（IaaS）管理和控制，整個(gè)設(shè)備單元以機(jī)柜（rackscale disaggregated hardware）方式存在。同時(shí)一切以API調(diào)用為主！

04 DPU需要解決的問(wèn)題

在Fungible的基礎(chǔ)上，我們總結(jié)了數(shù)據(jù)中心互聯(lián)DPU芯片需要解決的幾大問(wèn)題如下：

DPU的技術(shù)細(xì)節(jié)

? ?????

接下來(lái)我們將從系統(tǒng)角度分析當(dāng)前DPU做的什么事情，解決了哪些問(wèn)題。

01?傳統(tǒng)云計(jì)算的網(wǎng)絡(luò)模型

服務(wù)器互聯(lián)和網(wǎng)絡(luò)架構(gòu)是一個(gè)非常復(fù)雜并且涉及到非常多的環(huán)節(jié)，為了簡(jiǎn)化問(wèn)題，我只將DPU會(huì)涉及到的環(huán)節(jié)顯示出來(lái)，如下圖：

計(jì)算模塊：主要由host CPU承擔(dān)（部分由網(wǎng)卡上面的DMA小芯片承擔(dān)）。當(dāng)一個(gè)微服務(wù)（APP應(yīng)用）和另外一個(gè)微服務(wù)（APP應(yīng)用）通訊的時(shí)候，按照節(jié)點(diǎn)內(nèi)（同一個(gè)host CPU上），和節(jié)點(diǎn)間（不同host CPU）上，數(shù)據(jù)流涉及的環(huán)節(jié)分別如下：

01.1 節(jié)點(diǎn)間數(shù)據(jù)流動(dòng)：

這是傳統(tǒng)服務(wù)器和服務(wù)器互聯(lián)的應(yīng)用場(chǎng)景，這種場(chǎng)景中數(shù)據(jù)主要經(jīng)歷用戶空間、內(nèi)核空間、hypervisor、總線、網(wǎng)卡、PHY、交換機(jī)等一些列路徑。在這些路徑中：

host CPU環(huán)節(jié)：現(xiàn)代CPU計(jì)算非?？欤舆t一般由計(jì)算量確定。如果協(xié)議復(fù)雜、延遲就高，主頻高，延遲就低。由于大部分協(xié)議都在host CPU上處理，所以傳統(tǒng)意義上提高主頻可以降低延遲；
HyperVisor路徑：HyperVisor和系統(tǒng)OS一般深度耦合，是IaaS計(jì)算平臺(tái)的核心，計(jì)算量不大，主要工作是資源調(diào)度和計(jì)算切換（context switch）。一般云計(jì)算應(yīng)用場(chǎng)景，資源（CPU、內(nèi)存等）存在一定量的超售（也就是一個(gè)CPU賣了2-4個(gè)用戶，用戶通過(guò)分時(shí)間使用CPU）。由于內(nèi)存的速率和CPU存在一個(gè)數(shù)量級(jí)的差異，頻繁的計(jì)算切換將嚴(yán)重影響CPU的效率，使得CPU處于等待數(shù)據(jù)讀取和寫入階段。同時(shí)因?yàn)榫W(wǎng)絡(luò)需要考慮狀態(tài)（TCP時(shí)序等），一旦切換發(fā)生很有可能需要重新開始計(jì)算一部分?jǐn)?shù)據(jù)，導(dǎo)致了無(wú)形中浪費(fèi)了計(jì)算資源，也增加了延遲；
系統(tǒng)總線模塊：這個(gè)模塊開始就是純硬件模塊了，一般的軟件架構(gòu)師不關(guān)注這一塊，一般的網(wǎng)絡(luò)芯片架構(gòu)師也不設(shè)計(jì)這一塊，是被忽視的部分。我們列出來(lái)是因?yàn)槲覀僁PU+將在這一塊上做文章，同時(shí)在DPU中也得包含這個(gè)部分。技術(shù)提升比較簡(jiǎn)單，提升總線頻率即可；
網(wǎng)卡模塊：這個(gè)是重頭戲，工作內(nèi)容卻非常簡(jiǎn)單，就是將網(wǎng)絡(luò)報(bào)文轉(zhuǎn)化成光電信號(hào)發(fā)出去。由于CPU需要處理大量的工作，所以增加一個(gè)DMA（一個(gè)小的MCU做簡(jiǎn)單的網(wǎng)絡(luò)協(xié)議處理功能）協(xié)助CPU干活?；旧犀F(xiàn)在Smart NIC和DPU就是對(duì)這個(gè)模塊進(jìn)行升級(jí)，讓一個(gè)MCU干更多復(fù)雜的事情；
PHY、網(wǎng)絡(luò)交換機(jī)部分：這一塊就是以太網(wǎng)協(xié)議的設(shè)備了。

01.2 節(jié)點(diǎn)內(nèi)數(shù)據(jù)流動(dòng)：

這種數(shù)據(jù)模式是微服務(wù)的基本通訊方式?；韭窂胶凸?jié)點(diǎn)間互聯(lián)一樣，唯一的區(qū)別是路由由Hypervisor（NAT或者端口，軟路由）或者網(wǎng)卡（Bridge，硬路由）處理，即網(wǎng)絡(luò)報(bào)文不需要額外交換機(jī)設(shè)備即可處理。這種方式是云計(jì)算的基本處理方式。

01.3 云計(jì)算資源池：

在分布式系統(tǒng)中（云計(jì)算、分布式數(shù)據(jù)庫(kù)、分布式存儲(chǔ)等），微服務(wù)同時(shí)存在多節(jié)點(diǎn)上，所以節(jié)點(diǎn)間、節(jié)點(diǎn)內(nèi)通訊共存。在這種模式上，每個(gè)微服務(wù)相當(dāng)于一個(gè)跨服務(wù)器間的“進(jìn)程”。這種情況下，多臺(tái)服務(wù)器互聯(lián)成為一個(gè)“大服務(wù)器”。其中網(wǎng)絡(luò)形成一個(gè)網(wǎng)絡(luò)拓?fù)?，稱為Fabric。所以DPU的目標(biāo)就是構(gòu)建一個(gè)快速的Fabric網(wǎng)絡(luò)，用于云計(jì)算應(yīng)用。

圖：網(wǎng)絡(luò)Fabric、計(jì)算池、微服務(wù)構(gòu)成云計(jì)算技術(shù)IaaS

綜上可以看到當(dāng)前數(shù)據(jù)中心（包括小型集群）都構(gòu)建在一個(gè)網(wǎng)絡(luò)Fabric基礎(chǔ)上，在這個(gè)Fabric上提供統(tǒng)一基于TCP/IP協(xié)議的微服務(wù)架構(gòu)。構(gòu)成這個(gè)網(wǎng)絡(luò)Fabric的基礎(chǔ)就是以太網(wǎng)技術(shù)，而技術(shù)發(fā)展目標(biāo)就是提升吞吐率和降低延遲。

02 DPU構(gòu)建下的云計(jì)算架構(gòu)

上面已經(jīng)介紹了網(wǎng)絡(luò)Fabric是微服務(wù)和云計(jì)算發(fā)展的必然趨勢(shì)。這個(gè)網(wǎng)絡(luò)Fabric就像一張數(shù)據(jù)網(wǎng)，數(shù)據(jù)在中間流動(dòng)。所以Fungible和Nvidia把組成這個(gè)Fabric的芯片命名為DPU，數(shù)據(jù)處理芯片。那DPU如何構(gòu)建這個(gè)Fabric？如何降低網(wǎng)絡(luò)延遲呢？

02.1 DPU的創(chuàng)新

DPU如何創(chuàng)新？剛剛介紹了在數(shù)據(jù)流中，內(nèi)核協(xié)議處理部分和微服務(wù)應(yīng)用相關(guān)性很小。所以一個(gè)想法就是將內(nèi)核模塊下沉到DMA上，這樣就需要一個(gè)更加強(qiáng)大的MCU。最開始Xillinx和Intel都用FPGA來(lái)替代傳統(tǒng)的DMA（網(wǎng)絡(luò)芯片），達(dá)到應(yīng)用加速的目的。在這種架構(gòu)下，數(shù)據(jù)處理發(fā)生在host CPU之前，所以可以改善應(yīng)用通訊的延遲，主要原因是：

網(wǎng)絡(luò)處理發(fā)生在中斷前，這個(gè)沒(méi)有改進(jìn)延遲，但節(jié)省了CPU的等待時(shí)間
FPGA是獨(dú)占式處理網(wǎng)絡(luò)任務(wù)，不需要context switch，極大降低了高負(fù)載應(yīng)用情況下的切換帶來(lái)的延遲，極大的降低了網(wǎng)絡(luò)抖動(dòng)
可以把一些需要硬件加速的通用計(jì)算用FPGA加速，進(jìn)一步釋放CPU

通過(guò)DPU互聯(lián)我們可以有效的降低網(wǎng)絡(luò)延遲和抖動(dòng)，構(gòu)建一個(gè)網(wǎng)絡(luò)Fabric。

02.2 當(dāng)前DPU的問(wèn)題：過(guò)熱

由于上述創(chuàng)新和Nvidia的大V效應(yīng)，DPU很快熱了起來(lái)?，F(xiàn)在DPU最大的問(wèn)題就是“過(guò)熱”，功耗太高了。以前一個(gè)網(wǎng)絡(luò)DMA芯片功耗才5瓦左右，現(xiàn)在一個(gè)DPU動(dòng)則100瓦以上（Fungible F1 120瓦）。大部分應(yīng)用場(chǎng)景無(wú)法用承受這么大功耗的網(wǎng)絡(luò)設(shè)備。尤其是在100/200G以上，光模塊功耗已經(jīng)超過(guò)網(wǎng)絡(luò)設(shè)備的情況下，再增加一個(gè)100瓦的網(wǎng)絡(luò)DPU，會(huì)極大的提升網(wǎng)絡(luò)的能源消耗。所以必須解決DPU功耗問(wèn)題。

02.3 當(dāng)前DPU的問(wèn)題：架構(gòu)臃腫

另外一個(gè)問(wèn)題和架構(gòu)有關(guān)，如果仔細(xì)看看DPU的架構(gòu)不難發(fā)現(xiàn)，基本上DPU包括三個(gè)模塊：1）網(wǎng)絡(luò)模塊，2）計(jì)算模塊，3）總線模塊。其中計(jì)算模塊可以理解為以前網(wǎng)絡(luò)DMA芯片的升級(jí)版本，從一個(gè)簡(jiǎn)單的ASIC升級(jí)成了一個(gè)強(qiáng)大的CPU或者網(wǎng)絡(luò)處理器；網(wǎng)絡(luò)模塊是NIC的核心部件，接口為100/200G，同時(shí)提供網(wǎng)絡(luò)交換功能，本質(zhì)是一個(gè)小型的網(wǎng)絡(luò)交換芯片；而總線模塊是因?yàn)樾枰ヂ?lián)host CPU進(jìn)行協(xié)議轉(zhuǎn)換，也需要互聯(lián)DPU內(nèi)置CPU，一般采取PCIe 4.0/5.0為主。

如果不是Fungible把F1叫做DPU用于智能網(wǎng)絡(luò)，我覺得把這顆芯片當(dāng)作一個(gè)路由器或者防火墻芯片也是綽綽有余的?？紤]到Fungible具備強(qiáng)大的路由器、防火墻背景，這就不難理解了。我感覺Fungible的技術(shù)路線就是將防火墻芯片變成小放在網(wǎng)卡設(shè)備上，給每一臺(tái)服務(wù)器提供一個(gè)防火墻芯片。但120瓦的功耗的確有點(diǎn)高。個(gè)人覺得這條技術(shù)路線不是DPU應(yīng)該做的事情。

Nvidia很快就發(fā)現(xiàn)了這個(gè)問(wèn)題，他們覺得如果用DPU處理CPU的任務(wù)是不可能的。DPU的CPU只應(yīng)該做路徑初始化和異常處理，有點(diǎn)類似L2/L3層交換機(jī)的意思。所以Nvidia的DPU就只放了幾顆arm cpu，增加可編程能力而已。功耗也明顯降低了下來(lái)。

02.4 當(dāng)前DPU的問(wèn)題：成本太高

和功耗一樣現(xiàn)在的DPU成本太高了，基于DPU的解決方案變沒(méi)有降低網(wǎng)絡(luò)互聯(lián)的成本。

02.5 當(dāng)前DPU的問(wèn)題：應(yīng)用場(chǎng)景

目前DPU都是面向數(shù)據(jù)中心的應(yīng)用場(chǎng)景。但服務(wù)器增長(zhǎng)空間更多在邊緣計(jì)算中心，而且未來(lái)邊緣計(jì)算互聯(lián)將成為網(wǎng)絡(luò)技術(shù)趨勢(shì)，所以DPU必須考慮邊緣計(jì)算場(chǎng)景。

下一代數(shù)據(jù)中心（集群）將以Data Fabric作為支撐，而DPU是這個(gè)新Fabric的核心。

為什么芯片會(huì)催生新的計(jì)算架構(gòu)

? ?????

01 DPU和Smart NIC

DPU區(qū)別于Smart NIC最顯著的特點(diǎn)，DPU本身構(gòu)建了一個(gè)新的網(wǎng)絡(luò)拓?fù)?，而不是?jiǎn)單的數(shù)據(jù)處理卸載計(jì)算。最開始Fungible就是因?yàn)榘l(fā)展了自己的TCP協(xié)議，極大的降低了以太網(wǎng)互聯(lián)的延遲和抖動(dòng)問(wèn)題，從而定義了DPU芯片。

DPU和Smart NIC的區(qū)別如下：

DPU可以構(gòu)建新的協(xié)議，Smart NIC一般只是加速協(xié)議處理
DPU可以構(gòu)建總線拓?fù)?，Smart NIC是一個(gè)設(shè)備，無(wú)法構(gòu)建新的總線拓?fù)?/span>
DPU可以作為中心芯片（可以直接控制SSD等設(shè)備），而Smart NIC無(wú)法直接控制SSD、GPU等

Nvidia對(duì)DPU和Smart NIC做了一個(gè)非常詳細(xì)的介紹，但沒(méi)有到核心架構(gòu)上。DPU可以脫離host CPU存在，而Smart NIC不行。這個(gè)本質(zhì)的區(qū)別就是DPU可以構(gòu)建自己的總線系統(tǒng)，從而控制和管理其他設(shè)備，也就是一個(gè)真正意義上的中心芯片，第三顆芯片。這個(gè)也是為什么Smart NIC出來(lái)這么多年，只有Fungible可以說(shuō)他們的芯片是DPU！

02 “神奇”的DPU復(fù)用

總線是一個(gè)非常珍貴的資源，可以做很多事情！Fungible的架構(gòu)師明顯意思到了這一點(diǎn)，做了非常有意思的解決方案。DPU復(fù)用！我們見過(guò)利用SR-IOV技術(shù)在一個(gè)服務(wù)器中虛擬化多個(gè)網(wǎng)卡VF的技術(shù)來(lái)實(shí)現(xiàn)多張網(wǎng)卡的，但很少見到一張網(wǎng)卡被多個(gè)服務(wù)器使用的？當(dāng)然回到Fungbile DPU功耗達(dá)到120瓦的實(shí)際情況下，我們必須多“復(fù)用”這個(gè)DPU達(dá)到降低使用成本的目的。Fungible的架構(gòu)師還真的就這么干了一個(gè)系統(tǒng)。

在DPU復(fù)用架構(gòu)中，DPU實(shí)際上起到了交換ASIC作用，也就是說(shuō)DPU可以互聯(lián)一個(gè)小集群。目前Fungible是支持8個(gè)，Nvidia的BlueFiled應(yīng)該也不會(huì)超過(guò)8個(gè)。

03 DPU復(fù)用開創(chuàng)的“芯”計(jì)算架構(gòu)

DPU的復(fù)用看似是Fungible一個(gè)無(wú)奈的選擇（功耗和成本太高、需要降低TCO），但卻創(chuàng)造了一個(gè)全新的計(jì)算架構(gòu)。傳統(tǒng)的以CPU為中心的計(jì)算體系，要讓位給DPU為了。未來(lái)我們將單獨(dú)從架構(gòu)上分析為什么這個(gè)趨勢(shì)是不可避免的。

傳統(tǒng)服務(wù)器架構(gòu)中，服務(wù)器設(shè)計(jì)以CPU為中心，CPU通過(guò)初始化總線樹，給每一個(gè)設(shè)備分配ID，然后所有設(shè)備按照總線協(xié)議進(jìn)行協(xié)作。網(wǎng)卡通過(guò)SR-IOV技術(shù)可以通過(guò)軟硬件協(xié)同的方式加速虛擬化環(huán)境中的網(wǎng)絡(luò)性能，這種網(wǎng)絡(luò)處理方式中，Mellonax的ConnectX性能比較突出。如果需要多路CPU，就通過(guò)CPU總線的方式擴(kuò)展一路、雙路、四路、甚至八路CPU加強(qiáng)計(jì)算能力。這種架構(gòu)通用計(jì)算能力強(qiáng)悍，但重復(fù)計(jì)算較多（每個(gè)VM都需要處理相似的網(wǎng)絡(luò)計(jì)算），對(duì)CPU的開銷比較大，成本非常高。這個(gè)就是30% Datacenter tax的來(lái)源。

在DPU復(fù)用架構(gòu)中，DPU相當(dāng)于一個(gè)網(wǎng)絡(luò)交換機(jī)，互聯(lián)多個(gè)CPU服務(wù)器，形成一個(gè)計(jì)算集群。由于網(wǎng)絡(luò)協(xié)議棧和一些公共計(jì)算由DPU提前處理完成，在這個(gè)集群中，CPU和CPU通訊減少了很多開銷，達(dá)到了降低延遲的效果?；蛘叻催^(guò)來(lái)說(shuō)，就是不需要強(qiáng)大的CPU了。這樣可以極大降低8路互聯(lián)集群的CPU成本，同時(shí)增強(qiáng)網(wǎng)絡(luò)數(shù)據(jù)處理能力。在云計(jì)算領(lǐng)域具備非常明顯的競(jìng)爭(zhēng)優(yōu)勢(shì)。所以成為當(dāng)前技術(shù)發(fā)展最熱門的方向。

04 DPU到底是什么？

目前DPU是沒(méi)有一個(gè)明確的定義的。雖然大家都強(qiáng)調(diào)以數(shù)據(jù)處理為主，但實(shí)際上做的都是Smart NIC的事情。同時(shí)明顯Fungbile的出發(fā)是以網(wǎng)絡(luò)架構(gòu)為中心，以網(wǎng)絡(luò)安全為手段的技術(shù)路線，本質(zhì)上是一個(gè)L4（協(xié)議層）的公司在試圖解決L2/L3（Fabric和路由）的問(wèn)題，而Nvidia是以設(shè)備為中心，以GPU數(shù)據(jù)加速為手段，本質(zhì)上是一個(gè)L1（設(shè)備層）的公司在解決L2/L3（Fabric和路由）的問(wèn)題，兩個(gè)公司的技術(shù)背景和技術(shù)路線也存在明顯的差別。其他公司就只能算是一個(gè)Smart NIC公司了，打著DPU的旗號(hào)干加速的事情。

05?DPU的未來(lái)

雖然Fungible和Nvidia都意識(shí)到了DPU的重要性，時(shí)間上具備領(lǐng)先優(yōu)勢(shì)，也做出了新架構(gòu)的解決方案。但I(xiàn)ntel發(fā)布的IPU進(jìn)一步強(qiáng)調(diào)了在基礎(chǔ)架構(gòu)上數(shù)據(jù)芯片的重要性，干脆把IaaS模塊全部下沉到了DPU上，將這個(gè)DPU重新命名為IPU。雖然Intel目前還沒(méi)有明確表明自己IPU的架構(gòu)，但可以預(yù)見Intel將整合網(wǎng)絡(luò)、軟件平臺(tái)、總線技術(shù)的技術(shù)力量。

雖然目前DPU/IPU的定義沒(méi)有標(biāo)準(zhǔn)，但數(shù)據(jù)芯片作為未來(lái)計(jì)算架構(gòu)的支撐已經(jīng)成為必然趨勢(shì)。

來(lái)源：全棧云技術(shù)架構(gòu)

下載鏈接：

中國(guó)數(shù)據(jù)處理器行業(yè)概覽（2021）

DPU在數(shù)據(jù)中心和邊緣云上的應(yīng)用

英偉達(dá)DPU集數(shù)據(jù)中心于芯片

轉(zhuǎn)載申明：轉(zhuǎn)載本號(hào)文章請(qǐng)注明作者和來(lái)源，本號(hào)發(fā)布文章若存在版權(quán)等問(wèn)題，請(qǐng)留言聯(lián)系處理，謝謝。

推薦閱讀

更多架構(gòu)相關(guān)技術(shù)知識(shí)總結(jié)請(qǐng)參考“架構(gòu)師全店鋪技術(shù)資料打包”相關(guān)電子書(37本技術(shù)資料打包匯總詳情可通過(guò)“閱讀原文”獲取)。

全店內(nèi)容持續(xù)更新，現(xiàn)下單“全店鋪技術(shù)資料打包(全)”，后續(xù)可享全店內(nèi)容更新“免費(fèi)”贈(zèng)閱，價(jià)格僅收198元(原總價(jià)350元)。

溫馨提示：

掃描二維碼關(guān)注公眾號(hào)，點(diǎn)擊閱讀原文鏈接獲取“架構(gòu)師技術(shù)全店資料打包匯總(全)”電子書資料詳情。

DPU崛起，詳談?dòng)?jì)算體系變革