DPU產(chǎn)業(yè)現(xiàn)狀與競爭格局


DPU的典型應(yīng)用場景包括:數(shù)據(jù)中心和云計算,網(wǎng)絡(luò)安全,高性能計算及AI,通信及邊緣計算,數(shù)據(jù)存儲,流媒體等。
本內(nèi)容來自《2021中國DPU行業(yè)發(fā)展白皮書》。
內(nèi)容共分4章:包括智能網(wǎng)卡的簡介及趨勢分析、DPU的簡介及分析、DPU產(chǎn)業(yè)分析及NVIDIA的DPU前景展望等。
下載鏈接:
1)在數(shù)據(jù)中心和云計算應(yīng)用中,DPU可廣泛應(yīng)用在物理機、虛擬化、容器化、私有云、公共云、混合云等各個方面。如OVS等Hypervisor、各種容器框架可以運行在DPU上,實現(xiàn)控制平面和業(yè)務(wù)的分離,保障業(yè)務(wù)安全性;如DPU為SDN和虛擬化應(yīng)用提供硬件加速,大規(guī)模數(shù)據(jù)中心中,將本在CPU上運行的通信和虛擬化操作卸載到DPU上,為用戶提供應(yīng)用加速即服務(wù)的附加價值。
2)在網(wǎng)絡(luò)安全中,DPU可應(yīng)用在分布式安全、下一代防火墻技術(shù)(NGFW)、微分段技術(shù)等方面。如DPU可以將一些安全相關(guān)的業(yè)務(wù)操作從CPU卸載到網(wǎng)卡,如數(shù)據(jù)的加密/解密(如IPSec、TLS等)操作、深度包檢測(DPI)等,大幅提升應(yīng)用的性能,降低CPU負載,并且支持靈活的網(wǎng)絡(luò)可編程性。
3)在高性能計算及AI中,DPU可應(yīng)用在云原生超級計算,深度學(xué)習(xí)推薦系統(tǒng)加速等方面。如DPU和配合NIVDIA Merlin處理深度學(xué)習(xí)推薦系統(tǒng)加速任務(wù),極大的提升產(chǎn)品數(shù)據(jù)處理與運行效率,幫助用戶實現(xiàn)更為快速的產(chǎn)品開發(fā)和迭代。
4)在通信及邊緣計算中,DPU可應(yīng)用在電信云、邊緣計算等方面。
5)在數(shù)據(jù)存儲中,DPU可應(yīng)用在超融合架構(gòu)(HCI)、彈性塊存儲、實例存儲等方面。
6)在流媒體中,DPU可應(yīng)用在視覺高品質(zhì),8K視頻,內(nèi)容分發(fā)網(wǎng)絡(luò)(CDN)等方面。
目前DPU市場仍處于藍海,呈現(xiàn)百家爭鳴的競爭格局。Intel、NVIDIA等企業(yè)紛紛布局DPU產(chǎn)業(yè),同時包括AWS、阿里巴巴、華為在內(nèi)的各大云服務(wù)商,都已經(jīng)在布局自己的云端處理器,行業(yè)競爭格局分析如下:


DPU方案類型大致可以概括為三種:
一是以通用眾核處理器為基礎(chǔ)DPU,例如Broadcom的Stingray架構(gòu),以多核ARM為核心,以眾取勝,可編程靈活性較好,但是應(yīng)用針對性不夠,對于特殊算法和應(yīng)用的支持,與通用CPU相比并無太顯著優(yōu)勢;
二是以專用核為基礎(chǔ)的異構(gòu)核陣列,這種架構(gòu)的特點是針對性較強、性能較好,但是犧牲了部分靈活性,如IPU;
第三種路線是結(jié)合了前面二者優(yōu)勢,即將通用處理器的可編程靈活性與專用的加速引擎相結(jié)合,正在成為最新的產(chǎn)品趨勢,以NVIDIA的BlueField-3系列DPU來看,就包括16個ARM核及多個專用加速引擎,F(xiàn)ungible的DPU則包含6大類的專用核,和52個MIPS小型通用核。
隨著DPU將數(shù)據(jù)中心的基礎(chǔ)設(shè)施操作從CPU上卸載過來,數(shù)據(jù)中心將形成DPU、GPU、CPU三位一體的狀態(tài);NVIDIA通過收購Mellanox積極布局DPU,搶占市場,憑借在GPU的絕對優(yōu)勢以及未來DPU的發(fā)力,NVIDIA有望在服務(wù)器處理器三大芯片中占據(jù)其二。對各廠商及現(xiàn)有產(chǎn)品分別綜述如下:
在技術(shù)路線上,英偉達DPU基于所收購的Mellanox網(wǎng)絡(luò)方案及ARM架構(gòu)實現(xiàn),側(cè)重于數(shù)據(jù)安全、網(wǎng)絡(luò)、存儲卸載。
在2021年6月15日的Six Five峰會上,英特爾推出了全新的基礎(chǔ)設(shè)施處理器(IPU,全稱Infrastructure Processing Unit)。IPU是一個網(wǎng)絡(luò)設(shè)備,可以安全地加速和管理數(shù)據(jù)中心的基礎(chǔ)設(shè)施功能與可編程硬件,旨在使云和通信服務(wù)提供商減少在中央處理器方面的開銷,并充分釋放性能價值。利用IPU,客戶能夠部署安全穩(wěn)定且可編程的解決方案,從而更好地利用資源,平衡數(shù)據(jù)處理與存儲的工作負載。IPU可將CPU或xPU連接到網(wǎng)絡(luò),加速主機基礎(chǔ)設(shè)施功能,并適用于現(xiàn)有和新興基礎(chǔ)設(shè)施用例,包括安全性、虛擬化、存儲、負載平衡,以及虛擬網(wǎng)絡(luò)功能和微服務(wù)的數(shù)據(jù)路徑優(yōu)化。IPU增強了基礎(chǔ)NIC中豐富的以太網(wǎng)網(wǎng)絡(luò)功能,通過高度優(yōu)化的硬件加速器和緊密耦合的計算引擎的組合處理任務(wù)來實現(xiàn)加速。適應(yīng)性是通過標準且易于使用的編程框架實現(xiàn)的,該框架結(jié)合了硬件和軟件功能。IPU擴展了英特爾的智能網(wǎng)卡功能,旨在應(yīng)對當下復(fù)雜的數(shù)據(jù)中心,并提升效率。
憑借在數(shù)據(jù)中心領(lǐng)域多年的耕耘與積淀,深諳數(shù)據(jù)中心企業(yè)需求并洞察行業(yè)發(fā)展的英特爾,IPU產(chǎn)品從設(shè)計、生產(chǎn)到推出,每一步都能看到合作伙伴的身影。當前基于Intel FPGA的IPU已經(jīng)導(dǎo)入多個云端服務(wù)商,目前也著手測試第一款采用ASIC的IPU產(chǎn)品;
Intel也強調(diào)接下來將會推出更多基于FPGA的IPU與專用ASIC,為新世代資料中心帶來更具彈性、安全與效率的XPU架構(gòu)。在適用于企業(yè)和云的IPU陣營,使用英特爾FPGA實現(xiàn)數(shù)據(jù)中心加速面向云服務(wù)提供商的采用英特爾FPGA的IPU有助于充分利用網(wǎng)絡(luò)功能并幫助提高基礎(chǔ)設(shè)施投資的收入;英特爾IPU為VMware下一代基礎(chǔ)架構(gòu)提供動力英特爾技術(shù)使VMware能夠為客戶提供對虛擬機、容器和裸機環(huán)境的統(tǒng)一管理;Monterey項目則重新定義混合云架構(gòu),英特爾IPU創(chuàng)新為邊緣節(jié)點、網(wǎng)絡(luò)基礎(chǔ)設(shè)施和數(shù)據(jù)中心計算提供了更高的性能。
Xilinx的開發(fā)是基于FPGA的Smart NIC,Xilinx于2019年秋季收購了Solarflare Communications,Solarflare自2012年以來一直在構(gòu)建基于ASIC和FPGA的NIC進行電子交易。
Xilinx的Alveo U25將雙SFP28端口直接連接到Zynq系列芯片,包括6GB DDR4內(nèi)存,Zynq的FPGA和ARM內(nèi)核可通過該芯片上運行的程序?qū)ζ溥M行訪問。FPGA有520K邏輯元件可用,但是提供的四核ARM可以彌補可用門數(shù)的減少。Xilinx將Alveo U25推向市場,最初是針對那些要求開放虛擬交換機(OvS)卸載功能的客戶。其將增加IPsec、機器學(xué)習(xí)(ML)、深度包檢查(DPI)、視頻轉(zhuǎn)碼和分析等功能的卸載。
Marvell最新推出的OCTEON 10系列DPU采用了臺積電5nm制程工藝,且首次用上了ARM的Neoverse N2 CPU內(nèi)核。這種類型的多功能芯片,旨在幫助移動和處理那些通過網(wǎng)絡(luò)傳輸?shù)臄?shù)據(jù),可實現(xiàn)集成機器學(xué)習(xí)推理的引擎、Inline加密處理引擎、以及矢量數(shù)據(jù)包處理器等的虛擬化。OCTEON 10也是Marvell首款采用臺積電N5P工藝制造的DPU芯片。其不僅率先集成了ARM的Neoverse N2 CPU核心,還支持最新的PCIe 5.0 I/O與DDR5內(nèi)存。

受益于最新的ARM處理器內(nèi)核,OCTEON 10在整型處理上是目前算力最高的DPU,然而其浮點運算僅支持FP16,在做內(nèi)聯(lián)機器學(xué)習(xí)時有一定局限性。OCTEON 10 新系列引入了矢量數(shù)據(jù)包處理引擎(VPP),與當前一代的標量處理引擎相比,它能夠?qū)?shù)據(jù)包的處理吞吐量,大幅提升至 5 倍。
中科馭數(shù)的創(chuàng)始團隊主要來自中科院計算所計算機體系結(jié)構(gòu)國家重點實驗室,是中國最早進行DPU芯片研發(fā)的團隊之一。中科馭數(shù)提出了軟件定義加速器技術(shù)(Software Defined Accelerator),自主研發(fā)了KPU(Kernel Processing Unit)芯片架構(gòu),并于2019年設(shè)計出業(yè)界首顆數(shù)據(jù)庫與時序數(shù)據(jù)處理融合加速芯片,已經(jīng)成功流片。中科馭數(shù)的DPU芯片,正是基于自研的KPU芯片架構(gòu),具有網(wǎng)絡(luò)協(xié)議處理、數(shù)據(jù)庫和大數(shù)據(jù)處理加速、存儲運算、安全加密運算等核心功能。
DPU發(fā)展仍在早期,強調(diào)落地和生態(tài)打造。數(shù)據(jù)中心核心算力芯片仍以CPU、GPU、FPGA和少量ASIC為主,并且通用CPU還是占據(jù)絕對統(tǒng)治地位。和CPU、GPU一樣,DPU作為基礎(chǔ)層的應(yīng)用支撐,發(fā)展的關(guān)鍵是必須重視生態(tài)建設(shè)和應(yīng)用支撐,落地并搶占市場、營造生態(tài)才是DPU產(chǎn)業(yè)發(fā)展的關(guān)鍵所在。
Intel、Marvell、NVIDIA成為最有潛力的產(chǎn)業(yè)先驅(qū)。大多數(shù)DPU方案是從基本的網(wǎng)絡(luò)控制器開始擴展至SoC。就Intel而言,其產(chǎn)品采取處理器配合FPGA,外加加速引擎的方式;Marvell則采取使用最新處理器內(nèi)核配合加速引擎的方式;NVIDIA則采用了處理器配合ASIC,外加加速引擎的方式。這三種方式代表著DPU產(chǎn)業(yè)的未來主流的發(fā)展方向。
(2)中國DPU產(chǎn)業(yè)發(fā)展現(xiàn)狀
中國DPU產(chǎn)業(yè)處于起步階段,自DPU概念出現(xiàn)以來,已有多家國內(nèi)公司進入該領(lǐng)域。
從中國國內(nèi)市場需求側(cè)來看,中國擁有世界最強的互聯(lián)網(wǎng)產(chǎn)業(yè)、規(guī)模最大的網(wǎng)民和線上生態(tài),正是因為數(shù)據(jù)的大爆發(fā),推動了對算力的需求,同時,中國愈加重視網(wǎng)絡(luò)安全,DPU在確保網(wǎng)絡(luò)安全方向有得天獨厚的優(yōu)勢,從數(shù)據(jù)安全到數(shù)據(jù)中心安全皆全方面覆蓋,從而具備較好的發(fā)展?jié)摿Γ@是DPU發(fā)展的前提。DPU將致力于解決“網(wǎng)絡(luò)協(xié)議處理、數(shù)據(jù)安全、算法加速”等問題,而這些問題有著“CPU做不好,GPU做不了”的特點。數(shù)據(jù)中心與云計算領(lǐng)域是中國DPU最大的應(yīng)用市場,DPU可為終端政企用戶提供較為成熟的安全的軟件定義及硬件加速解決方案。

得益于智能網(wǎng)卡方案的逐步成熟,疊加全球通用服務(wù)器出貨量的穩(wěn)定增長、L3以上級別智能駕駛汽車的技術(shù)落地、工業(yè)控制領(lǐng)域的需求增加、邊緣計算技術(shù)和物聯(lián)網(wǎng)技術(shù)的迅速發(fā)展,全球DPU產(chǎn)業(yè)市場規(guī)模呈現(xiàn)逐年增長的趨勢,并隨著Intel、NVIDIA等廠商的DPU大規(guī)模量產(chǎn),預(yù)計DPU市場將在2023-2024年迎來爆發(fā)式增長。2020年全球DPU產(chǎn)業(yè)市場規(guī)模達30.5億美元,預(yù)計到2025年全球DPU產(chǎn)業(yè)市場規(guī)模將超過245.3億美元。

得益于數(shù)據(jù)中心升級和邊緣計算、新能源汽車、IoT、工業(yè)物聯(lián)網(wǎng)等產(chǎn)業(yè)的發(fā)展所帶來的需求增長,中國DPU產(chǎn)業(yè)市場規(guī)模呈現(xiàn)逐年增長的趨勢,預(yù)計中國DPU市場將在2022-2023年迎來爆發(fā)式增長,并在2024-2025年保持平穩(wěn)。2020年中國DPU產(chǎn)業(yè)市場規(guī)模達3.9億元,預(yù)計到2025年中國DPU產(chǎn)業(yè)市場規(guī)模將超過565.9億元。
更多DPU行業(yè)分析,請參閱白皮書《2021中國DPU行業(yè)發(fā)展白皮書》。本白皮書內(nèi)容共分4章內(nèi)容,包括智能網(wǎng)卡的簡介及趨勢分析、DPU的簡介及分析、DPU產(chǎn)業(yè)分析及NVIDIA的DPU前景展望等。
下載鏈接:
2、信創(chuàng)產(chǎn)業(yè)研究框架
3、ARM行業(yè)研究框架
4、CPU研究框架
5、國產(chǎn)CPU研究框架
6、行業(yè)深度報告:GPU研究框架
2021年信創(chuàng)產(chǎn)業(yè)發(fā)展報告
信創(chuàng)產(chǎn)業(yè)系列專題(總篇)
中國信創(chuàng)產(chǎn)業(yè)發(fā)展白皮書(2021)
本號資料全部上傳至知識星球,更多內(nèi)容請登錄智能計算芯知識(知識星球)星球下載全部資料。

免責(zé)申明:本號聚焦相關(guān)技術(shù)分享,內(nèi)容觀點不代表本號立場,可追溯內(nèi)容均注明來源,發(fā)布文章若存在版權(quán)等問題,請留言聯(lián)系刪除,謝謝。
電子書<服務(wù)器基礎(chǔ)知識全解(終極版)>更新完畢,知識點深度講解,提供182頁完整版下載。
獲取方式:點擊“閱讀原文”即可查看PPT可編輯版本和PDF閱讀版本詳情。
溫馨提示:
請搜索“AI_Architect”或“掃碼”關(guān)注公眾號實時掌握深度技術(shù)分享,點擊“閱讀原文”獲取更多原創(chuàng)技術(shù)干貨。

