<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          淺談DPU產(chǎn)業(yè)發(fā)展現(xiàn)狀

          共 3540字,需瀏覽 8分鐘

           ·

          2022-02-20 23:14



          我們生活在一個每天都會產(chǎn)生大量數(shù)據(jù)的數(shù)字信息時代。隨著物聯(lián)網(wǎng)設(shè)備、自動駕駛汽車、聯(lián)網(wǎng)家庭和聯(lián)網(wǎng)工作場所數(shù)量的不斷增加,數(shù)據(jù)中心的數(shù)據(jù)愈加趨向飽和。因此,需要一種解決方案,使數(shù)據(jù)中心能夠處理不斷增加的進出和通過數(shù)據(jù)中心傳輸?shù)臄?shù)據(jù)量。


          下載地址:

          專用數(shù)據(jù)處理器 (DPU)技術(shù)白皮書

          2021中國DPU行業(yè)發(fā)展白皮書


          數(shù)據(jù)處理單元,通常稱為DPU,是一種新型可編程的高性能處理器,優(yōu)化執(zhí)行和加速由數(shù)據(jù)中心服務(wù)器執(zhí)行的網(wǎng)絡(luò)和存儲功能。DPU 就像 GPU 一樣插在服務(wù)器的 PCIe 插槽上,它們允許服務(wù)器將網(wǎng)絡(luò)和存儲功能從 CPU 卸載到DPU上?,從而使 CPU 專注于運行操作系統(tǒng)和系統(tǒng)應(yīng)用程序。DPU 通常使用可重新編程的 FPGA 與網(wǎng)卡相結(jié)合來加速網(wǎng)絡(luò)流量。

          ?

          DPU是由三個主要元件組成的片上系統(tǒng)。首先,數(shù)據(jù)處理單元通常有一個軟件可編程的多核 CPU 。第二個元件是高性能網(wǎng)絡(luò)接口,它使 DPU 能夠解析、處理并在網(wǎng)絡(luò)中有效地傳輸數(shù)據(jù)。第三個元件是一組豐富的靈活、可編程的加速引擎,它將網(wǎng)絡(luò)和存儲功能從 CPU 卸載到 DPU。

          ?

          此外,DPU 可用于處理包括網(wǎng)絡(luò)安全、防火墻任務(wù)、加密和基礎(chǔ)設(shè)施管理在內(nèi)的功能。

          ?

          DPU 最常見的特性是什么?

          DPU 具有很多功能,以下是最常見的功能:

          1)通過一個或多個 100 Gigabit 到 200 Gigabit 接口的高速連接 ?

          2)高速數(shù)據(jù)包處理

          3)基于 ARM 或 MIPS 的 CPU多核處理處理器(8個64位Arm CPU內(nèi)核)

          4)支持 DDR4和DDR5 RAM的內(nèi)存控制器

          5)加速器

          6)PCI Express Gen 4 支持

          7)安全功能

          8)自定義操作系統(tǒng)與主機系統(tǒng)的操作系統(tǒng)分離

          常見的 DPU 解決方案有哪些?


          2021年4月,英偉達發(fā)布了新一代數(shù)據(jù)處理器BlueField-3 DPU。BlueField-3是首款為AI和加速計算而設(shè)計的DPU,相比上一代產(chǎn)品,它具有10倍加速計算能力、16個Arm A78 CPU核,和4倍的加密速度。BlueField-3利用英偉達 DOCA(集數(shù)據(jù)中心于芯片的架構(gòu))軟件開發(fā)包的優(yōu)勢,為開發(fā)者提供一個完整、開放的軟件平臺,開發(fā)在BlueField DPU上開發(fā)軟件定義和硬件加速的網(wǎng)絡(luò)、存儲、安全和管理等應(yīng)用。BlueField-3預(yù)計將于2022年第一季度發(fā)布樣品。
          ?

          賽靈思和英特爾的一些產(chǎn)品被稱為SmartNIC ,利用FPGA 來加速網(wǎng)絡(luò)和存儲功能。智能網(wǎng)卡的工作原理與數(shù)據(jù)處理單元相同,它們將網(wǎng)絡(luò)功能從CPU 卸載到 SmartNIC,通過將網(wǎng)絡(luò)和存儲功能智能地委托給 SmartNIC ,從而釋放處理能力。FPGA 的可重新編程特性,為數(shù)據(jù)路徑帶來了并行性和定制化。?
          ?
          例如,賽靈思提供帶各種產(chǎn)品的 ALVEO 系列SmartNIC,英特爾及其合作伙伴提供了多種基于 FPGA 的 SmartNIC 解決方案,以加速大型數(shù)據(jù)中心的數(shù)據(jù)處理工作負(fù)載。英特爾稱其 SmartNIC“通過將交換、存儲和安全功能卸載到集成了英特爾 FPGA 和英特爾至強處理器的單一 PCIe 平臺上來提高數(shù)據(jù)中心的性能水平。” 英特爾提供了第二個更新的 SmartNIC解決方案,稱為 Silicom FPGA SmartNIC N5010,它結(jié)合了英特爾 Stratix 10 FPGA 和英特爾以太網(wǎng) 800 系列適配器,為組織提供 4個100 Gigabit 以太網(wǎng)端口,為數(shù)據(jù)中心提供充足的帶寬。
          ?
          Fungible是一家位于加利福尼亞的組合式系統(tǒng)初創(chuàng)公司。該公司聲稱其技術(shù)能為每100美元的數(shù)據(jù)中心網(wǎng)絡(luò)中的網(wǎng)絡(luò)、計算和存儲資源節(jié)省67美元。針對以數(shù)據(jù)為中心(data-centric)應(yīng)用的處理,F(xiàn)ungible研發(fā)了F1 DPU處理器和TrueFabric互聯(lián)技術(shù)。TrueFabric是由Fungible首先提出的新型大規(guī)模數(shù)據(jù)中心網(wǎng)絡(luò)互聯(lián)標(biāo)準(zhǔn),這種Fabric互聯(lián)協(xié)議基于標(biāo)準(zhǔn)的UDP/IP/Ethernet協(xié)議棧構(gòu)建。
          Fungible F1 DPU 外殼
          ?
          RoCEv2是一種當(dāng)前數(shù)據(jù)中心網(wǎng)絡(luò)中主流的互聯(lián)網(wǎng)絡(luò)協(xié)議,該協(xié)議同樣基于UDP/IP/Ethernet搭建,對終端提供高性能的RDMA Read/Write服務(wù),而TrueFabric對接入點提供高性能的Send/Receive服務(wù)。Fungible F1 DPU原生支持TrueFabric,因此F1 DPU可以用于大規(guī)模TrueFabric數(shù)據(jù)中心網(wǎng)絡(luò),不同類型的服務(wù)器都可以將Fungible DPU作為網(wǎng)絡(luò)接入點。
          ?

          還有哪些其他性能加速器?


          下面是數(shù)據(jù)中心中經(jīng)常使用的一些性能加速器,包括 GPU、CSD和 FPGA。

          1. GPU

          GPU通常部署在數(shù)據(jù)中心的高性能服務(wù)器上,以加速工作負(fù)載。服務(wù)器通常會將復(fù)雜的數(shù)學(xué)計算卸載到 GPU。因為GPU 采用了一種并行架構(gòu),該架構(gòu)由許多比 CPU 更小的內(nèi)核組成,使它們能夠并行處理許多任務(wù),從而使組織能夠從服務(wù)器中提取更多性能。
          ?
          來源:英偉達
          ?
          例如,CPU平均有四到十個核心,而 GPU 有數(shù)百或數(shù)千個較小的核心,它們一起運行以并行處理復(fù)雜的計算。CPU更適合順序數(shù)據(jù)處理。
          ?
          安裝在數(shù)據(jù)中心服務(wù)器上的 GPU 非常適合加速深度學(xué)習(xí)訓(xùn)練和機器學(xué)習(xí)訓(xùn)練,這些訓(xùn)練需要大量的計算能力,而CPU無法提供。組織使用 GPU 來訓(xùn)練深度學(xué)習(xí)和機器學(xué)習(xí)模型,數(shù)據(jù)集越大,神經(jīng)網(wǎng)絡(luò)越大,復(fù)雜的計算需要很長時間。在某些情況下,深度學(xué)習(xí)訓(xùn)練需要幾個小時,但若使用 CPU 執(zhí)行相同的任務(wù)可能需要幾天到幾周的時間。??
          ?
          此外,將GPU 添加到數(shù)據(jù)中心服務(wù)器可顯著提高數(shù)據(jù)吞吐量,并提供以盡可能低的延遲處理和分析數(shù)據(jù)的能力。(延遲是指完成給定任務(wù)所需的時間量,數(shù)據(jù)吞吐量是指單位時間內(nèi)完成的任務(wù)數(shù)。)

          2.計算存儲驅(qū)動器(CSD)

          計算存儲已經(jīng)作為性能加速器進入數(shù)據(jù)中心,在存儲設(shè)備級別處理數(shù)據(jù),減少了CPU 和存儲設(shè)備之間的數(shù)據(jù)傳輸。計算存儲支持實時數(shù)據(jù)分析,并通過減少輸入/輸出瓶頸來提高系統(tǒng)性能。CSD看起來與常規(guī)存儲驅(qū)動器相同,但它們包含一個多核處理器,用于執(zhí)行一些功能,例如在數(shù)據(jù)進入存儲設(shè)備時對數(shù)據(jù)進行索引,并在存儲設(shè)備中搜索特定條目。?
          ?
          來源:AnandTech
          ?
          由于實時處理和分析數(shù)據(jù)的需求不斷增長,CSD越來越受歡迎。數(shù)據(jù)不再需要在存儲設(shè)備和 CPU 之間傳輸。相反,數(shù)據(jù)在存儲設(shè)備本身上進行處理,在數(shù)據(jù)所在的確切位置為存儲介質(zhì)提供計算能力,從而實現(xiàn)實時分析和決策。?
          ?
          3. FPGA

          FPGA是一種集成電路,由邏輯塊、I/O單元和其他資源組成,允許用戶根據(jù)需要執(zhí)行的工作負(fù)載的特定要求以不同的方式重新編程和重新配置芯片。FPGA在執(zhí)行深度學(xué)習(xí)推理處理和機器學(xué)習(xí)推理方面也越來越受歡迎。
          ?
          來源:Xilinx
          ?
          在英偉達的帶領(lǐng)下,DPU的概念非常火爆。總體而言,由于數(shù)據(jù)中心中存儲的數(shù)據(jù)量不斷增加,需要一種能夠加速高性能數(shù)據(jù)中心服務(wù)器執(zhí)行的存儲和網(wǎng)絡(luò)功能的解決方案,而DPU 可以為現(xiàn)有服務(wù)器注入新的活力,發(fā)展市場非常巨大,預(yù)測到2025年僅中國市場就能達到每年40億美元的規(guī)模,估計全球?qū)⒊^120億美元。
          ?
          原文鏈接:
          https://premioinc.com/blogs/blog/what-is-a-dpu-data-processing-unit

          下載地址:

          專用數(shù)據(jù)處理器 (DPU)技術(shù)白皮書

          中國數(shù)據(jù)處理器行業(yè)概覽(2021)


          DPU在數(shù)據(jù)中心和邊緣云上的應(yīng)用

          英偉達DPU集數(shù)據(jù)中心于芯片

          2021中國DPU行業(yè)發(fā)展白皮書?

          CCIX緩存一致性互聯(lián)技術(shù)概述

          ARM CPU處理器資料匯總(1)

          ARM CPU處理器資料匯總(2)

          ARM系列處理器應(yīng)用技術(shù)完全手冊

          CPU和GPU研究框架合集


          本號資料全部上傳至知識星球,更多內(nèi)容請登錄智能計算芯知識(知識星球)星球下載全部資料




          免責(zé)申明:本號聚焦相關(guān)技術(shù)分享,內(nèi)容觀點不代表本號立場,可追溯內(nèi)容均注明來源,發(fā)布文章若存在版權(quán)等問題,請留言聯(lián)系刪除,謝謝。



          電子書<服務(wù)器基礎(chǔ)知識全解(終極版)>更新完畢,知識點深度講解,提供182頁完整版下載。

          獲取方式:點擊“閱讀原文”即可查看PPT可編輯版本和PDF閱讀版本詳情。



          溫馨提示:

          請搜索“AI_Architect”或“掃碼”關(guān)注公眾號實時掌握深度技術(shù)分享,點擊“閱讀原文”獲取更多原創(chuàng)技術(shù)干貨。


          瀏覽 57
          點贊
          評論
          收藏
          分享

          手機掃一掃分享

          分享
          舉報
          評論
          圖片
          表情
          推薦
          點贊
          評論
          收藏
          分享

          手機掃一掃分享

          分享
          舉報
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  婷婷五月先锋 | 综合se| 国产成人摸屄操屄熟 | 久久网站又改成什么 | 国产免费一区二区在线A片视频 |