<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          AI智算網(wǎng)絡(luò)兩大主流架構(gòu)及差異分析

          共 3982字,需瀏覽 8分鐘

           ·

          2024-06-21 07:44


          在深入探究 AI 智算網(wǎng)絡(luò)的領(lǐng)域時(shí),我們發(fā)現(xiàn)市場(chǎng)中主要存在兩大主流架構(gòu):InfiniBand 和RoCEv2。
          更多內(nèi)容參考:智算中心網(wǎng)絡(luò)架構(gòu)設(shè)計(jì)實(shí)踐(2023)”、“英偉達(dá)InfiniBand:面向AIGC的技術(shù)優(yōu)勢(shì)分析”、“InfiniBand與RoCE對(duì)比分析:AI數(shù)據(jù)中心網(wǎng)絡(luò)選擇指南”、“關(guān)于InfiniBand的技術(shù)問(wèn)答”。
          這兩種網(wǎng)絡(luò)架構(gòu)在性能、成本、通用性等多個(gè)關(guān)鍵維度上展現(xiàn)出各自的優(yōu)勢(shì),相互競(jìng)爭(zhēng)。我們將細(xì)致分析這兩種架構(gòu)的技術(shù)特性、它們?cè)?AI 智算網(wǎng)絡(luò)中的應(yīng)用場(chǎng)景,以及各自的優(yōu)勢(shì)和局限性。
          本文旨在評(píng)估InfiniBand 和 RoCEv2 在AI 智算網(wǎng)絡(luò)中的潛在應(yīng)用價(jià)值和未來(lái)的發(fā)展方向,以期為行業(yè)提供深刻的洞察和專業(yè)的指導(dǎo)。
          1 InfiniBand 網(wǎng)絡(luò)架構(gòu)
          InfiniBand 網(wǎng)絡(luò)主要通過(guò)子網(wǎng)管理器(Subnet Manager,簡(jiǎn)稱 SM)來(lái)進(jìn)行集中管理,SM通常部署在一臺(tái)接入子網(wǎng)的服務(wù)器上,充當(dāng)網(wǎng)絡(luò)的中樞控制器。子網(wǎng)中可能存在多個(gè)配置為SM 的設(shè)備,但僅有一個(gè)被指定為主 SM,負(fù)責(zé)通過(guò)管理數(shù)據(jù)報(bào)文(MAD)的內(nèi)部下發(fā)和上傳來(lái)管理所有交換機(jī)和網(wǎng)卡。每個(gè)網(wǎng)卡端口和交換芯片都通過(guò)由 SM 分配的唯一身份標(biāo)識(shí)(Local ID,LID)進(jìn)行識(shí)別,確保網(wǎng)絡(luò)內(nèi)設(shè)備的唯一性和準(zhǔn)確性。SM 的核心職責(zé)包括維護(hù)網(wǎng)絡(luò)的路由信息和計(jì)算更新交換芯片的路由表。網(wǎng)卡內(nèi)部的 SM Agent(SMA)功能使得網(wǎng)卡能夠獨(dú)立處理 SM 下發(fā)的報(bào)文,無(wú)需所在服務(wù)器的干預(yù),而提高了網(wǎng)絡(luò)的自動(dòng)化和效率。
          1.1 InfiniBand 網(wǎng)絡(luò)流控機(jī)制
          InfiniBand 網(wǎng)絡(luò)基于信用令牌(credit)機(jī)制,在每條鏈路都配備了一個(gè)預(yù)置緩沖區(qū)。發(fā)送端僅在確認(rèn)接收端有足夠的緩沖區(qū)后,才會(huì)啟動(dòng)數(shù)據(jù)發(fā)送,并且發(fā)送的數(shù)據(jù)量都不可超過(guò)接收端當(dāng)前可用的預(yù)置緩沖區(qū)的最大容量。當(dāng)接收端接收完報(bào)文,會(huì)釋放緩沖區(qū),并向發(fā)送端通報(bào)當(dāng)前可用的預(yù)置緩沖區(qū)大小,從而維持了網(wǎng)絡(luò)的流暢運(yùn)行和數(shù)據(jù)傳輸?shù)倪B續(xù)性。
          1.2 InfiniBand 網(wǎng)絡(luò)特點(diǎn):鏈路級(jí)流控與自適應(yīng)路由
          InfiniBand 網(wǎng)絡(luò)依靠鏈路級(jí)的流控機(jī)制,防止發(fā)送過(guò)量數(shù)據(jù),從而避免了緩沖區(qū)溢出或是數(shù)據(jù)丟包的問(wèn)題。同時(shí) InfiniBand 網(wǎng)絡(luò)的自適應(yīng)路由技術(shù)可根據(jù)每個(gè)數(shù)據(jù)包的具體情況進(jìn)行動(dòng)態(tài)路由選擇,在超大規(guī)模的網(wǎng)絡(luò)環(huán)境中實(shí)現(xiàn)了網(wǎng)絡(luò)資源的實(shí)時(shí)優(yōu)化和最佳負(fù)載均衡利用。
          2 RoCEv2 網(wǎng)絡(luò)架構(gòu)
          RoCE(RDMA over Converged Ethernet)協(xié)議是一種能在以太網(wǎng)上進(jìn)行 RDMA(Remote Direct Memory Access 遠(yuǎn)程內(nèi)存直接訪問(wèn))的集群網(wǎng)絡(luò)通信協(xié)議。該協(xié)議有兩個(gè)主要版本:RoCEv1 和RoCEv2。RoCEv1 作為鏈路層協(xié)議,要求通信雙方位于同一二層網(wǎng)絡(luò)內(nèi)。而RoCEv2 則為網(wǎng)絡(luò)層協(xié)議,它采用以太網(wǎng)網(wǎng)絡(luò)層和 UDP 傳輸層,取代了 InfiniBand 的網(wǎng)絡(luò)層,從而提供了更優(yōu)的可擴(kuò)展性。與 InfiniBand 網(wǎng)絡(luò)的集中管理方式不同,RoCEv2 采用的是純分布式架構(gòu),通常由兩層構(gòu)成,在擴(kuò)展性和部署靈活性方面具有顯著優(yōu)勢(shì)。
          2.1 RoCEv2 網(wǎng)絡(luò)流控機(jī)制
          優(yōu)先流控制(PFC)是一種逐跳流控策略,通過(guò)合理配置水位標(biāo)記來(lái)充分利用交換機(jī)的緩存,以實(shí)現(xiàn)以太網(wǎng)絡(luò)中的無(wú)丟包傳輸。當(dāng)下游交換機(jī)端口的緩存過(guò)載時(shí),該交換機(jī)就會(huì)向上游設(shè)備請(qǐng)求停止傳輸。已發(fā)送的數(shù)據(jù)則會(huì)存儲(chǔ)在下游交換機(jī)的緩存中,等到緩存恢復(fù)正常,端口將會(huì)請(qǐng)求恢復(fù)數(shù)據(jù)包的發(fā)送,從而維持網(wǎng)絡(luò)的流暢運(yùn)行。
          顯式擁塞通知(ECN)定義了一種基于 IP 層和傳輸層的流量控制和端到端擁塞通知機(jī)制。通過(guò)在交換機(jī)上向服務(wù)器端傳遞特定擁塞信息,然后服務(wù)器端再發(fā)送至客戶端通知源端降速?gòu)亩鴮?shí)現(xiàn)擁塞控制的目的。
          數(shù)據(jù)中心量化擁塞通知(DCQCN)是顯式擁塞通知(ECN)和優(yōu)先流控制(PFC)兩種機(jī)制的結(jié)合,旨在支持端到端的無(wú)損以太網(wǎng)通信。其核心理念是在網(wǎng)絡(luò)擁塞發(fā)生時(shí),優(yōu)先使用ECN 來(lái)通知發(fā)送端降低傳輸速率,防止 PFC 的不必要激活,同時(shí)也要避免擁塞嚴(yán)重導(dǎo)致緩沖區(qū)溢出的情況。通過(guò)這種精細(xì)的流量控制,DCQCN 能夠在保持網(wǎng)絡(luò)高效運(yùn)行的同時(shí),避免因擁塞造成的數(shù)據(jù)丟失。
          2.2 RoCEv2 網(wǎng)絡(luò)特點(diǎn):強(qiáng)大兼容性與成本優(yōu)化
          RoCE 網(wǎng)絡(luò)利用 RDMA 技術(shù)實(shí)現(xiàn)了高效的數(shù)據(jù)傳輸,不必占用遠(yuǎn)程服務(wù)器的 CPU 周期,從而充分利用帶寬并增強(qiáng)了網(wǎng)絡(luò)的可伸縮性。這種方法顯著降低了網(wǎng)絡(luò)延遲并提升了吞吐量,整體上提高了網(wǎng)絡(luò)性能。RoCE 方案的另一個(gè)顯著優(yōu)勢(shì)是它能夠無(wú)縫地融入現(xiàn)有的以太網(wǎng)基礎(chǔ)設(shè)施,這意味著企業(yè)無(wú)需額外投資于新設(shè)備或進(jìn)行設(shè)備更換,就能實(shí)現(xiàn)性能的飛躍。這種成本效益高的網(wǎng)絡(luò)升級(jí)方式對(duì)于降低企業(yè)的資本支出至關(guān)重要,使得 RoCE 成為提升智算中心網(wǎng)絡(luò)性能的優(yōu)選方案。
          3 InfiniBand 與 RoCEv2 的技術(shù)差異
          市場(chǎng)中對(duì)網(wǎng)絡(luò)的多樣化需求促成了 InfiniBand 和 RoCEv2 兩種網(wǎng)絡(luò)架構(gòu)的共同發(fā)展。InfiniBand 網(wǎng)絡(luò)憑借其高級(jí)技術(shù),如高效的轉(zhuǎn)發(fā)性能、快速的故障恢復(fù)時(shí)間和增強(qiáng)的擴(kuò)展性,以及運(yùn)維效率,在應(yīng)用層業(yè)務(wù)性能上展現(xiàn)出顯著優(yōu)勢(shì),特別是在大規(guī)模場(chǎng)景下,能夠提供卓越的網(wǎng)絡(luò)吞吐性能。
          而RoCEv2網(wǎng)絡(luò)則以其強(qiáng)大的通用性和較低的成本受到青睞,不僅適用于構(gòu)建高性能RDMA網(wǎng)絡(luò),還能無(wú)縫兼容現(xiàn)有的以太網(wǎng)基礎(chǔ)設(shè)施,這使得 RoCEv2 在廣泛性和適用性方面具有明顯優(yōu)勢(shì),能夠滿足不同規(guī)模和需求的網(wǎng)絡(luò)應(yīng)用。這兩種架構(gòu)各自的特性和優(yōu)勢(shì),為 AI 智算中心的網(wǎng)絡(luò)設(shè)計(jì)提供了豐富的選擇,以滿足不同用戶的具體需求。
          請(qǐng)參考“下載提醒:服務(wù)器基礎(chǔ)知識(shí)全解(終極版)”,“2023年服務(wù)器計(jì)算機(jī)CPU行業(yè)報(bào)告”、“2023年機(jī)架式服務(wù)器行業(yè)洞察”、“2023~2025服務(wù)器CPU路線圖”、“2023服務(wù)器產(chǎn)業(yè)鏈及市場(chǎng)競(jìng)爭(zhēng)格局”、“存儲(chǔ)系統(tǒng)關(guān)鍵技術(shù)全解(終極版)”、“更新下載:存儲(chǔ)系統(tǒng)基礎(chǔ)知識(shí)全解(終極版)”、“存儲(chǔ)芯片技術(shù)基礎(chǔ)知識(shí)介紹(2023)”等等。

          相關(guān)閱讀:


          轉(zhuǎn)載申明:轉(zhuǎn)載本號(hào)文章請(qǐng)注明作者來(lái)源,本號(hào)發(fā)布文章若存在版權(quán)等問(wèn)題,請(qǐng)留言聯(lián)系處理,謝謝。

          推薦閱讀
          更多架構(gòu)相關(guān)技術(shù)知識(shí)總結(jié)請(qǐng)參考“架構(gòu)師全店鋪技術(shù)資料打包(全)”相關(guān)電子書(shū)(41本技術(shù)資料打包匯總詳情可通過(guò)“閱讀原文”獲取)。

          全店內(nèi)容持續(xù)更新,現(xiàn)下單“架構(gòu)師技術(shù)全店資料打包匯總(全)”一起發(fā)送“服務(wù)器基礎(chǔ)知識(shí)全解(終極版)和“存儲(chǔ)系統(tǒng)基礎(chǔ)知識(shí)全解(終極版)pdf及ppt版本,后續(xù)可享全店內(nèi)容更新“免費(fèi)”贈(zèng)閱,價(jià)格僅收249元(原總價(jià)399元)。


          溫馨提示:

          掃描二維碼關(guān)注公眾號(hào),點(diǎn)擊閱讀原文鏈接獲取架構(gòu)師技術(shù)全店資料打包匯總(全)電子書(shū)資料詳情


          瀏覽 333
          點(diǎn)贊
          評(píng)論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          評(píng)論
          圖片
          表情
          推薦
          點(diǎn)贊
          評(píng)論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  免费在线观看小视频黄 | 亚洲多毛| 九一福利在线观看 | 狠狠操狠狠干天天操老骚逼 | 超碰人人操97 |