<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          如何配置InfiniBand和RDMA網(wǎng)絡?

          共 4684字,需瀏覽 10分鐘

           ·

          2022-03-11 03:30



          本文檔描述InfiniBand 程直接訪問(RDMA)是什么以及如何配置 InfiniBand 硬件。外,本文檔解了如何配置與 InfiniBand 相關的服。本文請參看“配置InfiniBand和RDMA網(wǎng)絡”。


          下載鏈接:

          RDMA技術專題匯總(1)

          RDMA技術專題匯總(2)



          1、InfiniBandRDMA介紹

          InfiniBand 代表個不同的因素:

          • InfiniBand 網(wǎng)的物理協(xié)議?

          • InfiniBand Verbs APIRDMAremote direct memory access)技的一個實現(xiàn)?


          RDMA 可在不涉及算機操作系統(tǒng)的情況下,從一個算機訪問另一臺算機的內存。此技術啟用了高吞 吐量和低延遲聯(lián)網(wǎng),且 CPU 使用率低。?


          在典型的 IP 數(shù)據(jù)傳輸中,當機器中的某個用程序向一臺機器上的用程序發(fā)送數(shù)據(jù),在接收層時 會出現(xiàn)以下情況:?


          • 1. 內核必接收數(shù)據(jù)。

          • 2. 內核必確定數(shù)據(jù)是否屬于該應用程序。?

          • 3. 內核用程序。

          • 4. 內核會等待用程序執(zhí)行系統(tǒng)調用到內核。

          • 5. 用程序將內核本身的內部內存空數(shù)據(jù)復制到用程序提供的沖中。?


          程意味著,如果主機適配器使用直接內存訪問(DMA),或者至少次,大多數(shù)網(wǎng)流量會被復制 到系統(tǒng)的主內存中。外,算機執(zhí)行很多上下文開關以在內核和用程序上下文間進行切。些上下 文切都可能造成高流量率的 CPU 負載,并可能造成其他任的性能下降。?


          RDMA 繞過內核在程中的干,和普通的 IP 不同CPU 。RDMA 協(xié)議 讓主機適配器知道數(shù)據(jù)包何來自網(wǎng),用程序應該接收它,并在用程序的內存空中保存數(shù)據(jù)包。InfiniBand,主機適配器不將數(shù)據(jù)包發(fā)送到內核,然后將其復制到用戶應用程序的內存中,而是,主機適 配器將數(shù)據(jù)包的內容直接放置在用程序的沖中。此程需要獨的 APIInfiniBand Verbs API,用 程序必支持API才能使用 RDMA。?


          Red Hat Enterprise Linux 8支持 InfiniBand 硬件和 InfiniBand Verbs API。外,Red Hat Enterprise Linux 支持以下技,以便在非 InfiniBand 硬件中使用 InfiniBand Verbs API:?


          • 聯(lián)網(wǎng)廣域 RDMA 協(xié)議(iWARP):通IP 網(wǎng)絡實RDMA 的網(wǎng)絡協(xié)議。?

          • RDMA over Converged Ethernet(RoCE),也稱以太網(wǎng)的 InfiniBand(IBoE):通以太網(wǎng)實現(xiàn) RDMA 的網(wǎng)絡協(xié)議。


          2、配置 ROCE

          比如 MellanoxBroadcom QLogic 都提供 RoCE 硬件。配置細節(jié),請參看“配置InfiniBand和RDMA網(wǎng)絡”。


          RoCE 是一種網(wǎng)絡協(xié)議,可實現(xiàn)以太網(wǎng)的程直接訪問(RDMA)。以下是不同的 RoCE 版本:?


          • RoCE v1?


          RoCE 版本 1 協(xié)議ethertype 0x8915 的以太網(wǎng)層協(xié)議,它允同一以太網(wǎng)廣播域中任何個主機之間進行通信。


          情況下,在使用 Mellanox ConnectX-3 網(wǎng)適配器Red Hat Enterprise Linux 使用 RoCE v1 RDMA 接管理器(RDMA_CM)。


          • RoCE v2?


          RoCE 版本 2 協(xié)議IPv4 IPv6 協(xié)議UDP 上存在。RoCE v2 保留 UDP 端口號 4791。默情況下,在使用 Mellanox ConnectX-3 ProConnectX-4 Lx ConnectX-5 網(wǎng)適配器,Red Hat Enterprise LinuxRoCE v2 用于 RDMA_CM,但硬件支持 RoCE v1 RoCE v2。?


          RDMA_CM 置客端和服器之用來傳輸數(shù)據(jù)的可靠接。RDMA_CM 建立接提供了一個與 RDMA 傳輸相關的接口。通信使用特定的 RDMA設備,數(shù)據(jù)傳輸是基于消息的。


          在客端使用 RoCE v2,在服器使用 RoCE v1 不被支持。在種情況下,將服器和客 端都配置RoCE v1 行通信。


          不支持在客端和服器上的 RoCE v1 使用 RoCE v2 協(xié)議。如果您的服器中硬件只支持 RoCE v1,將 您的客端配置使用 RoCE v1 與服器通信。部分述了如何在將 mlx5_0 驅動程序用于 Mellanox ConnectX-5 Infiniband 設備的客端上RoCE v1。


          Soft-RoCE RDMA over Ethernet 的一個實現(xiàn),它也稱RXE。在沒有 RoCE 主機道適配器 (HCA)的主機上使用 Soft-RoCE。


          Soft-RoCE 功能術預覽提供。品服務級別協(xié)議SLA)不支持技術預覽功 能,且其功能可能并不完善,因此帽不建在生產環(huán)境中使用它。


          配置細節(jié),請參看“配置InfiniBand和RDMA網(wǎng)絡”。


          3、配置核心RDMA子系統(tǒng)

          情況下,內核命名 IP over InfiniBand(IPoIB)設備,如 ib0,ib1 等。避免沖突,帽建udev 設 備管理器中創(chuàng)建一條規(guī)則創(chuàng)建持久且有意的名稱,如 mlx4_ib0。


          RDMA 操作需要固定物理內存。意味著內核不允把內存寫入到 swap 中。如果用固定太多內 存,系統(tǒng)會耗盡內存,并且內核會程來放更多內存。因此,內存固定是一個特操作。如果非 root 戶運行大型 RDMA 用程序,可能需要增加些用可在系統(tǒng)中的內存量。部分述 了如何rdma 配置無限內存。


          配置RDMA務,rdma 在內核中管理RDMA。如果Red Hat Enterprise Linux 檢測InfiniBandiWARP RoCE 設備,udev 設備管理器會指示 systemd 啟動 rdma 配置細節(jié),請參看“配置InfiniBand和RDMA網(wǎng)絡”。


          4、配置InfiniBand子網(wǎng)管理器

          所有 InfiniBand 網(wǎng)都必須運行子網(wǎng)管理器才能正常工作。即使臺機器沒有使用交機直接接, 也是如此。有可能有一個以上的子網(wǎng)管理器。在那種情況下,當主子網(wǎng)管理器出現(xiàn)故障外一個作從網(wǎng)管理器 的系統(tǒng)會接管。大多數(shù) InfiniBand 機都包含一個嵌入式子網(wǎng)管理器。


          但是,如果您需要一個更新的子網(wǎng)管理器,需使用 Red Hat Enterprise Linux 提供的 OpenSM 子網(wǎng)管理器。配置細節(jié),請參看“配置InfiniBand和RDMA網(wǎng)絡”。


          5、配置 IPOIB

          情況下,InfiniBand 不使用 IP 行通信。但是,IP over InfiniBand(IPoIB)InfiniBand 程直接訪問 (RDMA)網(wǎng)之上提供一個 IP 網(wǎng)擬層許現(xiàn)有未經(jīng)修改的用程序通InfiniBand 網(wǎng)絡傳輸數(shù) 據(jù),但性能低于用程序原生使用 RDMA 的數(shù)據(jù)。


          聯(lián)網(wǎng)廣域 RDMA 協(xié)議(iWARP)RoCE 網(wǎng)已基于 IP。因此,您不能在 IWARP RoCE 設備之上創(chuàng)IPoIB 設備。Mellanox 設備ConnectX-4 及更高版本開始,默使用 Enhanced IPoIB 模式(限數(shù) 據(jù))。設備不支持接的模式。


          IPOIB模式,在 Datagram Connected 模式下配置 IPoIB 設備。不同之在,IPoIB 層試圖使用什么型的 在通信的一端的機器中打開:


          Datagram 模式中,系統(tǒng)打開了一個不可靠、斷開接的個模式不支持大于 InfiniBand link-layer 的最大傳輸單(MTU)件包。IPoIB 傳輸IP 數(shù)據(jù)包之上添加了一個 4 節(jié) IPoIB 標頭。因此,IPoIB MTU 需要比 InfiniBand link-layer MTU 4 節(jié)。因2048 是一個常InfiniBand MTU,數(shù)據(jù)數(shù) 模式中常IPoIB 設備 MTU 2044。?


          Connected 模式中,系統(tǒng)會打開一個可靠、接的。此模式允大于 InfiniBand MTU 的消息,主機適配器理數(shù)據(jù)包分段和重新傳輸。因 此,InfiniBand 適配器以 Connected 模式發(fā)送的 IPoIB 信息大小沒有限制。但是,IP 數(shù)據(jù)包會受 size 字段和 TCP/IP 標頭的限制。因此,Connected 模式中的 IPoIB MTU 最大65520 節(jié)。


          接 模式模 的性能更高,但消耗的內核內存更多。?


          如果系統(tǒng)被配置使用 Connected 模式,它仍然會以 Datagram 模式發(fā)送多播流量,因InfiniBand 機和光無法在 Connected 模式下傳遞多播流量。外,當與任何未在 Connected 模式中配置的主 機通信,系統(tǒng)將返回 Datagram 模式。

          行將多播數(shù)據(jù)發(fā)送到接口上最大 MTU 用程序,您必將接口配置Datagram 模式,或者將 用程序配置以數(shù)據(jù)包大小數(shù)據(jù)包的大小封數(shù)據(jù)包發(fā)送的大小。配置細節(jié),請參看“配置InfiniBand和RDMA網(wǎng)絡”。


          相關閱讀:

          下載鏈接:

          RDMA技術專題匯總(1)

          RDMA技術專題匯總(2)

          總線級數(shù)據(jù)中心網(wǎng)絡技術白皮書

          超融合數(shù)據(jù)中心網(wǎng)絡

          中國聯(lián)通的開放網(wǎng)絡研究與實踐

          中國聯(lián)通開放硬件網(wǎng)絡設備白皮書

          白牌網(wǎng)絡及交換機白皮書匯總
          1、掘金云數(shù)據(jù)中心白盒化趨勢.pdf
          2、商用交換芯片SDN支持現(xiàn)狀分析.pdf
          3、白盒交換機技術白皮書.pdf
          4、協(xié)議無關交換機架構應用白皮書.pdf
          5、中國聯(lián)通開放硬件網(wǎng)絡設備白皮書.pdf
          6、中興通訊CO重構技術白皮書.pdf

          來源:全棧云技術架構


          ???????????????? ?END ?????????????????

          轉載申明:轉載本號文章請注明作者來源,本號發(fā)布文章若存在版權等問題,請留言聯(lián)系處理,謝謝。


          推薦閱讀

          更多架構相關技術總結請參考“架構師全店鋪技術資料打包”相關電子書(37本技術資料打包匯總詳情可通過“閱讀原文”獲取)。

          內容持續(xù)更新,現(xiàn)下單“全店鋪技術資料打包(全)”,后續(xù)可享全店更新“免費”贈閱,價格僅收198元(原總價350元)。



          溫馨提示:

          掃描二維碼關注公眾號,點擊閱讀原文鏈接獲取“IT技術全店資料打包匯總(全)電子書資料詳情。


          瀏覽 75
          點贊
          評論
          收藏
          分享

          手機掃一掃分享

          分享
          舉報
          評論
          圖片
          表情
          推薦
          點贊
          評論
          收藏
          分享

          手機掃一掃分享

          分享
          舉報
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  亚洲精品色图 | 69成人做爰www免费看 | 北条麻妃在线观看免费91 | 亚洲黄v| 奇米久久久久 |