云計算基礎(chǔ)設(shè)施技術(shù)需求(白皮書)


自從云計算技術(shù)在將近 20 年前推出以來,應(yīng)用和計算資源不斷從企業(yè)數(shù)據(jù)中心向云環(huán)境持續(xù)遷移。本文重點(diǎn)討論云基礎(chǔ)設(shè)施技術(shù)需求,白皮書下載鏈接:云基礎(chǔ)設(shè)施技術(shù)需求(白皮書)
IT基礎(chǔ)架構(gòu)向云端的遷移仍在繼續(xù),而據(jù) Gartner 預(yù)測,到 2025 年,將有 80% 的企業(yè)關(guān)停傳統(tǒng)數(shù)據(jù)中心,隨著這一轉(zhuǎn)變的推進(jìn),云服務(wù)提供商將面臨在超大規(guī)模云環(huán)境中不斷提高性能、擴(kuò)展性和安全性的挑戰(zhàn)。為達(dá)到所需的服務(wù)水平,這些超大規(guī)模云服務(wù)提供商采用一些工具,包括:

本文將探討中國片上系統(tǒng) (SoC) 開發(fā)人員在滿足現(xiàn)代云基礎(chǔ)架構(gòu)需求方面所面臨的一些挑戰(zhàn),以及可用于開發(fā)高效 SoC 解決方案的工具與技術(shù)。
推動云計算發(fā)展的主要趨勢推動當(dāng)前云計算市場發(fā)展的主要趨勢有三個,而每個趨勢都給 SoC 設(shè)計人員提出了挑戰(zhàn):
云數(shù)據(jù)的快速增長云數(shù)據(jù)正以指數(shù)級不斷增長。受互連設(shè)備數(shù)量快速增長,流視頻、社交媒體上共享的內(nèi)容日益增多、在線增強(qiáng)現(xiàn)實和虛擬現(xiàn)實 (AR/VR) 體驗以及 5G 無線網(wǎng)絡(luò)的推動,IDC 預(yù)計,從 2020 年至 2025 年,云數(shù)據(jù)的數(shù)量將增長3 倍。


云數(shù)據(jù)的增長推動著位于中心的超大規(guī)模數(shù)據(jù)中心和位于網(wǎng)絡(luò)邊緣的遠(yuǎn)程設(shè)施中計算密度不斷增加。計算密度的提高需要更節(jié)能的 CPU,這樣才能在現(xiàn)有數(shù)據(jù)中心設(shè)施的功耗和熱量預(yù)算范圍內(nèi)提高計算能力。由于對更節(jié)能的 CPU 的需求,市場最近對于針對每瓦特性能而優(yōu)化的基于 ARM 的服務(wù)器 CPU 再次表現(xiàn)出了極大的興趣。
數(shù)據(jù)量的增長對更快的服務(wù)器接口提出了需求,因為在服務(wù)器內(nèi)部和服務(wù)器之間需要搬運(yùn)大量數(shù)據(jù)。服務(wù)器內(nèi)的數(shù)據(jù)移動可能是主要的瓶頸,也是延時的根源。通過最大限度地減少數(shù)據(jù)移動,并在數(shù)據(jù)需要移動時提供高帶寬、低延遲接口,這對于最大程度提高性能、減少延時和功耗至關(guān)重要。要提高性能,所有內(nèi)部服務(wù)器接口都在進(jìn)行升級:
● DDR5 接口的速度提高到 6400 Mbps
● 當(dāng) PCIe 接口從 16GT/s 的 PCIe 4.0 過渡到 32GT/s 的 PCIe 5.0 時,其對帶寬的需求會加倍。由于 PCIe 4.0 未廣泛普及,某些設(shè)備的帶寬會增加更多,因此,某些設(shè)備將直接從 PCIe 3.0 (8GT/s) 轉(zhuǎn)到 PCIe 5.0。
● NVMe SSD 正從 PCIe 3.0 轉(zhuǎn)向 PCIe 5.0,使帶寬增加 4 倍
● Compute Express Link (CXL) 提供了在 PCIe 電接口上運(yùn)行的緩存一致性接口,并允許多個處理器 / 加速器有效共享數(shù)據(jù)和內(nèi)存,從而減少系統(tǒng)中需要移動的數(shù)據(jù)量。
● 通過采用 PAM4 編碼并支持多種協(xié)議的 56Gbps 和 112Gbps 新型高速 SerDes 技術(shù),可在包括晶片、芯片、加速器與背板的設(shè)備之間提供更快的接口除了上面列出的接口之外,多種類型的內(nèi)存還可以滿足不同用例的容量、功耗和性能要求。如果內(nèi)存容量是主要考慮因素,DDR5 則是必選的內(nèi)存類型。如果內(nèi)存帶寬是最重要的考慮因素,HBM2E 則可提供對內(nèi)存中數(shù)據(jù)的高速訪問。

舉例來說,圖 5 顯示了一個服務(wù)器的典型框圖,該服務(wù)器分別配備采用 CXL 和 PCIe 的一致性和非一致性 I/O 接口,以及一個大容量 DDR5 內(nèi)存接口。

為了在處理服務(wù)器之間傳輸?shù)臄?shù)據(jù)時提高性能和效率,許多服務(wù)器現(xiàn)在都整合了“智能 NIC”,它包含 NIC 上的嵌入式處理器,用于減輕主機(jī)CPU上的網(wǎng)絡(luò)協(xié)議、安全功能,SDN 和其他功能的處理負(fù)擔(dān)。智能 NIC 有助于以更高的性能對網(wǎng)絡(luò)數(shù)據(jù)包進(jìn)行處理,同時為應(yīng)用的處理保留主機(jī)CPU帶寬。

除了更快的接口和更高效的存儲器外,保護(hù)數(shù)據(jù)對于云計算同樣至關(guān)重要。隨著數(shù)據(jù)在云端傳輸和存儲的價值不斷提高,數(shù)據(jù)的不當(dāng)訪問和濫用等方面的威脅也在增加。為了適當(dāng)?shù)乇Wo(hù)授權(quán)用戶可訪問的數(shù)據(jù)的機(jī)密性、完整性和可用性,標(biāo)準(zhǔn)化機(jī)構(gòu)紛紛將安全要求納入數(shù)據(jù)接口協(xié)議中。要在這些高速接口中實施必需的安全算法,需要用于數(shù)據(jù)加密和解密的高質(zhì)量加解密 IP、用于實施高速安全協(xié)議的安全協(xié)議加速器 IP,以及用于提供信任根和安全密鑰管理的可信執(zhí)行環(huán)境。為了避免在各個數(shù)據(jù)路徑中產(chǎn)生瓶頸,用于實現(xiàn)這些功能的 IP 必須能夠保持原數(shù)據(jù)路徑線速率運(yùn)行。
在過去幾年間,全球數(shù)據(jù)中心市場呈現(xiàn)溫和增長的態(tài)勢,IT 支出從 2017 年的 1810 億美元將增長到 2021 年預(yù)期的 2120億美元(復(fù)合年增長率為 4.0%)。如圖 8 所示,約三分之一的支出用于服務(wù)器系統(tǒng)。截至 2019 年第四季度,按收入計算的前 5 位供應(yīng)商包括 HPE/New H3C Group和Dell Technologies,分別擁有約 16% 的市場份額,IBM、浪潮和聯(lián)想進(jìn)入前五名。值得指出的是,華為的服務(wù)器提供商地位不斷增強(qiáng),由于中國的“一帶一路”基礎(chǔ)設(shè)施項目的推動,有望很快躋身前五名。

如前文所述,數(shù)據(jù)增長對網(wǎng)絡(luò)速度提出了更高的要求。許多數(shù)據(jù)中心正在將從服務(wù)器到架頂 (ToR) 交換機(jī)的網(wǎng)絡(luò)接口速度從 25GbE 提高到 100GbE。在從 ToR 交換機(jī)到分支交換機(jī)和主干交換機(jī)的鏈路上以及數(shù)據(jù)中心設(shè)施之間安裝了400GbE 基礎(chǔ)架構(gòu)。領(lǐng)先的以太網(wǎng)交換機(jī)廠商已經(jīng)在開發(fā)基于 112G SerDes 的 800Gbps 交換機(jī),而且隨著數(shù)據(jù)量的持續(xù)增長,未來幾年可能會推出 1.6Tbps 以太網(wǎng)。

支持 400Gbps 以太網(wǎng)端口的基礎(chǔ)架構(gòu)交換機(jī)可采用 56G x 8 或 112G x 4 SerDes 電接口。

2019 年,數(shù)據(jù)中心網(wǎng)絡(luò)基礎(chǔ)架構(gòu)(主要以全球以太網(wǎng)交換機(jī)和路由器市場為代表)與 2018 年相比略有增長,實現(xiàn)總收入 443 億美元(以太網(wǎng)交換機(jī)為 288 億美元,路由器為 155 億美元)。華為和 Arista Networks 是前五名企業(yè)中在 2019全年相對于 2018 年實現(xiàn)市場份額增長的僅有兩家供應(yīng)商。圖顯示了全球前五名以太網(wǎng)交換機(jī)廠商各自的市場份額。

目前,中國是僅次于美國的全球第二大云基礎(chǔ)架構(gòu)市場,三家大型云服務(wù)提供商占據(jù)主導(dǎo)地位:阿里巴巴的云基礎(chǔ)架構(gòu)服務(wù)支出超過 46%,騰訊占 18%,百度 AI Cloud 占 8.8%。在 2019 年第四季度,中國云基礎(chǔ)架構(gòu)市場呈現(xiàn) 66.9% 的強(qiáng)勁增長勢頭,達(dá)到 33 億美元,占全球市場的 10.8%。
存儲行業(yè)的最新進(jìn)步要求管理不斷增長的數(shù)據(jù)量,并使用加速器來處理數(shù)據(jù)。這些進(jìn)步包括使用計算存儲、存儲類內(nèi)存、與持久性存儲器連接的緩存一致性接口,以及適用于更高數(shù)據(jù)傳輸速度的下一代 NVMe接口。計算存儲系統(tǒng)是智能存儲系統(tǒng),在存儲服務(wù)器內(nèi)完成應(yīng)用處理任務(wù),旨在最大程度減少從存儲服務(wù)器到計算服務(wù)器的網(wǎng)絡(luò)數(shù)據(jù)傳輸。計算存儲系統(tǒng)可以查詢本地數(shù)據(jù)庫,并且僅將結(jié)果集發(fā)送到應(yīng)用 / 數(shù)據(jù)庫服務(wù)器,而不是將大量原始數(shù)據(jù)發(fā)送到應(yīng)用/數(shù)據(jù)庫服務(wù)器進(jìn)行處理。
通過僅發(fā)送結(jié)果集,計算存儲系統(tǒng)可以減少網(wǎng)絡(luò)負(fù)載,使應(yīng)用處理器能夠執(zhí)行其他任務(wù)。存儲類內(nèi)存 (SCM) 為增強(qiáng)服務(wù)器性能提供了一種相對低成本、高性能、持久內(nèi)存解決方案。SCM 可以根據(jù)應(yīng)用的需求以多種方式部署。例如,使用 SCM 作為附加內(nèi)存層可以在數(shù)據(jù)庫服務(wù)器上實現(xiàn)在內(nèi)存中進(jìn)行數(shù)據(jù)處理,與 NAND 閃存驅(qū)動器相比,數(shù)據(jù)讀寫性能提高 10 倍或更多。

在存儲應(yīng)用中使用緩存一致性接口可以使多個設(shè)備在共享內(nèi)存時保持緩存一致性,從而提高性能,并減少數(shù)據(jù)移動。Compute Express Link (CXL) 就是這樣一種接口?;?PCIe 5.0 的 CXL 1.1 以 32GT/s 的速度為緩存、內(nèi)存和 I/O 設(shè)備提供數(shù)據(jù)傳輸。
NVMe 存儲設(shè)備紛紛采用 PCIe 5.0 接口,將 SSD 吞吐量提高到每個PCIe 通道 4GB/s。與PCIe 3.0相比,這一速度提高了4倍,目前,x86 服務(wù)器中一般都實施了 PCIe 3.0。
隨著云應(yīng)用不斷演進(jìn),出現(xiàn)了更多可視化內(nèi)容,對可視化計算的支持已經(jīng)成為云基礎(chǔ)架構(gòu)的一項額外功能,包括用于商業(yè)應(yīng)用(包括在線協(xié)作)和娛樂(例如電影)的流視頻、AR/VR 和圖像分析(例如 ADAS、安全和其他需要實時圖像識別的應(yīng)用)??梢暬嬎愕募ぴ鰧?dǎo)致高性能 GPU 集成到云服務(wù)器中,并通過高速加速器接口連接到主機(jī) CPU 基礎(chǔ)架構(gòu)。

云與邊緣的融合將使云服務(wù)更靠近最終用戶,從而提供更豐富、更高性能和更低的延時體驗。同時,隨著云服務(wù)提供商和電信提供商急于推銷本地化、高響應(yīng)性的服務(wù),這將為他們創(chuàng)造新的商機(jī),因為這些服務(wù)過去只能從云核心提供。在過去幾年中,連接到互聯(lián)網(wǎng)的設(shè)備數(shù)量一直在迅速增加,并且在未來幾年中將以更快的速度增長。據(jù) Statistica 估計,2018 年有 220 億個聯(lián)網(wǎng)設(shè)備,到 2025 年,這一數(shù)字將增長到 380 億以上。

在這些聯(lián)網(wǎng)的設(shè)備中,很多都是傳感器,用于收集數(shù)據(jù)并將其上傳到云端,以分析并確定立即或?qū)⒁扇〉男袆?。信息安全、交通和物料流管理以及自動駕駛汽車是眾多控制系統(tǒng)中的幾個例子,而且這些控制系統(tǒng)已經(jīng)或即將會通過互聯(lián)網(wǎng)交換信息。特別需要指出的是,對于控制系統(tǒng),數(shù)據(jù)必須可靠地傳送,而且從收集數(shù)據(jù)到基于這些數(shù)據(jù)發(fā)出命令幾乎不能有延時。換句話說,這些類型的應(yīng)用需要延時極低的基礎(chǔ)架構(gòu)。
要實現(xiàn)對控制系統(tǒng)和其他對延時敏感的應(yīng)用的快速響應(yīng),最佳方法也許是使數(shù)據(jù)收集、存儲和處理基礎(chǔ)架構(gòu)更靠近使用點(diǎn),即網(wǎng)絡(luò)邊緣。因此,我們看到越來越多的云服務(wù)提供商與電信公司合作,在多訪問邊緣計算 (MEC) 平臺中提供云服務(wù)。Microsoft Azure9 和 Google Cloud已與 AT&T 合作,在 AT&T 的多訪問邊緣計算站點(diǎn)部署了云基礎(chǔ)架構(gòu)。另外,AWS 與 Sprint(現(xiàn)為 T-Mobile)和 Verizon合作,通過各自的基礎(chǔ)架構(gòu)部署 AWS 云服務(wù)。
然而,在邊緣基礎(chǔ)架構(gòu)中部署云服務(wù)要求運(yùn)行云服務(wù)的設(shè)備能夠容忍邊緣環(huán)境,因為邊緣環(huán)境不一定擁有與典型云數(shù)據(jù)中心相同的物理空間、環(huán)境控制或電力供應(yīng)。因此,允許的延時越短,服務(wù)就越需要部署到邊緣,而且允許的功耗也可能越低。

最后,用于數(shù)據(jù)分析的人工智能已成為云數(shù)據(jù)中心的重要功能。人工智能加速器在設(shè)備中和云端無處不在。人工智能加速器支持執(zhí)行卷積、遞歸、尖峰和其他深度神經(jīng)網(wǎng)絡(luò),以支持大量應(yīng)用。針對云環(huán)境的人工智能加速器一般針對 TOPS進(jìn)行了優(yōu)化,以提供最高的性能。這些加速器的設(shè)計支持?jǐn)U展,以縮短訓(xùn)練時間并適應(yīng)最復(fù)雜的人工智能算法(支持超過 80 億個參數(shù))。由于人工智能加速器傾向于處理大量數(shù)據(jù),因此,內(nèi)存接口通常是瓶頸所在,這使得高帶寬內(nèi)存對于這些設(shè)備特別有益。

針對邊緣計算(尤其是聚合器和網(wǎng)關(guān)應(yīng)用)的人工智能加速器通常針對每瓦性能 (TOPS/W) 進(jìn)行了優(yōu)化,以解決邊緣基礎(chǔ)架構(gòu)和服務(wù)的功耗與延時問題。這些設(shè)備具有較高的計算能力和相對簡單的軟件模型,能夠提供快速響應(yīng)能力。它們往往為實現(xiàn)低成本和低功耗而進(jìn)行了優(yōu)化,而這通常會要求使用低功耗 DDR (LPDDR) 內(nèi)存。
為了支持人工智能解決方案的擴(kuò)展,加速器必須包含一個高速接口,例如 56Gbps 或 112Gbps SerDes 或 HBI。芯片間的高速接口提供了加速器縮放和擴(kuò)展能力,可滿足苛刻的人工智能應(yīng)用的需求。
新思科技提供了高質(zhì)量且經(jīng)過硅驗證的全面 IP 產(chǎn)品組合,使設(shè)計人員能夠開發(fā)支持當(dāng)前和未來云計算應(yīng)用的 SoC。新思科技的 DesignWare? 接口 IP、處理器 IP、安全 IP 和基礎(chǔ) IP 針對高性能、低延時和低功耗進(jìn)行了優(yōu)化,同時支持從16nm 到 5nm FinFET 的先進(jìn)處理技術(shù)。新思科技針對云 SoC 的全面 IP 產(chǎn)品組合包括:
● DDR5/4 內(nèi)存控制器和 PHY:提供一流的性能,數(shù)據(jù)速率高達(dá) DDR5-6400,引入了 DDR5 相位感知調(diào)度引擎,與競爭對手相比,面積減少了 15%,功耗降低 10%
● HBM2/2E 內(nèi)存 PHY:具有業(yè)界領(lǐng)先的面積和功耗,并且功耗比競爭對手的 IP 低 80%
● 112G 多協(xié)議 SerDes:以 <5.5pJ/ 比特的速率支持多種數(shù)據(jù)速率(1.25 至 112 Gbps)
● 112G USR/XSR SerDes 和 HBI 接口:針對芯片間接口進(jìn)行了面積優(yōu)化
● 高速以太網(wǎng)解決方案,包括原型設(shè)計套件和 IP 子系統(tǒng),可加快產(chǎn)品開發(fā)速度,并縮短上市時間
● PCIe 5.0 解決方案:經(jīng)過硅驗證,并已被 90% 的領(lǐng)先半導(dǎo)體公司使用
● CXL 解決方案:基于新思科技經(jīng)過硅驗證的 PCIe 5.0 IP 而構(gòu)建,可降低集成風(fēng)險,其中包括用于驗證 I/O、內(nèi)存訪問和一致性協(xié)議功能的 VC 驗證 IP
● ARC HS 處理器:提供從 1 到 12 個 CPU 內(nèi)核的業(yè)界領(lǐng)先的擴(kuò)展性,并支持多達(dá) 16 個用戶硬件加速器,以適應(yīng)極端工作負(fù)載
● 高能效 CCIX PHY 和最低 延時的控制器
● USB 3.0、USB 3.1、USB 3.2 和 USB4 解決方案:具有行業(yè)領(lǐng)先的低功耗和小面積實施能力,在數(shù)百萬 SoC 中提供了經(jīng)驗證的互操作性,并且降低設(shè)計風(fēng)險
● 高質(zhì)量、經(jīng)過硅驗證的基礎(chǔ) IP:包括內(nèi)存編譯器和非易失性存儲器 (NVM)、邏輯庫、通用 I/O (GPIO) 和測試解決方案,使片上系統(tǒng) (SoC) 設(shè)計人員能夠 降低集成風(fēng)險,并加快產(chǎn)品上市速度
● TCAM 和多端口內(nèi)存:支持用于網(wǎng)絡(luò)和其他應(yīng)用的高速、低功耗網(wǎng)絡(luò)解決方案
● ASIP Designer:通過基于 C/C++- 編譯器的高效軟件開發(fā)套件而開發(fā)定制加速器,該套件可自動適應(yīng)每種體系架構(gòu)的變更,并自動生成針對功耗和面積而優(yōu)化的可合成的 RTL
● 安全 IP:包括安全協(xié)議加速器、加密加速器和信任根 IP,可為云計算和其他市場中的多種產(chǎn)品提供最高效的芯片設(shè)計和最高的安全性的絕大多數(shù) IP。
云計算的演進(jìn)為 SoC 開發(fā)人員帶來了許多新的機(jī)遇和挑戰(zhàn)。這種技術(shù)引發(fā)的一些關(guān)鍵變化包括互聯(lián)網(wǎng)中傳輸以及云端存儲或使用的數(shù)據(jù)量快速增長,云服務(wù)向網(wǎng)絡(luò)邊緣的擴(kuò)展,以及為處理海量數(shù)據(jù)并從中獲取洞察而廣泛部署的人工智能。
隨著機(jī)器間的通信、流視頻、增強(qiáng)現(xiàn)實和虛擬現(xiàn)實以及其他應(yīng)用生成越來越多的數(shù)據(jù),云基礎(chǔ)架構(gòu)必須不斷增強(qiáng),以最大程度減少需要移動的數(shù)據(jù),并最大程度加快從一個位置向另一位置傳輸數(shù)據(jù)的速度,無論是長距離傳輸,還是服務(wù)器內(nèi)部的一個芯片傳輸?shù)搅硪粋€芯片。
隨著互聯(lián)網(wǎng)用戶和聯(lián)網(wǎng)設(shè)備數(shù)量不斷增多,互聯(lián)網(wǎng)上數(shù)據(jù)的快速增長要求采用新的機(jī)制而減少數(shù)據(jù)移動,并加快數(shù)據(jù)從一個位置向另一位置的傳輸。
借助高質(zhì)量、經(jīng)過硅驗證的 IP 構(gòu)件,設(shè)計人員能夠開發(fā)用于高端云計算解決方案的 SoC,包括服務(wù)器、網(wǎng)絡(luò)、存儲、可視化計算、邊緣計算和人工智能加速器應(yīng)用。
下載:云基礎(chǔ)設(shè)施技術(shù)需求(白皮書)

轉(zhuǎn)載申明:轉(zhuǎn)載本號文章請注明作者和來源,本號發(fā)布文章若存在版權(quán)等問題,請留言聯(lián)系處理,謝謝。
推薦閱讀
更多架構(gòu)相關(guān)技術(shù)知識總結(jié)請參考“架構(gòu)師技術(shù)全聯(lián)盟書店”相關(guān)電子書(35本技術(shù)資料打包匯總詳情可通過“閱讀原文”獲取)。
全店內(nèi)容持續(xù)更新,現(xiàn)下單“架構(gòu)師技術(shù)全店打包匯總(全)”,后續(xù)可享全店內(nèi)容更新“免費(fèi)”贈閱,價格僅收188元(原總價290元)。
溫馨提示:
掃描二維碼關(guān)注公眾號,點(diǎn)擊閱讀原文鏈接獲取“架構(gòu)師技術(shù)全店資料打包匯總(全)”電子書資料詳情。

