邊緣計(jì)算硬件架構(gòu)介紹


邊緣計(jì)算包括跨越廣泛位置和條件的系統(tǒng)組合,并支持各種用例。某個(gè)用例可能需要高功率GPU來實(shí)現(xiàn)人工智能(AI),而另一個(gè)用例則可能需要低功耗來延長電池壽命。設(shè)備的位置,例如微型邊緣數(shù)據(jù)中心或壁掛式工業(yè)機(jī)柜,對硬件施加了不同的限制。
部署在邊緣的硬件歷來是專門為特定工作負(fù)載構(gòu)建的,通常是內(nèi)容分發(fā)網(wǎng)絡(luò)或物聯(lián)網(wǎng)。隨著邊緣計(jì)算的普及和新的用例的出現(xiàn),通用基礎(chǔ)設(shè)施也被部署來運(yùn)行類似云的工作負(fù)載。IDC預(yù)測到2023年,邊緣網(wǎng)絡(luò)將占所有已部署云基礎(chǔ)設(shè)施的60%以上。除了已經(jīng)推動(dòng)邊緣增長的趨勢之外,大流行對勞動(dòng)力和運(yùn)營實(shí)踐的影響將繼續(xù)加速邊緣位置的基礎(chǔ)設(shè)施、應(yīng)用和數(shù)據(jù)資源的交付,這一影響將貫穿2021年和未來幾年。
熟悉的數(shù)據(jù)中心公司和云提供商將添加邊緣產(chǎn)品,但形態(tài)將越來越多樣化。例如,許多首批規(guī)模邊緣部署系統(tǒng)都是使用微模塊化邊緣數(shù)據(jù)中心構(gòu)建的,而這些系統(tǒng)正迅速被新的形態(tài)(如街邊機(jī)柜和燈桿附件)所增強(qiáng)。為了滿足整體連續(xù)性需求,特別是在需要計(jì)算的網(wǎng)絡(luò)中的不同點(diǎn),邊緣硬件將有所不同,從電信中心辦公室的全尺寸機(jī)架到工廠生產(chǎn)線上或通過專用5G連接的倉庫中的智能攝像頭,或者加固的戶外地點(diǎn),如賽道、石油鉆塔、工廠、辦公室,甚至飛機(jī)和船舶都能成為微型數(shù)據(jù)中心。
IT和運(yùn)營技術(shù)(OT)越來越融合,這種趨勢在邊緣尤為明顯。2021年也將帶來更多的變化:ARM服務(wù)器處理器、AI處理芯片、GPU、智能網(wǎng)卡(SmartNIC)和現(xiàn)場可編程門陣列(FPGA)板將越來越普遍。在邊緣執(zhí)行的更廣泛的工作負(fù)載將增加硬件的異構(gòu)性,從而產(chǎn)生更廣泛的CPU,以及新型硬件和網(wǎng)絡(luò)加速器。
基于ARM的芯片在邊緣的物聯(lián)網(wǎng)設(shè)備中一直很常見,但是ARM新的Neoverse平臺(tái)的目標(biāo)產(chǎn)品包括服務(wù)器、存儲(chǔ)處理器以及網(wǎng)絡(luò)硬件。AWS在其基于ARM的Graviton實(shí)例上投入了大量資金,這有助于驗(yàn)證ARM作為通用服務(wù)器處理器架構(gòu)的價(jià)值。AWS還發(fā)布了其Outposts超融合系統(tǒng)的1U版本,其中包括Graviton2處理器。微軟正在開發(fā)自己的基于ARM的硬件,用于CDN和其它邊緣場景,但尚未將其用到自己的數(shù)據(jù)中心之外的地方。Apple最近發(fā)布的基于ARM的M1處理器可能會(huì)增加對該領(lǐng)域的關(guān)注,消費(fèi)者可以看到功率和性能的提升(并為數(shù)百萬軟件開發(fā)人員提供架構(gòu)的輕松本地訪問),從而更好地全面了解ARM的平臺(tái)能力。
與此同時(shí),英特爾正在推動(dòng)為物聯(lián)網(wǎng)創(chuàng)建的Atom、Pentium和Xeon D SoC,作為競爭對手在用戶邊緣設(shè)備中與ARM和AMD競爭,例如用于工業(yè)應(yīng)用的攝像頭內(nèi)分析和實(shí)時(shí)檢查。FPGA、Xeon和ARM內(nèi)核都出現(xiàn)在SmartNIC中,英偉達(dá)熱衷于將其更名為DPU:數(shù)據(jù)處理單元為I/O、存儲(chǔ)、安全甚至虛擬化以及網(wǎng)絡(luò)加速提供CPU卸載,并可與GPU功能結(jié)合作為多用途硬件加速器。在中國供應(yīng)商的推動(dòng)下,開源的RISC-V硅架構(gòu)也有可能在這里發(fā)揮作用。
近年來,超大規(guī)模云提供商已轉(zhuǎn)向FPGA,用于網(wǎng)絡(luò)卸載以釋放可出售給客戶的CPU資源,并且越來越多地用于AI加速,因?yàn)橛布梢灾匦戮幊桃赃m應(yīng)機(jī)器學(xué)習(xí)算法的改進(jìn)。沒有多少組織具備自己構(gòu)建和運(yùn)行類似FPGA系統(tǒng)的技術(shù)能力,但隨著它們被打包到SmartNIC、DPU或其它加速器中,它們將變得更易于訪問。而且其電源效率更像是ASIC(專用集成電路)而不是GPU,因此非常適合邊緣計(jì)算。
英特爾、英偉達(dá)和AMD也在采取措施為數(shù)據(jù)中心(包括邊緣)提供完整的硬件和軟件堆棧。英特爾將推出首款獨(dú)立GPU,以及物聯(lián)網(wǎng)專用硬件、人工智能加速硬件、FPGA 和智能網(wǎng)卡、旨在提高CPU推理速度的Xeon指令以及基于硅光子學(xué)的可組合網(wǎng)絡(luò)交換機(jī)。所有這些選項(xiàng)都由英特爾的oneAPI編程模型聯(lián)系在一起。
為了與垂直堆棧競爭,AMD和英偉達(dá)正在進(jìn)行重大收購。英偉達(dá)已經(jīng)購買了Mellanox的SmartNIC和網(wǎng)絡(luò)技術(shù),并宣布有意收購ARM。這將允許英偉達(dá)作為獲得許可的IP提供GPU和張量核加速,除了提供自己的集成硬件選項(xiàng)(如EGX邊緣AI平臺(tái)),并配有軟件即服務(wù)(Software-as-a-Service,SaaS)控制平面。AMD收購Xilinx將為其帶來FPGA,包括Alveo SmartNIC和加速器,該公司一直將其定位為英偉達(dá)GPU的競爭。而另一種廣泛應(yīng)用于ARM核心SoC中的專業(yè)硬件加速技術(shù)也不會(huì)消失。
外形規(guī)格的標(biāo)準(zhǔn)化是使部署更容易、成本更低的重要戰(zhàn)略,包括尋找共享基礎(chǔ)設(shè)施投資的可擴(kuò)展點(diǎn)。類似于超大規(guī)模數(shù)據(jù)中心的硬件是如何圍繞開放計(jì)算項(xiàng)目的用例專門設(shè)計(jì)的,基礎(chǔ)設(shè)施邊緣的物理和操作現(xiàn)實(shí)的設(shè)計(jì)正在努力進(jìn)行中。Open19是一種方法,它由LinkedIn、Flex、HPe和Vapor率先提出,現(xiàn)在是Linux基金會(huì)的一個(gè)項(xiàng)目,成員包括Equinix和Cisco。
Open19提供了適用于標(biāo)準(zhǔn)19英寸機(jī)架的外形尺寸的開源標(biāo)準(zhǔn),該機(jī)架在現(xiàn)有的區(qū)域數(shù)據(jù)中心和電信中心辦公室中無處不在。Open19通過利用“盲插”電纜系統(tǒng),實(shí)現(xiàn)電源和數(shù)據(jù)的無電纜安裝。這使計(jì)算基礎(chǔ)設(shè)施能夠與物理機(jī)架、網(wǎng)絡(luò)和電源基礎(chǔ)設(shè)施分開安裝和維護(hù)。這可以顯著降低遠(yuǎn)程現(xiàn)場位置的運(yùn)營和維護(hù)成本,并允許在機(jī)架或機(jī)架子單元中異構(gòu)部署專用硬件。
讓機(jī)器人在需要更大容量時(shí)安裝新的Open19服務(wù)器還需要一段時(shí)間,但預(yù)先連接的機(jī)架在安裝任何計(jì)算之前可以同時(shí)連接電源、冷卻系統(tǒng)和網(wǎng)絡(luò),已經(jīng)加速了Equinix等早期采用者的構(gòu)建和修復(fù)。

大多數(shù)邊緣位置都將部署硬件以延長使用壽命:云硬件的使用壽命為5-7年或更久,但是預(yù)期的維護(hù)和物理服務(wù)的頻率甚至更低。一個(gè)極端的例子是微軟的實(shí)驗(yàn)性水下數(shù)據(jù)中心Project Natick,它在2020年產(chǎn)生了令人鼓舞的結(jié)果,不僅是因?yàn)轭A(yù)期的冷卻效率,還因?yàn)樵诘獨(dú)猸h(huán)境下,沒有受到維護(hù)方面的干擾,服務(wù)器運(yùn)行的穩(wěn)定性和正常運(yùn)行時(shí)間:故障率為陸地上標(biāo)準(zhǔn)Azure數(shù)據(jù)中心中相同服務(wù)器的八分之一,這是除了必要性之外的一大優(yōu)勢。
彈性和容災(zāi)也將在邊緣發(fā)展。最大化數(shù)據(jù)中心正常運(yùn)行時(shí)間的傳統(tǒng)方法往往依賴于完全冗余(例如,2n+1)機(jī)械系統(tǒng),這些系統(tǒng)通常成本太高,并且在邊緣位置占用太多空間。在邊緣環(huán)境中,系統(tǒng)正常運(yùn)行時(shí)間將由高可用性軟件和人工智能輔助自動(dòng)化提供,就像當(dāng)今主要依賴物理冗余的標(biāo)準(zhǔn)一樣。軟件編排允許開發(fā)人員在多個(gè)位置生成工作負(fù)載,高可用性軟件系統(tǒng)可以使用實(shí)時(shí)和預(yù)測性遙測饋送將流量路由到最佳可用的位置,并在檢測到故障時(shí)重新啟動(dòng)附近位置的服務(wù)。
網(wǎng)絡(luò)硬件正變得越來越基于軟件。電信公司正在推動(dòng)和采用數(shù)據(jù)中心熟悉的軟件定義網(wǎng)絡(luò)(Software-Defined Networking,SDN)和網(wǎng)絡(luò)功能虛擬化(Network Functions Virtualization,NFV)趨勢,希望圍繞商品“白盒”服務(wù)器設(shè)備進(jìn)行標(biāo)準(zhǔn)化,從而允許將工作負(fù)載放置在低成本硬件上的更多位置。其中包括在客戶終端將多個(gè)專有硬件設(shè)備整合到單個(gè)通用白盒設(shè)備上,這一點(diǎn)尤為重要。通用客戶終端設(shè)備(Universal Customer Premise Equipment,uCPE)并不新鮮,但它已經(jīng)不再是預(yù)測,而是成為了現(xiàn)實(shí)。許多現(xiàn)有的uCPE設(shè)備使用英特爾處理器,但這是ARM重點(diǎn)瞄準(zhǔn)的領(lǐng)域。
電信公司擁有充分利用SmartNIC的網(wǎng)絡(luò)專業(yè)知識(shí),隨著更多標(biāo)準(zhǔn)化軟件支持的到來,企業(yè)現(xiàn)在才可以使用這些SmartNIC,但它們應(yīng)該非常適合邊緣。
數(shù)據(jù)處理單元(Data Processing Unit,DPU)的功率預(yù)算僅比服務(wù)器中網(wǎng)卡的功率預(yù)算有所增加。因此,這些設(shè)備可能被證明是一種高效的方式,可以在電力可用性有限的位置實(shí)現(xiàn)加速并釋放邊緣服務(wù)器上的CPU內(nèi)核。可以運(yùn)行SoNIC等網(wǎng)絡(luò)操作系統(tǒng)的SmartNIC還可以在某些邊緣位置消除對單獨(dú)交換機(jī)的需求,這意味著非技術(shù)人員可以通過插入電源線和以太網(wǎng)電纜來安裝服務(wù)器。
存儲(chǔ)
正如SmartNIC從CPU卸載特定網(wǎng)絡(luò)的處理一樣,計(jì)算存儲(chǔ)正在成為一種在數(shù)據(jù)存儲(chǔ)的確切位置執(zhí)行數(shù)據(jù)處理和簡單的存儲(chǔ)相關(guān)應(yīng)用(如壓縮、加密、備份或搜索)的方式。這對于在邊緣運(yùn)行的數(shù)據(jù)密集型應(yīng)用具有功率和性能優(yōu)勢,并且隨著存儲(chǔ)陣列中的嵌入式計(jì)算變得更加復(fù)雜,它可以支持更多的工作負(fù)載。
機(jī)器學(xué)習(xí)訓(xùn)練通常從存儲(chǔ)中讀取數(shù)據(jù),并將模型寫回存儲(chǔ)中。將訓(xùn)練算法轉(zhuǎn)移到可以在存儲(chǔ)設(shè)備上執(zhí)行搜索和聚合的設(shè)備上計(jì)算資源中,可以釋放CPU用于其它工作,或通過允許工作負(fù)載在較低規(guī)格的設(shè)備上運(yùn)行來降低功耗要求。更低的延遲甚至可以提高訓(xùn)練性能。
計(jì)算存儲(chǔ)甚至可以在物聯(lián)網(wǎng)設(shè)備上運(yùn)行云服務(wù)的邊緣版本,因?yàn)樗捎肧SD和非易失性存儲(chǔ)器標(biāo)準(zhǔn)(NonVolatile Memory Express,NVMe)封裝,適合沒有其它加速選項(xiàng)的設(shè)備。隨著三星加入了少數(shù)且鮮為人知的已經(jīng)提供計(jì)算存儲(chǔ)設(shè)備的供應(yīng)商的行列,這項(xiàng)技術(shù)有望在長期內(nèi)成為主流。
雖然邊緣計(jì)算的當(dāng)前趨勢通常涉及更緊密的加速集成,但超大規(guī)模云提供商正在開始研究分類體系結(jié)構(gòu)。為了減少熟悉的多租戶方法不可避免的碎片化,其中計(jì)算、存儲(chǔ)、網(wǎng)絡(luò)和內(nèi)存成為一組可組合的結(jié)構(gòu),機(jī)柜式架構(gòu)(RSA)分別部署了CPU、GPU、硬件加速、RAM、存儲(chǔ)和網(wǎng)絡(luò)容量。然后動(dòng)態(tài)組合資源以適應(yīng)任意規(guī)模的工作負(fù)載;甚至主板的組件也可以進(jìn)行模塊化和分離。非易失性內(nèi)存模型,如NVMe和英特爾的Optane,提供了一組有趣的組件,將類似內(nèi)存的性能與持久存儲(chǔ)相結(jié)合,允許在電源可靠性可能存在問題的情況下進(jìn)行高性能操作。隨著NVMe over TCP標(biāo)準(zhǔn)添加到Linux內(nèi)核中,計(jì)算、RAM和存儲(chǔ)的分解變得更加引人注目和可靠。
低延遲網(wǎng)絡(luò)是邊緣計(jì)算基礎(chǔ)設(shè)施的重要組成部分,必須以足夠的密度和本地臨近度來實(shí)施,以便網(wǎng)絡(luò)連接在端點(diǎn)設(shè)備附近終止。隨著通用邊緣網(wǎng)絡(luò)的出現(xiàn),它們將重塑互聯(lián)網(wǎng)路由數(shù)據(jù)的方式。例如,隨著越來越多的數(shù)據(jù)在本地創(chuàng)建并保存在本地,互連密度將在邊緣激增,公共和私有互聯(lián)網(wǎng)骨干網(wǎng)將延伸到邊緣,對等互聯(lián)和數(shù)據(jù)交換將發(fā)生在接入網(wǎng)的一兩跳內(nèi),這也是新一代邊緣CDN和邊緣云系統(tǒng)將運(yùn)行的地方。
但邊緣網(wǎng)絡(luò)的挑戰(zhàn)不僅僅是時(shí)延和抖動(dòng)。例如,為了讓無線接入網(wǎng)絡(luò)利用邊緣計(jì)算、對等互聯(lián)和交換點(diǎn),無線網(wǎng)絡(luò)必須能夠在本地終止數(shù)據(jù)連接。這被稱為本地突破,在不同的地理區(qū)域和不同的技術(shù)之間,其復(fù)雜性會(huì)有很大的差異。
邊緣網(wǎng)絡(luò)是使用固定和無線連接,并依照公共和私有解決方案構(gòu)建的。在某些情況下,特別是對于本地部署,需要新的和升級(jí)的網(wǎng)絡(luò)設(shè)備,如通用客戶終端設(shè)備(uCPE),以利用當(dāng)前和新興的邊緣設(shè)備。此外,除了云增強(qiáng)和邊緣原生服務(wù)外,可能需要新設(shè)備來支持邊緣服務(wù),包括內(nèi)容分發(fā)網(wǎng)絡(luò)(CDN)和應(yīng)用分發(fā)網(wǎng)絡(luò)(ADN)。
隨著邊緣計(jì)算解決方案的激增,它們需要敏捷的連接,以高效地適應(yīng)不同的操作環(huán)境和服務(wù)需求。當(dāng)邊緣解決方案依賴于跨異構(gòu)網(wǎng)絡(luò)環(huán)境的廣域網(wǎng)(WAN)連接時(shí),情況尤其如此。例如,與自動(dòng)駕駛汽車和移動(dòng)游戲相關(guān)的移動(dòng)服務(wù)必須在WAN環(huán)境中可靠地運(yùn)行。軟件定義廣域網(wǎng)(SD-WAN)解決方案支持網(wǎng)絡(luò)資源的敏捷管理,以便在需要的時(shí)間和地點(diǎn)調(diào)配網(wǎng)絡(luò)資源。
邊緣計(jì)算對網(wǎng)絡(luò)基礎(chǔ)設(shè)施提出了新的要求。為此,專用邊緣網(wǎng)絡(luò)應(yīng)運(yùn)而生。傳統(tǒng)回傳網(wǎng)絡(luò)過載的背景下,新的后端服務(wù)可能需要在邊緣節(jié)點(diǎn)間遷移,保持足夠接近相關(guān)的數(shù)據(jù)和設(shè)備,尤其是當(dāng)設(shè)備處于運(yùn)行狀態(tài)時(shí)。在邊緣,網(wǎng)絡(luò)路由會(huì)監(jiān)控延遲和擁塞,同時(shí),網(wǎng)絡(luò)路由可以根據(jù)QoS目標(biāo)動(dòng)態(tài)重新配置。邊緣網(wǎng)絡(luò)實(shí)時(shí)適應(yīng)應(yīng)用和網(wǎng)絡(luò)條件的服務(wù)方面越來越敏捷,通常是通過整合數(shù)據(jù)中心和云技術(shù),如VXLAN,這些技術(shù)允許創(chuàng)建動(dòng)態(tài)層2網(wǎng)絡(luò)。動(dòng)L2網(wǎng)絡(luò)可以在保持IP地址不變的情況下,簡化后端服務(wù)從一個(gè)邊緣服務(wù)器到另一個(gè)邊緣服務(wù)器、從一個(gè)L2交換機(jī)到另一個(gè)L2交換機(jī)的實(shí)時(shí)遷移,同時(shí)保證服務(wù)的連續(xù)性。在其它條件下,這種服務(wù)的連續(xù)性難以實(shí)現(xiàn)。
邊緣計(jì)算網(wǎng)絡(luò)與部署在邊緣的設(shè)備的連接依賴各種無線技術(shù)。盡力而為的邊緣服務(wù)由Wi-Fi和低功耗無線接入(Low Power Wireless Access,LPWA)等未經(jīng)許可的無線技術(shù)支持。Wi-Fi用于本地提供寬帶服務(wù),版本不斷升級(jí),如Wi-Fi 6和802.11be。LPWA在非授權(quán)頻譜中提供廣域覆蓋,盡管只有窄帶能力。與此同時(shí),越來越多的邊緣服務(wù),尤其是邊緣原生服務(wù)(如協(xié)作自動(dòng)駕駛汽車和移動(dòng)沉浸式游戲),對網(wǎng)絡(luò)可用性、可靠性、帶寬和延遲性能要求極高,可能超過非授權(quán)頻譜技術(shù)可提供的能力。
衛(wèi)星連接用于全球覆蓋的邊緣計(jì)算服務(wù)的主干網(wǎng)絡(luò),如海洋或石油平臺(tái)應(yīng)用。近年來,高吞吐量衛(wèi)星(HTS)技術(shù)的出現(xiàn)顯著提高了衛(wèi)星性能。衛(wèi)星星座按軌道可分為低軌(LEO)、中軌(MEO)和地球同步軌道(GEO)衛(wèi)星星座。更高軌道的GEO衛(wèi)星可以提供更廣的覆蓋,并且所需的衛(wèi)星數(shù)量更少,但連接延遲更大。
4G-LTE、LTE-M(Cat-M1)、NB-IoT(窄帶物聯(lián)網(wǎng))和5G等授權(quán)頻譜都有望用于無線邊緣連接。所需資源可以通過與移動(dòng)網(wǎng)絡(luò)運(yùn)營商的商業(yè)關(guān)系獲得,在可以獲得私有和工業(yè)許可證的市場中獲得,或者部署在共享頻譜許可證中,例如美國的公民寬帶無線電服務(wù)(Citizens Broadband Radio Service,CBRS)頻段。
隨著數(shù)字服務(wù)的激增和對邊緣計(jì)算需求的推動(dòng),對網(wǎng)絡(luò)性能的多樣性要求將繼續(xù)增加。我們必須在考慮現(xiàn)有網(wǎng)絡(luò)技術(shù)的能力、各方需求以及其它因素(包括總擁有成本和地理覆蓋要求)的基礎(chǔ)上仔細(xì)評估這些要求。
下載鏈接:邊緣計(jì)算市場和生態(tài)報(bào)告(2021)
人工智能核心技術(shù)產(chǎn)業(yè)白皮書(2021)
本號(hào)資料全部上傳至知識(shí)星球,更多內(nèi)容請登錄智能計(jì)算芯知識(shí)(知識(shí)星球)星球下載全部資料。

免責(zé)申明:本號(hào)聚焦相關(guān)技術(shù)分享,內(nèi)容觀點(diǎn)不代表本號(hào)立場,可追溯內(nèi)容均注明來源,發(fā)布文章若存在版權(quán)等問題,請留言聯(lián)系刪除,謝謝。
電子書<服務(wù)器基礎(chǔ)知識(shí)全解(終極版)>更新完畢,知識(shí)點(diǎn)深度講解,提供182頁完整版下載。
獲取方式:點(diǎn)擊“閱讀原文”即可查看PPT可編輯版本和PDF閱讀版本詳情。
溫馨提示:
請搜索“AI_Architect”或“掃碼”關(guān)注公眾號(hào)實(shí)時(shí)掌握深度技術(shù)分享,點(diǎn)擊“閱讀原文”獲取更多原創(chuàng)技術(shù)干貨。

