IDC:未來計算的十大特征


過去數(shù)十年,算力的發(fā)展經(jīng)歷了性能優(yōu)化、綜合創(chuàng)新兩個階段。在性能優(yōu)化階段,隨著制作工藝的不斷提升,半導體行業(yè)一直遵循著每隔18-24個月,集成電路上可容納的元器件數(shù)目便會增加一倍的摩爾定律,芯片的性能也會隨之翻倍。
然而,芯片的制作正在接近物理極限;同時,芯片研發(fā)的成本也越來越高,單靠芯片性能的提升已經(jīng)五法滿足數(shù)字化時代下新興技術應用對算力的需求,例如人工智能領域中,新的算法模型無論是參數(shù)量還是復雜程度都開始呈現(xiàn)指數(shù)級的增長趨勢。

為了應對新興技術帶來的挑戰(zhàn),算力進入了綜合創(chuàng)新階段。云計算落地使得算力以更經(jīng)濟方式得到普惠;除CPU之外的大量協(xié)處理器被采用,由GPU、FPGA等加速芯片構成的異構計算使特定領域下的計算性能得到極大的提升。
IDC認為,未來算力正朝著靈活部署、智能自治的方向演進。企業(yè)對多云、混合云的使用越來越深入,開始利用邊緣計算形成云-邊-端協(xié)同的部署方式,開始使用內存驅動的基礎架構和新一代互聯(lián)技術對算力進行優(yōu)化,開始通過人工智能進行數(shù)據(jù)全生命周期的管理和運維,并著重建設數(shù)據(jù)安全體系和數(shù)字信任。針對算力的發(fā)展趨勢,IDC總結了未來算力的十大特征。

從數(shù)據(jù)前端采集到處理、存儲管理和應用,數(shù)據(jù)在企業(yè)內部和外部流轉的全過程中都需要能夠全方位支撐的IT基礎架構,這種支撐對現(xiàn)在算力的平臺的覆蓋提出了更多的要求。

數(shù)據(jù)采集:全球各行業(yè)用戶更加深刻地認識到數(shù)字化轉型的重要性和必然性,邊緣計算、人工智能、云、5G等技術在行業(yè)的應用越來越廣泛且深入,技術的應用促使海量數(shù)據(jù)的產(chǎn)生。伴隨著新業(yè)務的不斷開發(fā),企業(yè)數(shù)據(jù)呈全方位增加,且數(shù)據(jù)類型越來越多樣,大量非結構化數(shù)據(jù)不斷產(chǎn)生。這對數(shù)據(jù)采集系統(tǒng)的要求越來越高,系統(tǒng)需高效智能運用,并保證數(shù)據(jù)在后續(xù)的處理、決策、分析及信息服務能夠全面、準確、及時。
數(shù)據(jù)的存儲與管理:由于數(shù)據(jù)將成為企業(yè)重要資產(chǎn),保證數(shù)據(jù)的可靠性是主要要求。業(yè)務和應用對數(shù)據(jù)基礎設施的要求升級為可靠及可持續(xù)的服務,數(shù)據(jù)基礎設施要支撐數(shù)據(jù)中心演進成為組織機構的數(shù)據(jù)運營服務中心,承擔著運營支撐,信息資源服務,核心計算,數(shù)據(jù)存儲和備份,以及確保業(yè)務連續(xù)性等任務,使得數(shù)據(jù)基礎設施愈發(fā)復雜。
數(shù)據(jù)處理與傳輸:未來非結構化數(shù)據(jù)增速加快,對實時性需求也不斷攀升,數(shù)據(jù)大量且多樣化的增?給數(shù)據(jù)的處理帶來了極大的挑戰(zhàn)。當下各行各業(yè)的管理或生產(chǎn)在向智能化、自動化方向發(fā)展,比如金融的智能投顧、制造的智能質檢等,這些業(yè)務場景都需要數(shù)據(jù)被快速傳輸并處理,以滿足對數(shù)據(jù)的實時性需求,傳統(tǒng)IT基礎架構所提供的算力已經(jīng)很難滿足實際需求。
數(shù)據(jù)分析與利用:經(jīng)過采集、存儲、管理和處理的過程,系統(tǒng)需要從海量數(shù)據(jù)中迅速發(fā)現(xiàn)、快速捕捉有價值的信息進行準確分析和利用,使其價值最?化。在數(shù)字經(jīng)濟時代,數(shù)據(jù)正在借助多種新興技術賦能應用,未來的算力將不僅存在于核心數(shù)據(jù)中心,也同時會覆蓋到數(shù)據(jù)的采集、處理和應用過程中所涉及的端、邊緣等設備的技術創(chuàng)新。從云、網(wǎng)絡到邊緣,未來計算平臺將會在特定領域實現(xiàn)特定功能,提升數(shù)據(jù)分析和應用的能力。

隨著企業(yè)業(yè)務的不斷拓展以及數(shù)據(jù)量的爆發(fā),單一的IT基礎架構已經(jīng)無法滿足企業(yè)快速發(fā)展的需求,尤其通過對數(shù)據(jù)安全性、可擴展、可管理、性能、存儲空間和成本效益等需求的綜合考量,多云和混合云成為更多企業(yè)為了滿足靈活性擴展做出的主流選擇。
縱觀全球,云計算已經(jīng)從單純地以滿足資源型需求為主的中心云基礎設施,發(fā)展成為匯聚各類信息技術,覆蓋不同區(qū)域部署、兼顧垂直?業(yè)特定需求的新一代云平臺生態(tài)系統(tǒng),能夠更好地?持企業(yè)的云原生應用、自動化管理和業(yè)務創(chuàng)新,并滿足用戶在任何時間、任何地點對任何應用的響應需求。隨著企業(yè)業(yè)務的不斷拓展,單一云的運營模式已經(jīng)無法滿足企業(yè)快速發(fā)展的需求,5G、人工智能、大數(shù)據(jù),區(qū)塊鏈等新技術的發(fā)展也將成為企業(yè)云計算平臺建設的推動力,多云、混合云以及邊緣云已經(jīng)成為更多企業(yè)為了滿?靈活性擴展做出的不二選擇。因此,集云成本管理、云資源整合和跨云調度等功能的多云管理平臺及服務應運而生,并將成為企業(yè)數(shù)字化轉型的核心支柱。
隨著多云時代的來臨,越來越多的企業(yè)在確保IT基礎架構穩(wěn)定性和安全性的前提下,開始關注基礎架構的敏捷性和運營效率。未來工作負載將越來越豐富,而多云和混合云構成的混合IT環(huán)境是未來數(shù)字化基礎架構的發(fā)展趨勢。企業(yè)也將針對不同的應用和工作負載進行基礎架構選擇并部署到最佳位置,將傾向于采用敏捷的數(shù)字基礎架構并實現(xiàn)IT運營效率和創(chuàng)新能力的提升。
IDC預測,到2024年,全球應用程序的數(shù)量將超過過去40年的總和。而60%以上的ISV將重新架構或構建新的云原生應用,為客戶實現(xiàn)云成本控制、云應用快速升級提供更好的選擇。為了獲得業(yè)務敏捷性,全球企業(yè)將致力于通過使用云原生開發(fā)和部署服務,在2022年前實現(xiàn)其50%的現(xiàn)有應用的現(xiàn)代化。
?在企業(yè)業(yè)務需求推動下,人工智能應用已經(jīng)實現(xiàn)從點到面式的發(fā)展,也從通用應用場景滲透到更多行業(yè)特定場景,逐漸成為企業(yè)發(fā)展和生存的剛需。隨著AI技術在各行業(yè)的廣泛應用,深度學習作為訓練模型的主流算法,也需要強大的并行處理能力,服務器供應商通過為服務器配置更強大的處理器如:GPU,F(xiàn)PGA以及ASIC芯片等提升計算能力。

目前較為受關注的異構計算方式有CPU+GPU, CPU+FPGA以及CPU+ASIC,與傳統(tǒng)服務器相比,異構服務器主要的提升為通過協(xié)處理器實現(xiàn)更多的并行計算和低延遲的計算能力,支持更大容量的內存滿足當下實時負載增加的需求,提供更多外置硬盤插槽,并廣泛支持NVMe/PCIE等協(xié)議,滿足數(shù)據(jù)洪流需求。
在異構計算支撐下,人工智能能夠解決的企業(yè)需求越來越多,對各行業(yè)的滲透更加深入,其中互聯(lián)網(wǎng)、政府、金融、電信、制造等行業(yè)對于人工智能的使用已經(jīng)日趨成熟,很多碎片化應用也開始被廣泛使用,并輻射到媒體娛樂、現(xiàn)代農業(yè)、智能家居等多個不同領域。目前中國較為成熟的應用場景包括精準營銷、公共安全及預警等。未來,有望得到?泛的應用場景包括:智能導診,自動駕駛,IT自動化等。這些場景的逐漸落地與應用,將進一步促進異構計算市場的發(fā)展。

IDC認為,未來數(shù)字化基礎架構將從過去傳統(tǒng)的云到端部署,演進為云-邊-端協(xié)同無處不在的新型計算架構,越來越多的企業(yè)正在向混合型業(yè)務模式轉型,新冠疫情也迫使企業(yè)做出改變,成為真正的“分布式”的企業(yè),向混合型業(yè)務模式的轉變將增加企業(yè)對靈活的、地理分散的基礎架構資源的需求,尤其是邊緣基礎架構的需求。邊緣計算從概念提出發(fā)展至今,已經(jīng)逐步落地階段,在中國,制造、交通、能源等行業(yè)已經(jīng)率先布局邊緣計算,道路管理、設備監(jiān)測等多個場景。
人工智能的落地進一步促進了邊緣計算的發(fā)展,邊緣計算可以讓人工智能就近服務于數(shù)據(jù)源或者使用者,未來,邊緣智能將成為邊緣計算的重要形態(tài),從?更好地實現(xiàn)?動駕駛、智能安防、智能質檢、智能診斷、智能家居等多個領域的應用。
IDC預計,到2023年,80%混合型業(yè)務的企業(yè)將會把至支持人工智能和邊緣基礎架構上的投資增加4倍,以確保實時的業(yè)務敏捷性和洞察力。根據(jù)IDC統(tǒng)計,2020年上半年,中國邊緣計算定制服務器的出貨量中,單路服務器占比已經(jīng)超過10%,高于整體服務器市場中單路服務器6.1%的占比。

內存驅動的基礎架構使?新興的持久性內存技術來降低數(shù)據(jù)訪問的延遲,這些延遲遠遠超出了主內存的有限容量,同時提供了極佳的性能和企業(yè)級存儲管理功能。內存驅動的基礎架構利用了諸如NVMe、NVMe over Fabrics、SCM等技術,提供了滿?下?代應用不斷發(fā)展的性能、可靠性和功能需求所需的功能,這些應用在企業(yè)數(shù)字化轉型的加速過程中正被廣泛的部署。
使用SCM技術有諸多好處,目前雖然固態(tài)硬盤在逐步的替換傳統(tǒng)硬盤,使存儲系統(tǒng)性能大為提升,但是從內存到固態(tài)硬盤之間仍然存在延遲的瓶頸,而SCM這種性能介于內存和固態(tài)硬盤之間的技術,可以有效幫助消除這一瓶頸,它能夠提供接近DRAM的性能和更大的存儲容量,每GB的成本比傳統(tǒng)的內存更低,同時,該技術的性能密度提高了其他方面效率,例如需要較少的后端存儲容量,縮減存儲基礎架構的開支,所以在實現(xiàn)DRAM替換和持久性內存這些用例上可以提升計算平臺的性價比。

異構計算成為未來支撐超大算力的重要解決方案,而下一代互聯(lián)技術同樣得到快速發(fā)展為算力的提升提供基礎。邊緣計算、人工智能、高性能計算等工作負載均對運算能力和速度提出了前所未有的要求,而隨著摩爾定律失效以及功耗的限制,未來的基礎架構將從“以處理器為中心的計算”向“以內存為中心的計算”轉變,通過解構實現(xiàn)以內存為中心的共享內存資源池將降低節(jié)點間的數(shù)據(jù)傳輸功耗和延時,從而促進未來算力和SCM技術的突破。
互聯(lián)的定義即為GPU、FPGA、ASIC或其它加速卡與CPU之間的數(shù)據(jù)連接。在CPU與加速卡之間,以及加速卡之間形成的芯片互聯(lián)技術被更多的采用,雖然PCIe有著非常通用的標準化設計,但帶寬有限將會產(chǎn)生瓶頸IT廠商等在芯心互聯(lián)技術方面持續(xù)升級,以提供速度更快和擴展性更強的互聯(lián)。以CXL和Gen-Z為代表的等下一代互聯(lián)技術取得快速發(fā)展,采用和擴展“以內存為中心”的互連是行業(yè)需要關注的技術方向,同時總線的創(chuàng)新也帶來了在單個機箱外部擴展亞微秒級延遲技術的機會,為架構創(chuàng)新創(chuàng)造了可能。
PCIe即PCI-Express,是一種高速串行計算機擴展總線標準,也是目前主流的下一代總線標準,最常見的互聯(lián)類型是PCIe 3.0。PCI 特別興趣小組(PCI-SIG)于2017年底發(fā)布了PCIe 4.0標準,將 PCIe 3.0 的帶寬翻了一倍,并于2019年正式發(fā)布了PCIe 5.0規(guī)范,帶寬是PCIe 3.0的四倍。在即將來PCIe 5.0高帶寬時代,通用CPU和加速芯片間的協(xié)同、互聯(lián)以及內存共享不僅將成為主流趨勢,還將推進異構服務器的性能擴展以及算力的大幅提升。
CXL互聯(lián)協(xié)議是基于PCIe 5.0之上的互聯(lián)方案,服務于高性能計算機和數(shù)據(jù)中心領域的超高速互聯(lián)新標準,主要用于CPU和加速芯片之間通信。在PCIe5.0高帶寬時代,CXL將會成為一項關鍵性技術,使加速器和CPU之間實現(xiàn)更加連貫的內存共享。隨著數(shù)據(jù)爆炸式增長,以及特定工作負載的快速創(chuàng)新,例如壓縮、加密和人工智能等促進了異構計算中專用加速器和通用CPU的協(xié)同工作。這些加速器不僅需要與處理器實現(xiàn)高性能連接,理想情況下,它們還能夠共享一個公共內存,以減少損耗和延遲。CXL在CPU和加速芯片(如GPU、FPGA 和網(wǎng)絡)之間創(chuàng)建了高速、低延遲的互連性,使設備之間實現(xiàn)內存一致性,允許資源共享,同時可以簡化相關硬件的設計難度和軟件堆棧的復雜性,降低整套系統(tǒng)的成本。
Gen-Z是一種開放系統(tǒng)互連架構,旨在通過直接連接、交換或Fabric拓撲為數(shù)據(jù)和設備提供內存語義訪問。Gen-Z以內存為中?的基于標準的方案致力于提供開放、可靠、靈活、安全和高性能的架構,在巨量信息進入數(shù)據(jù)心之際實現(xiàn)對它的容納和分析。Gen-Z技術支持廣泛的新型存儲級內存介質和加速設備,采用了以內存為中心的新型混合計算技術和經(jīng)過性能優(yōu)化的系列高效解決方案。
另外,NVLink是一種高速、直接的 GPU 到 GPU 互聯(lián)技術,通過為多 GPU 系統(tǒng)配置提供更高的帶寬、更多的連接和改進的可擴展性解決互連問題。NVSwitch將多個 NVLink加以整合,在單個節(jié)點內以NVLink的較高速度實現(xiàn)多對多的 GPU 通信。Infinity Fabric總線技術,目前支持CPU-CPU以及GPU-GPU之間的連接,下一代Infinity Fabric技術將最多支持8個GPU芯片的連接,并支持CPU-GPU間的連接,為加速計算提供動力。還有OpenCAPI和CCIX等新興互連標準,旨在為加速器,內存和處理器提供更緊密的耦合。

過去的幾十年,承載算?的底層基礎架構從大型主機到小型機、再到橫向擴展的X86架構,經(jīng)歷了多輪演變。隨著智能設備以及數(shù)據(jù)量的爆發(fā)對算力需求激增,面向企業(yè)關鍵應用、AI加速、大數(shù)據(jù)分析的?作負載層出不窮,以及超大規(guī)模數(shù)據(jù)中心應用越來越廣泛等因素,均促使數(shù)據(jù)中心的機架密度迎來快速的上漲,這也成為企業(yè)降本增效的共識。IDC定義的密度優(yōu)化服務器,是指具有多個計算節(jié)點且節(jié)點間共享電源、冷卻、存儲、網(wǎng)絡、交互或管理等物理資源的服務器,實現(xiàn)在更小的空間內集成更多的處理器和I/O擴展能力,極大的降低了空間成本并顯著提升系統(tǒng)性能。
超融合、異構計算等新技術促使密度優(yōu)化服務器的形態(tài)更加多樣,在整機柜機架密度以及服務器單機密度大幅提升的趨勢下,將提升對數(shù)據(jù)中心的計算效率和功率密度,相應地對數(shù)據(jù)中心散熱也提出了新的挑戰(zhàn)。廠商在服務器的設計中不斷進行創(chuàng)新和突破,在接近服務器或核心的CPU層面,采用風冷、液冷、風扇設計優(yōu)化、機架后方熱量交換器等新型的冷卻技術來有效降低服務器單機散熱的問題。

目前,CPU內核的數(shù)量擴展越來越多,主流芯片支持64個核心,未來核心數(shù)還會進一步擴展,這個使得CPU的性能增長更加線性,同時功能集的一致性得到增強,可以有效幫助計算平臺支撐橫向擴展以面向全新的IT基礎架構,同時滿足AI等數(shù)字化架構的全新應用需求。簡單說,用戶需要更多數(shù)量的內存來填充每個核,而不只是考慮更多的內存容量,如何選擇合適的內存數(shù)量和容量,從而達到性能最優(yōu),是用戶在采用Chiplet架構時需要重點考慮的問題。
Chiplet從初期的設計思路提出,到AMD的EYPC系列的成功,開始進如主流視野,隨后應?于FPGA芯片中。未來,Chiplet設計會成為提升算例的另一個演進方向,該生態(tài)將會由傳統(tǒng)芯片廠商、小型初創(chuàng)企業(yè)以及超大規(guī)模互聯(lián)網(wǎng)公司共同建設,對于最終用戶來說,無疑是降本增效的選擇之一。

智能運維將依賴于人工智能技術和機器學習實現(xiàn),云計算為資源調配提供了一個控制點和自助服務功能,使開發(fā)和DevOps團隊能夠快速訪問資源。智能運維可持更高級別工作負載的可移植性和對高度動態(tài)應?程序的支持,同時可以控制成本,實現(xiàn)安全法規(guī)的遵從性。

確保數(shù)據(jù)的安全應從最底層的IT基礎架構開始,IT基礎架構的透明化對于數(shù)據(jù)的安全性和可靠性對于下一個十年至關重要,未來,將有更多的安全解決方案利人工智能、區(qū)塊鏈等一些新興技術,以提高風險管理能力,并實現(xiàn)預先的威脅監(jiān)測等防護功能。除此之外,IDC認為,供應鏈網(wǎng)絡的安全同樣重要:供應鏈網(wǎng)絡的安全需要確保在半導體、各子系統(tǒng)和系統(tǒng)制造的各個階段保護產(chǎn)品的IP和安全完整性,它可以確保在半導體制造以及半導體和?系統(tǒng)被納入最終產(chǎn)品時的安全。這使得知識產(chǎn)權所有者可以信任供應鏈合作伙伴,并幫助供應鏈合作伙伴獲得更多的客戶,因為其知識產(chǎn)權受到了保護,它還可以確保產(chǎn)品不受篡改并可溯源,在供應鏈的各個環(huán)節(jié)確保更高的安全性。
內容來源于“智能計算芯世界”,本期內容分享完畢,更多內容參考:未來計算十大趨勢。
1、EDA行業(yè)研究框架
2、半導體大硅片研究框架
3、封測行業(yè)研究框架
4、光刻機行業(yè)研究框架
4、國產(chǎn)FPGA研究框架
5、國產(chǎn)基帶芯片研究框架
6、深度報告:NOR存儲芯片研究框架
1、行業(yè)深度報告:GPU研究框架
2、信創(chuàng)產(chǎn)業(yè)研究框架
3、ARM行業(yè)研究框架
4、CPU研究框架
5、國產(chǎn)CPU研究框架
6、行業(yè)深度報告:GPU研究框架
《三種使用PCIe IP的節(jié)能技術》
《5G如何影響芯片設計》?
《從數(shù)據(jù)中心到邊緣的AI芯片設計》?
《多通道LPDDR4性能和功耗優(yōu)化》?
《工業(yè)物聯(lián)網(wǎng)在半導體行業(yè)中的機遇》?
《人工智能專用SoC芯片IP需求分析》

轉載申明:轉載本號文章請注明作者和來源,本號發(fā)布文章若存在版權等問題,請留言聯(lián)系處理,謝謝。
推薦閱讀
更多架構相關技術知識總結請參考“架構師全店鋪技術資料打包”相關電子書(35本技術資料打包匯總詳情可通過“閱讀原文”獲取)。
全店內容持續(xù)更新,現(xiàn)下單“全店鋪技術資料打包(全)”,后續(xù)可享全店內容更新“免費”贈閱,價格僅收188元(原總價290元)。
溫馨提示:
掃描二維碼關注公眾號,點擊閱讀原文鏈接獲取“架構師技術全店資料打包匯總(全)”電子書資料詳情。

