

中央處理器(CPU,Central Processing Unit)是一臺計算機的運算和控制核心,其功能主要是完成對計算機指令的執(zhí)行和對數(shù)據(jù)的處理,CPU與內(nèi)部存儲器、輸入/輸出設備被認為是電子計算機三大核心部件。
為持久內(nèi)存優(yōu)化的存儲引擎什么樣?

目前幾乎所有馮·諾伊曼型計算機的CPU的工作流程可以分為:提取指令、指令編譯、指令執(zhí)行、訪問主存并讀取操作數(shù)、寫回等五個階段。CPU的幾大主要結(jié)構(gòu)在過程中的作用如下:控制單元(Control Unit)作為CPU的控制中心,負責將存儲器中的數(shù)據(jù)發(fā)送至運算單元并將運算后的結(jié)果存回到存儲器中,其一切行為均來自于指令。運算單元(Arithmetic/Logic Unit)可以執(zhí)行算術運算和邏輯運算。它執(zhí)行來自于控制單元的命令。存儲單元(Registers、Cache)是CPU中數(shù)據(jù)暫時存儲的位置,其中寄存有待處理或者處理完的數(shù)據(jù)。寄存器(Registers)較內(nèi)存相比,可以減少CPU訪問數(shù)據(jù)的時間,也可以減少CPU訪問內(nèi)存的次數(shù),有助于提高CPU的工作速度。目前CPU架構(gòu)主要分為CISC(復雜指令集)和 RISC(精簡指令集)。
1971年美國英特爾公司推出世界第一款商用計算機微處理器Intel 4004,被認為是CPU發(fā)展史的開端。作為4位處理器,Intel 4004由10um制程工藝在2英寸晶圓上打造,集成了2300個晶體管,主頻為740kHz。到了2020年,第十一代酷睿處理器芯片基于英特爾10nm工藝打造,將集成超過百億個晶體管,最高主頻可高達4.8Ghz。這顆CPU芯片不再是單一的CPU,而是集成了全新架構(gòu)的Willow Cove內(nèi)核、Iris X圖形處理器、內(nèi)存控制器、圖像處理器、媒體解碼器、電源管理、神經(jīng)元加速器和各類高速接口控制器等各種組件。其中Willow Cove內(nèi)核正是這顆CPU芯片集成的傳統(tǒng)意義上的CPU。CPU的發(fā)展史,按照其處理信息的字長,可以分為:四位微處理器、八位微處理器、十六位微處理器、三十二位微處理器以及六十四位微處理器等等。

英特爾X86指令集中的單指令多數(shù)據(jù)流指令集可以劃分為MMX、SSE、AVX。英特爾的指令集采用疊加的方式向前發(fā)展,從奔騰的MMX到Skylake的AVX512,指令集的位數(shù)從64位升級至了512位。單次指令的負載能力提升了8倍。MMX指令集是多媒體拓展指令集的簡稱。初代的MMX僅提供整數(shù)運算,而不兼容浮點運算,且當年MMX的軟件支持進展緩慢;SSE是流式單指令多數(shù)據(jù)流的簡稱,該指令集創(chuàng)建了新的128位寬的寄存器文件(XMM0–XMM7)和新的單指令多數(shù)據(jù)流指令,解決了MMX的核心缺點;AVX是高級矢量拓展指令集的簡稱,該指令集使用16個YMM寄存器對多條數(shù)據(jù)執(zhí)行單個指令。

X86架構(gòu)目前占據(jù)服務器、桌面及移動PC的主要市場份額。從歷史發(fā)展來看,CISC誕生于1960年代,而RISC思想成立于1970年代,成熟于1980年代,CISC發(fā)展要早于RISC;從性能來看,CISC憑借其較強的單核性能領先于RISC,能夠更好的滿足服務器、桌面、移動PC的運算需求;從生態(tài)來看,上世紀80年代后期Intel和Windows組成的“Wintel”聯(lián)盟成立,打敗了蘋果、IBM、摩托羅拉的Power聯(lián)盟,自此Wintel壟斷桌面市場長達20多年。截止目前,服務器、桌面及移動PC市場主要使用X86架構(gòu)處理器,其中Intel更是憑借先發(fā)優(yōu)勢及生態(tài)優(yōu)勢占據(jù)市場大多數(shù)份額。后來隨著AMD第二代Epyc處理器“羅馬”問世,AMD的服務器CPU市占率在短短兩年內(nèi)從1%增長到了8%;接著AMD發(fā)布第三代Epyc處理器“米蘭”,其服務器市場份額有望達到15%。由于AMD服務器芯片的較高性價比及臺積電7納米制程技術的加成,越來越多的數(shù)據(jù)中心開始采購AMD的產(chǎn)品。因此,X86市場目前整體呈現(xiàn)Intel及AMD兩家獨大的競爭格局。
RISC具備高度優(yōu)化的指令集、大量的寄存器、高度規(guī)則的指令流水線以及讀取/存儲體系結(jié)構(gòu),使得RISC在執(zhí)行指令時速度較快且性能穩(wěn)定,從而適宜流水線方式運作,并在并行處理方面具備明顯優(yōu)勢。RISC概念是由Berkeley的David Patterson正式提出,1980年David Patterson 和 Carlo H. Sequin兩位教授領導了Berkeley RISC項目,該項目最終產(chǎn)生了RISC設計,生成了RISC-I的處理器;RISC成熟于20世紀80年代中后期,越來越多的商業(yè)RISC芯片開始廣泛應用;20世紀90年代后期,憑借開源、異構(gòu)運算、可定制化等優(yōu)勢,ARM開始大面積應用到低能耗的移動設備,伴隨著iPhone的問世以及谷歌推出基于ARM指令集的Android系統(tǒng)(AA體系),以ARM架構(gòu)為代表的RISC在移動設備領域大幅領先以X86為代表的CISC架構(gòu)。截止目前,RISC架構(gòu)仍占據(jù)移動設備領域主要市場份額,并隨著性能不斷提升及生態(tài)不斷完善,RISC架構(gòu)也在逐步進軍CISC為主的PC、桌面及服務器領域。
服務器、桌面和PC端長期被X86架構(gòu)占據(jù),目前RISC架構(gòu)主要應用在移動終端、嵌入式、超算等其他領域,如超90%的智能手機采用ARM架構(gòu),MIPS在嵌入式設備中有著廣泛應用,搭載了40960顆申威SW26010以及運行國產(chǎn)操作系統(tǒng)神威睿思的神威太湖之光獲得全球超級計算機第一名,并持續(xù)4年等等。
ARM架構(gòu):移動設備之王,逐步向服務器及桌面拓展
雖然X86架構(gòu)長期占據(jù)服務器、桌面、PC主要市場份額,但是近期RISC架構(gòu)也不斷向X86優(yōu)勢領域進攻,主要體現(xiàn)在兩個方面:一是技術層面走向融合,逐步適應X86架構(gòu)生態(tài),例如蘋果在軟件生態(tài)上通過Rosetta 2和Universal 2使原先基于X86的軟件可以無縫地運行在M1芯片中;二是性能不斷提升、生態(tài)不斷完善,與X86架構(gòu)正面競爭,例如蘋果A13在晶體管密度與1165g7相近,線程數(shù)少于對方1/4,主頻低于對方1/2的情況下,在性能方面領先英特爾1年;在服務器領域,ARM的新星架構(gòu)“Neoverse”,在單核心方面追平AMD和Intel的服務器CPU的同時,憑借ARM并行計算、能耗控制、易拓展性的優(yōu)勢,在多核性能方面超過對手60%以上,ARM的性能已經(jīng)不再成為短板。
ARM架構(gòu),曾稱進階精簡指令集機器(Advanced RISC Machine)更早稱作Acorn RISC Machine,是一個32位精簡指令集(RISC)處理器架構(gòu)。還有基于ARM設計的派生產(chǎn)品,重要產(chǎn)品包括Marvell的XScale架構(gòu)和德州儀器的OMAP系列。ARM架構(gòu)具有成本低、低費用、低功耗、小體積、高性能的特點。適用眾核架構(gòu),適合高并發(fā)、高帶寬的計算場景。
ARM與合作伙伴的商業(yè)模式主要有:1. PoP IP;2. IP Core;3. BoC(例如高通);4. Architectural(例如蘋果)四種模式。
ARM處理器廣泛使用在嵌入式系統(tǒng)設計,低耗電節(jié)能,非常適用移動通訊領域。消費性電子產(chǎn)品,例如可攜式裝置(PDA、移動電話、多媒體播放器、掌上型電子游戲,和計算機),電腦外設(硬盤、桌上型路由器),甚至導彈的彈載計算機等軍用設施。
世界各大半導體生產(chǎn)商從ARM公司購買其設計的ARM微處理器核,根據(jù)各自不同的應用領域,加入適當?shù)耐鈬娐罚瑥亩纬勺约旱?span style="font-family: "Times New Roman";color: rgb(0, 0, 0);">ARM微處理器芯片進入市場。
到目前為止,ARM處理器及技術的應用已經(jīng)廣泛深入到國民經(jīng)濟的各個領域。
MIPS架構(gòu):高效低耗的閃耀明星
MIPS架構(gòu)20多年前由斯坦福大學開發(fā),是一種簡潔、優(yōu)化、具有高度擴展性的RISC架構(gòu)。它的基本特點是:包含大量的寄存器、指令數(shù)和字符、可視的管道延時時隙,這些特性使MIPS架構(gòu)能夠提供最高的每平方毫米性能和當今SoC設計中最低的能耗。MIPS公司的R系列就是在此基礎上開發(fā)的RISC工業(yè)產(chǎn)品的微處理器。這些系列產(chǎn)品為很多計算機公司采用構(gòu)成各種工作站和計算機系統(tǒng)。

MIPS多線程CPU已廣泛應用于不同領域、不同類型的產(chǎn)品之中,并且這一勢頭仍將延續(xù)。隨著從LTE轉(zhuǎn)向下一代技術,即在MIPS I6400和I6500內(nèi)核中支持同步多線程技術,多線程也會成為5G高速增強移動寬帶等眾多新一代應用程序的理想選擇。此外,MIPS多線程CPU還可以用于許多移動設備的LTE調(diào)制解調(diào)器中。憑借獨特的多線程功能,尤其是在聯(lián)網(wǎng)和汽車等領域,MIPS CPU將繼續(xù)提供極具吸引力的性能和功效,并為電子行業(yè)提供廣泛的生態(tài)系統(tǒng)支持。
RISC-V架構(gòu):完全開源的新晉明星,物聯(lián)網(wǎng)時代迎來發(fā)展機遇
RISC-V是一個基于精簡指令集(RISC)原則的第五代開源指令集架構(gòu)(ISA),于2010年由加州大學伯克利分校的研究團隊開發(fā),具有完全開源、架構(gòu)簡單、易于移植適用于各種設備、完整工具鏈等特點,運行效率高,目前接受度逐漸提高,有望成為繼X86和ARM架構(gòu)之后第三大主流指令集架構(gòu)。RISC-V基金會為非盈利會員制組織,旨在通過采用和實施免費和開放的 RISC-V 指令集架構(gòu) (ISA) 來推動處理器創(chuàng)新的新時代,自 RISC-V 基金會于 2015 年成立以來,RISC-V 生態(tài)系統(tǒng)經(jīng)歷了爆炸式增長,2020年成員增長率達到133%。物聯(lián)網(wǎng)興起為RISC-V帶來發(fā)展機遇。移動終端和開源Android系統(tǒng)作為下游終端的興起必然帶動上游產(chǎn)業(yè)鏈拓展增長空間,物聯(lián)網(wǎng)應用的興起為包括RISC-V在內(nèi)的指令集架構(gòu)的上游產(chǎn)業(yè)鏈提供新的成長潛力。從市場潛力來看,全球物聯(lián)網(wǎng)市場規(guī)模查過20萬億美元,預計在2025年將達到1567萬億美元;中國物聯(lián)網(wǎng)市場蓬勃發(fā)展,2020年市場規(guī)模1.66萬億美元。同時從技術上看,RISC-V開源等特性與物聯(lián)網(wǎng)要求更靈活和多樣的特性吻合。外國技術限制與半導體國產(chǎn)化進程加快。自中美貿(mào)易戰(zhàn)以來,中國企業(yè)受制于美國不能升級架構(gòu)的風險并且這種風險長期存在,RISC-V開源及逐漸被廣泛接受為我國芯片廠商通過RISC-V架構(gòu)實現(xiàn)自主性提供可行性。

RISC-V的優(yōu)點包括:(1)發(fā)展時間短,架構(gòu)設計上沒有歷史包袱,采用的理念和方法較為先進;(2)開源的機制降低了進入門檻,使技術觸及更多企業(yè)和開發(fā)者;(3)尚未一家獨大,發(fā)展模式不受限。短期內(nèi)ARM架構(gòu)依然會占據(jù)中高端市場,RISC-V主要在一些碎片化的新興市場展開應用,比如物聯(lián)網(wǎng)領域的輕終端場景,這些場景有低功耗低成本的需求,但是往往程序不用大改、對軟件生態(tài)的依賴性不高、出貨量又很大,符合RISC-V階段性的發(fā)展目標。RISC-V的主要缺點是發(fā)展時間短,生態(tài)不完整,碎片化程度高,但是隨著入場玩家增加,這一問題有望得到解決。RISC-V誕生時間太短,相關的編譯器、開發(fā)工具和軟件開發(fā)環(huán)境(IDE)以及其它生態(tài)要素還在發(fā)展。RISC-V必須依靠強有力的商業(yè)玩家來長期支持和推進,方能得到持續(xù)發(fā)展。開源特性吸引大批科技公司入場RISC-V領域,未來RISC-V架構(gòu)芯片數(shù)量將逐步放量。RISC-V允許任何廠商設計、制造和銷售RISC-V芯片和軟件,其開源特性吸引IBM、NXP、西部數(shù)據(jù)、英偉達、高通、三星、谷歌、華為、阿里、Red Hat 與特斯拉等100 多家科技公司加入其陣營,國內(nèi)也成立了RISC-V 中國聯(lián)盟拓展相關領域發(fā)展。據(jù)Semico Research,預計到2025 年,采用 RISC-V 架構(gòu)的芯片數(shù)量將增至624 億顆,2018 年至 2025 年復合增長率高達 146%。
國產(chǎn)CPU的飛騰之路:十五期間,國家啟動發(fā)展國產(chǎn)CPU的泰山計劃,863計劃也提出自主研發(fā)CPU。2006年核高基專項啟動,國產(chǎn)CPU領域迎來了新一輪的國家支持。誕生出了鯤鵬、飛騰、龍芯、兆芯、海光、申威等一批優(yōu)質(zhì)企業(yè),國產(chǎn)CPU再度啟。
中國自2001年開始啟動處理器設計項目,至今將近20年,產(chǎn)生了以中科龍芯、天津飛騰、海光信息、上海申威、上海兆芯等為代表的國產(chǎn)CPU,并且產(chǎn)品的性能逐年提高,應用領域不斷擴展,使中國長期以來無“芯”可用的局面得到了極大扭轉(zhuǎn),為構(gòu)建安全、自主、可控的國產(chǎn)化計算平臺奠定了基礎。
目前,國產(chǎn)CPU架構(gòu)大體可以分為三類:第一類,是以龍芯為代表的MIPS指令集架構(gòu)和以申威為代表的Alpha架構(gòu),申威已基本實現(xiàn)完全自主可控(申威64已經(jīng)完全形成了自己的架構(gòu)),龍芯部分關鍵技術需付專利費;第二類,是以飛騰和華為鯤鵬為代表基于ARM指令集授權的國產(chǎn)芯片。ARM主要有三種授權等級:使用層級授權、內(nèi)核層級授權和架構(gòu)/指令集層級授權,其中指令集層級授權等級最高,企業(yè)可以對ARM指令集進行改造以實現(xiàn)自行設計處理器,目前海思、飛騰已經(jīng)獲得ARMV8永久授權;第三類,是以海光、兆芯為代表的獲得x86的授權(僅內(nèi)核層級的授權),未來擴充指令集形成自主可控指令集難度較大。因此,可以看出,在自主可控程度上申威、龍芯>飛騰、鯤鵬>海光、兆芯,但未來鯤鵬和飛騰如果基于ARMV8發(fā)展出自己的指令集,則創(chuàng)新可信程度將顯著提升。同時在未來ARMV9V10等新架構(gòu)拿不到授權的情況下,依然可以維持先進性。

在X86領域,AMD市場規(guī)模從2018年到2019年增長了1pcts,Intel小幅下滑,但仍然呈現(xiàn)出Intel占主導領域的態(tài)勢。在服務器領域,Intel市占率仍然高達96%以上,同時AMD公司正在努力提升自己的市場份額,從2018年的1.8%增長到2019年的3.9%,增長了117%。 在筆記本電腦領域中,AMD市占率大幅上升,從2018年的10%增長到2019年的14.6%,Intel則下降了5.1%。在桌上型電腦領域中,AMD市占率持續(xù)上升,兆芯也占據(jù)了一定市場份額。
在非x86領域,主流cpu架構(gòu)為ARM,RISC-V,MIPS以及Power。其中ARM以低耗、高效、發(fā)展時間長的優(yōu)勢牢牢把握手機等移動終端的市場,目前也是非X86架構(gòu)中應用最廣泛、發(fā)展最成熟的架構(gòu),市占率達到43.2%;RISC-V發(fā)展時間短且更加靈活,在物聯(lián)網(wǎng)領域備受關注,近幾年以其開源性質(zhì)被重點關注發(fā)展;MIPS主要應用在網(wǎng)關、機頂盒等網(wǎng)絡設備中,市占率達到9%;Power所代表的小型機是企業(yè)IT基礎設施的核心。在移動終端方面,ARM占據(jù)絕對優(yōu)勢,通過授權占據(jù)移動設備端90%以上的市場,構(gòu)成市場上的標準架構(gòu)。聯(lián)發(fā)科是世界上最大的ARM手機芯片供應商,蘋果、三星、高通等行業(yè)領頭羊均在最近幾年使用ARM架構(gòu),逐步實現(xiàn)基于ARM的全生態(tài)鏈。在服務器方面,非x86目前參與者華為、飛騰、高通、亞馬遜等,華為的鯤鵬服務器是ARM服務器的重要參與者,盡管據(jù)華為稱,鯤鵬出貨量已占據(jù)市場50%,ARM架構(gòu)有望發(fā)揮其在移動市場的優(yōu)勢,借力云端協(xié)同,搶占服務器市場更多份額。國產(chǎn)龍芯是基于MIPS的服務器重要廠商。在桌面PC市場,ARM正逐漸被跟多企業(yè)應用,2011年微軟開始采用ARM的Windows系統(tǒng),ARM開始進入X86的傳統(tǒng)優(yōu)勢領域,如今蘋果MacOS、新版Windows等均采用了ARM。
目前非X86市場仍以ARM架構(gòu)為主,占非X86處理器絕大部份份額。ARM架構(gòu)在智能手機、調(diào)制解調(diào)器、車載信息設備、可穿戴設備等領域都占據(jù)絕對統(tǒng)治地位。此外,隨著ARM處理性能升級,達到與傳統(tǒng)X86體系分庭抗禮的水平。整體來看,以高通驍龍、聯(lián)發(fā)科、三星Exynos、蘋果A系列偉代表的ARM架構(gòu)RISC處理器占據(jù)了移動處理器的市場。MIPS、Alpha、Power等架構(gòu)已不是市場主流,但在特定領域內(nèi)仍在被使用。基于ARM授權芯片數(shù)量不斷增長。截止到2019年,基于ARM授權的芯片出貨量超過1660億顆,占全球整個芯片市場出貨量的市場份額高達34%;就服務器領域,2019年全年,非X86服務器出貨量達到8060臺,同比增長60.2%,市場規(guī)模達到5.2億美元,同比增長2.0%;2020年Q3非X86服務器CPU同期收入為16.4億美元,占比7.2%。ARM架構(gòu)拓展除移動設備外的多個領域。蘋果發(fā)布基于ARM處理器架構(gòu)的全新Macbook。對與ARM產(chǎn)業(yè)提振作用巨大,2020年11月蘋果放棄了使用多年的Intel處理器,將在兩年內(nèi)全部過度到ARM處理器。服務器端ARM處理器也在陸續(xù)應用。2020年6月亞馬遜AWS宣布第六代亞馬遜彈性計算服務中基于ARM三種產(chǎn)品高出同類X86性價比的40%。此外,ARM在物聯(lián)網(wǎng)、汽車等領域均有很大發(fā)展?jié)撡|(zhì)。ARM在公共事業(yè)、智慧城市、資產(chǎn)管理等領域均提供了解決方案。
中國數(shù)據(jù)處理器行業(yè)概覽(2021)
DPU在數(shù)據(jù)中心和邊緣云上的應用
英偉達DPU集數(shù)據(jù)中心于芯片
行業(yè)研究:國產(chǎn)6大CPU全對比
龍芯LoongArch指令集全集
RISC-V芯片產(chǎn)業(yè)指令集架構(gòu)研究
來源:智能計算芯世界

轉(zhuǎn)載申明:轉(zhuǎn)載本號文章請注明作者和來源,本號發(fā)布文章若存在版權等問題,請留言聯(lián)系處理,謝謝。
推薦閱讀
更多架構(gòu)相關技術知識總結(jié)請參考“架構(gòu)師全店鋪技術資料打包”相關電子書(37本技術資料打包匯總詳情可通過“閱讀原文”獲取)。
全店內(nèi)容持續(xù)更新,現(xiàn)下單“全店鋪技術資料打包(全)”,后續(xù)可享全店內(nèi)容更新“免費”贈閱,價格僅收198元(原總價350元)。
溫馨提示:
掃描二維碼關注公眾號,點擊閱讀原文鏈接獲取“架構(gòu)師技術全店資料打包匯總(全)”電子書資料詳情。
