

CPU作為服務(wù)器的運算和控制核心,其指令集架構(gòu)有CISC和RISC兩種。從性能角度來說,CISC與RISC并無絕對的孰優(yōu)孰劣之分。目前看來,CISC與RISC已逐步走向融合,兩方處理器互相借鑒互相優(yōu)化。目前X86架構(gòu)CPU占整體服務(wù)器市場約 96%,處于絕對領(lǐng)先的地位。以ARM為代表的國產(chǎn)架構(gòu)服務(wù)器有望異軍突起。ARM早期專注低功耗領(lǐng)域,在移動端處于領(lǐng)先位置,生態(tài)體系十分完善,但在服務(wù)器等計算市場,多年來推進緩慢。隨著多核異構(gòu)計算時代和場景多樣化計算時代到來,帶來對計算架構(gòu)多樣性的需求,考慮中國市場政府、金融、能源等行業(yè)端生態(tài)逐步完善以及華為鯤鵬的入局,以ARM為代表的國產(chǎn)架構(gòu)服務(wù)器有望獲得一席之地。而ARM公司本身也推出了Neoverse新架構(gòu),以期大幅提升性能,增強在服務(wù)器領(lǐng)域的競爭力。國產(chǎn)架構(gòu)服務(wù)器群雄逐鹿。目前,國產(chǎn)CPU包括鯤鵬、飛騰、海光、龍芯、兆芯、宏芯、申威等。在黨政軍領(lǐng)域,龍芯、飛騰、兆芯等目前占據(jù)主流,華為鯤鵬未來有望在商用市場占據(jù)主導(dǎo),海光憑借其出色的單核性能和X86完善生態(tài)也有望獲得一定市場份額。

一、服務(wù)器行業(yè)發(fā)展簡史
1.1 服務(wù)器:一種為客戶機提供服務(wù)的高性能計算機
服務(wù)器是指網(wǎng)絡(luò)環(huán)境中的高性能計算機,包括應(yīng)用程序服務(wù)器、文檔服務(wù)器、郵件服務(wù)器、Web服務(wù)器及代理服務(wù)器等。整個互聯(lián)網(wǎng)的結(jié)構(gòu)幾乎都基于客戶機-服務(wù)器模型。客戶機-服務(wù)器模型的本質(zhì)是客戶機請求、服務(wù)器響應(yīng),即服務(wù)器的功能是為客戶機提供數(shù)據(jù)服務(wù)。服務(wù)器由處理器(CPU)、內(nèi)存、磁盤、網(wǎng)卡、監(jiān)視器、電源、機箱等組成,和通用的計算機架構(gòu)類似,但是由于需要提供高可靠的服務(wù),因此在處理能力、穩(wěn)定性、可靠性、安全性、可擴展性、可管理性等方面的要求比普通的個人電腦高。服務(wù)器的最大特點就是其強大的運算能力,即使是一部簡單的服務(wù)器系統(tǒng),通常也至少要有兩顆處理器以構(gòu)成對稱多處理架構(gòu),使其能在短時間內(nèi)完成大量工作,并為大量用戶提供服務(wù)。服務(wù)器常見的外型有四種:塔式服務(wù)器(Tower Server)、機架服務(wù)器(Rack Server)、刀片服務(wù)器(Blade Server)、機柜式服務(wù)器。其中機柜是指為服務(wù)器正常工作提供相適應(yīng)的環(huán)境和安全防護的安裝箱,通過機柜可以保證服務(wù)器設(shè)備穩(wěn)定可靠地工作。

服務(wù)器行業(yè)已經(jīng)發(fā)展了近60年。服務(wù)器的發(fā)展最早可以追溯到1964年,IBM引入System/360。System/360是由5種功能越來越強大的計算機所組成的系列,這些計算機運行同一操作系統(tǒng)并能夠使用相同的44個外圍設(shè)備。

1.2 CPU:服務(wù)器的運算和控制核心
中央處理器(Central Processing Unit,簡稱CPU)是服務(wù)器的核心構(gòu)成之一,其功能主要是解釋計算機指令以及處理服務(wù)器中的數(shù)據(jù)。CPU的主要運作原理是執(zhí)行儲存“程序”里的一系列指令。程序以一系列數(shù)字的形式存儲在存儲器中。指令集架構(gòu)(Instruction Set Architecture),又稱指令集或指令集體系,是計算機體系結(jié)構(gòu)中與程序設(shè)計有關(guān)的部分,包含了基本數(shù)據(jù)類型,指令集,寄存器,尋址模式,存儲體系,中斷,異常處理以及外部I/O。指令集架構(gòu)包含一系列的opcode即操作碼(機器語言),以及由特定處理器執(zhí)行的基本命令。簡單地來說,指令集一般被整合在操作系統(tǒng)內(nèi)核最底層的硬件抽象層中,屬于計算機中硬件與軟件的接口,它向操作系統(tǒng)定義了CPU的基本功能。CPU按指令集的架構(gòu)區(qū)分,分為CISC(Complex Instruction Set Computing,復(fù)雜指令集)型和RISC(Reduced Instruction Set Computing,精簡指令集)型兩類。
CISC的設(shè)計者希望通過直接在硬件中構(gòu)建復(fù)雜的指令從而使編程更方便、程序運行速度更快,其架構(gòu)中每個指令可執(zhí)行若干低端操作,諸如從存儲器讀取、存儲、和計算操作,全部集于單一指令之中;與之相反,RISC架構(gòu)中只包含使用頻率高的少量簡單指令,并提供一些必要的指令以支持操作系統(tǒng)和高級語言。CISC陣營以Intel、AMD的X86架構(gòu)為代表,而RISC陣營則包括ARM、MIPS、Power PC等架構(gòu);從硬件角度來講,CISC處理的是不等長指令集,而RISC執(zhí)行的是等長精簡指令集,在并行處理方面RISC明顯優(yōu)于CISC。由于RISC執(zhí)行的是精簡指令集,相比CISC在硬件層面需要更少的晶體管,所以它的硬件制造工藝更簡單且成本更低廉。RISC型CPU與CISC的CPU在軟件和硬件上都不兼容,這是由指令集的特性而決定的。從性能角度來說,CISC與RISC并無絕對的孰優(yōu)孰劣之分。但在發(fā)展過程中,CISC陣營的Intel和AMD在提升芯片性能上做出了持續(xù)的努力,芯片的功耗被放在了性能后的第二位;而RISC本身出現(xiàn)時間較CISC晚十年左右(ARM誕生于1985年,X86誕生于1978年),ARM、MIPS在創(chuàng)始初期缺乏與Intel產(chǎn)品對抗的實力,專注于以低功耗為前提的高性能芯片。RISC陣營的Power PC架構(gòu)最初是為個人計算機產(chǎn)品而設(shè)計,但其出現(xiàn)時已是1992年,此時Intel旗下的80386和80486占據(jù)了大部分PC市場。
次年,Intel赫赫有名的奔騰系列發(fā)布并助力Intel占領(lǐng)了絕大部分PC市場,這是第五代基于CISC的X86架構(gòu)微處理器,Intel將其命名為“Pentium”。在整個1990年代中期,PowerPC處理器均達到或超過了最快的x86 CPU的基準(zhǔn)測試成績。但由于PowerPC面向Windows、OS / 2和Sun的客戶都存在應(yīng)用軟件極度缺乏的問題,所以最終并未在PC市場濺起水花。但其后Apple因為PowerPC處理器的更高性能,在Macintosh個人電腦系列使用了PowerPC處理器。2005年,出于發(fā)熱量和能源消耗有關(guān)的考慮,Apple宣布不再在其Apple Macintosh計算機中使用PowerPC處理器,轉(zhuǎn)而支持Intel生產(chǎn)的處理器。此后PowerPC開始往超高性能服務(wù)器方向發(fā)展。
CISC與RISC已逐步走向融合,兩方處理器互相借鑒互相優(yōu)化。例如,Intel公司的Pentium Pro種內(nèi)含三個能夠把x86指令轉(zhuǎn)換成118位定長的RISC風(fēng)格微操作的譯碼器。

1.3 X86一統(tǒng)天下數(shù)十年
X86泛指一系列英特爾公司用于開發(fā)處理器的指令集架構(gòu)。該系列較早期的處理器名稱是以數(shù)字來表示80X86,包括Intel 8086、80186、80286、80386以及80486。由于以“86”作為結(jié)尾,因此其架構(gòu)被稱為“X86”。

Intel與AMD競爭不斷,造就高性能X86。Intel具有很強的研發(fā)實力,芯片性能一直處于行業(yè)領(lǐng)先。在20世紀(jì)70年代至21世紀(jì)初,廠商最看重的因素之一即為處理器的性能,而RISC本身出現(xiàn)時間較CISC晚十年左右,ARM、MIPS在創(chuàng)始初期缺乏與Intel產(chǎn)品對抗的實力,改以專注于以低功耗為前提的高性能芯片。同時Intel X86也很早開始借鑒RISC架構(gòu)優(yōu)勢,不斷技術(shù)革新,比如“Pentium”奔騰處理器就采用了超標(biāo)量架構(gòu),即有一個處理簡單和通用指令的管線。Intel最新產(chǎn)品十代酷睿桌面版Comet Lake-S系列處理器及400系芯片組中,最低配置的酷睿i3-10100四核處理器已經(jīng)達到3.6GHz基礎(chǔ)頻率,4.3GHz睿頻,全核4.1GHz。從單機性能上來講,Intel目前依舊處于強勢地位。Wintel聯(lián)盟建立四十余年,X86軟件生態(tài)完善。1981年,由于個人計算機市場不受IBM看重,IBM選取8088做個人計算機業(yè)務(wù)的CPU,并將操作系統(tǒng)外包給微軟,Wintel聯(lián)盟就此開始征程。
在Wintel建立之初,微軟并沒有打算唯一地只支持Intel,早期,微軟操作系統(tǒng)有兩條業(yè)務(wù)線,一條專用支持X86架構(gòu),另一條則支持考慮了操作系統(tǒng)的可移植性,可支持RISC架構(gòu)的計算機。但由于RISC處理器在PC端的份額遠不及X86,微軟又取消了對部分RISC架構(gòu)的支持。后來,X86成為了個人電腦的標(biāo)準(zhǔn)平臺,也成為了歷來市場上最成功的CPU架構(gòu)。專注芯片架構(gòu)研發(fā),不碰設(shè)備生態(tài)。就Intel來講,不與設(shè)備生產(chǎn)商、軟件開發(fā)者或者系統(tǒng)開發(fā)者成為利益競爭關(guān)系是一個十分重要的致勝因素。IBM和SUM大包大攬生產(chǎn)多種服務(wù)器設(shè)備,但其它設(shè)備生產(chǎn)商可能會基于不支持競爭對手的角度不愿意選擇PowerPC和SPARC架構(gòu),而選擇X86架構(gòu)。
從成本、性能、生態(tài)三方面來講,X86都是早期數(shù)據(jù)中心的最優(yōu)選。從成本和性能角度來講,X86相比大型機與小型機,在RAS(Reliability, Availability, Serviceability)有所欠缺,但具有生態(tài)系統(tǒng)開放、兼容性高、價格便宜的優(yōu)勢。且由于分布式系統(tǒng)成熟,X86服務(wù)器集群的性能并無較大差距。大型機和小型機價格昂貴、體系封閉,一般只在部分要求零宕機的領(lǐng)域使用(如銀行業(yè)、電信業(yè)等)。從生態(tài)的角度來講,由于X86在市場上占有率高,相比其它架構(gòu)而言,X86有著獨一無二的軟件和硬件生態(tài)優(yōu)勢,故目前全球的數(shù)據(jù)中心大部分都是采用Intel的X86架構(gòu)服務(wù)器芯片,X86生態(tài)系統(tǒng)也愈發(fā)強大。根據(jù)DRAMeXchange調(diào)查顯示,服務(wù)器用CPU中,X86架構(gòu)CPU占整體服務(wù)器市場約 96%。


二、以ARM為代表的CISC架構(gòu)服務(wù)器有望異軍突起
2.1 ARM公司:全球領(lǐng)先的半導(dǎo)體設(shè)計與軟件公司
ARM架構(gòu),從1983年開始由艾康電腦公司設(shè)計開發(fā),最早為其命名為Acorn精簡指令集機器(Acorn RISC Machine)。1980年代晚期,蘋果電腦開始與艾康電腦合作開發(fā)新版的ARM核心,為了更好地支持這一重要項目,艾康電腦將設(shè)計團隊組成了一間名為安謀國際科技(Advanced RISC Machines Ltd.)的新公司,基于此原因人們也常常將ARM稱作高級精簡指令集機器(Advanced RISC Machine)。但在2016年,安謀國際科技被日本軟銀集團以3.3萬億日元(約合311億美元)收購,此后,ARM公司退出股市。

不同于Intel自主完成架構(gòu)、芯片設(shè)計和芯片制造,也不同于無工廠模式(Fabless)的AMD、NVIDIA自己完成架構(gòu)和芯片設(shè)計而將芯片制造工作交給代工廠完成,ARM公司本身并不靠自有的設(shè)計來制造或出售CPU,而是通過提供各種授權(quán)條款來獲得收益。

ARM公司一般有三種授權(quán)方式:指令集授權(quán)、內(nèi)核授權(quán)和使用權(quán)授權(quán)。指令集授權(quán)是ARM公司提供的最大限度的授權(quán),其產(chǎn)品形式為ARM v系列(即ARM架構(gòu))。被授權(quán)方可以對ARM公司的指令集進行擴展或縮減,從而得到其自己的指令集架構(gòu)。蘋果公司就取得了這種授權(quán)。例如,iphone 11/ 11 pro/ 11 pro Max等機型上搭載的Apple A13芯片,其微架構(gòu)就是基于ARMv8.3-A指令集架構(gòu)自主研發(fā)。此外,華為、長城、高通、三星等公司也取得了ARM的指令集授權(quán)。內(nèi)核授權(quán)的產(chǎn)品主要是指ARM公司提供的一系列微架構(gòu),目前主要是ARM cortex系列。被授權(quán)方可以在內(nèi)核基礎(chǔ)上對緩存、I/O等設(shè)計進行修改。這是ARM公司提供的最廣泛的授權(quán)方式。ARM是廣為人知最昂貴的CPU內(nèi)核之一。取得這種授權(quán)的公司包括高通、三星、華為、德州儀器(TI)、博通、飛思卡爾、富士通以及Calxeda等等。使用權(quán)授權(quán)的產(chǎn)品則是指ARM已經(jīng)設(shè)計好的CPU/GPU。被授權(quán)人可以使用ARM設(shè)計好的CPU/GPU。在這一種授權(quán)中,被授權(quán)人可自由發(fā)揮的空間非常小。

2.2 ARM架構(gòu)已被廣泛應(yīng)用到各個領(lǐng)域
ARM公司的商業(yè)發(fā)展極其迅速,主要有以下幾點原因:發(fā)展早期避開Intel鋒芒,專注低功耗領(lǐng)域。ARM公司發(fā)展之初也在個人計算機領(lǐng)域做出了努力,但后來發(fā)現(xiàn)其產(chǎn)品與Intel的新品無法競爭之后,迅速轉(zhuǎn)換路徑投入了以低功耗為前提的高性能芯片的研發(fā)。早期清晰的發(fā)展路線也為ARM之后抓住智能手機爆發(fā)機遇做好了鋪墊。授權(quán)策略正確,內(nèi)核授權(quán)價格低,廠商間競爭激烈。1991年ARM公司就開始了授權(quán)模式。MIPS的定價策略是內(nèi)核授權(quán)很貴,而架構(gòu)授權(quán)很便宜,且對指令集擴展不受限制;而ARM的定價策略是架構(gòu)授權(quán)非常昂貴而內(nèi)核授權(quán)很便宜,且廠商需要修改設(shè)計需要繼續(xù)付大量的費用。從實踐結(jié)果來看,ARM的授權(quán)策略優(yōu)于MIPS。MIPS便宜的架構(gòu)授權(quán)吸引了一批有能力通過指令集開發(fā)CPU的廠商,但由于允許廠商自行修改指令集,導(dǎo)致生態(tài)碎片化且互相不兼容,也極大影響了開發(fā)者和使用者的熱情;而ARM的授權(quán)模式對無能力通過指令集開發(fā)CPU的廠商十分友好,這些廠商能通過購買內(nèi)核授權(quán)來快速推出CPU產(chǎn)品,甚至有研發(fā)能力的公司也愿意使用現(xiàn)成的ARM內(nèi)核來集成CPU,從而大幅度降低產(chǎn)品開發(fā)成本和縮短開發(fā)周期。ARM的商業(yè)模式也使得進入廠商多,激烈的競爭使得ARM產(chǎn)品價格不斷下降,生態(tài)日趨完善。
完善的生態(tài)體系。ARM完善的硬軟件生態(tài)使得設(shè)備廠商、開發(fā)者和使用者都充滿信心。ARM架構(gòu)的應(yīng)用領(lǐng)域已十分廣泛。據(jù)2011年ARM的客戶報告統(tǒng)計,79億ARM處理器出貨量,占有95%的智能手機、90%的硬盤驅(qū)動器、40%的數(shù)字電視和機上盒、15%的微控制器、和20%的移動電腦。十年來,ARM市場格局變化不大。截止到2017年,已經(jīng)生產(chǎn)的ARM架構(gòu)的處理器超過1000億個,是應(yīng)用最廣泛的指令集架構(gòu),也是產(chǎn)量最大的指令集架構(gòu)。由于ARM在成本、功耗和散熱上的優(yōu)勢,它對于便攜式電池供電的設(shè)備(包括智能手機、便攜式計算機和平板電腦以及其他嵌入式系統(tǒng))來說十分理想。同時對于消耗大量電力的超級計算機與云計算數(shù)據(jù)中心,ARM也是一種節(jié)能的優(yōu)秀解決方案。目前,ARM處理器可以在很多消費性電子產(chǎn)品上看到,從便攜式設(shè)備(PDA、移動電話、多媒體播放器、掌上型電子游戲和計算機)到電腦外設(shè)(硬盤、桌面型路由器),甚至在導(dǎo)彈的彈載計算機等軍用設(shè)施中都有它的存在。在此之外,還有一些基于ARM設(shè)計的衍生產(chǎn)品,包括Marvell的XScale架構(gòu)和德州儀器的OMAP系列。

2016年,日本富士通宣布了研發(fā)接替“京”的“Post-K”超級計算機。“Post-K”超級計算機采用富士通與ARM公司共同開發(fā)的ARM處理器A64FX。富士通稱,他們目標(biāo)是“創(chuàng)造出世界上最高性能的超級計算機”,“其應(yīng)用執(zhí)行性能是京超級計算機的100倍”。如果此應(yīng)用執(zhí)行速度實現(xiàn),那么Post-K超算將進入百億億次級別(exascale),1 exaflops表示每秒10^18次浮點運算。

2.3 ARM在服務(wù)器領(lǐng)域的嘗試
從2008年開始,ARM公司開始醞釀進軍ARM服務(wù)器芯片市場的計劃。此后,AMD、三星、AWS、高通、Calxeda以及Marvell等多個公司相繼開發(fā)了ARM架構(gòu)服務(wù)器芯片。但除AWS以外,其余公司的ARM服務(wù)器芯片均未在市場上有持續(xù)表現(xiàn)。AWS推出基于ARM架構(gòu)的云計算服務(wù)。AWS在2018年正式對外發(fā)布了基于ARM架構(gòu)的云服務(wù)器芯片Graviton及基于該芯片提供的EC2 A1虛擬服務(wù)器和云服務(wù),并表示此芯片對部分工作負載能耗可降低45%。在2019年12月的AWS re:Invent 會議上,亞馬遜公布了新一代的ARM 服務(wù)器芯片 Graviton2。據(jù)介紹,AWS Graviton 2 處理器的速度比較前一代芯片提升了7倍,浮點性能提升了2倍,性能表現(xiàn)強悍。AMD、三星、高通、Calxeda以及Marvell等公司在ARM服務(wù)器芯片上的嘗試均未獲得成功。

從AWS和Marvell的實踐觀察,在云計算領(lǐng)域ARM架構(gòu)芯片低功耗低成本的優(yōu)勢不可小覷。但AMD、三星、高通、Calxeda以及Marvell五個公司在ARM服務(wù)器芯片領(lǐng)域均未獲得成功,我們認為主要有以下兩方面原因:ARM在服務(wù)器領(lǐng)域的生態(tài)并不成熟,Wintel聯(lián)盟牢牢壟斷計算產(chǎn)業(yè)生態(tài),各類廠商更傾向于X86架構(gòu),故ARM服務(wù)器在市場推廣方面存在較大阻力。ARM服務(wù)器芯片是一個需要持續(xù)投入的產(chǎn)業(yè)。如高通、三星可能出于對當(dāng)時情況的判斷,認為ARM服務(wù)器暫時不具備良好的市場前景,故放棄了此業(yè)務(wù)。X86服務(wù)器相較于ARM服務(wù)器而言,具有性能強的優(yōu)勢,但同時也具有功耗大、成本高的劣勢。因此,ARM已經(jīng)明確了其針對數(shù)據(jù)中心的Neoverse架構(gòu)迭代升級策略,每一代性能提升都在30%以上,遠超X86 CPU每一代性能提升的幅度,ARM與X86之間性能上的差距將不斷縮小。

近幾年,ARM性能提升的同時,其生態(tài)也得到了較大的擴展:2018年11月開始,Windows已經(jīng)開始支持64位ARM應(yīng)用開發(fā)和提交,這將十分有利于ARM生態(tài)的構(gòu)建。2019年6月在德國法蘭克福國際超算大會上,NVIDIA宣布支持Arm CPU,以構(gòu)建具有極高能效水平的百萬兆級AI超級計算機。NVIDIA創(chuàng)始人兼首席執(zhí)行官黃仁勛表示:NVIDIA CUDA加速的計算和Arm的高能效CPU架構(gòu)的相結(jié)合,將助力HPC社區(qū)實現(xiàn)大幅提升,以達到百萬兆級。Arm架構(gòu)服務(wù)器的開源應(yīng)用
Arm架構(gòu)服務(wù)器和存儲
服務(wù)器硬件體系架構(gòu)淺析
服務(wù)器市場現(xiàn)狀研究
推薦閱讀:

免責(zé)申明:本號聚焦相關(guān)技術(shù)分享,內(nèi)容觀點不代表本號立場,可追溯內(nèi)容均注明來源,發(fā)布文章若存在版權(quán)等問題,請留言聯(lián)系刪除,謝謝。
電子書<服務(wù)器基礎(chǔ)知識全解(終極版)>更新完畢,知識點深度講解,提供182頁完整版下載。
獲取方式:點擊“閱讀原文”即可查看PPT可編輯版本和PDF閱讀版本詳情。
溫馨提示:
請搜索“AI_Architect”或“掃碼”關(guān)注公眾號實時掌握深度技術(shù)分享,點擊“閱讀原文”獲取更多原創(chuàng)技術(shù)干貨。
