計(jì)算三大變化,帶來了哪些紅利?

11月11日,蘋果公司推出三款新的Mac電腦——MacBook Air、13英寸MacBook Pro和Mac Mini。這些新電腦首次采用了蘋果自己的處理器M1,而非已經(jīng)應(yīng)用了15年的英特爾處理器。
無獨(dú)有偶,英特爾在10月公布的第三季度財(cái)報(bào)顯示,在收入和每股收益方面表現(xiàn)平平。第三季度收入為183億美元,同比下降4.6%,最顯著的一個(gè)變化是云服務(wù)器芯片的訂單正在放緩。
因?yàn)樵谧约旱闹悄苁謾C(jī)iPhone上采用自己的芯片,蘋果實(shí)現(xiàn)了商業(yè)利益的最大化。而這次在MAC上棄用英特爾的處理器的最大一次變革,預(yù)示著ICT領(lǐng)域,一場(chǎng)涉及面甚廣的計(jì)算變革正在積極推進(jìn)。

異構(gòu)計(jì)算,沒有一成不變
目前英特爾、AMD主導(dǎo)的企業(yè)計(jì)算,正在遭遇Arm、RISC-V和IBM POWER指令集所形成的巨大生態(tài)力量的挑戰(zhàn)。
在桌面電腦、服務(wù)器甚至云計(jì)算領(lǐng)域,英特爾和AMD苦戰(zhàn)幾十年。在2000年,英特爾和AMD占領(lǐng)了PC/服務(wù)器處理器的幾乎所有市場(chǎng)。
之后AMD通過其Opteron處理器體系結(jié)構(gòu),將64位指令引入x86指令集。英特爾隨后在其核心處理器體系結(jié)構(gòu)和至強(qiáng)產(chǎn)品中添加了AMD 64(現(xiàn)在為x86-64)指令。此后,AMD在2008-2018年期間將大部分服務(wù)器處理器市場(chǎng)份額拱手送給了英特爾。
目前,超過90%的云基礎(chǔ)架構(gòu)即服務(wù)(IaaS)實(shí)例類型都基于Intel Xeon處理器。
AMD和Intel目前是唯一獲得交叉許可以使用彼此的重要x86-64專利的服務(wù)器處理器供應(yīng)商。構(gòu)建現(xiàn)代的x86-64服務(wù)器處理器需要獲得AMD和Intel的專利。
幾年前,Arm認(rèn)為,相比x86指令集,它將獲得重要的市場(chǎng)份額。Arm的業(yè)務(wù)模式是將Aarch64指令集許可給設(shè)計(jì)自己的服務(wù)器處理器的公司。
獲得許可的Arm服務(wù)器處理器越來越多,如Ampere的eMAG,AWS Graviton,華為的鯤鵬Kunpeng,以及Marvell的ThunderX。在萬物互聯(lián)時(shí)代,這些企業(yè)看中是ARM系統(tǒng)在性能和功耗方面具有獨(dú)特的優(yōu)勢(shì)
2019年1月華為發(fā)布Kunpeng 920新芯片組,旨在進(jìn)入數(shù)據(jù)中心,并將為公司的泰山TaiShan服務(wù)器提供處理器。
華為的鯤鵬處理器由自己設(shè)計(jì),基于由ARM創(chuàng)立的芯片組架構(gòu),ARM是總部設(shè)在英國(guó),現(xiàn)在由軟銀控制。華為表示,配備有Kunpeng 920的新服務(wù)器旨在幫助處理和存儲(chǔ)大量數(shù)據(jù)。
ARM憑借其處理器 IP一直是移動(dòng)設(shè)備處理器的主要供應(yīng)商,但最近幾年卻試圖進(jìn)入服務(wù)器和云市場(chǎng)。當(dāng)然,華為并不是唯一一家擁有用于服務(wù)器的7納米處理器的公司。在服務(wù)器領(lǐng)域,華為已經(jīng)成為了英特爾和NVIDIA等的競(jìng)爭(zhēng)對(duì)手。
Kunpeng 920也不是華為首款7nm處理器。該公司擁有為自己的手機(jī)設(shè)計(jì)的麒麟Kirin 980和為處理在云中運(yùn)行的人工智能應(yīng)用程序而創(chuàng)建的昇騰Ascend 910。Ascend 910還可用于數(shù)據(jù)中心,但其功能與新的鯤鵬Kunpeng 920不同。

為了獲得AMD和Arm都在嘗試的IaaS市場(chǎng)份額,RISC-V將必須展示企業(yè)級(jí)質(zhì)量和云工作負(fù)載性能價(jià)值。但是RISC-V目前仍處于早期的開發(fā)階段,相信目前還不會(huì)成為云數(shù)據(jù)中心部署的成熟競(jìng)爭(zhēng)者。
為了生存,IBM將其POWER指令集免費(fèi)提供給開源世界。顯然,IBM的POWER9是企業(yè)級(jí)服務(wù)器處理器。IBM出色地啟動(dòng)了OpenPOWER Foundation,該基金會(huì)為POWER9創(chuàng)建了云服務(wù)器供應(yīng)鏈生態(tài)系統(tǒng)。
Google在過去幾年展示了基于OpenPOWER的POWER9云服務(wù)器。Google Cloud是否將POWER9部署到其公共IaaS中,其他云服務(wù)商會(huì)跟隨,目前在不得而知。
另外,創(chuàng)建可行的x86服務(wù)器處理器所需的許多專利已經(jīng)過期或即將過期。自從AMD設(shè)計(jì)出AMD 64和Opteron處理器以來已20年英特爾的Pentium 4和SSE指令集始于1998年,并于2000年末投入市場(chǎng)。
AMD于2003年春季使用Intel的Pentium 4 32位指令集,AMD的AMD 64 64位指令集擴(kuò)展和Intel的SSE2多媒體指令集擴(kuò)展,推出了其Opteron處理器體系結(jié)構(gòu)。利用今天即將到期的知識(shí)產(chǎn)權(quán)的組合,可使新進(jìn)入市場(chǎng)的公司繞開Arm、RISC-V和POWER指令集所面臨的軟件生態(tài)系統(tǒng)挑戰(zhàn)。
要記住,專利的有效期是基于專利的申請(qǐng)日期,通常是在產(chǎn)品發(fā)布之前。
驗(yàn)證是任何處理器指令集軟件生態(tài)系統(tǒng)增長(zhǎng)的最大驅(qū)動(dòng)力。從操作框架和應(yīng)用程序開發(fā)的角度來看,所有聲稱與指令集兼容的處理器實(shí)際上必須兼容。AMD和英特爾擁有令人印象深刻的x86-64驗(yàn)證套件,但在數(shù)據(jù)中心領(lǐng)域,這主要是為了解決三十年來與傳統(tǒng)企業(yè)操作系統(tǒng)和應(yīng)用程序的兼容性問題。云部署可能會(huì)指定一個(gè)輕得多的驗(yàn)證套件,從而降低了新的x86-64服務(wù)器處理器進(jìn)入者的門檻。
盡管沒有公開的跡象表明,有公司會(huì)設(shè)計(jì)基于x86-64的新處理器內(nèi)核,但設(shè)計(jì)和驗(yàn)證新的服務(wù)器處理器內(nèi)核體系結(jié)構(gòu)大約需要三到四年的時(shí)間。這意味著無論基于x86-64、Arm Aarch64、POWER9還是RISC-V,現(xiàn)在都應(yīng)該為2022年服務(wù)器處理器產(chǎn)品的發(fā)布進(jìn)行開發(fā)。
計(jì)算多樣化,通用計(jì)算與AI計(jì)算共同發(fā)展
在通用計(jì)算CPU橫行天下多年之后,GPU(圖形處理單元)主導(dǎo)的并行計(jì)算因?yàn)锳I應(yīng)用開始變得流行,讓通用計(jì)算與AI計(jì)算共同發(fā)展。
在AI計(jì)算方面,參與者越來越多,未來會(huì)有更多的好消息。
英偉達(dá)在并行處理方面已有24年歷史,其無處不在的CUDA平臺(tái)的發(fā)展使該公司具有獨(dú)特的優(yōu)勢(shì)。數(shù)以億計(jì)的自動(dòng)駕駛汽車和數(shù)萬億個(gè)物聯(lián)網(wǎng)設(shè)備,為英偉達(dá)NVIDIA的GPU產(chǎn)品創(chuàng)造了巨大的市場(chǎng)機(jī)會(huì)。
我們已經(jīng)看到,使用NVIDIA的Volta AI平臺(tái)進(jìn)行機(jī)器學(xué)習(xí)的所有主要云/超大規(guī)模OEM以及Oracle和SAP等主要企業(yè)供應(yīng)商,都普遍采用GPU。
人工智能是GPU的殺手級(jí)應(yīng)用。分析師統(tǒng)計(jì),目前全球500強(qiáng)超級(jí)計(jì)算機(jī)中只有15個(gè)使用GPU芯片。在未來五年中,這些超級(jí)計(jì)算機(jī)中的100%將通過GPU加速。

在AI服務(wù)器上,中國(guó)服務(wù)器和云計(jì)算公司浪潮在性能和市場(chǎng)份額上都有上佳的表現(xiàn)。
最近公布結(jié)果顯示,在AI基準(zhǔn)測(cè)試MLPerf中,浪潮的AI服務(wù)器NF5488A5創(chuàng)下18項(xiàng)性能記錄;在SPC-1基準(zhǔn)評(píng)測(cè)報(bào)告中,浪潮存儲(chǔ)平均100美金可以購(gòu)買到13198 個(gè)IOPS的性能,刷新了榜單全球最優(yōu)成績(jī)。
此外,在IDC公布的中國(guó)AI加速計(jì)算報(bào)告中,浪潮AI服務(wù)器2020年上半年的銷售額達(dá)6.88億美元,市場(chǎng)份額達(dá)53.5%,拿下中國(guó)AI服務(wù)器的半壁江山。
根據(jù)浪潮信息相關(guān)資料,在服務(wù)器的發(fā)展中,摩爾定律已經(jīng)出現(xiàn)衰退,增長(zhǎng)從主頻增長(zhǎng)變成核數(shù)增長(zhǎng),即將對(duì)超算領(lǐng)域的提升產(chǎn)生制約。浪潮判斷,異構(gòu)加速計(jì)算會(huì)成為未來進(jìn)步的方向。
恰在此后,英偉達(dá)開發(fā)出NVLink,用來連接高速GPU形成性能更強(qiáng)的計(jì)算系統(tǒng)。當(dāng)時(shí)所有服務(wù)器廠商都對(duì)此抱有質(zhì)疑的態(tài)度,認(rèn)為這個(gè)技術(shù)沒什么用,并且因?yàn)橐蟾邘捄偷脱舆t,技術(shù)難度頗高。但浪潮看準(zhǔn)方向,在全球第一個(gè)開始研發(fā)基于NVLink高速AI服務(wù)器,上市后獲得客戶市場(chǎng)認(rèn)可。
2018年華為正式發(fā)布兩款A(yù)I芯片:采用7nm工藝制程的昇騰910,以及12nm工藝制程的昇騰310。
2019年,華為又推出了全場(chǎng)景AI計(jì)算框架MindSpore。這些AI基礎(chǔ)軟件平臺(tái)實(shí)現(xiàn)了極簡(jiǎn)易用、極致性能。這讓小的傳統(tǒng)企業(yè)能夠基于華為的全棧平臺(tái),能以少代碼,甚至不開發(fā)代碼也能充分利用AI能力。
2018年阿里巴巴達(dá)摩院發(fā)布了一種名為Ali-NPU的AI芯片,該芯片將通過其公共云供任何人使用。此舉旨在增強(qiáng)阿里云的AI實(shí)力,促進(jìn)行業(yè)AI應(yīng)用的發(fā)展。
與阿里巴巴的做法類似,Google的母公司Alphabet自2015年以來,內(nèi)部的工程師一直在使用Google的定制張量處理單元(TPU)來加速自己的機(jī)器學(xué)習(xí)任務(wù)。2019年Google宣布了可以處理更具挑戰(zhàn)性的計(jì)算工作的第二代TPU,并于今年2月開始讓公眾可以通過云使用第二代TPU。
Google認(rèn)為,第二代Google AI芯片可以代替Nvidia等公司的圖形處理單元使用,它不僅可以訓(xùn)練AI模型,還可以完成更多工作。
至少與Nvidia在數(shù)據(jù)中心的GPU業(yè)務(wù)相比,阿里巴巴和Google AI芯片計(jì)劃目前仍處于起步階段。
實(shí)際上,Google和Nvidia仍然是合作伙伴,Nvidia的GPU與TPU一起仍可在Google云中使用。當(dāng)然,阿里巴巴還通過其云提供了Nvidia GPU,并將在Ali-NPU推出后繼續(xù)這樣做。
很明顯Facebook也正在探索AI芯片開發(fā)。英特爾去年曾表示,正在與Facebook合作開發(fā)AI新芯片。
Facebook的AI芯片可能改善內(nèi)部研究人員的操作,并提高系統(tǒng)的效率,以供數(shù)十億使用該公司應(yīng)用的用戶提高效率。
同時(shí),蘋果在高端iPhone X手機(jī)的芯片中內(nèi)置了“神經(jīng)引擎”元素。微軟正在為其下一個(gè)版本的HoloLens混合現(xiàn)實(shí)耳機(jī)開發(fā)AI芯片。特斯拉一直在為其車輛開發(fā)AI芯片。
計(jì)算生態(tài)正在悄悄變化
據(jù)中國(guó)軟件網(wǎng)觀察,在計(jì)算領(lǐng)域,傳統(tǒng)的WinTel聯(lián)盟體系,X86+linux聯(lián)盟體系,甚至蘋果和英特爾組成生態(tài)體系等,都正發(fā)生悄悄的變化。
在計(jì)算生態(tài)中,最大的變化當(dāng)屬國(guó)產(chǎn)自主創(chuàng)新生態(tài)體系日益壯大。
華為在2019年宣布“硬件開放、軟件開源、使能合作伙伴”,意在創(chuàng)建基于鯤鵬、升騰的計(jì)算生態(tài)體系。
華為計(jì)算產(chǎn)品線總裁鄧泰華的話直截了當(dāng):“鯤鵬、昇騰提供多樣性算力、擁抱全棧創(chuàng)新、與合作伙伴、開發(fā)者朋友們一起,持續(xù)打造計(jì)算產(chǎn)業(yè)生態(tài),讓每一位開發(fā)者的智慧匯聚成全生態(tài)創(chuàng)新,共同點(diǎn)亮多樣性計(jì)算新時(shí)代”。
在今年HUAWEI CONNECT 2020期間,華為宣布向業(yè)界全面開放鯤鵬全棧、昇騰全棧、發(fā)布分布式多樣性計(jì)算軟件套件,加速產(chǎn)業(yè)創(chuàng)新,使能極簡(jiǎn)開發(fā),與業(yè)界伙伴攜手,共贏計(jì)算新時(shí)代。
華為開放主板和部件,使能硬件伙伴打造自有品牌整機(jī)產(chǎn)品,全面共享能力,堅(jiān)持伙伴優(yōu)先,在2020年6月,伙伴服務(wù)器出貨量已超過華為自有品牌;
華為如期開源openEuler、openGauss、openLooKeng和MindSpore,軟件伙伴基于開源版本陸續(xù)推出商用發(fā)行版并在關(guān)鍵行業(yè)和項(xiàng)目商用;
華為全方面使能合作伙伴,鯤鵬、昇騰開發(fā)者已超過30萬,合作伙伴超過1000家,完成兼容性認(rèn)證的解決方案超過3000個(gè)。
萬物互聯(lián)的智能時(shí)代,算力需求爆炸式增長(zhǎng),單純依靠芯片工藝進(jìn)步帶來的算力提升,已不能滿足需求,須進(jìn)行計(jì)算體系的架構(gòu)創(chuàng)新。華為的創(chuàng)新就是從通用計(jì)算走向通用計(jì)算加異構(gòu)計(jì)算的多樣性算力創(chuàng)新,和從硬件到基礎(chǔ)軟件,到應(yīng)用使能的全棧協(xié)同創(chuàng)新。

在國(guó)產(chǎn)計(jì)算生態(tài)方面,PK體系進(jìn)展神速。“PK體系”是一個(gè)基礎(chǔ)的、先進(jìn)的、開放的架構(gòu)組合。
飛騰“Phytium處理器”,是中國(guó)電子自主設(shè)計(jì)兼容ARM V8指令集的處理器芯片產(chǎn)品。麒麟Kylin操作系統(tǒng)也是中國(guó)電子自主開發(fā)的國(guó)產(chǎn)操作系統(tǒng)。它支持云計(jì)算、虛擬化、大數(shù)據(jù)等先進(jìn)應(yīng)用并與飛騰CPU深度適配。
PK體系是兼容移動(dòng)、云、(虛擬化)、大數(shù)據(jù)和物聯(lián)網(wǎng)、人工智能等各項(xiàng)新技術(shù)的產(chǎn)品組合生態(tài)。
“PK體系”聚合國(guó)內(nèi)產(chǎn)學(xué)研領(lǐng)域400多家核心企業(yè),共同開展關(guān)鍵技術(shù)攻關(guān)和公共技術(shù)服務(wù),形成豐富的辦公和事務(wù)處理類應(yīng)用生態(tài)體系,目前已在國(guó)家部委、中央企業(yè)、地方政府等重要行業(yè)領(lǐng)域信息化建設(shè)中實(shí)現(xiàn)數(shù)萬套規(guī)模應(yīng)用。
通過聯(lián)合兄弟央企,打造CPU和操作系統(tǒng)聯(lián)合創(chuàng)新實(shí)驗(yàn)室,推動(dòng)PK體系在國(guó)家重要行業(yè)領(lǐng)域廣泛應(yīng)用;通過聯(lián)合地方政府,建成了包括長(zhǎng)沙中電軟件園在內(nèi)的35家產(chǎn)業(yè)園區(qū),構(gòu)建了年?duì)I業(yè)收入超過6000億元的大生態(tài)。
據(jù)介紹,“PK體系”對(duì)接國(guó)際ARM服務(wù)器標(biāo)準(zhǔn)與軟件領(lǐng)域企業(yè),與 Google、微軟、戴爾等在技術(shù)標(biāo)準(zhǔn)領(lǐng)域,與Linaro、紅帽等在ARM全球開源生態(tài)領(lǐng)域,與SAP、IBM等在企業(yè)級(jí)應(yīng)用領(lǐng)域展開全面合作。基于“PK體系”的生態(tài)建設(shè),已成為國(guó)際ARM生態(tài)體系的重要支撐。
國(guó)產(chǎn)自主計(jì)算生態(tài)的發(fā)展,讓計(jì)算自主可控落地,產(chǎn)生效益和價(jià)值。
