目前業(yè)界性能最強(qiáng)的 ARM 服務(wù)器芯片,性能超過(guò)業(yè)界標(biāo)桿 20%,能效比提升 50% 以上。
10 月 18 日是 2021 云棲大會(huì)的開(kāi)放日,在 40000 平米的展區(qū)中,有一個(gè)展位格外引人注目。這里展示著阿里的「芯片家族」:從平頭哥首顆芯片玄鐵 910 到首顆自研高性能 AI 芯片含光 800,再到其他專(zhuān)用芯片,阿里這兩年的造芯之路「幾乎」一覽無(wú)余,只有紅布之下是個(gè)例外。「紅布之下是什么呢?」「到明天云棲大會(huì)開(kāi)幕就知道了。」現(xiàn)場(chǎng)工作人員賣(mài)起了關(guān)子。
十幾個(gè)小時(shí)后,阿里云智能總裁、達(dá)摩院院長(zhǎng)張建鋒為我們揭開(kāi)了謎底:原來(lái)這是阿里平頭哥芯片家族的新成員——倚天 710。它采用了業(yè)界最先進(jìn)的 5nm 工藝,單芯片可容納高達(dá) 600 億顆晶體管。
和專(zhuān)注于 AI 推理的含光 800 不同,倚天 710 是一顆通用服務(wù)器芯片(CPU),也是第一顆采用 5nm 工藝的服務(wù)器芯片。它基于最新的Armv9 架構(gòu),內(nèi)含 128 核 CPU,主頻最高達(dá)到 3.2GHz,能同時(shí)兼顧性能和功耗。在內(nèi)存和接口方面,它集成了業(yè)界領(lǐng)先的 DDR5、PCIE5.0 等技術(shù),能有效提升芯片的傳輸速率,并且可適配云的不同應(yīng)用場(chǎng)景。在 SPECInt2017 基礎(chǔ)測(cè)試平臺(tái)上,倚天 710 的跑分達(dá)到 440 分,是當(dāng)前性能最強(qiáng)的服務(wù)器芯片,超出業(yè)界標(biāo)桿 20%,能效比優(yōu)于業(yè)界標(biāo)桿 50%,能有效幫助數(shù)據(jù)中心節(jié)能減排。阿里表示,倚天 710 是阿里云推進(jìn)「一云多芯」策略的重要一步,也是阿里第一顆為云而生的 CPU 芯片,即將在阿里云數(shù)據(jù)中心部署。「基于阿里云『一云多芯』和『做深基礎(chǔ)』的商業(yè)策略,我們發(fā)布倚天 710,希望滿(mǎn)足客戶(hù)多樣性的計(jì)算需求,這款芯片不出售,主要是阿里云自用。我們將繼續(xù)與英特爾、英偉達(dá)、AMD、ARM 等合作伙伴保持密切合作,為客戶(hù)提供更多選擇?!箯埥ㄤh介紹說(shuō)。
作為一家電商、物流、云計(jì)算、大數(shù)據(jù)、全球化等場(chǎng)景的公司,阿里擁有世界上最挑戰(zhàn)、最豐富的計(jì)算場(chǎng)景、網(wǎng)絡(luò)場(chǎng)景、機(jī)器學(xué)習(xí)場(chǎng)景,需要使用大量芯片,自研芯片能夠降低阿里巴巴集團(tuán)內(nèi)部整體計(jì)算的成本。隨著倚天 710 的發(fā)布,平頭哥已擁有處理器 IP、AI 芯片及通用芯片等產(chǎn)品家族。其中,玄鐵系列為 AIoT 終端芯片提供 IP,出貨量已達(dá) 25 億顆;含光 800 為人工智能場(chǎng)景提供 AI 算力,服務(wù)于搜索推薦、視頻直播等行業(yè);倚天 710 則通過(guò)阿里云為云上用戶(hù)提供算力。從玄鐵到含光再到倚天,平頭哥三年完成「三級(jí)跳」造芯難,一直是這兩三年的熱門(mén)話(huà)題,國(guó)內(nèi)企業(yè)也在快馬加鞭補(bǔ)齊芯片設(shè)計(jì)的短板。但在高性能 CPU 市場(chǎng)上,國(guó)內(nèi)還沒(méi)有太多成功的經(jīng)驗(yàn)。正如中國(guó)科學(xué)院微電子研究所所長(zhǎng)葉甜春所說(shuō),集成電路就是一座喜馬拉雅山,而核心芯片就是珠穆朗瑪峰,「需要全世界最高端的技術(shù)?!?/span>為了攀登這座高峰,阿里早在幾年前就開(kāi)始了布局。2016 年,阿里投資軟件定義網(wǎng)絡(luò)(SDN)芯片公司 Barefoot 以及翱捷科技、寒武紀(jì)、深鑒、耐能、中天微、恒玄科技等多家芯片公司;2017 年又成立了達(dá)摩院并組建了一支由半導(dǎo)體行業(yè)頂級(jí)專(zhuān)家組成的技術(shù)團(tuán)隊(duì)。2018 年,阿里全資收購(gòu)大陸唯一擁有自主嵌入式 CPU IP core 的中天微。在那年的云棲大會(huì)上,達(dá)摩院芯片研發(fā)團(tuán)隊(duì)與中天微團(tuán)隊(duì)合并,平頭哥半導(dǎo)體公司就此成立。在之后的三年里,平頭哥完成了「三級(jí)跳」:先是發(fā)布了當(dāng)時(shí)業(yè)界性能最強(qiáng)的 RISC-V 處理器玄鐵 710,讓基于 RISC-V 架構(gòu)的高性能芯片成為可能,也讓芯片設(shè)計(jì)的門(mén)檻進(jìn)一步降低;緊接著,在 2019 年的云棲大會(huì)上,平頭哥又發(fā)布了阿里第一顆芯片含光 800,這是一顆針對(duì)場(chǎng)景深度定制的芯片,創(chuàng)造了性能和能效比的兩項(xiàng)第一;再接著就是今年云棲大會(huì)倚天 710 CPU 的問(wèn)世。
CPU 是半導(dǎo)體行業(yè)設(shè)計(jì)門(mén)檻最高的芯片之一。為了達(dá)到通用服務(wù)器 CPU 的性能、功耗要求,倚天 710 采用了很多領(lǐng)先的技術(shù),包括 Armv9、DDR5、PCIE5.0 等,并對(duì)它們做了深度定制。Armv9 是 ARM 公司在今年 3 月份正式推出的新架構(gòu)。它的前輩——ARM 在 2011 年推出的第一款 64 位架構(gòu) Armv8——之前已經(jīng)在服務(wù)器領(lǐng)域取得了一些成功,不少企業(yè)基于此架構(gòu)開(kāi)發(fā)了可用于服務(wù)器和超算領(lǐng)域的產(chǎn)品,個(gè)別產(chǎn)品也獲得了不錯(cuò)的效果,讓 Arm 芯片從小型或移動(dòng)設(shè)備,進(jìn)入了新的領(lǐng)域。Armv9 在此基礎(chǔ)上進(jìn)一步創(chuàng)新。根據(jù) ARM 官方的介紹,新的 Armv9 架構(gòu)將會(huì)至少使用 10 年,未來(lái)兩代基于 Armv9 架構(gòu)的處理器在性能上有望提升 30%。而且與 Armv8 架構(gòu)不同的是,Armv9 架構(gòu)的適用范圍更廣闊,其一系列改進(jìn)不少都是為了 Arm 架構(gòu)芯片可以實(shí)現(xiàn)高性能計(jì)算做鋪墊。長(zhǎng)期以來(lái),X86 服務(wù)器一直占據(jù)市場(chǎng)主導(dǎo)地位,而且構(gòu)建起了成熟的商業(yè)生態(tài)并占據(jù)專(zhuān)利和標(biāo)準(zhǔn)制定等戰(zhàn)略高地。相比之下,ARM 芯片在服務(wù)器領(lǐng)域存在性能劣勢(shì)以及生態(tài)環(huán)境的阻力。Armv9 的一系列改進(jìn)為芯片企業(yè)進(jìn)一步探索基于 Arm 的服務(wù)器芯片設(shè)計(jì)提供了信心。除了這些國(guó)際領(lǐng)先技術(shù),倚天 710 還引入了許多自研技術(shù),從前端架構(gòu)設(shè)計(jì)到后端物理實(shí)現(xiàn)都是自研。在前端設(shè)計(jì)方面,為解決核數(shù)眾多條件下的帶寬瓶頸,平頭哥對(duì)于片上互聯(lián)作出特殊優(yōu)化,采用新的流控算法,降低系統(tǒng)反壓,有效提升了系統(tǒng)效率和擴(kuò)展性,使單核高性能有效地轉(zhuǎn)化為整個(gè)系統(tǒng)的高性能。此外,通過(guò)新的系統(tǒng)地址到 DRAM 地址的轉(zhuǎn)換機(jī)制,倚天 710 支持安全、非安全隔離、多 NUMA、異常通道隔離多種特性,同時(shí) DRAM 讀寫(xiě)效率大幅度提升。在后端物理實(shí)現(xiàn)方面,5nm 工藝對(duì)能量密度、芯片內(nèi)部結(jié)構(gòu)的布局提出了極高的要求。為此,平頭哥在研發(fā)過(guò)程中靈活調(diào)度了 30 種不同的 EDA 軟件、深度定制時(shí)鐘網(wǎng)絡(luò)和定制 IP 技術(shù)。此外,他們還采用了先進(jìn)的多芯片堆疊技術(shù),最后成功確保了芯片性能、功耗的優(yōu)化。倚天芯片的研制成功,標(biāo)志著平頭哥已經(jīng)具備大型復(fù)雜芯片的研發(fā)設(shè)計(jì)能力,并進(jìn)入與 Intel、AMD、AWS 等少數(shù)一流芯片公司競(jìng)爭(zhēng)的行列。從服務(wù)器芯片發(fā)布到玄鐵處理器開(kāi)源,阿里端云一體化戰(zhàn)略逐漸清晰除了在縱深向不斷突破芯片技術(shù)外,平頭哥也在積極推動(dòng)芯片生態(tài)的發(fā)展。在本次云棲大會(huì)現(xiàn)場(chǎng),平頭哥宣布四款開(kāi)源玄鐵 RISC-V 系列處理器(玄鐵 E902、E906、C906、C910),并開(kāi)放相關(guān)工具及系統(tǒng)軟件。開(kāi)發(fā)者可通過(guò)平頭哥 Github 和芯片開(kāi)放社區(qū)(Open Chip Community)下載玄鐵源代碼,在此基礎(chǔ)上,實(shí)現(xiàn)開(kāi)源 EDA 協(xié)同,創(chuàng)新硬件架構(gòu),豐富軟件應(yīng)用生態(tài)。這是繼發(fā)布玄鐵 710 等處理器后,平頭哥在 RISC-V 生態(tài)上的重要舉措,也是全球首個(gè)商業(yè)處理器的開(kāi)源,進(jìn)一步拉近了 RISC-V 技術(shù)與開(kāi)發(fā)者的距離,成為全球硬件開(kāi)源的新里程碑。
AIoT 時(shí)代,RISC-V 架構(gòu)因其開(kāi)放、靈活的特性,有望成為繼 Intel X86、ARM 后的下一代廣泛應(yīng)用的 CPU 架構(gòu)。但是,當(dāng)前 RISC-V 架構(gòu)面臨應(yīng)用碎片化、開(kāi)發(fā)效率低、軟硬件適配難等問(wèn)題,軟硬件生態(tài)尚未成熟。玄鐵 RISC-V 系列處理器采用自研技術(shù),覆蓋從低功耗到高性能的各類(lèi)場(chǎng)景,支持 AliOS、FreeRTOS、RT-Thread、Linux、Android 等操作系統(tǒng),并已成功應(yīng)用于微控制器、工業(yè)控制、智能家電、智能電網(wǎng)、圖像處理、人工智能、多媒體和汽車(chē)電子等領(lǐng)域。不久前,玄鐵 910 全球首次實(shí)現(xiàn)兼容安卓,極大拓展了 RISC-V 架構(gòu)面向開(kāi)放生態(tài)的想象力。阿里表示,對(duì)于正在上升期的 RISC-V 架構(gòu)技術(shù)而言,只有更多的開(kāi)發(fā)者和企業(yè)使用,才能共同推進(jìn)生態(tài)進(jìn)步,真正讓這一技術(shù)在芯片和操作系統(tǒng)等軟硬件層面實(shí)現(xiàn)繁榮,平頭哥也會(huì)從中受益。服務(wù)器芯片發(fā)布、玄鐵系列處理器宣布開(kāi)源,阿里的端云一體化戰(zhàn)略逐漸清晰。作為構(gòu)筑這一戰(zhàn)略的核心,達(dá)摩院、平頭哥及阿里云,正在成為阿里巴巴三位一體的核心技術(shù)棧。平頭哥得到了達(dá)摩院和阿里云的軟實(shí)力加持,例如基于達(dá)摩院的算法能力,打破了算法和硬件之間的鴻溝;基于阿里云飛天云平臺(tái)的優(yōu)勢(shì),快速形成了端云一體芯片生態(tài)。阿里表示,他們希望通過(guò)自研的強(qiáng)大技術(shù)平臺(tái)和生態(tài)系統(tǒng)能力,推動(dòng)國(guó)產(chǎn)自主芯片的產(chǎn)業(yè)化落地。轉(zhuǎn)發(fā),點(diǎn)贊,在看,安排一下?