國產(chǎn)CPU之4種架構(gòu)和6大品牌


前言:服務(wù)器是一種為客戶機(jī)提供服務(wù)的高性能計(jì)算機(jī)
前篇“國產(chǎn)基礎(chǔ)軟硬件:開源、遷移、上云,關(guān)鍵在生態(tài)”分享了國產(chǎn)基礎(chǔ)軟硬件發(fā)展策略,今天接著國產(chǎn)化話題,講講國產(chǎn)處理器。
國產(chǎn) CPU 廠商得到了相應(yīng)指令集的架構(gòu)授權(quán),發(fā)展成為6大主流廠商:龍芯、飛騰、鯤鵬、海光、申威、兆芯。CPU 的指令集分為復(fù)雜指令集(CISC)和精簡指令集(RISC)兩大類。復(fù)雜指令集以x86架構(gòu)為代表,精簡指令集則包括 ARM、MIPS、Alpha、Power 等。

6 大主流 CPU 廠商的技術(shù)路線和生態(tài)建設(shè)各有優(yōu)勢(shì)。目前在通用計(jì)算領(lǐng)域,優(yōu)勢(shì)較強(qiáng)的是龍芯、飛騰、鯤鵬、海光這 4 大廠商,我們將在本章進(jìn)行重點(diǎn)介紹。

龍芯技術(shù)源于中科院計(jì)算產(chǎn)業(yè),沿著市場(chǎng)化的道路不斷發(fā)展,已有超過 20 多年的 CPU 行業(yè)積累。2001 年,在中科院計(jì)算所知識(shí)創(chuàng)新工程的支持下,龍芯課題組正式成立。2010 年,龍芯公司正式成立。龍芯堅(jiān)持“市場(chǎng)帶技術(shù)”的道路,而不是“市場(chǎng)換技術(shù)”的道路,堅(jiān)持自主研發(fā),堅(jiān)持市場(chǎng)化的機(jī)制,整體的發(fā)展可概況為三個(gè)十年。

龍芯 CPU 系列包括龍芯 3 號(hào)大 CPU、 龍芯 2 號(hào)中 CPU 、龍芯 1 號(hào)小 CPU 三個(gè)系列,分別針對(duì)電腦(桌面和服務(wù)器)、工控和嵌入式、單片機(jī)領(lǐng)域。本章重點(diǎn)介紹用于桌面和服務(wù)器的龍芯3 號(hào)系列 CPU。
1)早期階段(2015 年之前):性能較低,達(dá)不到“可用”程度:龍芯第一代 3A1000/3B1500 的單核性能較低,SPEC CPU 2006 分值只有 2-3 分,打開 20M 的測(cè)試文檔需要 33 秒。
2)開始進(jìn)入“可用”階段(2016-2017 年):單核性能顯著提升:龍芯第二代 3A3000/3B3000/7100 單核性能提升到 10-11 分,超過 Intel 凌動(dòng)系列,打開 20M 的測(cè)試文檔時(shí)間縮短為 6 秒。
3)“可用”向“好用”升級(jí)階段(2019-2020):單核性能再次突破:龍芯第三代 3A/B4000、3A/C5000、7A2000 的單核性能提高到 20-30 分,打開 20M 的測(cè)試文檔時(shí)間少于 1 秒。

龍芯 3 號(hào)的更新升級(jí)有兩種模式:
1)工藝更新微結(jié)構(gòu)不變?
2)工藝不變更新微結(jié)構(gòu)。
龍芯 3A4000相比 3000,采用相同工藝(28nm)但性能成倍提高;龍芯 5000 系列工藝更新 12nm。龍芯 3 號(hào) CPU 下一代 5000 系列的目標(biāo):提高主頻和核數(shù)。龍芯新一代桌面芯片 3A5000 將在2020年Q2 流片,采用 12nm 工藝,單核性能提高至 25-30 分,與 3A4000 可原位替換,操作系統(tǒng)二進(jìn)制兼容;龍芯服務(wù)器芯片 3C5000 預(yù)計(jì)于 2020 三季度流片,采用 12nm工藝,16 核結(jié)構(gòu),支持 4-16 路服務(wù)器。

雖然從全球整體來看,MIPS 架構(gòu)的生態(tài)基礎(chǔ)相對(duì) x86 和 ARM 較為薄弱,但龍芯的信創(chuàng)生態(tài)建設(shè)已經(jīng)較為完善,而且處于不斷擴(kuò)張的發(fā)展中。龍芯非常重視 Linux 生態(tài)建設(shè),為開源社區(qū)積極貢獻(xiàn)代碼,增強(qiáng)技術(shù)影響力。龍芯致力于 Linux 生態(tài)體系的兼容優(yōu)化,有上百人規(guī)模的開源軟件工程師團(tuán)隊(duì),提供操作系統(tǒng)和底層軟件兜底服務(wù)的能力。
2020 年 3 月 17 日,Java14f 發(fā)布,根據(jù)官方發(fā)布的統(tǒng)計(jì),Oracle、紅帽、SAP、龍芯和谷歌,位于 OpenJDK 代碼提交次數(shù)的全球前五位。

在應(yīng)用開發(fā)環(huán)境建設(shè)方面,龍芯支持主流的 Linux 開發(fā)環(huán)境,包括多種編程語言、函數(shù)庫、平臺(tái)引擎和集成開發(fā)工具等。

PC 端的生態(tài)建設(shè):龍芯 CPU 已經(jīng)支持主流的整機(jī)、操作系統(tǒng)、辦公軟件、瀏覽器、輸入法和部分設(shè)計(jì)工具等常見軟硬件,覆蓋了基本的辦公需求。

服務(wù)器生態(tài)領(lǐng)域:龍芯目前的 3B4000 服務(wù)器芯片是 4 核的,可以支持雙路、 四路全相連結(jié)構(gòu),實(shí)現(xiàn)了虛擬機(jī)效率提升至 95%以上、跨片訪存帶寬提升至 400% 以上、內(nèi)存數(shù)量線性擴(kuò)展以及高吞吐率。目前也已經(jīng)有百款廠商適配了龍芯的服務(wù)器 CPU。我們認(rèn)為,龍芯新一代 16 核的服務(wù)器CPU 在 2020 年內(nèi)流片之后,龍芯在服務(wù)器領(lǐng)域的市場(chǎng)影響力將進(jìn)一步得到增強(qiáng)。
云計(jì)算生態(tài)領(lǐng)域:龍芯的 KVM 虛擬機(jī)于 2019 年 4 月發(fā)布,完善支持 OpenStack 集群管理工具,實(shí)現(xiàn)了從 CPU 到系統(tǒng), 全鏈條虛擬機(jī)的自主研制。在云容器方面,龍芯的 Doker 容器于2017 年發(fā)布,完善支持集群管理工具 Swarm、 Kubernets、 Openshift、 Mesos 等。龍芯的云計(jì)算生態(tài)伙伴包括:浪潮云、 騰訊云、 金山云、 曙光云、 云棧希云、 中標(biāo)易云、 道客云、航天科工天熠云、 UCLOUD、 CETC 電科云、 普華云、 升騰云、 金蝶云、江蘇華云、 廣西梯度云、 上海田畝云、 北京優(yōu)炫云、 成都精靈云、 廣東品高云,等等。
飛騰有 20 多年的 CPU 研制積累,背后依托中國電子信息產(chǎn)業(yè)集團(tuán)(CEC)。2014 年,中國電子信息產(chǎn)業(yè)集團(tuán)、天津?yàn)I海新區(qū)政府、天津先進(jìn)技術(shù)研究院三方聯(lián)合成立天津飛騰信息技術(shù)有限公司,致力于飛騰系列 CPU 的設(shè)計(jì)研發(fā)和產(chǎn)業(yè)推廣。飛騰公司核心技術(shù)和研發(fā)團(tuán)隊(duì)來自國內(nèi)頂尖高校,擁有 20 多年自主 CPU 研制經(jīng)驗(yàn)。飛騰的芯片面向三大領(lǐng)域:服務(wù)器、PC 和嵌入式,本章重點(diǎn)介紹服務(wù)器和 PC 端的 CPU。
從技術(shù)路線角度,飛騰的發(fā)展經(jīng)歷了 2 個(gè)階段:
1)早期:基于 SPARC 架構(gòu)(1999-2012),生態(tài)建設(shè)受限。2000 年,飛騰第一款嵌入式 CPU 推出;2005 年,飛騰團(tuán)隊(duì)推出了 32 位、64 位的通用 CPU;2009 年推出第一款 8 核高性能 CPU, 2012 年飛騰 16 核高性能通用 CPU 推出。但整個(gè) SPARC 架構(gòu)生態(tài)日漸式微,也一定程度上影響了飛騰 CPU 的進(jìn)一步推廣。
2)新篇章:基于 ARM 架構(gòu)(2014-至今),性能顯著提升、生態(tài)建設(shè)順利推進(jìn)。2014 年飛騰基于ARM 架構(gòu)的 FT-1500A 推出,性能相當(dāng)于 Intel Xeon E3,從此開啟了技術(shù)發(fā)展的新篇章。2017年,飛騰推出 64 核的 FT-2000+系列。2019 年,飛騰桌面版 FT-2000/4 問世,采用 16nm 工藝,性能相當(dāng)于 Intel Core i3 系列。

飛騰新一代的 CPU 實(shí)現(xiàn)了性能的顯著提升:在桌面領(lǐng)域:飛騰新一代的 FT-2000/4 較上一代 FT-1500A/4 計(jì)算性能提升了 1 倍,功耗方面降低 33%。FT-2000/4 還可以通過“降頻”、“減核”的方式,在能源、交通、化工、金融等關(guān)鍵領(lǐng)域?qū)崿F(xiàn)嵌入式低功耗終端應(yīng)用。在服務(wù)器領(lǐng)域:飛騰新一代的服務(wù)器芯片 FT-2000+/64 較上一代 FT-1500A/16 計(jì)算性能提升 5.5 倍,單位功耗算力提升近 2 倍,是更加高效更加綠色的芯片。

飛騰基于 ARM V8 架構(gòu)的服務(wù)器 CPU,相比 x86 架構(gòu)的海外廠商產(chǎn)品,優(yōu)勢(shì)在于多核處理能力和功耗上面。在 2019 年的某項(xiàng)目中,4 臺(tái)基于飛騰 FT-2000+/64(64 核,16nm)的單路服務(wù)器和 4 臺(tái)搭載英特爾至強(qiáng) E5-2650V4(12 核,14nm)的雙路服務(wù)器在大數(shù)據(jù)方面進(jìn)行了對(duì)比測(cè)試。在 Storm測(cè)試中,飛騰的各項(xiàng)測(cè)試均相當(dāng)或占優(yōu)。
在離線計(jì)算 Spark 測(cè)試中,飛騰得益于其多核處理能力,也實(shí)現(xiàn)了性能占優(yōu);在消息隊(duì)列 Kafka 測(cè)試中,飛騰的性能和 x86 服務(wù)器基本相當(dāng)。飛騰的功耗僅僅為對(duì)方的 50%。體現(xiàn)出了飛騰對(duì)大數(shù)據(jù)組件,尤其對(duì)離線計(jì)算的良好支持,也體現(xiàn)了飛騰 CPU的節(jié)能。
針對(duì)云計(jì)算平臺(tái)的虛擬化方面,飛騰服務(wù)器芯片提供了較好的硬件輔助虛擬化支持。在FT2000+/64 服務(wù)器上對(duì)比了虛擬機(jī)雙核(采用 KVM 虛擬化)和宿主機(jī)雙核在基準(zhǔn)測(cè)試中的效率比值,平均約為 97.5%左右,這為基于 KVM 虛擬化的云平臺(tái)性能提供了強(qiáng)有力的支撐。
生態(tài)建設(shè):飛騰通過性能強(qiáng)大、低功耗的桌面 CPU,構(gòu)建了終端全棧生態(tài)。終端全棧架構(gòu)包括硬件層,固件、操作系統(tǒng)及驅(qū)動(dòng)層和應(yīng)用層。

飛騰軟硬件生態(tài)圈:飛騰聯(lián)合了近 1000 家國內(nèi)的軟件/硬件廠商,支持超過 300 款服務(wù)器、30 多款整機(jī)、40 多款便攜筆記本、20 多款存儲(chǔ)設(shè)備。
鯤鵬處理器基于 Armv8 架構(gòu)永久授權(quán),處理器核、微架構(gòu)和芯片均由華為自主研發(fā)設(shè)計(jì),鯤鵬計(jì)算產(chǎn)業(yè)兼容全球 Arm 生態(tài)。除了傳統(tǒng)的服務(wù)器 CPU 和桌面 CPU,華為圍繞鯤鵬處理器打造了“算、存、傳、管、智”五個(gè)子系統(tǒng)的芯片族。歷經(jīng) 10 多年,目前已累計(jì)投入超過 2 萬名工程師。

在通用計(jì)算領(lǐng)域,鯤鵬 CPU 目前主要集中在服務(wù)器領(lǐng)域。鯤鵬 920 服務(wù)器 CPU 基于 ARM V8 多核架構(gòu),最高集成 64 個(gè)物理核,主頻最高 2.6GHz,通過多核來提升算力。另外,華為鯤鵬 PC 級(jí) 的 CPU 也在規(guī)劃中。

根據(jù)華為開發(fā)者大會(huì) 2020(cloud)公布的數(shù)據(jù),相比英特爾 Skylake 服務(wù)器 CPU,華為鯤鵬 920 系列芯片的性能更高,功耗更低,主要得益于鯤鵬 920 的工藝升級(jí)到了 7nm,內(nèi)核數(shù)量更多,而且進(jìn)行了多核優(yōu)化處理。

華為推出了基于鯤鵬 CPU 的泰山服務(wù)器系列,包含多個(gè)種類。根據(jù)華為 2019 年的生態(tài)大會(huì)公布的信息,華為未來將重點(diǎn)聚焦于算力的上游,進(jìn)行生態(tài)伙伴賦能,未來有可能逐漸退出服務(wù)器整機(jī)領(lǐng)域。我們認(rèn)為,隨著華為生態(tài)建設(shè)的逐步完善和廠商對(duì)鯤鵬 CPU 接受度進(jìn)一步提高,華為鯤鵬CPU 未來有望不依賴于華為自己的服務(wù)器整機(jī)進(jìn)行推廣,從而實(shí)現(xiàn)戰(zhàn)略升維。

在 AI 算力方面,華為提供昇騰 AI 處理器和 Atlas 平臺(tái)。昇騰系列包括 310 和 910 兩款,均采用華為自研的達(dá)芬奇架構(gòu)。昇騰 310 定位是高效、靈活、可編程的 AI 處理器,功耗僅 8W,八位整數(shù)精度(INT8)性能達(dá)到 16TOPS,16 位浮點(diǎn)數(shù)(FP16)性能達(dá)到 8 TFLOPS;昇騰 910 定位為超高算力的 AI 處理器,其最大功耗為310W,八位整數(shù)精度(INT8)下的性能達(dá)到 512TOPS,16位浮點(diǎn)數(shù)(FP16)下的性能達(dá)到 256 TFLOPS。
作為一款高集成度的片上系統(tǒng)(SoC),除了基于達(dá)芬奇架構(gòu)的 AI 核外,昇騰 910 還集成了多個(gè) CPU、DVPP 和任務(wù)調(diào)度器,具有自我管理能力,可以充分發(fā)揮其高算力的優(yōu)勢(shì)。昇騰 910 集成了 HCCS、PCIe 4.0 和 RoCE v2 接口,為構(gòu)建橫向擴(kuò)展(Scale Out)和縱向擴(kuò)展(Scale Up)系統(tǒng)提供了靈活高效的方法。HCCS 是華為自研的高速互聯(lián)接口,片內(nèi) RoCE 可用于節(jié)點(diǎn)間直接互聯(lián),最新的 PCIe 4.0 的吞吐量比上一代提升一倍。華為 Atlas 平臺(tái)是搭載昇騰處理器相關(guān)的服務(wù)器、邊緣計(jì)算小站、AI 集群等。
鯤鵬生態(tài)加速推進(jìn):華為聚焦于架構(gòu)和并發(fā),提供算力;硬件開放、軟件開源、支持遷移和生態(tài)伙伴共建生態(tài)。在華為開發(fā)者大會(huì) 2020(Cloud)上,華為宣布“沃土計(jì)劃 2.0” ,將在 2020 年投入 2 億美元推動(dòng)鯤鵬計(jì)算產(chǎn)業(yè)發(fā)展,并公布面向高校、初創(chuàng)企業(yè)、開發(fā)人員及合作伙伴的扶持細(xì)則。

華為攜手騰訊游戲啟動(dòng)在鯤鵬領(lǐng)域的全面合作,并與麒麟軟件、普華基礎(chǔ)軟件、統(tǒng)信軟件、中科院軟件所共同宣布基于 openEuler 的商用版本操作系統(tǒng)正式發(fā)布,加速鯤鵬生態(tài)在各行業(yè)落地。
海光(Hygon)獲得 AMD x86 授權(quán):2016 年,為應(yīng)對(duì)危機(jī),AMD 成立了天津海光來授權(quán) x86 芯片的設(shè)計(jì),由此獲得 2.93 億美元現(xiàn)金。天津海光成立了成都海光微電子和成都海光集成電路公司。AMD 分別擁有海光微電子股份 51%和海光集成電路 30%的股份。海光微電子由 AMD 持有大多數(shù)控股,因此被授權(quán)使用 x86 的設(shè)計(jì)。

2019 年,海光進(jìn)入實(shí)體清單,產(chǎn)業(yè)鏈一度受到影響,但恢復(fù)程度有望超預(yù)期。依托中科曙光、中科院的雄厚的研發(fā)實(shí)力,從長期來看,海光具備吸收先進(jìn)的技術(shù)并做出自主改進(jìn)和升級(jí)的能力,供應(yīng)鏈的影響逐步減弱。在半導(dǎo)體生產(chǎn)線全球化布局的大背景下,公司通過全面梳理供應(yīng)鏈,積極尋找可替代部件,也和部分上游企業(yè)進(jìn)行了積極溝通,以促進(jìn)交易恢復(fù)。公司供應(yīng)鏈運(yùn)營方面取得了實(shí)質(zhì)性進(jìn)展,已經(jīng)形成了相對(duì)完整的應(yīng)對(duì)方案,能夠保持公司供應(yīng)鏈平穩(wěn)運(yùn)行。可以看到,掌握先進(jìn)制程工藝的廠商已經(jīng)有三星、中芯國際、臺(tái)積電等廠商。

海光在吸收了 AMD 的技術(shù)的基礎(chǔ)上,憑借 x86 的生態(tài)和性能優(yōu)勢(shì),依托中科院、中科曙光的研發(fā)實(shí)力支撐,通過整合供應(yīng)鏈資源,有望在 2020 年實(shí)現(xiàn)市場(chǎng)份額的進(jìn)一步突破。
完整內(nèi)容參考《國產(chǎn)基礎(chǔ)軟硬件:開源、遷移、上云,關(guān)鍵在生態(tài)》內(nèi)容如下,下載鏈接:國產(chǎn)基礎(chǔ)軟硬件:開源、遷移、上云,關(guān)鍵在生態(tài)

相關(guān)下載:CPU和GPU研究框架合集
1、行業(yè)深度報(bào)告:GPU研究框架
2、信創(chuàng)產(chǎn)業(yè)研究框架
3、ARM行業(yè)研究框架
4、CPU研究框架
5、國產(chǎn)CPU研究框架
6、行業(yè)深度報(bào)告:GPU研究框架
來源:智能計(jì)算芯世界

轉(zhuǎn)載申明:轉(zhuǎn)載本號(hào)文章請(qǐng)注明作者和來源,本號(hào)發(fā)布文章若存在版權(quán)等問題,請(qǐng)留言聯(lián)系處理,謝謝。
推薦閱讀
更多架構(gòu)相關(guān)技術(shù)知識(shí)總結(jié)請(qǐng)參考“架構(gòu)師全店鋪技術(shù)資料打包”相關(guān)電子書(37本技術(shù)資料打包匯總詳情可通過“閱讀原文”獲取)。
全店內(nèi)容持續(xù)更新,現(xiàn)下單“全店鋪技術(shù)資料打包(全)”,后續(xù)可享全店內(nèi)容更新“免費(fèi)”贈(zèng)閱,價(jià)格僅收198元(原總價(jià)350元)。
溫馨提示:
掃描二維碼關(guān)注公眾號(hào),點(diǎn)擊閱讀原文鏈接獲取“架構(gòu)師技術(shù)全店資料打包匯總(全)”電子書資料詳情。

