深度分析:4種國產(chǎn)CPU架構(gòu)和6大品牌

前篇“國產(chǎn)基礎軟硬件:開源、遷移、上云,關(guān)鍵在生態(tài)”分享了國產(chǎn)基礎軟硬件發(fā)展策略,今天接著國產(chǎn)化話題,講講國產(chǎn)處理器。
國產(chǎn) CPU 廠商得到了相應指令集的架構(gòu)授權(quán),發(fā)展成為6大主流廠商:龍芯、飛騰、鯤鵬、海光、申威、兆芯。CPU 的指令集分為復雜指令集(CISC)和精簡指令集(RISC)兩大類。復雜指令集以x86架構(gòu)為代表,精簡指令集則包括 ARM、MIPS、Alpha、Power 等。

6 大主流 CPU 廠商的技術(shù)路線和生態(tài)建設各有優(yōu)勢。目前在通用計算領域,優(yōu)勢較強的是龍芯、飛騰、鯤鵬、海光這 4 大廠商,我們將在本章進行重點介紹。

龍芯技術(shù)源于中科院計算產(chǎn)業(yè),沿著市場化的道路不斷發(fā)展,已有超過 20 多年的 CPU 行業(yè)積累。2001 年,在中科院計算所知識創(chuàng)新工程的支持下,龍芯課題組正式成立。2010 年,龍芯公司正式成立。龍芯堅持“市場帶技術(shù)”的道路,而不是“市場換技術(shù)”的道路,堅持自主研發(fā),堅持市場化的機制,整體的發(fā)展可概況為三個十年。

龍芯 CPU 系列包括龍芯 3 號大 CPU、 龍芯 2 號中 CPU 、龍芯 1 號小 CPU 三個系列,分別針對電腦(桌面和服務器)、工控和嵌入式、單片機領域。本章重點介紹用于桌面和服務器的龍芯3 號系列 CPU。
1)早期階段(2015 年之前):性能較低,達不到“可用”程度:龍芯第一代 3A1000/3B1500 的單核性能較低,SPEC CPU 2006 分值只有 2-3 分,打開 20M 的測試文檔需要 33 秒。
2)開始進入“可用”階段(2016-2017 年):單核性能顯著提升:龍芯第二代 3A3000/3B3000/7100 單核性能提升到 10-11 分,超過 Intel 凌動系列,打開 20M 的測試文檔時間縮短為 6 秒。
3)“可用”向“好用”升級階段(2019-2020):單核性能再次突破:龍芯第三代 3A/B4000、3A/C5000、7A2000 的單核性能提高到 20-30 分,打開 20M 的測試文檔時間少于 1 秒。

龍芯 3 號的更新升級有兩種模式:
1)工藝更新微結(jié)構(gòu)不變
2)工藝不變更新微結(jié)構(gòu)。
龍芯 3A4000相比 3000,采用相同工藝(28nm)但性能成倍提高;龍芯 5000 系列工藝更新 12nm。龍芯 3 號 CPU 下一代 5000 系列的目標:提高主頻和核數(shù)。龍芯新一代桌面芯片 3A5000 將在2020年Q2 流片,采用 12nm 工藝,單核性能提高至 25-30 分,與 3A4000 可原位替換,操作系統(tǒng)二進制兼容;龍芯服務器芯片 3C5000 預計于 2020 三季度流片,采用 12nm工藝,16 核結(jié)構(gòu),支持 4-16 路服務器。

雖然從全球整體來看,MIPS 架構(gòu)的生態(tài)基礎相對 x86 和 ARM 較為薄弱,但龍芯的信創(chuàng)生態(tài)建設已經(jīng)較為完善,而且處于不斷擴張的發(fā)展中。龍芯非常重視 Linux 生態(tài)建設,為開源社區(qū)積極貢獻代碼,增強技術(shù)影響力。龍芯致力于 Linux 生態(tài)體系的兼容優(yōu)化,有上百人規(guī)模的開源軟件工程師團隊,提供操作系統(tǒng)和底層軟件兜底服務的能力。
2020 年 3 月 17 日,Java14f 發(fā)布,根據(jù)官方發(fā)布的統(tǒng)計,Oracle、紅帽、SAP、龍芯和谷歌,位于 OpenJDK 代碼提交次數(shù)的全球前五位。

在應用開發(fā)環(huán)境建設方面,龍芯支持主流的 Linux 開發(fā)環(huán)境,包括多種編程語言、函數(shù)庫、平臺引擎和集成開發(fā)工具等。

PC 端的生態(tài)建設:龍芯 CPU 已經(jīng)支持主流的整機、操作系統(tǒng)、辦公軟件、瀏覽器、輸入法和部分設計工具等常見軟硬件,覆蓋了基本的辦公需求。

服務器生態(tài)領域:龍芯目前的 3B4000 服務器芯片是 4 核的,可以支持雙路、 四路全相連結(jié)構(gòu),實現(xiàn)了虛擬機效率提升至 95%以上、跨片訪存帶寬提升至 400% 以上、內(nèi)存數(shù)量線性擴展以及高吞吐率。目前也已經(jīng)有百款廠商適配了龍芯的服務器 CPU。我們認為,龍芯新一代 16 核的服務器CPU 在 2020 年內(nèi)流片之后,龍芯在服務器領域的市場影響力將進一步得到增強。
云計算生態(tài)領域:龍芯的 KVM 虛擬機于 2019 年 4 月發(fā)布,完善支持 OpenStack 集群管理工具,實現(xiàn)了從 CPU 到系統(tǒng), 全鏈條虛擬機的自主研制。在云容器方面,龍芯的 Doker 容器于2017 年發(fā)布,完善支持集群管理工具 Swarm、 Kubernets、 Openshift、 Mesos 等。龍芯的云計算生態(tài)伙伴包括:浪潮云、 騰訊云、 金山云、 曙光云、 云棧希云、 中標易云、 道客云、航天科工天熠云、 UCLOUD、 CETC 電科云、 普華云、 升騰云、 金蝶云、江蘇華云、 廣西梯度云、 上海田畝云、 北京優(yōu)炫云、 成都精靈云、 廣東品高云,等等。
飛騰有 20 多年的 CPU 研制積累,背后依托中國電子信息產(chǎn)業(yè)集團(CEC)。2014 年,中國電子信息產(chǎn)業(yè)集團、天津濱海新區(qū)政府、天津先進技術(shù)研究院三方聯(lián)合成立天津飛騰信息技術(shù)有限公司,致力于飛騰系列 CPU 的設計研發(fā)和產(chǎn)業(yè)推廣。飛騰公司核心技術(shù)和研發(fā)團隊來自國內(nèi)頂尖高校,擁有 20 多年自主 CPU 研制經(jīng)驗。飛騰的芯片面向三大領域:服務器、PC 和嵌入式,本章重點介紹服務器和 PC 端的 CPU。
從技術(shù)路線角度,飛騰的發(fā)展經(jīng)歷了 2 個階段:
1)早期:基于 SPARC 架構(gòu)(1999-2012),生態(tài)建設受限。2000 年,飛騰第一款嵌入式 CPU 推出;2005 年,飛騰團隊推出了 32 位、64 位的通用 CPU;2009 年推出第一款 8 核高性能 CPU, 2012 年飛騰 16 核高性能通用 CPU 推出。但整個 SPARC 架構(gòu)生態(tài)日漸式微,也一定程度上影響了飛騰 CPU 的進一步推廣。
2)新篇章:基于 ARM 架構(gòu)(2014-至今),性能顯著提升、生態(tài)建設順利推進。2014 年飛騰基于ARM 架構(gòu)的 FT-1500A 推出,性能相當于 Intel Xeon E3,從此開啟了技術(shù)發(fā)展的新篇章。2017年,飛騰推出 64 核的 FT-2000+系列。2019 年,飛騰桌面版 FT-2000/4 問世,采用 16nm 工藝,性能相當于 Intel Core i3 系列。

飛騰新一代的 CPU 實現(xiàn)了性能的顯著提升:在桌面領域:飛騰新一代的 FT-2000/4 較上一代 FT-1500A/4 計算性能提升了 1 倍,功耗方面降低 33%。FT-2000/4 還可以通過“降頻”、“減核”的方式,在能源、交通、化工、金融等關(guān)鍵領域?qū)崿F(xiàn)嵌入式低功耗終端應用。在服務器領域:飛騰新一代的服務器芯片 FT-2000+/64 較上一代 FT-1500A/16 計算性能提升 5.5 倍,單位功耗算力提升近 2 倍,是更加高效更加綠色的芯片。

飛騰基于 ARM V8 架構(gòu)的服務器 CPU,相比 x86 架構(gòu)的海外廠商產(chǎn)品,優(yōu)勢在于多核處理能力和功耗上面。在 2019 年的某項目中,4 臺基于飛騰 FT-2000+/64(64 核,16nm)的單路服務器和 4 臺搭載英特爾至強 E5-2650V4(12 核,14nm)的雙路服務器在大數(shù)據(jù)方面進行了對比測試。在 Storm測試中,飛騰的各項測試均相當或占優(yōu)。
在離線計算 Spark 測試中,飛騰得益于其多核處理能力,也實現(xiàn)了性能占優(yōu);在消息隊列 Kafka 測試中,飛騰的性能和 x86 服務器基本相當。飛騰的功耗僅僅為對方的 50%。體現(xiàn)出了飛騰對大數(shù)據(jù)組件,尤其對離線計算的良好支持,也體現(xiàn)了飛騰 CPU的節(jié)能。
針對云計算平臺的虛擬化方面,飛騰服務器芯片提供了較好的硬件輔助虛擬化支持。在FT2000+/64 服務器上對比了虛擬機雙核(采用 KVM 虛擬化)和宿主機雙核在基準測試中的效率比值,平均約為 97.5%左右,這為基于 KVM 虛擬化的云平臺性能提供了強有力的支撐。
生態(tài)建設:飛騰通過性能強大、低功耗的桌面 CPU,構(gòu)建了終端全棧生態(tài)。終端全棧架構(gòu)包括硬件層,固件、操作系統(tǒng)及驅(qū)動層和應用層。

飛騰軟硬件生態(tài)圈:飛騰聯(lián)合了近 1000 家國內(nèi)的軟件/硬件廠商,支持超過 300 款服務器、30 多款整機、40 多款便攜筆記本、20 多款存儲設備。
鯤鵬處理器基于 Armv8 架構(gòu)永久授權(quán),處理器核、微架構(gòu)和芯片均由華為自主研發(fā)設計,鯤鵬計算產(chǎn)業(yè)兼容全球 Arm 生態(tài)。除了傳統(tǒng)的服務器 CPU 和桌面 CPU,華為圍繞鯤鵬處理器打造了“算、存、傳、管、智”五個子系統(tǒng)的芯片族。歷經(jīng) 10 多年,目前已累計投入超過 2 萬名工程師。

在通用計算領域,鯤鵬 CPU 目前主要集中在服務器領域。鯤鵬 920 服務器 CPU 基于 ARM V8 多核架構(gòu),最高集成 64 個物理核,主頻最高 2.6GHz,通過多核來提升算力。另外,華為鯤鵬 PC 級 的 CPU 也在規(guī)劃中。

根據(jù)華為開發(fā)者大會 2020(cloud)公布的數(shù)據(jù),相比英特爾 Skylake 服務器 CPU,華為鯤鵬 920 系列芯片的性能更高,功耗更低,主要得益于鯤鵬 920 的工藝升級到了 7nm,內(nèi)核數(shù)量更多,而且進行了多核優(yōu)化處理。

華為推出了基于鯤鵬 CPU 的泰山服務器系列,包含多個種類。根據(jù)華為 2019 年的生態(tài)大會公布的信息,華為未來將重點聚焦于算力的上游,進行生態(tài)伙伴賦能,未來有可能逐漸退出服務器整機領域。我們認為,隨著華為生態(tài)建設的逐步完善和廠商對鯤鵬 CPU 接受度進一步提高,華為鯤鵬CPU 未來有望不依賴于華為自己的服務器整機進行推廣,從而實現(xiàn)戰(zhàn)略升維。

在 AI 算力方面,華為提供昇騰 AI 處理器和 Atlas 平臺。昇騰系列包括 310 和 910 兩款,均采用華為自研的達芬奇架構(gòu)。昇騰 310 定位是高效、靈活、可編程的 AI 處理器,功耗僅 8W,八位整數(shù)精度(INT8)性能達到 16TOPS,16 位浮點數(shù)(FP16)性能達到 8 TFLOPS;昇騰 910 定位為超高算力的 AI 處理器,其最大功耗為310W,八位整數(shù)精度(INT8)下的性能達到 512TOPS,16位浮點數(shù)(FP16)下的性能達到 256 TFLOPS。
作為一款高集成度的片上系統(tǒng)(SoC),除了基于達芬奇架構(gòu)的 AI 核外,昇騰 910 還集成了多個 CPU、DVPP 和任務調(diào)度器,具有自我管理能力,可以充分發(fā)揮其高算力的優(yōu)勢。昇騰 910 集成了 HCCS、PCIe 4.0 和 RoCE v2 接口,為構(gòu)建橫向擴展(Scale Out)和縱向擴展(Scale Up)系統(tǒng)提供了靈活高效的方法。HCCS 是華為自研的高速互聯(lián)接口,片內(nèi) RoCE 可用于節(jié)點間直接互聯(lián),最新的 PCIe 4.0 的吞吐量比上一代提升一倍。華為 Atlas 平臺是搭載昇騰處理器相關(guān)的服務器、邊緣計算小站、AI 集群等。
鯤鵬生態(tài)加速推進:華為聚焦于架構(gòu)和并發(fā),提供算力;硬件開放、軟件開源、支持遷移和生態(tài)伙伴共建生態(tài)。在華為開發(fā)者大會 2020(Cloud)上,華為宣布“沃土計劃 2.0” ,將在 2020 年投入 2 億美元推動鯤鵬計算產(chǎn)業(yè)發(fā)展,并公布面向高校、初創(chuàng)企業(yè)、開發(fā)人員及合作伙伴的扶持細則。

華為攜手騰訊游戲啟動在鯤鵬領域的全面合作,并與麒麟軟件、普華基礎軟件、統(tǒng)信軟件、中科院軟件所共同宣布基于 openEuler 的商用版本操作系統(tǒng)正式發(fā)布,加速鯤鵬生態(tài)在各行業(yè)落地。
海光(Hygon)獲得 AMD x86 授權(quán):2016 年,為應對危機,AMD 成立了天津海光來授權(quán) x86 芯片的設計,由此獲得 2.93 億美元現(xiàn)金。天津海光成立了成都海光微電子和成都海光集成電路公司。AMD 分別擁有海光微電子股份 51%和海光集成電路 30%的股份。海光微電子由 AMD 持有大多數(shù)控股,因此被授權(quán)使用 x86 的設計。

2019 年,海光進入實體清單,產(chǎn)業(yè)鏈一度受到影響,但恢復程度有望超預期。依托中科曙光、中科院的雄厚的研發(fā)實力,從長期來看,海光具備吸收先進的技術(shù)并做出自主改進和升級的能力,供應鏈的影響逐步減弱。在半導體生產(chǎn)線全球化布局的大背景下,公司通過全面梳理供應鏈,積極尋找可替代部件,也和部分上游企業(yè)進行了積極溝通,以促進交易恢復。公司供應鏈運營方面取得了實質(zhì)性進展,已經(jīng)形成了相對完整的應對方案,能夠保持公司供應鏈平穩(wěn)運行。可以看到,掌握先進制程工藝的廠商已經(jīng)有三星、中芯國際、臺積電等廠商。

海光在吸收了 AMD 的技術(shù)的基礎上,憑借 x86 的生態(tài)和性能優(yōu)勢,依托中科院、中科曙光的研發(fā)實力支撐,通過整合供應鏈資源,有望在 2020 年實現(xiàn)市場份額的進一步突破。
來源:國產(chǎn)CPU:4種架構(gòu)和6大品牌(深度)
完整內(nèi)容參考《國產(chǎn)基礎軟硬件:開源、遷移、上云,關(guān)鍵在生態(tài)》內(nèi)容如下,下載鏈接:國產(chǎn)基礎軟硬件:開源、遷移、上云,關(guān)鍵在生態(tài)


轉(zhuǎn)載申明:轉(zhuǎn)載本號文章請注明作者和來源,本號發(fā)布文章若存在版權(quán)等問題,請留言聯(lián)系處理,謝謝。
