下篇:國產6大CPU的春秋戰(zhàn)國(附下載)


本系列上篇分享文章<上篇:國產6大CPU技術全對比(附下載),以下將完成下篇內容分享。
下載鏈接:

天津飛騰是國產自主安全主力芯片廠商。飛騰專注于ARM芯片研發(fā),是中國最早獲得 ARMv8 指令集架構授權的芯片設計廠商,主要致力于國產高性能、低功耗集成電路芯片的設計與服務,產品廣泛應用于計算機終端與服務器。目前國內完全自主設計的芯片廠商僅飛騰、龍芯、海光、兆芯和申威等寥寥數家,飛騰在CPU、JS引擎性能、 HTML5 兼容性等方面全面領先其他廠商 。
飛騰產品覆蓋高性能服務器CPU 、高能效桌面CPU和高端嵌入式 CPU 等。飛騰是國內通用CPU里面譜系最全的CPU廠家,包括高性能服務器CPU 、高效能桌面CPU 、高端嵌入式 CPU ,能為從端到云的各類設備提供核心算力支撐 。目前,主推產品是面向服務器的FT 2000+64、面向桌面終端的FT2000四核和面向嵌入式的FT2000A兩核。

飛騰CPU是PK體系信息系統(tǒng)的核心。飛騰的CPU芯片架構和國際主流ARM 指令集接軌,而內部則是完全自主研發(fā)的“飛騰內核”。架構和國際主流接軌,保證了芯片接口的通用性,產品能更好地融入國際市場和生態(tài)環(huán)境;自主研發(fā)內核,則保障了芯片的自主性和可控性?;谧灾餮邪l(fā)的處理器內核,飛騰擁有高性能服務器 CPU 、桌面 CPU 和高端嵌入式 CPU完整的產品譜系,并與國內軟硬件廠商完成適配和產品業(yè)化研發(fā),使得基于飛騰芯片的產品性能上可以達到替代國外產品,為從端到云的各型設備提供核心算力支撐,為我國構建安全、自主、可控的國產化計算平臺奠定了基礎。
目前,飛騰已經與國內眾多廠家開展合作,攜手合作伙伴構建繁榮開放的生態(tài),合作伙伴數量超過 1000 家、累計研制了 6 大類 900 余種整機產品,已經適配和正在適配的軟件和外設超過 2400 種,飛騰已經建立起云端邊和嵌入式全棧解決方案圖譜。
2020H1,公司業(yè)績大幅增長 。2020 年上半年,公司已實現營收 3.5 億元,超過19 全年營收,下半年將繼續(xù)保持增長勢頭,年底實現全年出貨量100 余萬片,營收 10 億元目標。
今年以來,飛騰對高性能服務器CPU 、高效能桌面CPU和高端嵌入式CPU等三條產品線進行了全面品牌升級。高性能服務器CPU統(tǒng)一以飛騰騰云S系列命名(為服務器和數據中心提供強算力、高并發(fā)的計算服務)、高效能桌面CPU產品線統(tǒng)一以飛騰騰銳 D 系列命名(打造高性能、高安全的單用戶極致體驗)、高端嵌入式產品線統(tǒng)一以飛騰騰瓏 E 系列命名(提供定制化契合各行各業(yè)嵌入式應用的解決方案)。騰龍、騰銳、騰瓏并駕齊驅,三線齊飛 。

2020年7月23日,飛騰發(fā)布騰云系列第一代高可擴展多路服務器芯片騰云 S2500。與 FT 2000+相比性能大幅提升,擴展支持2路-8路,一臺服務器整機最多可以支持8 顆S2500芯片直連構成多路服務器,片內集成64MB三級Cache ,支持8個DDR4 3200 存儲通道。

在整機性能方面,雙路的SPECint分值為1000+增長至原來的2倍,四路的SPECint值為 1800+,是原來的 3.5 倍。
在分布式數據庫性能方面,雙路服務器的 tpmC 值達到 98000 ,線性提升至原來的 2 倍,四路的 tpmC 值達到176000,增長至原來的4倍。
在云桌面支持方面,雙路服務器支持虛擬機70個,是原來的2.5倍,四路服務器支持140個,是原來的5倍。

未來三年的產品規(guī)劃:騰云 S系列將有兩款核心產品(騰云 S5000和騰云S6000)、騰銳D系列有兩款核心產品(騰銳 D2000 和騰銳D3000)、騰瓏E系列(騰瓏E2000和騰瓏 E3000)。
華為基于ARM 架構,研發(fā)五大芯片族,實現全場景布局。華為自研芯片產品主要包括服務器芯片鯤鵬系列、手機 SOC 芯片麒麟系列、人工智能芯片昇騰系列、 5G 基站芯片天罡系列、 5G 終端芯片巴龍系列等以及一系列專用芯片,如凌霄芯片、 NB IoT 芯片、視頻編碼解碼芯片以及 SSD 控制芯片等。
Kunpeng 處理器從指令集和微架構兩方面進行兼容性設計,兼容全球 ARM 生態(tài),并圍繞 Kunpeng 處理器打造了“算、存、傳、管、智”五個子系統(tǒng)的芯片族,實現全場景處理器布局。華為從 2004 年開始投資研發(fā)第一顆嵌入式處理芯片,歷經 16 年,累計投入超過 2 萬名工程師,形成了目前以“鯤鵬 昇騰”為核心的基礎芯片族。
作為鯤鵬計算產業(yè)底座的 Kunpeng 處理器,華為持續(xù)重點投入以滿足市場對于新算力的需求。目前鯤鵬系列已經實現量產的有 Kunpeng 912 、Kunpeng 916 、 Kunpeng 920 、 Kunpeng 920s ,而Kunpeng 920Lite 、Kunpeng930及 Kunpeng 930s 目前 仍在研發(fā)中, Kunpeng 930Lite 尚在規(guī)劃中。

最新鯤鵬920芯片已實現通用計算最強算力,性能優(yōu)于其他廠商的同類型芯片。2019 年,華為發(fā)布最新鯤鵬 920 處理器。這款鯤鵬 920 基于ARMv8 指令集,是行業(yè)內首款 7nm 數據中心 ARM 處理器,由華為自主研發(fā)設計,采用多發(fā)射、亂序執(zhí)行、優(yōu)化分支預測等多種手段提升單核的性能。鯤鵬920擁有64個內核,集成8通道DDR4,可以提供多個接口主頻可達2.6GHz,總帶寬 640Gbps,保證了920超強算力的高效輸出。
此外,在 Memory子系統(tǒng)上也進行了大量的優(yōu)化,采用當前典型的3級Cache 的架構,對 Cache 大小以及延時進行了優(yōu)化設計。鯤鵬920面向數據中心,主打低功耗強性能,性能達到業(yè)界領先水平,尤其是整型計算能力,業(yè)界標準SPECint Benchmark 評分超過930 ,超出業(yè)界標桿 25%同時能效優(yōu)于業(yè)界標桿30%。并已經針對大數據、分布式存儲、數據庫及云服務等場景進行了歐化,通過軟硬協(xié)同進一步提升處理器的性能。

鯤鵬920已實現性能超越Intel系列X86 芯片。鯤鵬芯片算力維度方面在非 X86 架構芯片中明顯領先,且發(fā)展至目前已經達到可以與 X86 芯片相匹配的性能。鯤鵬 920 芯片基于ARM v8架構,各方面性能優(yōu)異。目前從整體性能上看,鯤鵬 920 與芯片龍頭 Intel 公司所生產的芯片相比較而言,48核鯤鵬 920 與 Intel 至強 8180 性能相當,但鯤鵬 920 能耗比對方低 20%,而 64 核的鯤鵬 920 測試性能要遠優(yōu)于 Intel 至強 8180。這證明 ARM 架構已經具備趕超 X86 架構性能的能力。

從2019 年開始一直加速各行業(yè)生態(tài)的適配,在政府端進行得較為充分完善。目前在操作系統(tǒng)方面,推出了自主研發(fā)的歐拉服務器操作系統(tǒng),但歐拉操作系統(tǒng)與鯤鵬產業(yè)合作伙伴誠邁科技的統(tǒng)信UOS 、中國軟件的麒麟操作系統(tǒng)并不矛盾,華為將借助鯤鵬 920 與這些國產操作系統(tǒng)的適配來構建起強大的鯤鵬生態(tài)。目前基于統(tǒng)信UOS 、華為鯤鵬平臺的整機、應用、外設的適配已經超過1000款,在日常辦公領域已經完全具備替換 Windows系統(tǒng)的能力。
華為是ARM服務器芯片領域的領軍企業(yè),其產品已經服務于國內多個領域 。移動領域,華為海思的麒麟芯片已經通過華為高端手機 Mate 系列、 P系列打響自身品牌;服務器與云計算領域,華為陸續(xù)發(fā)布的鯤鵬系列和昇騰系列芯片,基于 ARM 架構,分別用于服務器和云計算市場 。然而,在不斷加劇的國際封鎖 和美國制裁下,華為鯤鵬的發(fā)展蒙上了一層不確定性。
國內最早自主研發(fā)芯片廠商,于2001年在中科院計算所開始研發(fā),得到了中科院、 863、 973 、核高基等項目大力支持,完成了十年的核心技術積累。2010 年,中國科學院和北京市政府共同牽頭出資,龍芯中科技術有限公司正式成立,開始市場化運作,旨在將龍芯處理器的研發(fā)成果產業(yè)化 。
龍芯CPU采用MIPS體系結構,產品現包括龍芯1 號小 CPU 、龍芯2號中CPU和龍芯 3 號大CPU三個系列,此外還包括龍芯 7A1000 橋片 。產品方面,龍芯目前共推出3代CPU產品, 2017年4月發(fā)布面向桌面服務器應用的龍芯3號處理器的最新升級產品龍芯3A3000/3B3000 ,其中,龍芯 3A3000 基于中芯 28nm FDSOI 工藝,自主 GS464E 架構(自主指令系統(tǒng) LoongISA),設計為四核 64 位,主頻 1.5GHz ,功耗僅 30W ,是目前國產CPU中單核 SPEC 實測性能最高的芯片之一。
2019年12月,龍芯推出首款基于 GS464v 微架構的四核處理器 3A4000 相比上一代 產品實測性能提高 一倍 。預計 2020 年 年底將 推出 3A5000/3C5000,其工藝改進提高主頻至 2.5GHz ,核數提升至 16 核。


相比龍芯3A3000 處理器,龍芯3A4000 性能翻倍 。龍芯3 A4000相比3A3000的 GS464e 微架構,進一步優(yōu)化流水線,提升運行頻率,加強對虛擬化、向量支持、加解密、安全機制等方面的支持。其芯片整體實測性能提升一倍左右 。


在某些測試項目中,龍芯3A4000 的速度超過了3A3000 的三倍,比如hmmer 測試, 3A4000 的速度是3A3000 的 3.6 倍,這是因為龍芯 3A4000 的向量指令在發(fā)揮作用。但與 Intel i5 7200U處理器相比,龍芯3A4000處理器性能 還存在一定差距。
從測試結果可以看到,3A4000 處理器單核整數性能只有 i57200U的 60%, 浮點性能只有后者的50% 。但考慮到 Intel i5 7200U睿頻頻率高達3.1GHz,處理器的每GHz 性能為整數10.64分,浮點12.6 分;3A4000 處理器核的同主頻性能已經能夠達到 i5 7200U 處理器的80%-90%。
海光信息技術有限公司成立于2014年10月,公司重要股東為中科曙光,持股36.68。海光信息主營高性能處理器,業(yè)務涵蓋芯片領域的設計、制造和生產等環(huán)節(jié),自主設計了“禪定” X86中央處理器。2016年4月,AMD宣布將與海光信息成立合資公司,授權其生產服務器處理器,AMD獲得2.93億美元的授權費。目前,海光資金以天津投資和曙光自有資金為主。
通過與AMD成立合資公司,變相獲得X86內核授權 。由于Intel與AMD之間存在交叉授權協(xié)議,當AMD成立合資公司時,若AMD為非控股股東,則合資公司不能獲得 X86 授權,只有 AMD 保持控股狀態(tài)時,合資公司才能獲得 X86 授權。因此最初合資的一項條件就是AMD控股合資公司。但如果由 AMD 控股了合資公司,那勢必影響合資公司獲得國家扶持的力度,而且一旦外資控股,其創(chuàng)新可信身份將存疑 ,很多國產項目將無法參與。

于是,AMD與海光達成了一個迂回的合作方案。首先,AMD與海光信息成立合資公司成都海光微電子技術有限公司(簡稱“海光微電子”), AMD持股51%,為控股股東,負責開發(fā)CPU核(享有AMD 現有的X86內核授權)。然后海光與AMD 另外成立一家由海光信息控股的合資公司成都集成電路設計有限公司(簡 稱“海光集成電路”),海光信息持股70% 。由海光集成電路購買海光微電子的 IP 授權,以此為基礎開發(fā)CPU ,最終實現ARM賣 IP核的翻版。從而,既規(guī)避了Intel 的 X86 授權限制,又使得海光X86 CPU 成為內資公司開發(fā)的產品,滿足創(chuàng)新可信要求。
海光的最大優(yōu)勢是其產品性能和X86豐富的應用生態(tài) 。由于有 AMD 技術做后盾, AMD 授權給海光的是性能強勁的 Zen 的結構和代碼,海光芯片性能優(yōu)越,在國家級超算項目應用廣泛(主要用于曙光服務器)。
2018年7月, AMD與天津海光合作后首款 X86 處理器 Dhyana (禪定)啟動生產 Dhyana (禪定)基于超微(AMD)Zen核心架構開發(fā),性能方面與AMD EPYC處理器相似,Linux維護者將EPYC 支持代碼轉移到Dhyana(禪定)處理器后可以成功運行,說明當時兩款處理器差異相對較小。
2019年6月,中科曙光與四川成都合作建立成都超算中心。2020年5月10日,中國電信 56314臺服務器集采華為鯤鵬 920 芯片、海光Hygon Dhyana系列處理器的H系列全國產化服務器,首次將全國產化服務器單獨列入招標目錄。2020年7月1日, Intel停供服務器芯片,海光已開始向國內諸多服務器廠商供貨。

海光處理器當下暫未受制裁影響,海光產品當下確定性相對較高,但X86架構的核心指令集仍然掌握在Intel和AMD 手中,且海光未獲得桌面產品授權, 下一步海光將在現有架構基礎上持續(xù)迭代創(chuàng)新,維持國產的優(yōu)勢。
申威最初基于Alpha指令集架構,形成三個系列國產處理器產品線。成都申威科技有限公司,主要從事對申威處理器的產業(yè)化推廣,核心業(yè)務包括申威處理器芯片內核、封裝設計、技術支持服務及銷售,小型超級計算機研發(fā)、測試、銷售、服務及核心部件生產,基于申威處理器的軟件、中間件開發(fā),嵌入式計算機系統(tǒng)定制化產品服務,集成電路 IP 核等知識產權授權。
申威處理器是在國家“核高基”重大專項支持下,由上海高性能集成電路中心,采用自主指令集,研制的具有完全自主知識產權的國產處理器系列。現已形成申威高性能計算處理器、服務器及桌面處理器、嵌入式處 理器三個系列的國產處理器產品線,以及申威國產 I/O 套片產品線。
申威CPU長期創(chuàng)新可信,但生態(tài)建設存在難度。2006 年,背靠科技部和上海市政府的上海高性能集成電路設計中心首次成功研制出基于DEC公司Alpha 架構的申威1 單核 CPU,130nm工藝,主頻 900MHz 。申威作為軍方專供CPU廠商,軍隊大部分機密設備均使用申威處理器,因此出于安全性能以及知識產權角度,申威在研發(fā)出第一代基于 Alpha 指令集的 CPU 后,將指令集替換為自研的自主可控申威64位指令集,完全區(qū)別于原有Alpha 指令集。
因此,基于完全自主指令集架構的申威 CPU 研發(fā)能力不受限制,不受美國制裁的威脅,可以為軍隊、黨政機關等高機密、關鍵行業(yè)持續(xù)穩(wěn)定提供支撐,并已經開展了產業(yè)化推廣。但由于申威是唯一一個基于申威64位指令集打造的國產CPU廠商,因此后續(xù)在 獨立生態(tài)建設上將存在一定難度。
申威在服務器領域向上至超算領域的應用場景中性能強大,優(yōu)勢較為明顯。2016年6 月20日,搭載了申威 SW26010 以及國產操作系統(tǒng)神威睿思的神威太湖之光獲得全球超級計算機第一名,并持續(xù)4 年。神威太湖之光峰值計算速度達每秒12.54 億億次,是全球首臺峰值計算速度超過十億億次的超級計算機,軟件硬件并行,均為申威自主設計。

2020年1月,申威與中國電科進行了對接。目前,中國電科已經成立中電科申泰公司,負責申威處理器的產業(yè)推廣工作。2020年7月29日,申威全國首條服務器規(guī)?;a線在上海松江區(qū)正式啟用。這標志著中國電科貫徹落實國家戰(zhàn)略要求,實現了申威服務器規(guī)?;a。目前已建成的規(guī)模化生產線年產能超過4萬臺。
申威與多家廠商進行適配,國產處理器得以推廣應用的關鍵在于生態(tài)的豐富與否。為應對這一問題,申威推出了自研的操作系統(tǒng),實現了從處理器到操作系統(tǒng),在到上層應用軟件的國產化。近期,多家廠商與申威處理器進行兼容認證,涉及操作系統(tǒng)、存儲等軟件硬件領域,例如統(tǒng)信、聯(lián)想、大道云行、鼎甲等。目前,申威處理器適配的操作系統(tǒng)有中標麒麟、統(tǒng)信UOS及深度deepin。
上海兆芯集成電路有限公司(簡稱“兆芯”)于2013年成立,由上海聯(lián)合投資有限公司(隸屬于上海市國資委)和臺灣威盛電子共同成立 ,總部位于上海張江,在北京、西安、武漢、深圳等地設有研發(fā)中心和分支機構。目前,上海市國資委持股比例為 85.24% 。威盛電子是臺灣老牌芯片公司,是除 Intel 、 AMD之外,唯一一家擁有X86 架構授權的公司,也是除高通之外,唯一一家擁有CDMA 基帶授權的公司。
兆芯的技術源自 VIA,通過技術引進、仿制,再修改原始設計,最后自主創(chuàng)新,致力于通過技術創(chuàng)新與兼容主流的發(fā)展路線,為行業(yè)用戶提供通用處理器和配套芯片等產品。公司成立以來,兆芯已成功研發(fā)并量產多款通用處理器產品,并形成“開先”、“開勝”兩大產品系列。


2019年6月,兆芯發(fā)布開先KX 6000,開勝KH 30000系列處理器,是首款主頻達到3.0GHz 的國產通用處理器,也是業(yè)內第一款完整集成 CPU 、 GPU 、芯片組的 SoC 單芯片國產通用處理器,其單芯片性能相比上一代產品提升了多達50%,同頻下的性能功耗比則是上代產品的3倍,產品性能與國際主流的 Intel i5水平相當。
來源:本文參考自國金證券和網絡。
下載鏈接:
全集下載:
《龍芯LoongArch 指令集介紹》
《龍芯指令系統(tǒng)融合技術》
《龍芯架構32位精簡版參考手冊》
《龍芯架構參考手冊卷一:基礎架構》
《龍芯3A1000 處理器用戶手冊(上冊)》
《龍芯3A1000 處理器用戶手冊(下冊)》
《龍芯3A3000-3B3000處理器手冊(上冊)》
《龍芯3A3000-3B3000處理器手冊(上冊)》
1、行業(yè)深度報告:GPU研究框架
2、信創(chuàng)產業(yè)研究框架
3、ARM行業(yè)研究框架
4、CPU研究框架
5、國產CPU研究框架
6、行業(yè)深度報告:GPU研究框架

電子書<服務器基礎知識全解(終極版)>更新完畢,知識點深度講解,提供182頁完整版下載。
獲取方式:點擊“閱讀原文”即可查看詳情,提供PPT可編輯版本和PDF閱讀版本。
溫馨提示:
請搜索“AI_Architect”或“掃碼”關注公眾號實時掌握深度技術分享,點擊“閱讀原文”獲取更多原創(chuàng)技術干貨。

