華為智能化戰(zhàn)略,國產(chǎn)AI基礎(chǔ)設(shè)施突破

華為在計(jì)算、網(wǎng)絡(luò)、存儲等領(lǐng)域的綜合優(yōu)勢明顯,從器件級、節(jié)點(diǎn)級、集群級和業(yè)務(wù)級全面提升系統(tǒng)可靠性,將大模型訓(xùn)練穩(wěn)定性從天級提升到月級。
1.1.算力、運(yùn)力、存力全方位發(fā)展,國產(chǎn)算力瓶頸有望突破
大模型進(jìn)入萬億參數(shù)時代,單體服務(wù)器算力有限,需要將大量杰斯安服務(wù)器、存儲器等通過網(wǎng)絡(luò)相連,打造大規(guī)模算力集群。通過對處理器、網(wǎng)絡(luò)架構(gòu)和存儲性能的全面優(yōu)化,為大模型訓(xùn)練提供高性能、高帶寬、低延遲的智算能力支撐。
關(guān)于算力發(fā)展的突破方向,華為改變了傳統(tǒng)的服務(wù)器堆疊模式,以系統(tǒng)架構(gòu)創(chuàng)新的思路,著力打造 AI 集群,實(shí)現(xiàn)算力、運(yùn)力、存力的一體化設(shè)計(jì),突破算力瓶頸。

1.2.昇騰 AI 計(jì)算集群打造超大規(guī)模無收斂集群組網(wǎng)
華為昇騰 AI 計(jì)算集群采用全新的華為星河 AI 智算交換機(jī) CloudEngine XH16800,借助其高密的800GE端口能力,兩層交換網(wǎng)絡(luò)即可實(shí)現(xiàn)2250節(jié)點(diǎn)(等效于 18000 張卡)超大規(guī)模無收斂集群組網(wǎng)。
算力方面,華為通過架構(gòu)和系統(tǒng)創(chuàng)新,構(gòu)筑面向多場景的大算力平臺,突破 AI 大模型訓(xùn)練的算力瓶頸。
存力方面,華為發(fā)布領(lǐng)先的 AI 知識庫存儲 OceanStor A800, 以創(chuàng)新架構(gòu)構(gòu)建高性能數(shù)據(jù)存儲。
運(yùn)力方面,華為發(fā)布業(yè)界首款高運(yùn)力 DCN 星河 AI 智算交換機(jī),和業(yè)界容量最大的超寬全光智能 DCI 方案,以大規(guī)模,大容量網(wǎng)絡(luò)運(yùn)力釋放大算力。

1.3.昇騰芯片+ MindSpore 生態(tài),全球算力第二極
華為深耕 AI 算力,推出了完全自主架構(gòu)的昇騰 AI 處理器 910 (Ascend 910),Ascend 910 采用華為自研達(dá)芬奇架構(gòu)。
昇騰 910 的半精度 (FP16)算力達(dá)到 256 Tera-FLOPS,整數(shù)精度(NT8) 算力達(dá)到 512 Tera-OPS,且芯片最大功耗僅為 310W,比此前設(shè)計(jì)規(guī)格的 350W 更低。

除了超高的算力之外,昇騰 910 還擁有高集成度和高速互聯(lián)的特性。它集成了CPU、DVPP 和任務(wù)管理器,因此它能獨(dú)立完成 AI 訓(xùn)練流程。同時昇騰 910 集成了 HCCS、PCIe 和 RoCE 三種高速接口。其中最新的 PCle 吞吐量相比上一代翻了一倍。這些特性共同組成了算力最強(qiáng)的昇騰 910 處理器。
配合昇騰 910,華為采用全棧全場景AI 計(jì)算框架 MindSpore,打造昇騰 AI 基礎(chǔ)軟硬件平臺, 攜手伙伴共建昇騰 AI 計(jì)算產(chǎn)業(yè)。
1)硬件方面,華為采用自有硬件+硬件生態(tài)伙伴方式,為終端客戶提供多樣化算力選擇。
2)軟件方面,開發(fā)、銷售自有知識產(chǎn)權(quán)的應(yīng)用程序、軟件、垂直細(xì)分應(yīng)用等產(chǎn)品,能對接昇騰產(chǎn)品,有能力二次開發(fā)的軟件伙伴,相關(guān)上市公司包括:智洋創(chuàng)新等。
一周解惑系列:光刻機(jī)各環(huán)節(jié)國產(chǎn)化情況
華為全面智能化戰(zhàn)略,國產(chǎn)AI基礎(chǔ)設(shè)施曙光初現(xiàn)
芯片戰(zhàn)爭:世界最關(guān)鍵技術(shù)的爭奪戰(zhàn)
光刻機(jī)深度:篳路藍(lán)縷,尋光刻星火(2023)
