AMD公布AI路線圖:MI325X將比H200快1.3倍!還有全新AI PC芯片!
共 4621字,需瀏覽 10分鐘
·
2024-06-03 12:32
6月3日,AMD董事長兼CEO蘇姿豐在Computex 2024展會的開幕主題演講中,公布了全新云端AI加速芯片路線圖,今年將會推出全新Instinct MI325X。同時,AMD還發(fā)布了代號為“Strix Point”的第三代AI PC芯片“銳龍AI 300系列”,以及AMD Ryzen 9000系列桌面處理器(Granite Ridge)。
今年將推出MI325X,性能相比英偉達H200提升1.3倍
根據(jù)AMD公布的全新云端AI加速芯片路線圖顯示,AMD今年將會推出全新的AI加速芯片Instinct MI325X,2025年推出MI350,2026年推出MI400。
據(jù)介紹,MI325X將延續(xù)CDNA3構(gòu)架,采用第四代高帶寬內(nèi)存(HBM) HBM3E,容量大幅提升至288GB,內(nèi)存帶寬也將提升至6TB/s,整體的性能將進一步提升,其他方面的規(guī)格則基本保持與MI300X一致,便于客戶的產(chǎn)品升級過渡。
蘇姿豐指出,MI325X的AI性能提升幅度為AMD史上最大,相較競品英偉達H200將有1.3倍以上的提升,同時更有性價比優(yōu)勢,MI325X將于今年第四季度開始供貨。
另外,AMD還將在2025年推出新一代的MI350系列,該系列芯片將采用3nm制程,基于全新的構(gòu)架,集成288GB HBM3E內(nèi)存,并支持FP4/FP6數(shù)據(jù)格式,推理運算速度較現(xiàn)有MI300系列芯片快35倍。
據(jù)供應(yīng)鏈信息透露,MI350將進入液冷世代,為AI服務(wù)器運算提供更強的算力、更佳的能源效率。
2026年,AMD還將會推出新一代的MI400系列,保持一年一更新的節(jié)奏。
AMD銳龍AI 300系列發(fā)布:AI算力高達50TOPS!
早在2023年初,AMD就發(fā)布了銳龍7040系列(代號Pheonix)的全球首款集成獨立NPU AI引擎的x86處理器,基于全新設(shè)計的XDNA架構(gòu),算力約10TOPS(每秒10萬億次浮點運算),加上CPU、GPU整體算力約33TOPS,開創(chuàng)了AI PC的新時代。
2023年底,AMD又推出了銳龍8040系列(代號Hawk Point),NPU AI算力一舉提升了60%,達到約16TOPS,整體算力也提升至39TOPS。
而最新的代號為Strix Point的“銳龍AI 300系列”,則采用了全新的Zen5 PU架構(gòu),GPU內(nèi)核也升級為了RDNA3.5架構(gòu),NPU也是全新的XDNA2架構(gòu),號稱是“面向下代AI PC/Copilot+ PC的世界一流處理器”。
銳龍AI 300系列首發(fā)只有兩款型號,“銳龍AI 9 HX 370”和“銳龍AI 9 HX 365”都定位高端市場。
其中,“銳龍AI 9 HX 370”是頂級旗艦,CPU部分擁有12核心24線程,多年來首次在這一定位上提供更多核心,相比銳龍8040系列增加了多達1/3。二級緩存還是每核心1MB,總?cè)萘孔匀辉黾拥?2MB。三級緩存終于打破了16MB的“禁錮”,增加了足足一半來到24MB。最高主頻5.1GHz。GPU部分不但升級架構(gòu),CU單元數(shù)量也從12個增至16個,命名為“Radeon 890M”。NPU算力則提升到了50TOPS,增加了2倍有余。
“銳龍AI 9 365”也是高端型號,10核心20線程,二級緩存10MB,三級緩存仍為24MB,最高頻率達5.0GHz,NPU算力也是50TOPS,GPU部分也是Radeon 890M。
從AMD第一和第二代XDNA NPU架構(gòu)的對比圖中,可以看到整體布局基本一致,但規(guī)模大大擴充。
AI Tile(初代叫AIE Tile)也就是核心的AI計算引擎模塊,從之前的20個增加到32個,再加上本身的增強。
Mem Tile也就是本地內(nèi)存模塊,從原來的5個增加到8個,可以更好地配合更大規(guī)模的本地調(diào)度、運算。
另外,用于互連的交叉總線也從普通的Data Fabric,升級為Zen/RDNA家族上無處不在的Infinity Fabric,傳輸帶寬和效率更高。
AMD聲稱,XDNA2 NPU的計算能力提升了多達5倍,多任務(wù)并行能力翻了一番,能效也提升了最多2倍。
需要指出的是,這里說的AI算力提升5倍,是指的Llama 2 70億參數(shù)大模型的響應(yīng)速度,從啟動到獲得第一個token,銳龍AI 9 HX 370達到了銳龍9 8940HS的多達5倍。
另外非常關(guān)鍵的一點,XDNA2首發(fā)引入了全新的Block FP16浮點精度,也就是BFloat16、BF16。它在CPU、GPU上已經(jīng)很常見,而在NPU上還是第一次。
傳統(tǒng)的FP8浮點格式性能高而精度不足,F(xiàn)P16浮點格式精度高而性能略遜,而將二者融合起來的BF16可以在精度、性能上達到較好的平衡,靈活性也更高。
同時,大多數(shù)AI應(yīng)用都采用了16位精度,因此有了BF16,不再需要量化為8位精度,減少了轉(zhuǎn)換步驟,提高了執(zhí)行效率。
高通驍龍X Elite NPU的算力為45TOPS,Intel即將推出的下一代酷睿Ultra Lunar Lake NPU算力同樣是45TOPS,銳龍AI 300系列則一舉超越二者,成為當(dāng)今最強NPU。
至于蘋果M4,其NPU的算力只有區(qū)區(qū)38TOPS,還不到Windows陣營這邊Copilot+ PC的最低算力需求門檻40TOPS。
隨著算力的大幅提升,NPU的應(yīng)用也將不再局限于一些持續(xù)性低負(fù)載場景(比如視頻會議),而是有了更多可能,一方面可以在更多場景中部分取代CPU、GPU,以更高的能效執(zhí)行AI運算,大大提升筆記本的續(xù)航能力。
另一方面,更強力的NPU配合更強力的CPU、GPU,可以在更多場景中部署端側(cè)AI,進一步擺脫對云側(cè)的依賴,最大好處就是可以避免隱私泄露和安全威脅。
當(dāng)然,硬件算力再強,也需要生態(tài)應(yīng)用的落地配合。作為AI PC的先行者,AMD 2024年內(nèi)的ISV合作廠商將超過150家,既有Adobe、微軟、Topaz Labs這樣的世界級大廠,也有百川智能、釘釘、、無問芯穹、有道這樣的國內(nèi)名企,前途不可限量。
新一代AI PC的最大亮點就是配合最新的Windows系統(tǒng),可以打造全新的Copilot+體驗,比如歷史回憶、視頻會議實時錄制與翻譯、協(xié)同創(chuàng)作等。
官方提供的數(shù)據(jù)顯示,銳龍AI 9 HX 370對比高通驍龍X Elite,日常辦公、生產(chǎn)力創(chuàng)作、多任務(wù)、圖形等各方面都遙遙領(lǐng)先,尤其是圖形計算性能高出了73%。
對比英特爾目前最強的酷睿Ultra 9 185H,無論是日常應(yīng)用還是游戲,都有著大幅的提升,平均性能提升36%。就看英特爾下一代Lunar Lake的表現(xiàn)了。
對比蘋果M3,銳龍AI 9 HX 370在各方面也都有著很大的性能優(yōu)勢,特別是在3D性能上,超出了98%。
銳龍AI 300系列的筆記本將從7月份起陸續(xù)上市,目前已有100多款設(shè)計,涵蓋宏碁、華碩、戴爾、惠普、聯(lián)想、微星等各大主要OEM品牌。
華碩會在臺北電腦展上宣布一系列配備銳龍AI 300系列處理器的筆記本,其中輕薄本有16英寸的靈耀(Zenbook S)、14/15/16英寸的無畏(Vivobook S),創(chuàng)作本有16和13英寸的ProArt P16/X13,游戲本有16英寸的ROG幻系列、14/16英寸的天選系列(TUF GAMING A14/A16)。
微星首批三款,都是16寸大屏機型,包括面向高端商務(wù)辦公的Summit A16 AI+,輕薄全能游戲型的絕影A16 AI+、主打超薄商務(wù)與創(chuàng)作的尊爵A16 AI+。
AMD Zen5 Ryzen 9000系列發(fā)布:性能比i9-14900K快56%!
全新發(fā)布的AMD Ryzen 9000系列桌面處理器(Granite Ridge),基于Zen5構(gòu)架,第一批產(chǎn)品將于2024年7月推出。
蘇姿豐強調(diào),Ryzen 9000系列是繼Ryzen 7000“Raphael”和Ryzen 8000“Hawk Point”系列之后,AM5插槽的第三個系列,將配備兩個Zen5小芯片,每個小芯片最多有8個核心,最高16個內(nèi)核和32線程,與Ryzen 7000系列類似。AMD還繼續(xù)支持SMT(同時多線程功能)。
AMD首批推出了四款CPU產(chǎn)品,都配有2CU RDNA2集顯:
Ryzen 9 9950X配備16核心32線程,170W TDP,最高主頻5.7 GHz;
Ryzen 9 9900X配備12核心24線程,120W TDP,最高主頻5.6 GHz;
Ryzen 7 9700X配備8核心16線程,65W TDP,最高主頻5.5 GHz;
Ryzen 5 9600X配備6核心12線程,65W TDP,最高主頻5.4 GHz。
根據(jù)AMD官方測試,其Zen 5內(nèi)核面向PC平臺的IPC性能相比Zen 4平均提升了約16%。
與英特爾Core i9-14900K相比,AMD旗艦16核心Ryzen 9 9950X在游戲性能測試中的速度快4%到23%。在生產(chǎn)力性能測試中,9950X顯示出更大的優(yōu)勢,比英特爾Core i9-14900K快7%至56%。
AMD宣布Ryzen 9000系列將于7月31日推出,具體定價細(xì)節(jié)將很快將會公布。
編輯:芯智訊-浪客劍
2023年全球汽車CIS市場:安森美第一,豪威第二!舜宇主導(dǎo)了車用鏡頭市場!
黃仁勛臺北“夜宴”:臺系服務(wù)器代工廠高管悉數(shù)到場,一桌消費1040塊!
Arm最強CPU及GPU內(nèi)核發(fā)布:聯(lián)發(fā)科天璣9400將首發(fā)!
中美芯片戰(zhàn)之下,馬來西亞的半導(dǎo)體“野心”曝光
涉嫌違規(guī)對華供貨,應(yīng)用材料再度收到美國商務(wù)部傳票
151.8億元!紫光股份擬收購新華三30%股權(quán)!
臺積電3nm產(chǎn)能今年將增加3倍!南京廠獲“無限期豁免”!
行業(yè)交流、合作請加微信:icsmart01
芯智訊官方交流群:221807116
