RTX 3090 AI性能實(shí)測(cè):FP32訓(xùn)練速度提升50%,張量核心縮水
點(diǎn)擊上方“AI算法與圖像處理”,選擇加"星標(biāo)"或“置頂”
重磅干貨,第一時(shí)間送達(dá)
曉查 發(fā)自 凹非寺
本文轉(zhuǎn)載自:量子位(QbitAI)
NVIDIA最近發(fā)布了備受期待的RTX 30系列顯卡。
其中,性能最強(qiáng)大的RTX 3090具有24GB顯存和10496個(gè)CUDA核心。而2018年推出的旗艦顯卡Titan RTX同樣具有24GB顯存。
Titan RTX |
RTX 3090 |
|
架構(gòu) |
圖靈TU102 |
安培GA102 |
CUDA核心 |
4609 |
10496 |
張量核心 |
576 |
328 |
顯存 |
24GB |
24GB |
顯存帶寬 |
672GB/s |
936GB/s |
TDP |
285W |
350W |
RTX 3090在深度學(xué)習(xí)訓(xùn)練任務(wù)中,性能表現(xiàn)究竟如何,它能否取代Titan RTX成為最強(qiáng)消費(fèi)級(jí)AI訓(xùn)練卡?現(xiàn)在已經(jīng)有了答案。
國(guó)外兩位AI從業(yè)者在拿到這款顯卡后,第一時(shí)間測(cè)試了其在TensorFlow上的AI訓(xùn)練性能。

由于RTX 3090現(xiàn)階段不能很好地支持TensorFlow 2,因此先在TensorFlow 1.15上進(jìn)行測(cè)試。
話不多說,先看數(shù)據(jù)。在FP32任務(wù)上,RTX 3090每秒可處理561張圖片,Titan RTX每秒可處理373張圖片,性能提升50.4%!

而在FP16任務(wù)上,RTX 3090每秒可處理1163張圖片,Titan RTX每秒可處理1082張圖片,性能僅提升7.5%。

為何在FP32任務(wù)上的性能提升比在FP16上更明顯,主要是因?yàn)镽TX 3090大大提高了CUDA核心的數(shù)量。但是用于處理FP16的張量核心數(shù)量明顯減少,這可能會(huì)影響FP16性能。
即便如此,張量核心更少的RTX 3090在很多FP16任務(wù)上,性能依然有小幅提升。
隨后,英偉達(dá)官方提供了支持RTX 3090的CUDA 11.1,谷歌官方在TensorFlow nightly版中提供了對(duì)最新顯卡的支持。
又有用戶再次測(cè)試了兩款顯卡的性能對(duì)比。
FP16 |
FP32 |
|||
Titan RTX |
RTX 3090 |
Titan RTX |
RTX 3090 |
|
AlexNet |
6634 |
8255 |
4448 |
6493 |
Inception3 |
656.1 |
616.3 |
223 |
337.3 |
Inception4 |
298.1 |
132.7 |
99.74 |
143.7 |
ResNet152 |
423.9 |
484 |
134.5 |
203.6 |
ResNet150 |
966.8 |
1260 |
336 |
525.9 |
VGG16 |
339.7 |
442.5 |
212.1 |
325.6 |
△ 訓(xùn)練性能:每秒處理的圖片數(shù)量
可以看出,使用FP32進(jìn)行的所有模型訓(xùn)練,RTX 3090都能實(shí)現(xiàn)40%~60%的訓(xùn)練提升。而大多數(shù)模型的FP16訓(xùn)練速度幾乎不變,最多提升20%,甚至在Inception模型上還有所下降。
只能說RTX 3090在張量核心上的“刀法”頗為精準(zhǔn),如果你對(duì)FP16訓(xùn)練性能有較高要求,也許可以等待今后的升級(jí)版。
不過RTX 3090上市價(jià)格僅1499美元,比Titan RTX便宜1000美元,仍不失為“性價(jià)比”之選。
參考鏈接:
https://www.pugetsystems.com/labs/hpc/RTX3090-TensorFlow-NAMD-and-HPCG-Performance-on-Linux-Preliminary-1902/
https://www.evolution.ai/post/benchmarking-deep-learning-workloads-with-tensorflow-on-the-nvidia-geforce-rtx-3090
下載1:OpenCV黑魔法
在「AI算法與圖像處理」公眾號(hào)后臺(tái)回復(fù):OpenCV黑魔法,即可下載小編精心編寫整理的計(jì)算機(jī)視覺趣味實(shí)戰(zhàn)教程
下載2 CVPR2020
在「AI算法與圖像處理」公眾號(hào)后臺(tái)回復(fù):CVPR2020,即可下載1467篇CVPR 2020論文 個(gè)人微信(如果沒有備注不拉群!) 請(qǐng)注明:地區(qū)+學(xué)校/企業(yè)+研究方向+昵稱
覺得有趣就點(diǎn)亮在看吧

