<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          RTX 3090 AI性能實(shí)測(cè):FP32訓(xùn)練速度提升50%,張量核心縮水

          共 2440字,需瀏覽 5分鐘

           ·

          2020-10-07 12:34

          點(diǎn)擊上方AI算法與圖像處理”,選擇加"星標(biāo)"或“置頂”

          重磅干貨,第一時(shí)間送達(dá)

          曉查 發(fā)自 凹非寺 
          本文轉(zhuǎn)載自:量子位(QbitAI)

          NVIDIA最近發(fā)布了備受期待的RTX 30系列顯卡。

          其中,性能最強(qiáng)大的RTX 3090具有24GB顯存10496個(gè)CUDA核心。而2018年推出的旗艦顯卡Titan RTX同樣具有24GB顯存。


          Titan RTX

          RTX 3090

          架構(gòu)

          圖靈TU102

          安培GA102

          CUDA核心

          4609

          10496

          張量核心

          576

          328

          顯存

          24GB

          24GB

          顯存帶寬

          672GB/s

          936GB/s

          TDP

          285W

          350W

          RTX 3090在深度學(xué)習(xí)訓(xùn)練任務(wù)中,性能表現(xiàn)究竟如何,它能否取代Titan RTX成為最強(qiáng)消費(fèi)級(jí)AI訓(xùn)練卡?現(xiàn)在已經(jīng)有了答案。

          國(guó)外兩位AI從業(yè)者在拿到這款顯卡后,第一時(shí)間測(cè)試了其在TensorFlow上的AI訓(xùn)練性能。

          由于RTX 3090現(xiàn)階段不能很好地支持TensorFlow 2,因此先在TensorFlow 1.15上進(jìn)行測(cè)試。

          話不多說,先看數(shù)據(jù)。在FP32任務(wù)上,RTX 3090每秒可處理561張圖片,Titan RTX每秒可處理373張圖片,性能提升50.4%

          而在FP16任務(wù)上,RTX 3090每秒可處理1163張圖片,Titan RTX每秒可處理1082張圖片,性能僅提升7.5%

          為何在FP32任務(wù)上的性能提升比在FP16上更明顯,主要是因?yàn)镽TX 3090大大提高了CUDA核心的數(shù)量。但是用于處理FP16張量核心數(shù)量明顯減少,這可能會(huì)影響FP16性能。

          即便如此,張量核心更少的RTX 3090在很多FP16任務(wù)上,性能依然有小幅提升。

          隨后,英偉達(dá)官方提供了支持RTX 3090的CUDA 11.1,谷歌官方在TensorFlow nightly版中提供了對(duì)最新顯卡的支持。

          又有用戶再次測(cè)試了兩款顯卡的性能對(duì)比。


          FP16

          FP32


          Titan RTX

          RTX 3090

          Titan RTX

          RTX 3090

          AlexNet

          6634

          8255

          4448

          6493

          Inception3

          656.1

          616.3

          223

          337.3

          Inception4

          298.1

          132.7

          99.74

          143.7

          ResNet152

          423.9

          484

          134.5

          203.6

          ResNet150

          966.8

          1260

          336

          525.9

          VGG16

          339.7

          442.5

          212.1

          325.6

           訓(xùn)練性能:每秒處理的圖片數(shù)量

          可以看出,使用FP32進(jìn)行的所有模型訓(xùn)練,RTX 3090都能實(shí)現(xiàn)40%~60%的訓(xùn)練提升。而大多數(shù)模型的FP16訓(xùn)練速度幾乎不變,最多提升20%,甚至在Inception模型上還有所下降。

          只能說RTX 3090在張量核心上的“刀法”頗為精準(zhǔn),如果你對(duì)FP16訓(xùn)練性能有較高要求,也許可以等待今后的升級(jí)版。

          不過RTX 3090上市價(jià)格僅1499美元,比Titan RTX便宜1000美元,仍不失為“性價(jià)比”之選。

          參考鏈接:

          https://www.pugetsystems.com/labs/hpc/RTX3090-TensorFlow-NAMD-and-HPCG-Performance-on-Linux-Preliminary-1902/

          https://www.evolution.ai/post/benchmarking-deep-learning-workloads-with-tensorflow-on-the-nvidia-geforce-rtx-3090

          下載1:OpenCV黑魔法


          AI算法與圖像處公眾號(hào)后臺(tái)回復(fù):OpenCV黑魔法,即可下載小編精心編寫整理的計(jì)算機(jī)視覺趣味實(shí)戰(zhàn)教程


          下載2 CVPR2020

          AI算法與圖像處公眾號(hào)后臺(tái)回復(fù):CVPR2020即可下載1467篇CVPR 2020論文
               
          個(gè)人微信(如果沒有備注不拉群!
          請(qǐng)注明:地區(qū)+學(xué)校/企業(yè)+研究方向+昵稱


          覺得有趣就點(diǎn)亮在看吧


          瀏覽 170
          點(diǎn)贊
          評(píng)論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          評(píng)論
          圖片
          表情
          推薦
          點(diǎn)贊
          評(píng)論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  国产操比 | 三级成人AV | 黄色免费一级在线视频 | 影音先锋中字一区二区 | 2017夜夜撸 |