<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          用 CuPy 將Numpy加速700倍?

          共 2795字,需瀏覽 6分鐘

           ·

          2021-07-31 01:47

          作為 Python 語言的一個擴展程序庫,Numpy 支持大量的維度數(shù)組與矩陣運算,為 Python 社區(qū)帶來了很多幫助。借助于 Numpy,數(shù)據(jù)科學家、機器學習實踐者和統(tǒng)計學家能夠以一種簡單高效的方式處理大量的矩陣數(shù)據(jù)。那么 Numpy 速度還能提升嗎?本文介紹了如何利用 CuPy 庫來加速 Numpy 運算速度。

          就其自身來說,Numpy 的速度已經(jīng)較 Python 有了很大的提升。當你發(fā)現(xiàn) Python 代碼運行較慢,尤其出現(xiàn)大量的 for-loops 循環(huán)時,通常可以將數(shù)據(jù)處理移入 Numpy 并實現(xiàn)其向量化最高速度處理。


          但有一點,上述 Numpy 加速只是在 CPU 上實現(xiàn)的。由于消費級 CPU 通常只有 8 個核心或更少,所以并行處理數(shù)量以及可以實現(xiàn)的加速是有限的。


          這就催生了新的加速工具——CuPy 庫。


          何為 CuPy?


          CuPy 是一個借助 CUDA GPU 庫在英偉達 GPU 上實現(xiàn) Numpy 數(shù)組的庫?;?Numpy 數(shù)組的實現(xiàn),GPU 自身具有的多個 CUDA 核心可以促成更好的并行加速。


          CuPy 接口是 Numpy 的一個鏡像,并且在大多情況下,它可以直接替換 Numpy 使用。只要用兼容的 CuPy 代碼替換 Numpy 代碼,用戶就可以實現(xiàn) GPU 加速。


          CuPy 支持 Numpy 的大多數(shù)數(shù)組運算,包括索引、廣播、數(shù)組數(shù)學以及各種矩陣變換。

          如果遇到一些不支持的特殊情況,用戶也可以編寫自定義 Python 代碼,這些代碼會利用到 CUDA 和 GPU 加速。整個過程只需要 C++格式的一小段代碼,然后 CuPy 就可以自動進行 GPU 轉(zhuǎn)換,這與使用 Cython 非常相似。


          在開始使用 CuPy 之前,用戶可以通過 pip 安裝 CuPy 庫:

          pip install cupy

          使用 CuPy 在 GPU 上運行


          為符合相應(yīng)基準測試,PC 配置如下:

          • i7–8700k CPU

          • 1080 Ti GPU

          • 32 GB of DDR4 3000MHz RAM

          • CUDA 9.0


          CuPy 安裝之后,用戶可以像導入 Numpy 一樣導入 CuPy:

          import numpy as np
          import cupy as cp
          import time

          在接下來的編碼中,Numpy 和 CuPy 之間的切換就像用 CuPy 的 cp 替換 Numpy 的 np 一樣簡單。如下代碼為 Numpy 和 CuPy 創(chuàng)建了一個具有 10 億 1』s 的 3D 數(shù)組。為了測量創(chuàng)建數(shù)組的速度,用戶可以使用 Python 的原生 time 庫:

          ### Numpy and CPU
          s = time.time()
          *x_cpu = np.ones((1000,1000,1000))*
          e = time.time()
          print(e - s)### CuPy and GPU
          s = time.time()
          *x_gpu = cp.ones((1000,1000,1000))*
          e = time.time()
          print(e - s)

          這很簡單!


          令人難以置信的是,即使以上只是創(chuàng)建了一個數(shù)組,CuPy 的速度依然快得多。Numpy 創(chuàng)建一個具有 10 億 1』s 的數(shù)組用了 1.68 秒,而 CuPy 僅用了 0.16 秒,實現(xiàn)了 10.5 倍的加速。

          但 CuPy 能做到的還不止于此。


          比如在數(shù)組中做一些數(shù)學運算。這次將整個數(shù)組乘以 5,并再次檢查 Numpy 和 CuPy 的速度。

          ### Numpy and CPU
          s = time.time()
          *x_cpu *= 5*
          e = time.time()
          print(e - s)### CuPy and GPU
          s = time.time()
          *x_gpu *= 5*
          e = time.time()
          print(e - s)

          果不其然,CuPy 再次勝過 Numpy。Numpy 用了 0.507 秒,而 CuPy 僅用了 0.000710 秒,速度整整提升了 714.1 倍。


          現(xiàn)在嘗試使用更多數(shù)組并執(zhí)行以下三種運算:


          1. 數(shù)組乘以 5

          2. 數(shù)組本身相乘

          3. 數(shù)組添加到其自身


          ### Numpy and CPU
          s = time.time()
          *x_cpu *= 5
          x_cpu *= x_cpu
          x_cpu += x_cpu*
          e = time.time()
          print(e - s)### CuPy and GPU
          s = time.time()
          *x_gpu *= 5
          x_gpu *= x_gpu
          x_gpu += x_gpu*
          e = time.time()
          print(e - s)


          結(jié)果顯示,Numpy 在 CPU 上執(zhí)行整個運算過程用了 1.49 秒,而 CuPy 在 GPU 上僅用了 0.0922 秒,速度提升了 16.16 倍。


          數(shù)組大?。〝?shù)據(jù)點)達到 1000 萬,運算速度大幅度提升


          使用 CuPy 能夠在 GPU 上實現(xiàn) Numpy 和矩陣運算的多倍加速。值得注意的是,用戶所能實現(xiàn)的加速高度依賴于自身正在處理的數(shù)組大小。下表顯示了不同數(shù)組大?。〝?shù)據(jù)點)的加速差異:


          數(shù)據(jù)點一旦達到 1000 萬,速度將會猛然提升;超過 1 億,速度提升極為明顯。Numpy 在數(shù)據(jù)點低于 1000 萬時實際運行更快。此外,GPU 內(nèi)存越大,處理的數(shù)據(jù)也就更多。所以用戶應(yīng)當注意,GPU 內(nèi)存是否足以應(yīng)對 CuPy 所需要處理的數(shù)據(jù)。

          文章轉(zhuǎn)載:Python編程學習圈
          (版權(quán)歸原作者所有,侵刪)

          點擊下方“閱讀原文”查看更多

          瀏覽 43
          點贊
          評論
          收藏
          分享

          手機掃一掃分享

          分享
          舉報
          評論
          圖片
          表情
          推薦
          點贊
          評論
          收藏
          分享

          手機掃一掃分享

          分享
          舉報
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  日韩精品18禁 | 人人射视频 | 色拍拍最新| 亚洲日本中文字幕在线 | 曰韩人妻一区二区 |