<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          加速深度學(xué)習(xí)在線部署,TensorRT安裝及使用教程

          共 3729字,需瀏覽 8分鐘

           ·

          2020-10-01 21:35








          向AI轉(zhuǎn)型的程序員都關(guān)注了這個(gè)號???

          機(jī)器學(xué)習(xí)AI算法工程?? 公眾號:datayx



          1 什么是TensorRT

          一般的深度學(xué)習(xí)項(xiàng)目,訓(xùn)練時(shí)為了加快速度,會使用多GPU分布式訓(xùn)練。但在部署推理時(shí),為了降低成本,往往使用單個(gè)GPU機(jī)器甚至嵌入式平臺(比如 NVIDIA Jetson)進(jìn)行部署,部署端也要有與訓(xùn)練時(shí)相同的深度學(xué)習(xí)環(huán)境,如caffe,TensorFlow等。由于訓(xùn)練的網(wǎng)絡(luò)模型可能會很大(比如,inception,resnet等),參數(shù)很多,而且部署端的機(jī)器性能存在差異,就會導(dǎo)致推理速度慢,延遲高。這對于那些高實(shí)時(shí)性的應(yīng)用場合是致命的,比如自動駕駛要求實(shí)時(shí)目標(biāo)檢測,目標(biāo)追蹤等。所以為了提高部署推理的速度,出現(xiàn)了很多輕量級神經(jīng)網(wǎng)絡(luò),比如squeezenet,mobilenet,shufflenet等。基本做法都是基于現(xiàn)有的經(jīng)典模型提出一種新的模型結(jié)構(gòu),然后用這些改造過的模型重新訓(xùn)練,再重新部署。

          而tensorRT 則是對訓(xùn)練好的模型進(jìn)行優(yōu)化。tensorRT就只是推理優(yōu)化器。當(dāng)你的網(wǎng)絡(luò)訓(xùn)練完之后,可以將訓(xùn)練模型文件直接丟進(jìn)tensorRT中,而不再需要依賴深度學(xué)習(xí)框架(Caffe,TensorFlow等),如下:


          可以認(rèn)為tensorRT是一個(gè)只有前向傳播的深度學(xué)習(xí)框架,這個(gè)框架可以將 Caffe,TensorFlow的網(wǎng)絡(luò)模型解析,然后與tensorRT中對應(yīng)的層進(jìn)行一一映射,把其他框架的模型統(tǒng)一全部 轉(zhuǎn)換到tensorRT中,然后在tensorRT中可以針對NVIDIA自家GPU實(shí)施優(yōu)化策略,并進(jìn)行部署加速。


          2 TensorRT安裝

          tensorrt的安裝方式很簡單,只需要注意一些環(huán)境的依賴關(guān)系就可以,我們以tensorrt5.0.4版本為例,參考官網(wǎng)安裝教程https://docs.nvidia.com/deeplearning/sdk/tensorrt-install-guide/index.html,這里簡單總結(jié)一下步驟

          tensorrt支持的環(huán)境和python版本如表所示


          2.1 環(huán)境確認(rèn)

          • 確認(rèn)CUDA版本是9.0或者10.0,可通過運(yùn)行nvcc -V指令來查看CUDA,如果不是9.0以上,則需要先把CUDA版本更新一下nn

          • cudnn版本是7.3.1,如果不滿足要求,按照《Linux之cudnn升級方法》進(jìn)行升級

          • 需安裝有tensorflow,uff模塊需要

          2.2 安裝pycuda

          如果要使用python接口的tensorrt,則需要安裝pycuda

          2.3?下載安裝包

          1. 進(jìn)入下載鏈接https://developer.nvidia.com/nvidia-tensorrt-download

          2. 點(diǎn)擊Download Now(需要登錄英偉達(dá)賬號,沒有的注冊一個(gè))

          3. 選擇下載的版本(最新TensorRT5)

          4. 完成問卷調(diào)查

          5. 選擇同意協(xié)議

          6. 根據(jù)自己的系統(tǒng)版本和CUDA版本,選擇安裝包,如圖所示(如果是完整安裝,建議選擇Tar File Install Packages,這樣可以自行選擇安裝位置)


          2.4 安裝指令

          如果要使用python版本,則使用pip安裝,執(zhí)行下邊的指令




          為了避免安裝時(shí)各種問題,我們也可以使用deb包的方式安裝,即在2.3步驟中選擇自己系統(tǒng)對應(yīng)的版本,然后使用如下指令安裝







          2.5 環(huán)境測試

          運(yùn)行python測試,導(dǎo)入模塊不報(bào)錯(cuò)就表明安裝正確


          注意:導(dǎo)入uff的時(shí)候需要安裝tensorflow模塊,tensorflow版本要與cuda版本對應(yīng),比如cuda9要對應(yīng)tensorflow1.12及以下版本,以上版本需要cuda10,具體參考官網(wǎng)

          如果導(dǎo)入tensorrt報(bào)錯(cuò)如下,則是因?yàn)閜ython版本不對,應(yīng)根據(jù)2.1節(jié)上邊的那個(gè)表調(diào)整自己的python版本



          3 使用流程

          在/TensoRT-5.0.2.6/samples/python文件夾下有很多python的例子,我們以第一個(gè)end_to_end_tensorflow_mnist的例子為例,描述tensorrt的使用流程,在README.md文件里也說得很明白了

          3.1 安裝依賴

          需要安裝好numpy、Pillow、pycuda、tensorflow等環(huán)境,如果都有可以跳過

          3.2 生成pb文件

          運(yùn)行model.py后,會下載數(shù)據(jù)mnist.npz,并開始訓(xùn)練,完成后在models文件夾下生成lenet5.pb文件,如果自己已經(jīng)訓(xùn)練得到pb文件,上述過程可以跳過

          3.3 格式轉(zhuǎn)化

          要將tensorflow的pb文件轉(zhuǎn)化為uff格式的文件,首先找到convert_to_uff文件,看自己用的是哪個(gè)版本的python,如果是python3,則在/usr/lib/python3.5/dist-packages/uff/bin文件夾下,如果是python2,則在/usr/lib/python2.7/dist-packages/uff/bin文件夾下

          我們在終端中進(jìn)入end_to_end_tensorflow_mnist,運(yùn)行以下指令


          需要注意的是:該轉(zhuǎn)化過程只支持在x86平臺上實(shí)現(xiàn),如果想在TX2等嵌入式平臺上使用tensorrt,需要先在x86平臺上將pb模型轉(zhuǎn)化為uff文件,然后再拷貝到TX2上使用

          3.4 運(yùn)行文件

          運(yùn)行sample.py文件,得到如下輸出,表明可完整的使用tensorrt



          參考文章


          通過pytorch搭建卷積神經(jīng)網(wǎng)絡(luò)完成手寫識別任務(wù),并將訓(xùn)練好的模型以多種方式部署到TensorRT中加速

          https://github.com/GuanLianzheng/pytorch_to_TensorRT5


          TensorRT之TX2部署TensorFlow目標(biāo)檢測模型

          https://blog.csdn.net/zong596568821xp/article/details/86077553


          TensorRT安裝及使用教程

          https://arleyzhang.github.io/articles/7f4b25ce/





          閱讀過本文的人還看了以下文章:


          TensorFlow 2.0深度學(xué)習(xí)案例實(shí)戰(zhàn)


          基于40萬表格數(shù)據(jù)集TableBank,用MaskRCNN做表格檢測


          《基于深度學(xué)習(xí)的自然語言處理》中/英PDF


          Deep Learning 中文版初版-周志華團(tuán)隊(duì)


          【全套視頻課】最全的目標(biāo)檢測算法系列講解,通俗易懂!


          《美團(tuán)機(jī)器學(xué)習(xí)實(shí)踐》_美團(tuán)算法團(tuán)隊(duì).pdf


          《深度學(xué)習(xí)入門:基于Python的理論與實(shí)現(xiàn)》高清中文PDF+源碼


          特征提取與圖像處理(第二版).pdf


          python就業(yè)班學(xué)習(xí)視頻,從入門到實(shí)戰(zhàn)項(xiàng)目


          2019最新《PyTorch自然語言處理》英、中文版PDF+源碼


          《21個(gè)項(xiàng)目玩轉(zhuǎn)深度學(xué)習(xí):基于TensorFlow的實(shí)踐詳解》完整版PDF+附書代碼


          《深度學(xué)習(xí)之pytorch》pdf+附書源碼


          PyTorch深度學(xué)習(xí)快速實(shí)戰(zhàn)入門《pytorch-handbook》


          【下載】豆瓣評分8.1,《機(jī)器學(xué)習(xí)實(shí)戰(zhàn):基于Scikit-Learn和TensorFlow》


          《Python數(shù)據(jù)分析與挖掘?qū)崙?zhàn)》PDF+完整源碼


          汽車行業(yè)完整知識圖譜項(xiàng)目實(shí)戰(zhàn)視頻(全23課)


          李沐大神開源《動手學(xué)深度學(xué)習(xí)》,加州伯克利深度學(xué)習(xí)(2019春)教材


          筆記、代碼清晰易懂!李航《統(tǒng)計(jì)學(xué)習(xí)方法》最新資源全套!


          《神經(jīng)網(wǎng)絡(luò)與深度學(xué)習(xí)》最新2018版中英PDF+源碼


          將機(jī)器學(xué)習(xí)模型部署為REST API


          FashionAI服裝屬性標(biāo)簽圖像識別Top1-5方案分享


          重要開源!CNN-RNN-CTC 實(shí)現(xiàn)手寫漢字識別


          yolo3 檢測出圖像中的不規(guī)則漢字


          同樣是機(jī)器學(xué)習(xí)算法工程師,你的面試為什么過不了?


          前海征信大數(shù)據(jù)算法:風(fēng)險(xiǎn)概率預(yù)測


          【Keras】完整實(shí)現(xiàn)‘交通標(biāo)志’分類、‘票據(jù)’分類兩個(gè)項(xiàng)目,讓你掌握深度學(xué)習(xí)圖像分類


          VGG16遷移學(xué)習(xí),實(shí)現(xiàn)醫(yī)學(xué)圖像識別分類工程項(xiàng)目


          特征工程(一)


          特征工程(二) :文本數(shù)據(jù)的展開、過濾和分塊


          特征工程(三):特征縮放,從詞袋到 TF-IDF


          特征工程(四): 類別特征


          特征工程(五): PCA 降維


          特征工程(六): 非線性特征提取和模型堆疊


          特征工程(七):圖像特征提取和深度學(xué)習(xí)


          如何利用全新的決策樹集成級聯(lián)結(jié)構(gòu)gcForest做特征工程并打分?


          Machine Learning Yearning 中文翻譯稿


          螞蟻金服2018秋招-算法工程師(共四面)通過


          全球AI挑戰(zhàn)-場景分類的比賽源碼(多模型融合)


          斯坦福CS230官方指南:CNN、RNN及使用技巧速查(打印收藏)


          python+flask搭建CNN在線識別手寫中文網(wǎng)站


          中科院Kaggle全球文本匹配競賽華人第1名團(tuán)隊(duì)-深度學(xué)習(xí)與特征工程



          不斷更新資源

          深度學(xué)習(xí)、機(jī)器學(xué)習(xí)、數(shù)據(jù)分析、python

          ?搜索公眾號添加:?datayx??



          機(jī)大數(shù)據(jù)技術(shù)與機(jī)器學(xué)習(xí)工程

          ?搜索公眾號添加:?datanlp

          長按圖片,識別二維碼

          瀏覽 118
          點(diǎn)贊
          評論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          評論
          圖片
          表情
          推薦
          點(diǎn)贊
          評論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  中文字幕免费在线观看视频 | 日韩欧美色 | 国产精品爆乳露双乳呻吟 | 欧美videos办公室丝袜长腿 | 丁香花激情网 |