NVDLA英偉達(dá)標(biāo)準(zhǔn)化推斷加速框架
NVDLA ,即 NVIDIA Deep Learning Accelerator ,是英偉達(dá)開(kāi)源的一個(gè)開(kāi)放框架,以促進(jìn)設(shè)計(jì)深度學(xué)習(xí)推斷加速的標(biāo)準(zhǔn)方法。 通過(guò)其模塊化架構(gòu),NVDLA 具有可擴(kuò)展性和高度可配置性,旨在簡(jiǎn)化集成性和可移植性(靈活性)。
簡(jiǎn)單來(lái)說(shuō),NVDLA 硬件提供了一個(gè)簡(jiǎn)單、靈活和魯棒的推斷加速解決方案。硬件支持各種 IoT 設(shè)備,以 Open NVDLA 協(xié)議開(kāi)源。
NVDLA 硬件主要由以下幾個(gè)模塊組成:
卷積核心(Convolution Core):即一種最優(yōu)化的高性能卷積引擎。
一維數(shù)據(jù)處理器(Single Data Processor):激活函數(shù)的奇點(diǎn)檢索引擎。
二維數(shù)據(jù)處理器(Planar Data Processor):用于池化的平面均值引擎。
通道數(shù)據(jù)處理器(Channel Data Processor):高級(jí)歸一化函數(shù)的多通道均值引擎。
專(zhuān)用內(nèi)存與數(shù)據(jù)形狀重塑引擎(Dedicated Memory and Data Reshape Engines):張量形狀重塑和復(fù)制操作的內(nèi)存到內(nèi)存轉(zhuǎn)換加速。

評(píng)論
圖片
表情
