14種輕量級網絡綜述 — 主干網絡篇

極市導讀
早期的卷積神經很少考慮參數量和計算量的問題,由此輕量級網絡誕生,其旨在保持模型精度基礎上近一步減少模型參數量和復雜度。本文對主要的輕量級網絡進行了簡述,讓大家對輕量級網絡的發(fā)展歷程以及種類有更加清晰的了解。 >>加入極市CV技術交流群,走在計算機視覺的最前沿
輕量級網絡的核心是在盡量保持精度的前提下,從體積和速度兩方面對網絡進行輕量化改造,本文對輕量級網絡進行簡述,主要涉及以下網絡:
SqueezeNet系列 ShuffleNet系列 MnasNet MobileNet系列 CondenseNet ESPNet系列 ChannelNets PeleeNet IGC系列 FBNet系列 EfficientNet GhostNet WeightNet MicroNet
SqueezeNet系列
SqueezeNet系列是比較早期且經典的輕量級網絡,SqueezeNet使用Fire模塊進行參數壓縮,而SqueezeNext則在此基礎上加入分離卷積進行改進。雖然SqueezeNet系列不如MobieNet使用廣泛,但其架構思想和實驗結論還是可以值得借鑒的。
SqueezeNet
SqueezeNet是早期開始關注輕量化網絡的研究之一,使用Fire模塊進行參數壓縮。

SqueezeNext

Low Rank Filters ? 低秩分解的核心思想就是將大矩陣分解成多個小矩陣,這里使用CP分解(Canonical Polyadic Decomposition), 將 卷積分解成 和 的分離卷積, 參數量能從 降為 。 Bottleneck Module ? 參數量與輸入輸出維度有關,雖然可以使用深度分離卷積來減少計算量,但是深度分離卷積在終端系統(tǒng)的計算并不高效。因此采用SqueezeNet的squeeze層進行輸入維度的壓縮,每個block的開頭使用連續(xù)兩個squeeze層,每層降低1/2維度。 Fully Connected Layers ? 在AlexNet中,全連接層的參數占總模型的96%,SqueezeNext使用bottleneck層來降低全連接層的輸入維度,從而降低網絡參數量。
ShuffleNet系列
ShuffleNet V1

圖1a是最直接的方法,將所有的操作進行了絕對的維度隔離,但這會導致特定的輸出僅關聯了很小一部分的輸入,阻隔了組間的信息流,降低了表達能力。 圖1b對輸出的維度進行重新分配,首先將每個組的輸出分成多個子組,然后將每個子組輸入到不同的組中,能夠很好地保留組間的信息流。
ShuffleNet V2

MnasNet

MobileNet系列
MobileNetV1

MobileNetV2

MobileNetV3

CondenseNet

ESPNet系列
ESPNet

ESPNetV2

ChannelNets

PeleeNet

IGC系列
IGCV1

IGCV2

IGCV3

FBNet系列
FBNet

FBNetV2

FBNetV3

EfficientNet

GhostNet

訓練好的網絡一般都有豐富甚至冗余的特征圖信息來保證對輸入的理解,相似的特征圖類似于對方的ghost。但冗余的特征是網絡的關鍵特性,論文認為與其避免冗余特征,不如以一種cost-efficient的方式接受,于是提出能用更少參數提取更多特征的Ghost模塊,首先使用輸出很少的原始卷積操作(非卷積層操作)進行輸出,再對輸出使用一系列簡單的線性操作來生成更多的特征。這樣,不用改變其輸出的特征圖數量,Ghost模塊的整體的參數量和計算量就已經降低了。
WeightNet

論文提出了一種簡單且高效的動態(tài)生成網絡WeightNet,該結構在權值空間上集成了SENet和CondConv的特點,在激活向量后面添加一層分組全連接,直接產生卷積核的權值,在計算上十分高效,并且可通過超參數的設置來進行準確率和速度上的trade-off。
MicroNet

論文提出應對極低計算量場景的輕量級網絡MicroNet,包含兩個核心思路Micro-Factorized convolution和Dynamic Shift-Max,Micro-Factorized convolution通過低秩近似將原卷積分解成多個小卷積,保持輸入輸出的連接性并降低連接數,Dynamic Shift-Max通過動態(tài)的組間特征融合增加節(jié)點的連接以及提升非線性,彌補網絡深度減少帶來的性能降低。
本文亮點總結
如果覺得有用,就請分享到朋友圈吧!
公眾號后臺回復“ICCV2021”獲取最新論文合集~

# CV技術社群邀請函 #

備注:姓名-學校/公司-研究方向-城市(如:小極-北大-目標檢測-深圳)
即可申請加入極市目標檢測/圖像分割/工業(yè)檢測/人臉/醫(yī)學影像/3D/SLAM/自動駕駛/超分辨率/姿態(tài)估計/ReID/GAN/圖像增強/OCR/視頻理解等技術交流群
每月大咖直播分享、真實項目需求對接、求職內推、算法競賽、干貨資訊匯總、與 10000+來自港科大、北大、清華、中科院、CMU、騰訊、百度等名校名企視覺開發(fā)者互動交流~

