【CVPR2021】曠視研究院入選學術成果盤點
點擊上方“機器學習與生成對抗網(wǎng)絡”,關注星標
獲取有趣、好玩的前沿干貨!
oral論文
Fully Convolutional Networks for Panoptic Segmentation

oral論文
FFB6D: A Full Flow Bidirectional Fusion Network for 6D Pose Estimation

RepVGG: Making VGG-style ConvNets Great Again

Dynamic Region-Aware Convolution

Diverse Branch Block: Building a Convolution as an Inception-like Unit
我們提出一種卷積網(wǎng)絡基本模塊(DBB),用以豐富模型訓練時的微觀結構而不改變其宏觀架構,以此提升其性能。這種模塊可以在訓練后通過結構重參數(shù)化(structural re-parameterization)等效轉(zhuǎn)換為一個卷積,因而不引入任何額外的推理開銷。

我們歸納了六種可以此種等效轉(zhuǎn)換的結構,包括1x1-KxK連續(xù)卷積、average pooling等,并用這六種變換給出了一種代表性的形似Inception的DBB實例,在多種架構上均取得了顯著的性能提升。我們通過實驗確認了“訓練時非線性”(而推理時是線性的,如BN)和“多樣的鏈接”(比如1x1+3x3效果好于3x3+3x3)是DBB有效的關鍵。
??關鍵詞:結構重參數(shù)化,無推理開銷,無痛提升

Distribution Alignment: A Unified Framework for Long-tail Visual Recognition

End-to-End Object Detection with Fully Convolutional Network

本文首次在全卷積目標檢測器上去除了NMS(非極大值抑制)后處理,做到了端到端訓練。我們分析了主流一階段目標檢測方法,并發(fā)現(xiàn)傳統(tǒng)的一對多標簽分配策略是這些方法依賴NMS的關鍵,并由此提出了預測感知的一對一標簽分配策略。此外,為了提升一對一標簽分配的性能,我們提出了增強特征表征能力的模塊,和加速模型收斂的輔助損失函數(shù)。我們的方法在無NMS的情況下達到了與主流一階段目標檢測方法相當?shù)男阅堋T诿芗瘓鼍吧?,我們的方法的召回率超過了依賴NMS的目標檢測方法的理論上限。
??關鍵詞:端到端檢測,標簽分配,全卷積網(wǎng)絡
https://arxiv.org/abs/2012.03544
OTA: Optimal Transport Assignment for Object Detection

IQDet: Instance-wise Quality Distribution Sampling for Object Detection

由于一階段檢測器的標簽分配有靜態(tài)、沒有考慮目標框的全局信息等不足,我們提出了一種基于目標質(zhì)量分布采樣的目標檢測器。在本文中,我們提出質(zhì)量分布編碼模塊QDE和質(zhì)量分布采樣模塊QDS,通過提取目標框的區(qū)域特征,并基于高斯混合模型來對預測框的質(zhì)量分布進行建模,來動態(tài)的選擇檢測框的正負樣本分配。本方法只涉及訓練階段標簽分配,就可以在COCO等多個數(shù)據(jù)集上實現(xiàn)當前最佳結果。
??關鍵詞:標簽分配
FSCE: Few-Shot Object Detection via Contrastive Proposal Encoding

??關鍵詞:小樣本目標檢測,對比學習
End 
聲明:部分內(nèi)容來源于網(wǎng)絡,僅供讀者學術交流之目的,文章版權歸原作者所有。如有不妥,請聯(lián)系刪除。
猜您喜歡:
NVIDIA GPU成為數(shù)據(jù)科學,深度學習模型計算加速的關鍵,近期NVIDIA推出了一系列課程,涉及處理海量數(shù)據(jù)、一鍵GPU加速、GPU調(diào)度、代碼遷移、高效網(wǎng)絡通信等內(nèi)容。

現(xiàn)已免費向外界提供,歡迎長按下圖、掃碼報名:
附下載 | 經(jīng)典《Think Python》中文版
附下載 |《TensorFlow 2.0 深度學習算法實戰(zhàn)》
