港大同濟(jì)伯克利推出目標(biāo)檢測新范式:Sparse R-CNN
點(diǎn)擊上方“AI算法與圖像處理”,選擇加"星標(biāo)"或“置頂”
重磅干貨,第一時(shí)間送達(dá)
全新的目標(biāo)檢測范式Sparse R-CNN。 原文鏈接:https://zhuanlan.zhihu.com/p/310058362

沿著目標(biāo)檢測領(lǐng)域中 Dense 和 Dense-to-Sparse 的框架,Sparse R-CNN 建立了一種徹底的 Sparse 框架, 脫離 anchor box,reference point,Region Proposal Network(RPN) 等概念,無需 Non-Maximum Suppression(NMS) 后處理, 在標(biāo)準(zhǔn)的 COCO benchmark 上使用 ResNet-50 FPN 單模型在標(biāo)準(zhǔn) 3x training schedule 達(dá)到了 44.5 AP 和 22 FPS。
Paper: https://arxiv.org/abs/2011.12450
Code: https://github.com/PeizeSun/SparseR-CNN
第一大類是從非 Deep 時(shí)代就被廣泛應(yīng)用的 dense detector,例如 DPM,YOLO,RetinaNet,F(xiàn)COS。在 dense detector 中, 大量的 object candidates 例如 sliding-windows,anchor-boxes, reference-points 等被提前預(yù)設(shè)在圖像網(wǎng)格或者特征圖網(wǎng)格上,然后直接預(yù)測這些 candidates 到 gt 的 scaling/offest 和物體類別。
第二大類是 dense-to-sparse detector,例如,R-CNN 家族。這類方法的特點(diǎn)是對(duì)一組 sparse 的 candidates 預(yù)測回歸和分類,而這組 sparse 的 candidates 來自于 dense detector。
NMS 后處理
many-to-one 正負(fù)樣本分配
prior candidates 的設(shè)計(jì)



Backbone 是基于 ResNet 的 FPN。
Head 是一組 iterative 的 Dynamic Instance Interactive Head,上一個(gè) head 的 output features 和 output boxes 作為下一個(gè) head 的 proposal features 和 proposal boxes。Proposal features 在與 RoI features 交互之前做 self-attention。
訓(xùn)練的損失函數(shù)是基于 optimal bipartite matching 的 set prediction loss。


原文鏈接:https://zhuanlan.zhihu.com/p/310058362
下載1:leetcode 開源書
在「AI算法與圖像處理」公眾號(hào)后臺(tái)回復(fù):leetcode,即可下載。每題都 runtime beats 100% 的開源好書,你值得擁有!
下載2 CVPR2020
在「AI算法與圖像處理」公眾號(hào)后臺(tái)回復(fù):CVPR2020,即可下載1467篇CVPR 2020論文 個(gè)人微信(如果沒有備注不拉群!) 請(qǐng)注明:地區(qū)+學(xué)校/企業(yè)+研究方向+昵稱
覺得不錯(cuò)就點(diǎn)亮在看吧

