點(diǎn)擊上方“小白學(xué)視覺”，選擇加"星標(biāo)"或“置頂”

重磅干貨，第一時(shí)間送達(dá)

本文轉(zhuǎn)自｜計(jì)算機(jī)視覺聯(lián)盟

1.RRPN（兩階段文字檢測華科白翔組）

時(shí)間：3 Mar 2017

題目：Arbitrary-Oriented Scene Text Detection via Rotation Proposals

鏈接：https://arxiv.org/abs/1703.01086

創(chuàng)新：

應(yīng)該是第一個(gè)基于RPN架構(gòu)引入旋轉(zhuǎn)候選框?qū)崿F(xiàn)任意方向的場景文本檢測。基于旋轉(zhuǎn)的anchor得到旋轉(zhuǎn)ROI，然后提取相應(yīng)特征，效果可以

pipeline

預(yù)定義anchor

2.EAST （單階段文字檢測器曠世科技）

時(shí)間：11 Apr 2017

題目：EAST: An Efficient and Accurate Scene Text Detector

鏈接：https://arxiv.org/pdf/1704.03155.pdf

知乎解讀：https://zhuanlan.zhihu.com/p/37504120

創(chuàng)新：

提出單階段的檢測框架figure3。提出一種新的旋轉(zhuǎn)目標(biāo)定義方式（特征點(diǎn)到旋轉(zhuǎn)框的四邊距離以及角度信息），如下圖c，圖d，e分別預(yù)測四個(gè)距離和角度信息
應(yīng)該算是比較早的anchor-free方法檢測旋轉(zhuǎn)目標(biāo)的嘗試，將旋轉(zhuǎn)的ground-truth box向內(nèi)按比例縮小一個(gè)范圍如下圖左上角（a）中的綠色框，特征點(diǎn)落在這個(gè)綠色框內(nèi)作為正樣本。2019年的一篇 anchor-free 水平框目標(biāo)檢測器FoveaBox 和這個(gè)思路有點(diǎn)相似（arxiv.org/abs/1904.0379）

提出一個(gè)Locality-Aware NMS，加速nms過程

3. R2CNN （兩階段文字檢測三星中國）

時(shí)間：29 Jun 2017

題目：R2CNN: Rotational Region CNN for Orientation Robust Scene Text Detection

鏈接：https://arxiv.org/ftp/arxiv/papers/1706/1706.09579.pdf

知乎解讀：https://zhuanlan.zhihu.com/p/41662351

創(chuàng)新：

提出一種新的旋轉(zhuǎn)目標(biāo)定義方式（檢測順時(shí)針順序的四個(gè)角點(diǎn)中的前兩個(gè)角點(diǎn)x1 y1 x2 y2和矩形高）

整體使用faster rcnn框架，考慮到某些文字框的寬高差距很大，在ROI pooling時(shí) 除了使用7x7的pooled size 還增加了3x11和11x3 兩種pooled size。3x11可以更好地捕捉水平特征，這對于檢測寬大于高的框比較有好處，而11x3可以更好地捕捉豎直特征，這對于檢測高大于寬的框比較有好處。

4.RR-CNN（兩階段艦船檢測中科院自動化所）

時(shí)間：Sept. 2017

題目：ROTATED REGION BASED CNN FOR SHIP DETECTION

鏈接：https://ieeexplore.ieee.org/document/8296411

創(chuàng)新：

提出RRoI pooling layer，提取旋轉(zhuǎn)目標(biāo)特征
回歸旋轉(zhuǎn)目標(biāo)模型
傳統(tǒng)NMS針對同類目標(biāo)做，這篇文章針對多類別提出多任務(wù)NMS

roi pooling

多任務(wù)nms

5. DRBOX（兩階段目標(biāo)檢測中科院電子所）

時(shí)間：26 Nov 2017

題目：Learning a Rotation Invariant Detector with Rotatable Bounding Box

鏈接：https://arxiv.org/pdf/1711.09405.pdf

創(chuàng)新：

網(wǎng)絡(luò)pipeline如下，論文時(shí)間比較早，沒具體說使用了什么網(wǎng)絡(luò)結(jié)構(gòu)，參考其他論文說法，DRBOX類似RPN結(jié)構(gòu)

比較早的說明了用水平框檢測旋轉(zhuǎn)目標(biāo)存在的問題

6. TextBoxes++（單階段華科白翔組）

時(shí)間：9 Jan 2018

題目：TextBoxes++: A Single-Shot Oriented Scene Text Detector

鏈接：https://arxiv.org/pdf/1801.02765.pdf

知乎解讀：https://zhuanlan.zhihu.com/p/33723456

創(chuàng)新：

在SSD基礎(chǔ)上檢測水平框和旋轉(zhuǎn)框

使用不規(guī)則卷積核：
textboxes++中采用3x5的卷積核，以便更好的適應(yīng)長寬比更大的文字

使用OHEM策略
訓(xùn)練過程采用OHEM策略，不同于傳統(tǒng)的OHEM，訓(xùn)練分為兩個(gè)stage，stage1的正負(fù)樣本比為1:3，stage2的政府樣本比為1:6
多尺度訓(xùn)練
由于Textboxes++采用了全卷積結(jié)構(gòu)，因此可以適應(yīng)不同尺度的輸入。為了適應(yīng)不同尺度目標(biāo)，采用了多尺度訓(xùn)練。
級聯(lián)NMS
由于計(jì)算傾斜文字的IOU較為耗時(shí)，因此作者采用級聯(lián)NMS加速IOU計(jì)算，先計(jì)算所有所有框的最小外接矩形的IOU，做一次閾值為0.5的NMS，消除一部分框，然后再計(jì)算傾斜框的IOU的基礎(chǔ)上做一次閾值為0.2的NMS。

7. Learning roi transformer for oriented object detection in aerial images（cvpr2019 武大夏桂松兩階段）

時(shí)間 1 Dec 2018

題目：Learning roi transformer for oriented object detection in aerial images

論文鏈接：https://arxiv.org/abs/1812.00155

創(chuàng)新：

基于水平anchor，在RPN階段通過全連接學(xué)習(xí)得到旋轉(zhuǎn)ROI（區(qū)別于RRPN設(shè)置很多旋轉(zhuǎn)anchor，因?yàn)檫@篇文章是從水平anchor學(xué)習(xí)得到旋轉(zhuǎn)ROI，減小了計(jì)算量），基于旋轉(zhuǎn)ROI提取特征，然后進(jìn)行定位和分類

Rotated Position Sensitive RoI Align
基于旋轉(zhuǎn)框提取roi特征

8. R2PN（兩階段）

時(shí)間：August 2018

題目：Toward arbitrary-oriented ship detection with rotated region proposal and discrimination networks

鏈接：https://www.researchgate.net/publication/327096241_Toward_Arbitrary-Oriented_Ship_Detection_With_Rotated_Region_Proposal_and_Discrimination_Networks

創(chuàng)新：

感覺和RRPN比較像，基于旋轉(zhuǎn)anchor，通過RPN得到旋轉(zhuǎn)ROI，基于旋轉(zhuǎn)ROI提取特征，然后進(jìn)行定位和分類。和Learning roi transformer這篇文章區(qū)別是前者是旋轉(zhuǎn)anchor，后者是水平anchor，計(jì)算量更小。

9. R2CNN++（SCRDet）（兩階段中科院電子所）

時(shí)間：17 Nov 2018

題目：SCRDet: Towards More Robust Detection for Small, Cluttered and Rotated Objects

鏈接：https://arxiv.org/abs/1811.07126

添加特征融合和空間、通道注意力機(jī)制。基于水平anchor，通過RPN預(yù)測粗糙ROI，然后檢測頭實(shí)現(xiàn)對目標(biāo)的任意角的坐標(biāo)預(yù)測(x,y,w,h,θ)，pipeline如下：

pipline

創(chuàng)新：

SF-Net：把兩個(gè)不同層的feature map進(jìn)行定制化融合有效檢測小目標(biāo)

SF-Net

MDA-Net: 使用通道注意力和像素級別的注意力機(jī)制檢測密集目標(biāo)和小目標(biāo)

MDA-Net

提出改進(jìn)版的smooth L1loss 解決旋轉(zhuǎn)目標(biāo)在垂直時(shí)角度（從0°會突變到-90°）存在變化不連續(xù)問題

10. CAD-Net （兩階段）

時(shí)間：3 Mar 2019

題目：CAD-Net: A Context-Aware Detection Network for Objects in Remote Sensing Imagery

鏈接：https://arxiv.org/pdf/1903.00857.pdf

創(chuàng)新：

提出GCNet（Global Context Network），在進(jìn)行目標(biāo)檢測時(shí)融入全局上下文信息
提出PLCNet（pyramid local context network）引入空間注意力學(xué)習(xí)目標(biāo)協(xié)同關(guān)系，

網(wǎng)絡(luò)pipeline

PLCNet結(jié)構(gòu)

空間注意力

11. R3Det （單階段旋轉(zhuǎn)目標(biāo)檢測上交&南理&曠世）

時(shí)間 Aug 2019

題目：R3Det: Refined Single-Stage Detector with Feature Refinement for Rotating Object

論文鏈接：https://arxiv.org/abs/1908.05612

code：https://github.com/SJTU-Thinklab-Det/R3Det_Tensorflow

解讀鏈接：https://ming71.github.io/R3Det

創(chuàng)新：

旋轉(zhuǎn)目標(biāo)檢測（水平目標(biāo)檢測也）可能存在某個(gè)anchor所在的特征點(diǎn)的感受野和目標(biāo)位置、形狀不匹配（如下圖左上角，綠色框是anchor，它所在的特征點(diǎn)只能看到這艘船的一部分，那么直接用這個(gè)點(diǎn)的特征去回歸anchor 以擬合ground truth（紅色框）不一定準(zhǔn)確），所以這篇論文分兩個(gè)stage：first stage 從anchor預(yù)測旋轉(zhuǎn)框（橙色框），如下圖紅色數(shù)字1->2，這時(shí)候橙色框范圍和真實(shí)目標(biāo)就很接近了，然后根據(jù)橙色框提取特征（我理解為類似ROI pooling特征提?。?，通過這個(gè)特征回歸到ground truth，如下圖中紅色數(shù)字2->3.

網(wǎng)絡(luò)結(jié)構(gòu)沿用RetinaNet的結(jié)構(gòu)，并引入了feature refinement 模塊，并且可以疊加多次

feature refinement 模塊

END

下載1：OpenCV-Contrib擴(kuò)展模塊中文版教程

在「小白學(xué)視覺」公眾號后臺回復(fù)：擴(kuò)展模塊中文教程，即可下載全網(wǎng)第一份OpenCV擴(kuò)展模塊教程中文版，涵蓋擴(kuò)展模塊安裝、SFM算法、立體視覺、目標(biāo)跟蹤、生物視覺、超分辨率處理等二十多章內(nèi)容。

下載2：Python視覺實(shí)戰(zhàn)項(xiàng)目52講

在「小白學(xué)視覺」公眾號后臺回復(fù)：Python視覺實(shí)戰(zhàn)項(xiàng)目，即可下載包括圖像分割、口罩檢測、車道線檢測、車輛計(jì)數(shù)、添加眼線、車牌識別、字符識別、情緒檢測、文本內(nèi)容提取、面部識別等31個(gè)視覺實(shí)戰(zhàn)項(xiàng)目，助力快速學(xué)校計(jì)算機(jī)視覺。

下載3：OpenCV實(shí)戰(zhàn)項(xiàng)目20講

在「小白學(xué)視覺」公眾號后臺回復(fù)：OpenCV實(shí)戰(zhàn)項(xiàng)目20講，即可下載含有20個(gè)基于OpenCV實(shí)現(xiàn)20個(gè)實(shí)戰(zhàn)項(xiàng)目，實(shí)現(xiàn)OpenCV學(xué)習(xí)進(jìn)階。

交流群

歡迎加入公眾號讀者群一起和同行交流，目前有SLAM、三維視覺、傳感器、自動駕駛、計(jì)算攝影、檢測、分割、識別、醫(yī)學(xué)影像、GAN、算法競賽等微信群（以后會逐漸細(xì)分），請掃描下面微信號加群，備注：”昵稱+學(xué)校/公司+研究方向“，例如：”張三 + 上海交大 + 視覺SLAM“。請按照格式備注，否則不予通過。添加成功后會根據(jù)研究方向邀請進(jìn)入相關(guān)微信群。請勿在群內(nèi)發(fā)送廣告，否則會請出群，謝謝理解~

干貨 | 一文總結(jié)旋轉(zhuǎn)目標(biāo)檢測全面綜述：論文方法與代碼

1.RRPN（兩階段文字檢測 華科白翔組）

2.EAST （單階段文字檢測器 曠世科技）

3. R2CNN （兩階段文字檢測 三星中國）

4.RR-CNN（兩階段艦船檢測 中科院自動化所）

5. DRBOX（兩階段目標(biāo)檢測 中科院電子所）

6. TextBoxes++（單階段 華科白翔組）

7. Learning roi transformer for oriented object detection in aerial images（cvpr2019 武大夏桂松 兩階段）

8. R2PN（兩階段）

9. R2CNN++（SCRDet） （兩階段 中科院電子所）

10. CAD-Net （兩階段）

11. R3Det （單階段旋轉(zhuǎn)目標(biāo)檢測 上交&南理&曠世）

1.RRPN（兩階段文字檢測華科白翔組）

2.EAST （單階段文字檢測器曠世科技）

3. R2CNN （兩階段文字檢測三星中國）

4.RR-CNN（兩階段艦船檢測中科院自動化所）

5. DRBOX（兩階段目標(biāo)檢測中科院電子所）

6. TextBoxes++（單階段華科白翔組）

7. Learning roi transformer for oriented object detection in aerial images（cvpr2019 武大夏桂松兩階段）

9. R2CNN++（SCRDet）（兩階段中科院電子所）

11. R3Det （單階段旋轉(zhuǎn)目標(biāo)檢測上交&南理&曠世）