史上最全綜述 | 3D目標(biāo)檢測(cè)算法匯總?。▎文?雙目/LiDAR/多模態(tài)/時(shí)序/半弱自監(jiān)督)

本文約15200字,建議閱讀15+分鐘 我們對(duì)3D目標(biāo)檢測(cè)方法進(jìn)行了性能分析,并總結(jié)了多年來(lái)的研究趨勢(shì),展望了該領(lǐng)域的未來(lái)方向。
1摘要
2簡(jiǎn)述
我們從不同的角度全面回顧了3D目標(biāo)檢測(cè)方法,包括來(lái)自不同傳感器輸入的檢測(cè)(基于LiDAR、基于攝像頭和多模態(tài))、時(shí)間序列檢測(cè)、標(biāo)簽高效檢測(cè)、以及3D目標(biāo)檢測(cè)在駕駛系統(tǒng)中的應(yīng)用。 我們從結(jié)構(gòu)和層次上總結(jié)了3D目標(biāo)檢測(cè)方法,對(duì)這些方法進(jìn)行了系統(tǒng)分析,并為不同類(lèi)別方法的潛力和挑戰(zhàn)提供了有價(jià)值的見(jiàn)解。 對(duì)3D目標(biāo)檢測(cè)方法的綜合性能和速度進(jìn)行分析,確定多年來(lái)的研究趨勢(shì),并為3D目標(biāo)檢測(cè)的未來(lái)方向提供深刻的見(jiàn)解。

3背景
3D目標(biāo)檢測(cè)是什么?
1、定義
2、傳感器輸入

3、與2D目標(biāo)檢測(cè)的比較
3D目標(biāo)檢測(cè)方法必須處理多樣化的數(shù)據(jù)。點(diǎn)云檢測(cè)需要新的算子和網(wǎng)絡(luò)來(lái)處理不規(guī)則的點(diǎn)數(shù)據(jù),而點(diǎn)云和圖像的檢測(cè)需要特殊的融合機(jī)制。 3D目標(biāo)檢測(cè)方法通常利用不同的投影視圖來(lái)生成目標(biāo)預(yù)測(cè)結(jié)果。與從透視圖檢測(cè)目標(biāo)的2D目標(biāo)檢測(cè)方法相反,3D方法必須考慮不同的視圖來(lái)檢測(cè)3D目標(biāo),例如鳥(niǎo)瞰圖、點(diǎn)視圖、柱面視圖等。 3D目標(biāo)檢測(cè)對(duì)目標(biāo)在3D空間的準(zhǔn)確定位有很高的要求。分米級(jí)的定位誤差可能導(dǎo)致對(duì)行人和騎自行車(chē)的人等小目標(biāo)的檢測(cè)失敗,而在2D目標(biāo)檢測(cè)中,幾個(gè)像素的定位誤差可能仍然保持較高的IoU指標(biāo)(預(yù)測(cè)值和真值的IoU)。因此,不論是利用點(diǎn)云還是圖像進(jìn)行3D目標(biāo)檢測(cè),準(zhǔn)確的3D幾何信息都是必不可少的。
4、與室內(nèi)3D目標(biāo)檢測(cè)對(duì)比
自動(dòng)駕駛場(chǎng)景的檢測(cè)范圍遠(yuǎn)大于室內(nèi)場(chǎng)景。駕駛場(chǎng)景中的3D目標(biāo)檢測(cè)通常需要預(yù)測(cè)很大范圍內(nèi)的3D目標(biāo),例如Waymo[250]中為150m×150m×6m,而室內(nèi)3D目標(biāo)檢測(cè)通常以房間為單位,而其中[54]大多數(shù)單人房間小于10m×10m×3m。那些在室內(nèi)場(chǎng)景中工作的時(shí)間復(fù)雜度高的方法在駕駛場(chǎng)景中可能無(wú)法表現(xiàn)出好的適應(yīng)能力。 LiDAR和RGB-D傳感器的點(diǎn)云分布不同。在室內(nèi)場(chǎng)景中,點(diǎn)在掃描表面上分布相對(duì)均勻,大多數(shù)3D目標(biāo)在其表面上可以接收到足夠數(shù)量的點(diǎn)。而在駕駛場(chǎng)景中,大多數(shù)點(diǎn)落在LiDAR傳感器附近,而那些遠(yuǎn)離傳感器的3D目標(biāo)僅接收到少量點(diǎn)。因此,駕駛場(chǎng)景中的方法特別需要處理3D目標(biāo)的各種點(diǎn)云密度,并準(zhǔn)確檢測(cè)那些遙遠(yuǎn)和稀疏的目標(biāo)。 駕駛場(chǎng)景中的檢測(cè)對(duì)推理延遲有特殊要求。駕駛場(chǎng)景中的感知必須是實(shí)時(shí)的,以避免事故。因此,這些方法需要及時(shí)高效,否則它們將無(wú)法落地。
數(shù)據(jù)集
增大數(shù)據(jù)規(guī)模。 增加數(shù)據(jù)多樣性,不只有白天夜晚,還要包括陰天、雨天、雪天、霧天等。 增加標(biāo)注類(lèi)別,除了常用的機(jī)動(dòng)車(chē)、行人、非機(jī)動(dòng)車(chē)等,還應(yīng)包括動(dòng)物,路上的障礙物等。 增加多模態(tài)數(shù)據(jù),不只有點(diǎn)云和圖像數(shù)據(jù),還有高精地圖、雷達(dá)數(shù)據(jù)、遠(yuǎn)程激光雷達(dá)、熱成像數(shù)據(jù)等。

評(píng)價(jià)標(biāo)準(zhǔn)
4基于LiDAR的3D目標(biāo)檢測(cè)

3D目標(biāo)檢測(cè)的數(shù)據(jù)表示
1、基于點(diǎn)的3D目標(biāo)檢測(cè)


2、基于網(wǎng)格的3D目標(biāo)檢測(cè)


多視圖體素。一些方法從不同的視角提出了一種動(dòng)態(tài)體素化和融合方案,例如從鳥(niǎo)瞰圖和透視圖[360],從圓柱形和球形視圖[34],從深度視圖[59]等。 多尺度體素。一些論文生成不同尺度的體素[323]或使用可重構(gòu)體素。
3、基于Point-Voxel的3D目標(biāo)檢測(cè)方法


4、基于Range的3D目標(biāo)檢測(cè)


3D目標(biāo)檢測(cè)的學(xué)習(xí)目標(biāo)
1、Anchor-based方法


2、Anchor-free方法

3、利用輔助任務(wù)的3D目標(biāo)檢測(cè)

5基于相機(jī)的3D目標(biāo)檢測(cè)

單目3D目標(biāo)檢測(cè)
1、純圖像單目3D檢測(cè)





2、深度輔助的單目3D檢測(cè)


3、先驗(yàn)引導(dǎo)的單目3D檢測(cè)


4、基于雙目的3D目標(biāo)檢測(cè)


5、基于多相機(jī)的3D目標(biāo)檢測(cè)
6基于多模態(tài)的3D目標(biāo)檢測(cè)

基于LiDAR-相機(jī)融合的多模態(tài)檢測(cè)
1、前融合方法

2、中融合方法

3、后融合方法

基于雷達(dá)信號(hào)的多模態(tài)檢測(cè)
結(jié)合高精地圖的多模態(tài)檢測(cè)
7時(shí)序3D目標(biāo)檢測(cè)


激光雷達(dá)序列

利用流數(shù)據(jù)進(jìn)行3D目標(biāo)檢測(cè)

利用視頻進(jìn)行3D目標(biāo)檢測(cè)
8標(biāo)簽高效的3D目標(biāo)檢測(cè)
3D目標(biāo)檢測(cè)中的域自適應(yīng)


弱監(jiān)督3D目標(biāo)檢測(cè)

半監(jiān)督3D目標(biāo)檢測(cè)

自監(jiān)督3D目標(biāo)檢測(cè)

9自動(dòng)駕駛系統(tǒng)中的3D目標(biāo)檢測(cè)
自動(dòng)駕駛中的端到端學(xué)習(xí)

3D目標(biāo)檢測(cè)仿真
3D目標(biāo)檢測(cè)的魯棒性
協(xié)同3D目標(biāo)檢測(cè)
10分析和展望
研究趨勢(shì)
未來(lái)展望




11總結(jié)
12參考文獻(xiàn)
[1] Mao, J., Shi, S., Wang, X., & Li, H. (2022). 3D Object Detection for Autonomous Driving: A Review and New Outlooks.ArXiv, abs/2206.09474.
編輯:于騰凱
校對(duì):林亦霖
評(píng)論
圖片
表情
