久久久久久亚洲成人电影,操美女视频网站,青青草青娱乐在线视频,免费黄色一级视频,麻豆国产一区二区,91久久人澡人妻人人做人精品,熟女熟妇人妻一区二区三区,围内精品久久久久久久久变脸

點擊下方卡片，關(guān)注“新機器視覺”公眾號

視覺/圖像重磅干貨，第一時間送達

文章導(dǎo)讀

計算機視覺任務(wù)中，2D卷積神經(jīng)網(wǎng)絡(luò)得益于極其出色的性能不斷刷新著各大視覺任務(wù)的榜單，可謂是YYDS。隨著人工智能算法的不斷推進，更多的研究者將目光聚焦到了3D任務(wù)，那么在3D視覺任務(wù)中，2D卷積神經(jīng)網(wǎng)絡(luò)的神話能否延續(xù)呢？答案是肯定的！今天小編將分享一篇3D點云檢測論文—Pointpillars，看看作者如何巧妙的只使用2D卷積，卻實現(xiàn)了高效的3D目標檢測。

3D點云檢測的現(xiàn)狀如何

最近幾年點云的三維目標檢測一直很火，從早期的PointNet、PointNet++，到體素網(wǎng)格的VoxelNet，后來大家覺得三維卷積過于耗時，又推出了Complex-yolo等模型把點云投影到二維平面，用圖像的方法做目標檢測，從而加速網(wǎng)絡(luò)推理。

所以在點云上實現(xiàn)3D目標檢測通常就是這三種做法：3D卷積、投影到前視圖或者鳥瞰圖（Bev）。

3D卷積的缺點是計算量較大，導(dǎo)致網(wǎng)絡(luò)的推理速度較慢。投影的方式受到點云的稀疏性的限制，使得卷積無法較好的提取特征，效率低下。而后來研究熱點轉(zhuǎn)向了采用鳥瞰圖（Bev）的方式，但存在的明顯的缺點就是需要手動提取特征，不利于推廣到其他的雷達上使用。

撥開那些花里胡哨的網(wǎng)絡(luò)，有什么更靠譜的模型能夠權(quán)衡速度和精度做三維目標檢測呢？

橫空殺出的PointPillars

這是一篇前兩年的點云目標檢測網(wǎng)絡(luò)，為什么重溫它是因為小編在學習百度Apollo 6.0時發(fā)現(xiàn)它被集成進去作為激光雷達的檢測模型了。在這里給大家解析一下該網(wǎng)絡(luò)模型，看看有啥特點！

Pointpillars的創(chuàng)新點在于：提出了一種新的編碼方式，利用柱狀物的方式生成偽圖像。

Pointpillars由三大部分組成：

利用pillars的方式將點云轉(zhuǎn)化為稀疏偽圖像；
使用2D網(wǎng)絡(luò)進行特征的學習；
使用SSD檢測頭進行Bbox的回歸。

如下圖所示：

網(wǎng)絡(luò)結(jié)構(gòu)

Pointpillars的性能表現(xiàn)：具有明顯的速度優(yōu)勢，最高也可達到105Hz，且對比僅使用點云作為輸入的3D目標檢測的方法有精度上的提升。

PointPillars的詳細分析

想要學習一個網(wǎng)絡(luò)模型，不管是圖像還是點云的檢測：

首先需要看看它是怎么做數(shù)據(jù)處理的？
然后了解它的特征提取模塊是怎么搭建的？
接下來了解它的檢測頭選用的是什么？
模型搭建完畢后需要分析損失函數(shù)如何權(quán)衡？
最后當然是看看實驗的仿真效果如何？

數(shù)據(jù)處理環(huán)節(jié)：

Pointpillar設(shè)計了一套編碼方式將激光雷達輸出的三維坐標轉(zhuǎn)換到網(wǎng)絡(luò)輸入的形式，操作如下：

通常從激光雷達中獲取的點云表現(xiàn)形式一般是x，y，z和反射強度i。
將點云離散到x-y平面的均勻間隔的網(wǎng)格中，從而創(chuàng)建一組柱狀集P ,具有| P | = B，z軸不需要參數(shù)進行控制。
將每個支柱中的點增加xc，yc，zc，xp和yp（其中c下標表示到支柱中所有點的算術(shù)平均值的距離，p下標表示從支柱x，y中心的偏移量）。激光雷達中的每個點就具有了九維的特征。
對每個樣本的非空支柱數(shù)（P）和每個支柱中的點數(shù)（N）施加限制，來創(chuàng)建大小為（D，P，N）的張量張量。如柱狀體中的數(shù)據(jù)太多，則進行隨機采樣，如數(shù)據(jù)太少，則用0進行填充。
簡化版本的PointNet對張量化的點云數(shù)據(jù)進行處理和特征提取（即對每個點都運用線性層+BN層+ReLU層），來生成一個（C，P，N）的張量，再對于通道上使用最大池化操作，輸出一個（C，P）的張量。
編碼后特征散布回原始的支柱位置，創(chuàng)建大小為（C，H，W）的偽圖像。

(D, P, N)--> (C, P, N) --> (C, P) --> (C, H, W)

上述的轉(zhuǎn)換流程流程如圖所示：