基于分割的包圍盒生成用于全方位行人檢測


摘要
由于行人在全向圖像中的出現(xiàn)可能會旋轉(zhuǎn)到任意角度,普通行人檢測器的性能可能會大幅下降?,F(xiàn)有的方法通過在推理過程中轉(zhuǎn)換圖像或用全方位圖像訓(xùn)練檢測器來緩解這個(gè)問題。但是,第一種方法大大降低了推理速度,第二種方法需要費(fèi)力的注釋。為了克服這些缺點(diǎn),作者利用現(xiàn)有的大型數(shù)據(jù)集(可以利用其分段注釋)來生成緊密匹配的邊框注釋。作者還提出了一種偽魚眼失真增強(qiáng)方法,進(jìn)一步提高了性能。大量的分析表明,作者的檢測器成功地將邊界框適合于行人,并顯示出顯著的性能改進(jìn)。

作者將本文的貢獻(xiàn)總結(jié)如下:
作者提出從現(xiàn)有的分割注釋中生成緊密匹配的邊界框,用于全方位的行人檢測。
作者提出了一種新的數(shù)據(jù)增強(qiáng)方法,使透視圖像能夠模仿全向圖像。
作者在公開可用的基準(zhǔn)數(shù)據(jù)集上進(jìn)行了大量的實(shí)驗(yàn),并證明了所提出的方法的顯著性能改進(jìn)。

框架結(jié)構(gòu)

提出的方法的總體架構(gòu)
訓(xùn)練時(shí)將視角圖像輸入到檢測器網(wǎng)絡(luò),評估時(shí)輸入全向圖像。

實(shí)驗(yàn)結(jié)果

基線方法和提出的方法對每個(gè)數(shù)據(jù)集的檢測結(jié)果示例
每個(gè)區(qū)塊的左右圖像分別顯示了基線法和提出的基于偽魚眼失真分割方法的結(jié)果。

MW-18Mar數(shù)據(jù)集每個(gè)位置的AP50
每個(gè)圖表中的柱形表示標(biāo)準(zhǔn)誤差。標(biāo)記的顏色表示每個(gè)圓圈中的位置。(B:用COCO的原始包圍盒訓(xùn)練,s + D:用分割注釋生成的包圍盒訓(xùn)練,添加偽魚眼失真。)
結(jié)論
本文提出了一種基于分割的包圍盒生成方法,在不使用全向圖像進(jìn)行訓(xùn)練的情況下提高全向行人檢測器的性能。這種方法使檢測器能夠緊密地將盒子放入行人中,因此優(yōu)于傳統(tǒng)方法,特別是對于高欠條閾值的AP。作者還提出了一種偽魚眼失真增強(qiáng)算法來進(jìn)一步提高性能。該方法使透視圖像能夠模仿全向圖像,從而提高了對全向圖像失真的魯棒性。實(shí)驗(yàn)結(jié)果表明,該檢測器成功地將盒子匹配到行人身上,并取得了顯著的性能改善。
論文鏈接:https://arxiv.org/pdf/2104.13764.pdf
雙一流高校研究生團(tuán)隊(duì)創(chuàng)建 ↓
專注于計(jì)算機(jī)視覺原創(chuàng)并分享相關(guān)知識 ?
整理不易,點(diǎn)贊三連!
