arxiv論文整理20240120-0126(目標(biāo)檢測方向)
A Saliency Enhanced Feature Fusion based multiscale RGB-D Salient Object Detection Network(ICASSP 2024)
摘要: 多尺度卷積神經(jīng)網(wǎng)絡(luò)(CNN)在解決各種視覺問題方面表現(xiàn)出了顯著的能力。然而,融合不同尺度的特征總是導(dǎo)致大型模型大小,阻礙了多尺度CNN在RGB-D顯著性檢測中的應(yīng)用。在本文中,我們提出了一種定制的特征融合模塊,名為Saliency Enhanced Feature Fusion(SEFF),用于RGB-D顯著性檢測。SEFF利用相鄰尺度的顯著性圖來增強(qiáng)融合所需的特征,從而產(chǎn)生更具代表性的融合特征。我們的多尺度RGB-D顯著性檢測器使用SEFF,并使用三個不同尺度處理圖像。SEFF用于融合RGB和深度圖像的特征,以及不同尺度解碼器的特征。對五個基準(zhǔn)數(shù)據(jù)集進(jìn)行的大量實驗證明了我們的方法優(yōu)于十種SOTA顯著性檢測器。
點評: 利用相鄰尺度的顯著性圖來增強(qiáng)融合所需的特征。
Enhancing Object Detection Performance for Small Objects through Synthetic Data Generation and Proportional Class-Balancing Technique: A Comparative Study in Industrial Scenarios(ESAIM23 )
摘要: 目標(biāo)檢測(OD)已被證明是提取局部類信息的重要計算機(jī)視覺方法,在工業(yè)中具有多種應(yīng)用。盡管許多最先進(jìn)的目標(biāo)檢測(SOTA)模型在中大型物體上表現(xiàn)良好,但它們似乎在小物體上表現(xiàn)不佳。在大多數(shù)工業(yè)用例中,很難收集和注釋小物體的數(shù)據(jù),因為這是耗時且容易出現(xiàn)人為錯誤的。此外,這些數(shù)據(jù)集可能是不平衡的,并且通常會導(dǎo)致模型收斂不高效。為了解決這一挑戰(zhàn),本研究提出了一種注入額外數(shù)據(jù)點以提高OD模型性能的新方法。通過使用合成數(shù)據(jù)生成,可以最小化小目標(biāo)數(shù)據(jù)點的數(shù)據(jù)收集和注釋困難,并創(chuàng)造一個具有平衡分布的數(shù)據(jù)集。本文討論了一種簡單的比例類平衡技術(shù)的效果,以實現(xiàn)更好的錨點匹配的OD模型。在工業(yè)用例中,對最先進(jìn)的OD模型(YOLOv5、YOLOv7和SSD)的實際和合成數(shù)據(jù)集的性能進(jìn)行了比較。
點評: 通過使用合成數(shù)據(jù)生成和比例類平衡技術(shù)來增強(qiáng)對小型物體的目標(biāo)檢測性能。
ps:承接程序代寫, 小程序編寫 程序應(yīng)用 深度學(xué)習(xí) 卷積神經(jīng)網(wǎng)絡(luò) pytorch paddlepaddle 數(shù)據(jù)結(jié)構(gòu) 機(jī)器學(xué)習(xí) 目標(biāo)檢測 圖像處理
有需要的兄弟們可以在我公眾號留言。
論文解讀的ppt(有備注,可直接講)可以在知識星球獲取:
我正在「目標(biāo)檢測er的小圈子」和朋友們討論有趣的話題,你?起來吧?
https://t.zsxq.com/0cM8tmd4l
