arxiv論文整理20231230-0105(目標(biāo)檢測方向)
Credible Teacher for Semi-Supervised Object Detection in Open Scene(ICASSP 2024)
摘要: 在半監(jiān)督目標(biāo)檢測(SSOD)中,通過利用未標(biāo)記數(shù)據(jù)來提高檢測性能取得了巨大成功。然而,在開放場景半監(jiān)督目標(biāo)檢測(O-SSOD)中,未標(biāo)記數(shù)據(jù)可能包含在已標(biāo)記數(shù)據(jù)中未觀察到的未知對象,這將增加模型對已知對象的預(yù)測中的不確定性。對于當(dāng)前主要依賴自訓(xùn)練的方法來說,這是有害的,因?yàn)楦嗟牟淮_定性會導(dǎo)致偽標(biāo)簽的定位和分類精度降低。因此,我們提出了可信教師(Credible Teacher),這是一個端到端的框架。可信教師采用互動式教學(xué)機(jī)制,使用靈活的標(biāo)簽,以防止不確定的偽標(biāo)簽誤導(dǎo)模型,并通過其他可信偽標(biāo)簽的指導(dǎo)逐漸減少其不確定性。經(jīng)驗(yàn)結(jié)果表明,我們的方法有效地抑制了O-SSOD引起的不利影響,并顯著優(yōu)于現(xiàn)有的對應(yīng)方法。
點(diǎn)評: 有效地利用少量標(biāo)記數(shù)據(jù)和大量未標(biāo)記數(shù)據(jù)進(jìn)行學(xué)習(xí)。
Depth-discriminative Metric Learning for Monocular 3D Object Detection(NeurIPS 2023)
摘要: 單目3D目標(biāo)檢測由于RGB圖像中缺乏深度信息而面臨重大挑戰(zhàn)。許多現(xiàn)有方法致力于通過為對象深度估計分配額外的參數(shù),利用額外的模塊或數(shù)據(jù)來提升目標(biāo)深度估計性能。相比之下,我們引入了一種新穎的度量學(xué)習(xí)方案,鼓勵模型提取深度判別特征,而不增加推理時間和模型大小。我們的方法利用保距函數(shù)來組織特征空間流形,以與地面實(shí)際深度對象相關(guān)。所提出的(K,B,eps)-準(zhǔn)等距損失利用了預(yù)定的成對距離限制作為調(diào)整對象描述符之間距離的指導(dǎo),同時不破壞自然特征流形的非線性。此外,我們引入了一個輔助頭來進(jìn)行逐個對象的深度估計,提高深度質(zhì)量的同時保持推理時間。通過實(shí)驗(yàn)證明了我們方法的廣泛適用性,當(dāng)集成到各種基線方法中時,整體性能有所改善。結(jié)果表明,我們的方法分別在KITTI和Waymo數(shù)據(jù)集上,平均提高了23.51%和5.78%的性能。
點(diǎn)評: 創(chuàng)新點(diǎn)主要集中在深度信息的利用和度量學(xué)習(xí)方法的設(shè)計上,以期望在單目圖像上進(jìn)行高效準(zhǔn)確的3D目標(biāo)檢測。
Assisting Blind People Using Object Detection with Vocal Feedback(MI-STA)
摘要: 對視力受損的人來說,在室內(nèi)和室外環(huán)境中進(jìn)行獨(dú)立移動并安全地行動是非常困難的。此外,這些身體和視力上的挑戰(zhàn)阻礙了他們?nèi)粘I罨顒拥倪M(jìn)行。同樣,他們在感知周圍環(huán)境中的物體方面也存在問題,這可能對他們構(gòu)成風(fēng)險。所提出的方法建議通過使用網(wǎng)絡(luò)攝像頭在實(shí)時視頻中檢測物體以實(shí)現(xiàn)物體識別過程。使用了基于卷積神經(jīng)網(wǎng)絡(luò)的實(shí)時目標(biāo)檢測技術(shù)You Look Only Once (YOLO)模型。此外,還使用了Python的OpenCV庫來實(shí)現(xiàn)軟件程序,并進(jìn)行了深度學(xué)習(xí)過程。將圖像識別結(jié)果通過Google文本轉(zhuǎn)語音庫轉(zhuǎn)換為視力受損用戶可以聽到的形式,并確定物體相對于屏幕位置的位置。通過使用平均精度(mAP)對獲得的結(jié)果進(jìn)行評估,發(fā)現(xiàn)與以往方法相比,所提出的方法取得了出色的結(jié)果。
點(diǎn)評: 結(jié)合了計算機(jī)視覺和語音反饋技術(shù),使得視覺障礙者也能在室內(nèi)外環(huán)境中獨(dú)立移動,并安全地行動。
ps:承接程序代寫, 小程序編寫 程序應(yīng)用 深度學(xué)習(xí) 卷積神經(jīng)網(wǎng)絡(luò) pytorch paddlepaddle 數(shù)據(jù)結(jié)構(gòu) 機(jī)器學(xué)習(xí) 目標(biāo)檢測 圖像處理
有需要的兄弟們可以在我公眾號留言。
論文解讀的ppt(有備注,可直接講)可以在知識星球獲取:
我正在「目標(biāo)檢測er的小圈子」和朋友們討論有趣的話題,你?起來吧?
https://t.zsxq.com/0cM8tmd4l
