圖像分類和目標(biāo)檢測(cè)技術(shù)有什么區(qū)別?
點(diǎn)擊上方“小白學(xué)視覺”,選擇加"星標(biāo)"或“置頂”
重磅干貨,第一時(shí)間送達(dá)
圖像分類和目標(biāo)檢測(cè)技術(shù)是計(jì)算機(jī)視覺領(lǐng)域的重要研究方法。這些技術(shù)幫助機(jī)器理解和識(shí)別實(shí)時(shí)對(duì)象和環(huán)境,幫助數(shù)字圖像作為輸入。多年來,計(jì)算機(jī)視覺技術(shù)已經(jīng)被應(yīng)用于多個(gè)領(lǐng)域,包括醫(yī)療保健、制造業(yè)、零售業(yè)等等。
由于像圖像分類和目標(biāo)檢測(cè)這樣的方法都是圍繞著數(shù)字圖像中的目標(biāo)識(shí)別而展開的,所以常常會(huì)留下混淆:這兩種技術(shù)到底是什么,這兩種技術(shù)又是如何區(qū)別的?
在本文中,我們將了解這兩種技術(shù)是什么,并討論使它們不同的各種場(chǎng)景。
圖像分類

簡(jiǎn)單地說,圖像分類是一種用于對(duì)圖像中特定對(duì)象的類別進(jìn)行分類或預(yù)測(cè)的技術(shù),該技術(shù)的主要目的是準(zhǔn)確識(shí)別圖像中的特征。
圖像分類的工作原理
一般來說,圖像分類技術(shù)可以分為參數(shù)和非參數(shù)、有監(jiān)督和無監(jiān)督以及硬分類器和軟分類器。對(duì)于有監(jiān)督分類,該技術(shù)基于所建立的決策邊界來傳遞結(jié)果,決策邊界主要依賴于訓(xùn)練模型時(shí)所提供的輸入和輸出。但是,在無監(jiān)督分類的情況下,該技術(shù)根據(jù)對(duì)輸入數(shù)據(jù)集本身的分析提供結(jié)果;特征不會(huì)直接輸入到模型中。
圖像分類技術(shù)涉及的主要步驟是確定合適的分類系統(tǒng)、特征提取、選擇好的訓(xùn)練樣本、圖像預(yù)處理和選擇合適的分類方法、分類后處理,最后對(duì)總體精度進(jìn)行評(píng)估。在這種技術(shù)中,輸入通常是特定對(duì)象(如上圖中的兔子)的圖像,輸出是定義和匹配輸入對(duì)象的預(yù)測(cè)類。卷積神經(jīng)網(wǎng)絡(luò)(CNNs)是目前最常用的用于圖像分類的神經(jīng)網(wǎng)絡(luò)模型。
圖像分類技術(shù)的類型
有監(jiān)督圖像分類技術(shù)包括并行六面體技術(shù)、最小距離分類器、最大似然分類器等。在一篇研究論文中,研究人員提到了以下幾種類型的圖像分類技術(shù)
●基于不同傳感器信息的圖像分類
●基于訓(xùn)練樣本性質(zhì)的圖像分類
●基于數(shù)據(jù)所用各種參數(shù)的圖像分類
●基于數(shù)據(jù)像素信息性質(zhì)的圖像分類
●基于每個(gè)空間數(shù)據(jù)元素生成的輸出數(shù)量的圖像分類
●基于空間信息性質(zhì)的圖像分類。
缺點(diǎn)
●在有監(jiān)督和無監(jiān)督的圖像分類技術(shù)中,缺點(diǎn)是訓(xùn)練階段需要大量的時(shí)間,不適合處理大數(shù)據(jù)。
目標(biāo)檢測(cè)

目標(biāo)檢測(cè)的問題定義是確定目標(biāo)在給定圖像中的位置,如目標(biāo)定位,以及每個(gè)目標(biāo)屬于哪個(gè)類別,即目標(biāo)分類。簡(jiǎn)單地說,目標(biāo)檢測(cè)是一種圖像分類技術(shù),除了分類之外,該技術(shù)還可以從自然圖像中的大量預(yù)定義類別中識(shí)別出目標(biāo)實(shí)例的位置。
這種技術(shù)能夠搜索特定種類的物體,如汽車、人、動(dòng)物、鳥類等,并已成功地應(yīng)用于下一代圖像和視頻處理系統(tǒng)中。只有隨著深度學(xué)習(xí)方法的出現(xiàn),這項(xiàng)技術(shù)的最新進(jìn)展才成為可能。
目標(biāo)檢測(cè)技術(shù)可以應(yīng)用于現(xiàn)實(shí)工程中,如人臉檢測(cè)、行人檢測(cè)、車輛檢測(cè)、交通標(biāo)志檢測(cè)、視頻監(jiān)控等。
目標(biāo)檢測(cè)的工作原理
傳統(tǒng)的目標(biāo)檢測(cè)模型主要分為信息區(qū)域選擇、特征提取和分類三個(gè)階段。有幾種流行的基于深度學(xué)習(xí)的目標(biāo)檢測(cè)模型,已被組織和學(xué)術(shù)界用于實(shí)現(xiàn)從圖像中檢測(cè)目標(biāo)的效率和準(zhǔn)確結(jié)果。受歡迎的機(jī)型包括MobileNet、You Only Live One(YOLO)、Mark RCNN、RetinaNet等。
缺點(diǎn)
近幾年來,在受控環(huán)境下的目標(biāo)檢測(cè)問題取得了很大的成功。然而,這個(gè)問題在不受控制的地方仍然沒有得到解決,特別是當(dāng)對(duì)象被放置在雜亂和閉塞的環(huán)境中的任意姿勢(shì)時(shí)。
