弱監(jiān)督方法在森林病蟲(chóng)害檢測(cè)中的應(yīng)用
【GiantPandaCV導(dǎo)語(yǔ)】這篇文章主要從兩個(gè)方面討論了弱監(jiān)督方法在森林病蟲(chóng)害檢測(cè)中實(shí)際應(yīng)用效果:弱監(jiān)督的實(shí)質(zhì)是什么,它與傳統(tǒng)監(jiān)督方式的區(qū)別是什么?
以及弱監(jiān)督為什么能應(yīng)用到森林病蟲(chóng)害檢測(cè)中? 這兩個(gè)切入點(diǎn)分別來(lái)自于讀文章最后的兩篇論文的思考和理解,希望能為對(duì)做病蟲(chóng)害檢測(cè)的讀者提供思路。
弱監(jiān)督的實(shí)質(zhì)是什么,它與傳統(tǒng)監(jiān)督方式有什么區(qū)別
(1)“弱監(jiān)督”并不弱:
弱監(jiān)督的概念主要針對(duì)少標(biāo)記樣本或者無(wú)標(biāo)記樣本的分類情況而言,其實(shí)質(zhì)是充分利用卷積層所具有的定位能力來(lái)實(shí)現(xiàn)無(wú)label條件下的圖像分類任務(wù),從而解決實(shí)際分類場(chǎng)景中標(biāo)記樣本獲取難的問(wèn)題。
傳統(tǒng)的監(jiān)督方式依賴于大量的標(biāo)記樣本,針對(duì)圖像級(jí)別的標(biāo)記還較容易獲得,但是像素級(jí)別的標(biāo)注將耗費(fèi)更多的時(shí)間,這無(wú)疑給分類任務(wù)增加了時(shí)間成本。弱監(jiān)督方法的提出使得基于大量標(biāo)記樣本的訓(xùn)練方式得到轉(zhuǎn)變,人們開(kāi)始探索僅基于易獲得標(biāo)簽(圖像級(jí))來(lái)實(shí)現(xiàn)圖像中特定目標(biāo)的識(shí)別與分割(simple to complex;multi-dilated convolution)。實(shí)現(xiàn)這一目標(biāo)的關(guān)鍵是如何構(gòu)建圖像標(biāo)簽和像素之間的關(guān)聯(lián),而這種關(guān)聯(lián)的實(shí)質(zhì)是建立標(biāo)簽與像素的映射關(guān)系,而這種關(guān)系的體現(xiàn)往往需要給圖像像素賦予相對(duì)重要值,2016年發(fā)表在CVPR上的一篇文章(CAM)發(fā)現(xiàn),分類網(wǎng)絡(luò)可以通過(guò)Top-down的方式定位出圖片上的哪些區(qū)域?qū)ξ矬w分類的貢獻(xiàn)較大,而這些區(qū)域往往屬于對(duì)應(yīng)語(yǔ)義的物體[1]。該研究對(duì)卷積特征映射執(zhí)行全局平均池化(GAP),并將這些特征用于產(chǎn)生所需輸出(分類或其他)的全連接層。基于這種簡(jiǎn)單的連接結(jié)構(gòu),可以通過(guò)將輸出層的權(quán)值投影到卷積特征映射上來(lái)識(shí)別圖像區(qū)域的重要性,這種技術(shù)我們稱之為類激活映射(CAM)。

類激活映射
當(dāng)人去識(shí)別一張圖像中所包含的常見(jiàn)對(duì)象時(shí),往往只需要關(guān)注對(duì)象的主要特征就能判別,這種生成熱力圖的方式與人類識(shí)別的過(guò)程很相似,研究通過(guò)訓(xùn)練后的模型來(lái)反演出機(jī)器所關(guān)注的主要特征映射,這種直覺(jué)的顯示方式使得分類結(jié)果更加容易理解,而且其實(shí)現(xiàn)方式也十分的簡(jiǎn)便。文中在分類前,對(duì)各個(gè)特征執(zhí)行全局平局池化操作,對(duì)特征圖中的數(shù)字求平均值,從而將特征圖轉(zhuǎn)換為單個(gè)數(shù)字W,這些值通過(guò)全連接層轉(zhuǎn)換為分類概率值,單從貓的類輸出來(lái)看,對(duì)應(yīng)W1,W2,W3三個(gè)權(quán)重,這三個(gè)權(quán)重將全局池化輸出連接到“貓”輸出節(jié)點(diǎn)。

最后一步是得到類激活映射可視化熱力圖,公式如下:

(2)全局平均池化與全局最大池化的比較
研究證明了全局平均池化在定位中的優(yōu)勢(shì)。文中指出,當(dāng)對(duì)映射進(jìn)行平均時(shí),所有低值都會(huì)減少特定映射的輸出。另一方面,對(duì)于全局最大池化(GMP),除了最具鑒別能力的區(qū)域外,所有圖像區(qū)域的低值并不影響分?jǐn)?shù),因?yàn)橹粓?zhí)行一個(gè)最大值操作。但是實(shí)驗(yàn)中經(jīng)過(guò)全局平均池化與全局最大池化操作的GoogleNet模型在分類精度上相似,這可能與池化的窗口的大小有關(guān),單一的小窗口可能并不能顯著體現(xiàn)全局平均池化與最大池化在查找對(duì)象主要特征的差別。

(3)該實(shí)驗(yàn)還發(fā)現(xiàn),當(dāng)GAP之前的最后一個(gè)卷積層具有更高的空間分辨率時(shí),網(wǎng)絡(luò)的定位能力有所提高。這給結(jié)合低層高分辨率特征來(lái)改進(jìn)實(shí)驗(yàn)方法提供了思路。
弱監(jiān)督為什么能應(yīng)用到森林病蟲(chóng)害檢測(cè)中?
弱監(jiān)督檢測(cè)方式可以利用圖像級(jí)標(biāo)簽實(shí)現(xiàn)像素級(jí)對(duì)象的識(shí)別
受限于實(shí)際調(diào)查樣地的復(fù)雜環(huán)境,使得病害木實(shí)際標(biāo)記樣本難以獲得,在沒(méi)有足夠標(biāo)記樣本的情況下,采用圖像級(jí)標(biāo)簽是唯一標(biāo)記來(lái)源,通過(guò)判別遙感圖像上是否包含病害木,來(lái)定義圖像的類別屬性。受到CAM的啟發(fā),Rui Qiao等人在識(shí)別馬尾松松材線蟲(chóng)病害木的研究過(guò)程中,證實(shí)了CAM在目標(biāo)定位的良好表現(xiàn)[2]。

受到病害影響的樹(shù)木冠層具有一定的表征變化,比如落葉、變色等現(xiàn)象,這使得病害木與背景之間具有可分離特征,為利用卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行目標(biāo)檢測(cè)提供了先決條件。下圖展示了病害木實(shí)際位置與對(duì)應(yīng)的熱力圖,其高概率區(qū)域多分布在冠層中心區(qū)域。

病害木的檢測(cè)方法要不分割要不就是定位,生成的熱力圖的方式正好有利于定位局部范圍,這給病害木的識(shí)別提供了技術(shù)支持。而且這種定位結(jié)果更加關(guān)注病害木的中心特征,這也更利于提取周圍噪聲的影響,使得檢測(cè)結(jié)果更加匹配真實(shí)位置。
參考文獻(xiàn)
[1] Zhou, B. , Khosla, A. , Lapedriza, A. , Oliva, A. , & Torralba, A. (2016). Learning deep features for discriminative localization. IEEE Computer Society.
[2] Rui Qiao , Ali Ghodsi , Honggan Wu , Yuanfei Chang & Chengbo Wang. (2020). Simple weakly supervised deep learning pipeline for detecting individual red-attacked trees in VHR remote sensing images.Remote Sensing Letters.
歡迎關(guān)注GiantPandaCV, 在這里你將看到獨(dú)家的深度學(xué)習(xí)分享,堅(jiān)持原創(chuàng),每天分享我們學(xué)習(xí)到的新鮮知識(shí)。( ? ?ω?? )?
有對(duì)文章相關(guān)的問(wèn)題,或者想要加入交流群,歡迎添加BBuf微信:
