目標(biāo)跟蹤入門篇-相關(guān)濾波
點(diǎn)擊下方卡片,關(guān)注“新機(jī)器視覺”公眾號(hào)
視覺/圖像重磅干貨,第一時(shí)間送達(dá)
本文來源:AI干貨知識(shí)庫,轉(zhuǎn)載自智車科技。文章僅用于學(xué)術(shù)交流。
/ 導(dǎo)讀 /
目標(biāo)跟蹤是計(jì)算機(jī)視覺領(lǐng)域的一個(gè)重要問題,目前廣泛應(yīng)用在體育賽事轉(zhuǎn)播、安防監(jiān)控和無人機(jī)、無人車、機(jī)器人等領(lǐng)域。
簡(jiǎn)單來說,目標(biāo)跟蹤就是在連續(xù)的視頻序列中,建立所要跟蹤物體的位置關(guān)系,得到物體完整的運(yùn)動(dòng)軌跡。給定圖像第一幀的目標(biāo)坐標(biāo)位置,計(jì)算在下一幀圖像中目標(biāo)的確切位置。在運(yùn)動(dòng)的過程中,目標(biāo)可能會(huì)呈現(xiàn)一些圖像上的變化,比如姿態(tài)或形狀的變化、尺度的變化、背景遮擋或光線亮度的變化等。目標(biāo)跟蹤算法的研究也圍繞著解決這些變化和具體的應(yīng)用展開。
目前目標(biāo)跟蹤的難點(diǎn)主要包含:
形態(tài)變化 - 姿態(tài)變化是目標(biāo)跟蹤中常見的干擾問題。運(yùn)動(dòng)目標(biāo)發(fā)生姿態(tài)變化時(shí), 會(huì)導(dǎo)致它的特征以及外觀模型發(fā)生改變, 容易導(dǎo)致跟蹤失敗。例如:體育比賽中的運(yùn)動(dòng)員、馬路上的行人。
尺度變化 - 尺度的自適應(yīng)也是目標(biāo)跟蹤中的關(guān)鍵問題。當(dāng)目標(biāo)尺度縮小時(shí), 由于跟蹤框不能自適應(yīng)跟蹤, 會(huì)將很多背景信息包含在內(nèi), 導(dǎo)致目標(biāo)模型的更新錯(cuò)誤;當(dāng)目標(biāo)尺度增大時(shí), 由于跟蹤框不能將目標(biāo)完全包括在內(nèi), 跟蹤框內(nèi)目標(biāo)信息不全, 也會(huì)導(dǎo)致目標(biāo)模型的更新錯(cuò)誤。因此, 實(shí)現(xiàn)尺度自適應(yīng)跟蹤是十分必要的。
遮擋與消失 - 目標(biāo)在運(yùn)動(dòng)過程中可能出現(xiàn)被遮擋或者短暫的消失情況。當(dāng)這種情況發(fā)生時(shí), 跟蹤框容易將遮擋物以及背景信息包含在跟蹤框內(nèi), 會(huì)導(dǎo)致后續(xù)幀中的跟蹤目標(biāo)漂移到遮擋物上面。若目標(biāo)被完全遮擋時(shí), 由于找不到目標(biāo)的對(duì)應(yīng)模型, 會(huì)導(dǎo)致跟蹤失敗。
圖像模糊 - 光照強(qiáng)度變化, 目標(biāo)快速運(yùn)動(dòng), 低分辨率等情況會(huì)導(dǎo)致圖像模型, 尤其是在運(yùn)動(dòng)目標(biāo)與背景相似的情況下更為明顯。因此, 選擇有效的特征對(duì)目標(biāo)和背景進(jìn)行區(qū)分非常必要。

目標(biāo)跟蹤算法發(fā)展
相比于光流法、Kalman、Meanshift 等傳統(tǒng)算法,相關(guān)濾波類算法跟蹤速度更快,深度學(xué)習(xí)類方法精度高。
具有多特征融合以及深度特征的追蹤器在跟蹤精度方面的效果更好。
使用強(qiáng)大的分類器是實(shí)現(xiàn)良好跟蹤的基礎(chǔ)。
尺度的自適應(yīng)以及模型的更新機(jī)制也影響著跟蹤的精度。
相關(guān)濾波器思想
相關(guān)濾波器發(fā)展
MOSSE
CSK
CSK針對(duì)MOSSE算法中采用稀疏采樣造成樣本冗余的問題,擴(kuò)展了嶺回歸、基于循環(huán)移位的近似密集采樣方法、以及核方法。MOSSE與CSK處理的都是單通道灰度圖像,引入了循環(huán)移位和快速傅里葉變換,極大地提高了算法的計(jì)算效率。但是離散傅里葉變換也帶來了一個(gè)副作用:邊界效應(yīng)。
針對(duì)邊界效應(yīng),有2個(gè)典型處理方法:在圖像上疊加余弦窗調(diào)制;增加搜索區(qū)域的面積。加余弦窗的方法,使搜索區(qū)域邊界的像素值接近0,消除邊界的不連續(xù)性。余弦窗的引入也帶來了缺陷: 減小了有效搜索區(qū)域。例如在檢測(cè)階段,如果目標(biāo)不在搜索區(qū)域中心,部分目標(biāo)像素會(huì)被過濾掉。如果目標(biāo)的一部分已經(jīng)移出了這個(gè)區(qū)域,很可能就過濾掉僅存的目標(biāo)像素。其作用表現(xiàn)為算法難以跟蹤快速運(yùn)動(dòng)的目標(biāo)。擴(kuò)大搜索區(qū)域能緩解邊界效應(yīng),并提高跟蹤快速移動(dòng)目標(biāo)的能力。但缺陷是會(huì)引入更多的背景信息,可能造成跟蹤漂移。
CN
CN在CSK的基礎(chǔ)上擴(kuò)展了多通道顏色。將RGB的3通道圖像投影到11個(gè)顏色通道,分別對(duì)應(yīng)英語中常用的語言顏色分類,分別是black, blue, brown, grey, green, orange, pink, purple, red, white, yellow,并歸一化得到10通道顏色特征。也可以利用PCA方法,將CN降維到2維。
DCF KCF
從DCF到KCF多了Gaussian-kernel,performance上升0.21%,fps下降46.46%,kernel-trick雖然有用但影響較小,如果注重速度可以摒棄,如果追求極限性能可以用。KCF可以說是對(duì)CSK的完善。論文中對(duì)嶺回歸、循環(huán)矩陣、核技巧、快速檢測(cè)等做了完整的數(shù)學(xué)推導(dǎo)。KCF在CSK的基礎(chǔ)上擴(kuò)展了多通道特征。KCF采用的HoG特征,核函數(shù)有三種高斯核、線性核和多項(xiàng)式核,高斯核的精確度最高,線性核略低于高斯核,但速度上遠(yuǎn)快于高斯核。
SAMF
SAMF基于KCF,特征是HoG+CN。SAMF實(shí)現(xiàn)多尺度目標(biāo)跟蹤的方法比較直接,類似檢測(cè)算法里的多尺度檢測(cè)方法。由平移濾波器在多尺度縮放的圖像塊上進(jìn)行目標(biāo)檢測(cè),取響應(yīng)最大的那個(gè)平移位置及所在尺度。因此這種方法可以同時(shí)檢測(cè)目標(biāo)中心變化和尺度變化。
DSST fDSST
從DSST到fDSST做了特征壓縮和scale filter加速即特征降維和插值,performance上升6.13%,fps上升83.37%。
DSST將目標(biāo)跟蹤看成目標(biāo)中心平移和目標(biāo)尺度變化兩個(gè)獨(dú)立問題。首先用HoG特征的DCF訓(xùn)練平移相關(guān)濾波,負(fù)責(zé)檢測(cè)目標(biāo)中心平移。然后用HoG特征的MOSSE(這里與DCF的區(qū)別是不加padding)訓(xùn)練另一個(gè)尺度相關(guān)濾波,負(fù)責(zé)檢測(cè)目標(biāo)尺度變化。2017年發(fā)表的文章又提出了加速版本fDSST。
尺度濾波器僅需要檢測(cè)出最佳匹配尺度而無須關(guān)心平移情況,其計(jì)算原理如圖。DSST將尺度檢測(cè)圖像塊全部縮小到同一個(gè)尺寸計(jì)算特征(CN+HoG),再將特征表示成一維(沒有循環(huán)移位),尺度檢測(cè)的響應(yīng)圖也是一維的高斯函數(shù)。

DSST本來就是對(duì)尺度自適應(yīng)問題的快速解決方案(支持33個(gè)尺度還比SAMF快很多),在fDSST中MD大神又對(duì)DSST進(jìn)行加速:
平移濾波器:PCA 方法將平移濾波器的 HOG 特征從 31 通道降維到 18 通道,這一步驟與上面的 CN 特征類似,直接用 PCA 進(jìn)行降維,作者提到由于這里用了線性核,所以不需要 CN 中所用的平滑子空間約束,更加簡(jiǎn)單粗暴。由于 HOG 特征天然會(huì)降低響應(yīng)分辨率(cell_size=4),這里也采用簡(jiǎn)單粗暴的方法,將響應(yīng)圖的分辨率上采樣到原始圖像分辨率,也就是響應(yīng)圖插值以提高檢測(cè)精度,方法是三角插值,等價(jià)于頻譜添 0,方法更加簡(jiǎn)單粗暴,但這一步會(huì)增加算法復(fù)雜度,而且方法太簡(jiǎn)單也必然效果較差。
尺度濾波器:QR 方法將尺度濾波器的 HOG 特征(二特征,沒有循環(huán)移位)~100017 降維到 1717,由于自相關(guān)矩陣維度較大影響速度,為了效率這里沒有用 PCA 而是 QR 分解。多尺度數(shù)量是 17(DSST 中的一半),響應(yīng)圖是 1*17,這里也通過插值方法將尺度數(shù)量從 17 插值到 33 以獲得更精確的尺度定位。
SRDCF
SRDCF與CFLB的思路都是擴(kuò)大搜索區(qū)域,同時(shí)約束濾波模板的有效作用域解決邊界效應(yīng)。給濾波模板增加一個(gè)約束,對(duì)接近邊界的區(qū)域懲罰更大,或者說讓邊界附近濾波模板系數(shù)接近0,速度比較慢。
CFLB/BACF
使搜索區(qū)域內(nèi),目標(biāo)區(qū)域以外的像素為0,CFLB僅使用單通道灰度特征,最新BACF將特征擴(kuò)展為多通道HOG特征。CFLB和BACF采用Alternating Direction Method of Multipliers(ADMM)快速求解。
DAT
不是一種相關(guān)濾波方法,而是一種基于顏色統(tǒng)計(jì)特征方法。DAT統(tǒng)計(jì)前景目標(biāo)和背景區(qū)域的顏色直方圖,這就是前景和背景的顏色概率模型,檢測(cè)階段,利用貝葉斯方法判別每個(gè)像素屬于前景的概率,得到像素級(jí)顏色概率圖
STAPLE STAPLE+CA
從Staple到STAPLE+CA加入Context-Aware約束項(xiàng),performance上升3.28%,fps下降43.18%,說明約束項(xiàng)有效,但犧牲了大量fps。STAPLE結(jié)合了模板特征方法DSST和顏色統(tǒng)計(jì)特征方法DAT。
相關(guān)濾波模板類特征(HOG)對(duì)快速變形和快速運(yùn)動(dòng)效果不好,但對(duì)運(yùn)動(dòng)模糊光照變化等情況比較好;而顏色統(tǒng)計(jì)特征(DAT)對(duì)變形不敏感,而且不屬于相關(guān)濾波框架沒有邊界效應(yīng),但對(duì)光照變化和背景相似顏色不好。因此,這兩類方法可以互補(bǔ)。
C-COT
圖像特征的表達(dá)能力在目標(biāo)跟蹤中起著至關(guān)重要的作用。以HoG+CN為代表的圖像特征,性能優(yōu)秀而且速度優(yōu)勢(shì)非常突出,但也成為性能進(jìn)一步提升的瓶頸。
以卷積神經(jīng)網(wǎng)絡(luò)(CNN)為代表的深度特征,具有更強(qiáng)大特征表達(dá)能力、泛化能力和遷移能力。將深度特征引入相關(guān)濾波也就水到渠成。
LMCF
LMCF提出了兩個(gè)方法,多峰目標(biāo)檢測(cè)和高置信度更新。多峰目標(biāo)檢測(cè)對(duì)平移檢測(cè)的響應(yīng)圖做多峰檢測(cè),如果其他峰峰值與主峰峰值的比例大于某個(gè)閾值,說明響應(yīng)圖是多峰模式,以這些多峰為中心重新檢測(cè),并取這些響應(yīng)圖的最大值作為最終目標(biāo)位置。
高置信度更新:只有在跟蹤置信度比較高的時(shí)候才更新跟蹤模型,避免目標(biāo)模型被污染。一個(gè)置信度指標(biāo)是最大響應(yīng)。另一個(gè)置信度指標(biāo)是平均峰值相關(guān)能量(average peak-to correlation energy, APCE),反應(yīng)響應(yīng)圖的波動(dòng)程度和檢測(cè)目標(biāo)的置信水平。
CSR-DCF
提出了空域可靠性和通道可靠性方法??沼蚩煽啃岳脠D像分割方法,通過前背景顏色直方圖概率和中心先驗(yàn)計(jì)算空域二值約束掩膜。這里的二值掩膜就類似于CFLB中的掩膜矩陣P。CSR-DCF利用圖像分割方法更準(zhǔn)確地選擇有效的跟蹤目標(biāo)區(qū)域。通道可靠性用于區(qū)分檢測(cè)時(shí)每個(gè)通道的權(quán)重。
ECO ECO-HC
ECO是C-COT的加速版,從模型大小、樣本集大小和更新策略三個(gè)方便加速,速度比C-COT提升了20倍,加量還減價(jià),在VOT2016數(shù)據(jù)庫上EAO提升了13.3%,當(dāng)然最厲害的還是hand-crafted features版本的ECO-HC有60FPS,接下來分別看看這三步。
第一減少模型參數(shù),既然CN特征和HOG特征都能降維,那卷積特征是不是也可以試試?這就是ECO中的加速第一步,也是最關(guān)鍵的一步,F(xiàn)actorized Convolution Operator分解卷積操作,效果類似PCA,但Conv. Feat.與前面的CN和HOG又不一樣:
CNN 特征維度過于龐大,在 C-COT 中是 96+512=608 通道,需要降很多很多維才能保證速度,而無監(jiān)督降維如果太多會(huì)直接影響效果(對(duì)比通用方法 - 取特征值的 95%以上的維度,保留信息量);
雖然 CNN 特征遷移能力比較強(qiáng),但這并不是針對(duì)跟蹤問題專門訓(xùn)練的特征,對(duì)跟蹤問題有用的信息隱藏在大量 CNN 激活值中,如果簡(jiǎn)單的無監(jiān)督降維,可能會(huì)過濾掉那些雖然不顯著,但對(duì)跟蹤問題有效的特征信息。當(dāng)然 HOG 和 CN 特征也有同樣的問題。
通過使用PCA, 有監(jiān)督降維:
—版權(quán)聲明—
僅用于學(xué)術(shù)分享,版權(quán)屬于原作者。
若有侵權(quán),請(qǐng)聯(lián)系微信號(hào):yiyang-sy 刪除或修改!
