<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          深度學(xué)習(xí)行人重識(shí)別綜述與展望,TPAMI 2021 最新文章

          共 5748字,需瀏覽 12分鐘

           ·

          2021-01-11 14:01


          點(diǎn)擊上方小白學(xué)視覺”,選擇加"星標(biāo)"或“置頂

          重磅干貨,第一時(shí)間送達(dá)

          作者 |?葉茫 武漢大學(xué)

          編輯 | CV君

          轉(zhuǎn)自?|?我愛計(jì)算機(jī)視覺(微信id:aicvml)


          摘要:行人重識(shí)別(Person Re-Identification,簡稱Re-ID),是一種利用計(jì)算機(jī)視覺技術(shù)來檢索圖像或者視頻序列中是否存在特定行人的AI技術(shù),在智慧城市等監(jiān)控場景中具有重要的應(yīng)用意義和前景。本文介紹我們最新的IEEE TPAMI綜述論文 《Deep Learning for Person Re-identification: A Survey and Outlook》,該文作者來自武漢大學(xué)、起源人工智能研究院(IIAI)、北理工、英國薩里大學(xué)、Salesforce亞洲研究院。


          首先非常感謝領(lǐng)域內(nèi)的前輩和各位大佬,為該綜述提供了非常充實(shí)的素材和基礎(chǔ)。
          這里先總結(jié)該綜述的幾個(gè)主要貢獻(xiàn)點(diǎn)

          1. 綜述:全面調(diào)研了近年來深度學(xué)習(xí)在 Re-ID 領(lǐng)域的進(jìn)展,囊括了近幾年三大視覺頂會(huì)上的大部分文章(如有遺漏,請諒解)。主要包括 Closed-world Re-IDOpen-world Re-ID 的研究進(jìn)展,常用數(shù)據(jù)集和評價(jià)指標(biāo)的概述,并分析了現(xiàn)有方法的不足和改進(jìn)點(diǎn)。

          2. 展望:1) 一個(gè)新的評價(jià)指標(biāo) mINP,用來評價(jià)找到最困難匹配行人所需要的代價(jià);2) 一個(gè)強(qiáng)有力的 AGW 方法,在四種不同類型的 Re-ID 任務(wù),包括 12個(gè)數(shù)據(jù)集中取得了較好的效果;3) 從五個(gè)不同的方面討論了未來 Re-ID 研究的重點(diǎn)和難點(diǎn),僅供大家參考。


          • 最新版本論文地址:https://arxiv.org/abs/2001.04193v2

          • 論文代碼和評價(jià)指標(biāo)開源地址:https://github.com/mangye16/ReID-Survey


          ? ? ??01??? ??

          前言

          根據(jù)個(gè)人理解,本文總結(jié) Re-ID 技術(shù)的五大步驟

          1. 數(shù)據(jù)采集,一般來源于監(jiān)控?cái)z像機(jī)的原始視頻數(shù)據(jù);

          2. 行人框生成,從視頻數(shù)據(jù)中,通過人工方式或者行人檢測或跟蹤方式將行人從圖中裁切出來,圖像中行人將會(huì)占據(jù)大部分面積;

          3. 訓(xùn)練數(shù)據(jù)標(biāo)注,包含相機(jī)標(biāo)簽和行人標(biāo)簽等其他信息;

          4. 重識(shí)別模型訓(xùn)練,設(shè)計(jì)模型(主要指深度學(xué)習(xí)模型),讓它從訓(xùn)練數(shù)據(jù)中盡可能挖掘“如何識(shí)別不同行人的隱藏特征表達(dá)模式”;

          5. 行人檢索,將訓(xùn)練好的模型應(yīng)用到測試場景中,檢驗(yàn)該模型的實(shí)際效果。


          如下圖所示:


          圖 1. 構(gòu)建行人重識(shí)別系統(tǒng)的五個(gè)主要步驟。包括:1)數(shù)據(jù)采集,2)行人框生成,3)訓(xùn)練數(shù)據(jù)標(biāo)注;4)重識(shí)別模型訓(xùn)練,5)行人檢索


          全文的綜述和展望都是圍繞這五個(gè)步驟來展開和討論的。針對以上五個(gè)步驟的一些約束條件,本文將ReID技術(shù)分為 Closed-world 和?Open-world 兩大子集。Closed-world 概括為大家常見的標(biāo)注完整的有監(jiān)督的行人重識(shí)別方法,Open-world 概括為多模態(tài)數(shù)據(jù),端到端的行人檢索,無監(jiān)督或半監(jiān)督學(xué)習(xí),噪聲標(biāo)注和一些 Open-set 的其他場景。



          ? ? ??02??? ??

          Closed-world Re-ID
          這一章節(jié)主要介紹大家常用的封閉世界(Closed-world)Re-ID 設(shè)置,一般包含以下假設(shè):

          • 通過圖像或視頻,可見光(RGB)攝像機(jī)捕捉行人;

          • 行人由 bounding boxes 框出;

          • 有足夠多的被標(biāo)注訓(xùn)練數(shù)據(jù);

          • 標(biāo)注的數(shù)據(jù)標(biāo)簽通常都是正確的;

          • query person 必須出現(xiàn)在 gallery set 中。


          根據(jù)方法設(shè)計(jì)流程,將其分為特征學(xué)習(xí),度量學(xué)習(xí)和排序優(yōu)化三個(gè)部分。研究人員的方法通常針對這三方面進(jìn)行改進(jìn),側(cè)重點(diǎn)不同。有的是提出了新穎的特征學(xué)習(xí)方法,有的提出有效的度量損失函數(shù),也有的是在測試檢索階段進(jìn)行優(yōu)化。在本章節(jié)末尾,還概括了現(xiàn)有的常用數(shù)據(jù)集和評價(jià)指標(biāo),以及現(xiàn)有 SOTA 的優(yōu)缺點(diǎn)分析。

          2.1 特征學(xué)習(xí)方法


          圖 2. 四種主要的Re-ID特征學(xué)習(xí)方法

          • 全局特征學(xué)習(xí):利用全身的全局圖像來進(jìn)行特征學(xué)習(xí),常見的改進(jìn)思路有Attention 機(jī)制,多尺度融合等;
          • 局部特征學(xué)習(xí):利用局部圖像區(qū)域(行人部件或者簡單的垂直區(qū)域劃分)來進(jìn)行特征學(xué)習(xí),并聚合生成最后的行人特征表示;
          • 輔助特征學(xué)習(xí):利用一些輔助信息來增強(qiáng)特征學(xué)習(xí)的效果,如語義信息(比如行人屬性等)、視角信息(行人在圖像中呈現(xiàn)的不同方位信息)、域信息(比如每一個(gè)攝像頭下的數(shù)據(jù)表示一類域)、GAN 生成的信息(比如生成行人圖像)、數(shù)據(jù)增強(qiáng)等;
          • 視頻特征學(xué)習(xí):利用一些視頻數(shù)據(jù)提取時(shí)序特征,并且融合多幀圖像信息來構(gòu)建行人特征表達(dá)
          • 特定的網(wǎng)絡(luò)設(shè)計(jì):利用 Re-ID 任務(wù)的特性,設(shè)計(jì)一些細(xì)粒度,多尺度等相關(guān)的網(wǎng)絡(luò)結(jié)構(gòu),使其更適用于 Re-ID 的場景。


          2.2 度量學(xué)習(xí)方法


          圖 3. 三種常見的Re-ID度量學(xué)習(xí)(損失函數(shù))方式


          早期的度量學(xué)習(xí)主要是設(shè)計(jì)不同類型的距離/相似度度量矩陣。深度學(xué)習(xí)時(shí)代,主要包括不同類型的損失函數(shù)的設(shè)計(jì)及采樣策略的改進(jìn):

          • Identity Loss:?將 Re-ID 的訓(xùn)練過程當(dāng)成圖像分類問題,同一個(gè)行人的不同圖片當(dāng)成一個(gè)類別,常見的有 Softmax 交叉熵?fù)p失函數(shù);
          • Verification Loss:將 Re-ID 的訓(xùn)練當(dāng)成圖像匹配問題,是否屬于同一個(gè)行人來進(jìn)行二分類學(xué)習(xí),常見的有對比損失函數(shù),二分類損失函數(shù);
          • Triplet Loss:將 Re-ID 的訓(xùn)練當(dāng)成圖像檢索問題,同一個(gè)行人圖片的特征距離要小于不同行人的特征距離,以及其各種改進(jìn);
          • 訓(xùn)練策略的改進(jìn):自適應(yīng)的采樣方式(樣本不均衡,難易程度)以及不同的權(quán)重分配策略


          2.3 排序優(yōu)化


          用學(xué)習(xí)好的 Re-ID 特征得到初始的檢索排序結(jié)果后,利用圖片之間的相似性關(guān)系來進(jìn)行初始的檢索結(jié)果優(yōu)化,主要包括重排序(re-ranking)和排序融合(rank fusion)等。

          圖 4. 重排序示例


          2.4 數(shù)據(jù)集和評價(jià)


          主要包括現(xiàn)有的一些常用圖像和視頻數(shù)據(jù)集的概括,以及現(xiàn)有方法 SOTA 的一些總結(jié)和分析,希望綜述里面的一些分析能夠在大家進(jìn)行模型設(shè)計(jì)時(shí)提供一些思路和幫助。具體分析詳見原文。


          ? ? ??03??? ??

          Open-World Re-ID
          由于常規(guī)的 Closed-world Re-ID 在有監(jiān)督的實(shí)驗(yàn)場景中已經(jīng)達(dá)到或接近瓶頸了,現(xiàn)在很多的研究都更偏向于 Open-World Re-ID 場景,也是當(dāng)前Re-ID研究的熱點(diǎn)。

          根據(jù) Re-ID 系統(tǒng)設(shè)計(jì)的五個(gè)步驟,本章節(jié)也從以下五個(gè)方面介紹:

          • 多模態(tài)數(shù)據(jù),所采集的數(shù)據(jù)不是單一的可見光模態(tài);

          • 端到端的行人檢索(End-to-end Person Search),沒有預(yù)先檢測或跟蹤好的行人圖片/視頻;

          • 無監(jiān)督和半監(jiān)督學(xué)習(xí),標(biāo)注數(shù)據(jù)有限或者無標(biāo)注的新場景;

          • 噪聲標(biāo)注的數(shù)據(jù),即使有標(biāo)注,但是數(shù)據(jù)采集和標(biāo)注過程中存在噪聲或錯(cuò)誤;

          • 一些其他 Open-set 場景,查詢行人找不到,群體重識(shí)別,動(dòng)態(tài)的多攝像頭網(wǎng)絡(luò)等。


          3.1 多模態(tài)(異構(gòu))數(shù)據(jù)


          • 基于深度圖像 Re-ID:旨在利用深度圖信息的匹配(融合或跨模態(tài)匹配),在很多人機(jī)交互的室內(nèi)場景應(yīng)用中非常重要;
          • 文本到圖像 Re-ID:旨在利用文字語言描述來搜索特定的行人圖像,解決實(shí)際場景中查詢行人圖像缺失等問題;
          • 可見光到紅外 Re-ID:旨在跨模態(tài)匹配白天的可見光圖像到夜晚的紅外行人圖像,也有一些方法直接解決低照度的重識(shí)別任務(wù);
          • 跨分辨率 Re-ID:不同高低分辨率行人圖像匹配,旨在解決不同距離攝像頭下行人分辨率差異巨大等問題


          總體而言,異構(gòu)的行人重識(shí)別問題需要解決的一大難題是不同模態(tài)數(shù)據(jù)之間的差異性問題


          3.2 端到端Re-ID(End-to-end Person Search)


          • 純圖像/視頻的 Re-ID;從原始 raw 圖像或者視頻中直接檢索出行人;
          • 多攝像頭跟蹤的 Re-ID;跨攝像頭跟蹤,也是很多產(chǎn)業(yè)化應(yīng)用的重點(diǎn)。


          3.3 半監(jiān)督和無監(jiān)督的 Re-ID


          為了緩解對標(biāo)注數(shù)據(jù)的依賴,半監(jiān)督和無監(jiān)督/自監(jiān)督現(xiàn)在成為了當(dāng)前研究的熱點(diǎn),在 CV 頂會(huì)上呈爆炸之勢。本文也主要分成兩個(gè)部分:無監(jiān)督 Re-ID(不需要標(biāo)注的源域)和無監(jiān)督域自適應(yīng) Re-ID(需要標(biāo)注的源域數(shù)據(jù)或模型):

          • 無監(jiān)督 Re-ID:主要包括一些跨攝像頭標(biāo)簽估計(jì)(聚類或圖匹配等)的方法,以及一些其他監(jiān)督信息挖掘的方法(如local patch相似性等);
          • 無監(jiān)督域自適應(yīng) Re-ID:包括一些目標(biāo)域圖像數(shù)據(jù)生成和一些目標(biāo)域監(jiān)督信息挖掘等方式。

          考慮到無監(jiān)督學(xué)習(xí)也是現(xiàn)在研究的熱點(diǎn),本文也對現(xiàn)有的 SOTA 做了一個(gè)簡單的總結(jié)和分析,可以看到現(xiàn)在的無監(jiān)督學(xué)習(xí)方法已經(jīng)是效果驚人了,未來可期。


          如下表所示:

          表 1. 現(xiàn)有無監(jiān)督學(xué)習(xí)方法在常見數(shù)據(jù)集上的效果


          3.4 噪聲魯棒的Re-ID


          主要針對標(biāo)注數(shù)據(jù)或者數(shù)據(jù)采集中產(chǎn)生的一些噪聲或錯(cuò)誤等,方法包括:

          • Partial Re-ID:解決行人圖像區(qū)域部分被遮擋的行人重識(shí)別問題;
          • Noise Sample:主要針對行人圖像或視頻中檢測、跟蹤產(chǎn)生的錯(cuò)誤或偏差
          • Noise Label:主要針對行人標(biāo)簽標(biāo)注產(chǎn)生的錯(cuò)誤


          3.5 Open-set Re-ID and Beyond


          主要針對一些其他開放場景進(jìn)行一些探討,如1)gallery set 中 query 行人沒有出現(xiàn)的場景;2)Group Re-ID:行人群體匹配的問題;3)動(dòng)態(tài)的多攝像頭網(wǎng)絡(luò)匹配等問題


          ? ? ??04??? ??

          展望

          4.1 新的評價(jià)指標(biāo)mINP:


          考慮到實(shí)際場景中,目標(biāo)人物具有隱匿性,很多時(shí)候要找到其困難目標(biāo)都非常難,給偵查工作帶來麻煩。mINP 主要目的是為了衡量 Re-ID 算法用來找到最難匹配樣本所要付出的代價(jià),


          其計(jì)算方式跟 mAP 一樣非常簡單,應(yīng)該還是對評價(jià) Re-ID 效果有一定補(bǔ)充作用。簡單來講,排名倒數(shù)第一的正確樣本位置越靠后,人工排查干預(yù)的代價(jià)越大,mINP的值越小。這里感謝 Fast-ReID(github.com/JDAI-CV/fast?)項(xiàng)目對我們評價(jià)指標(biāo)和方法的集成。


          4.2 新的基準(zhǔn)方法AGW


          主要是在@羅浩 的Bag of tricks(感謝)上做的一些改進(jìn),主要包括:

          • Non-local注意力機(jī)制的融合;

          • Generalized-mean (GeM) Pooling的細(xì)粒度特征提取;

          • 加權(quán)正則化的三元組損失(Weighted Regularization Triplet (WRT) loss)


          圖 5. AGW 方法的示意圖


          在審稿人的建議下,我們在四種不同類型的任務(wù)(圖像Re-ID, 視頻Re-ID,跨模態(tài)紅外Re-ID和Partial Re-ID)的12個(gè)數(shù)據(jù)集上均對我們提出的新指標(biāo)mINP和AGW方法進(jìn)行了測評,在大多數(shù)情況下,我們的方法都能夠取得比較好的效果。具體的實(shí)驗(yàn)結(jié)果和分析可以參考我們的論文和補(bǔ)充材料,希望我們的方法和評價(jià)指標(biāo)能對大家有一些幫助。


          4.3 對未來一些研究方向的思考


          這一部分也是緊扣前面提出的五個(gè)步驟,針對五個(gè)步驟未來亟待解決的關(guān)鍵問題或者熱點(diǎn)問題進(jìn)行歸納。由于每個(gè)人理解上的認(rèn)知偏差,這里的建議僅供大家參考:

          • 不可控的數(shù)據(jù)采集不確定多種模態(tài)混合的 Re-ID,而不是固定的模態(tài)設(shè)置;換裝的 Re-ID,2020 年已經(jīng)有好幾個(gè)新的數(shù)據(jù)集;
          • 減少人工標(biāo)注依賴:人機(jī)交互的主動(dòng)學(xué)習(xí),選擇性的標(biāo)注;從虛擬數(shù)據(jù)進(jìn)行學(xué)習(xí)(Learning from virtual data),如何解決虛擬數(shù)據(jù)中的domain gap;
          • 面向 Re-ID 通用網(wǎng)絡(luò)設(shè)計(jì):Domain Generalized Re-ID,如何設(shè)計(jì)一種在未知場景中也表現(xiàn)優(yōu)異的模型,如何利用自動(dòng)化機(jī)器學(xué)習(xí)來設(shè)計(jì)針對 Re-ID 任務(wù)的網(wǎng)絡(luò)模型;
          • 動(dòng)態(tài)的模型更新:如何以小的代價(jià)將學(xué)習(xí)好的網(wǎng)絡(luò)模型微調(diào)至新攝像頭場景中;如何高效的利用新采集的數(shù)據(jù)(Newly Arriving Data)來更新之前已訓(xùn)練好的模型;
          • 高效的模型部署:輕量型快速的行人重識(shí)別算法設(shè)計(jì),自適應(yīng)的針對不同類型的硬件配置(小型的移動(dòng)手機(jī)和大型服務(wù)器)調(diào)整模型。

          后記:很多內(nèi)容在這里都沒辦詳細(xì)描述,具體的細(xì)節(jié)還請大家移步原文、補(bǔ)充材料以及源代碼。因能力有限,部分描述不一定完全客觀正確,希望大家能夠理解。希望我們的綜述能夠給領(lǐng)域內(nèi)的同行提供一些幫助和借鑒。再次感謝各位同行和前輩!歡迎各位批評指正!


          下載1:OpenCV-Contrib擴(kuò)展模塊中文版教程
          在「小白學(xué)視覺」公眾號后臺(tái)回復(fù):擴(kuò)展模塊中文教程,即可下載全網(wǎng)第一份OpenCV擴(kuò)展模塊教程中文版,涵蓋擴(kuò)展模塊安裝、SFM算法、立體視覺、目標(biāo)跟蹤、生物視覺、超分辨率處理等二十多章內(nèi)容。

          下載2:Python視覺實(shí)戰(zhàn)項(xiàng)目31講
          小白學(xué)視覺公眾號后臺(tái)回復(fù):Python視覺實(shí)戰(zhàn)項(xiàng)目31講即可下載包括圖像分割、口罩檢測、車道線檢測、車輛計(jì)數(shù)、添加眼線、車牌識(shí)別、字符識(shí)別、情緒檢測、文本內(nèi)容提取、面部識(shí)別等31個(gè)視覺實(shí)戰(zhàn)項(xiàng)目,助力快速學(xué)校計(jì)算機(jī)視覺。

          下載3:OpenCV實(shí)戰(zhàn)項(xiàng)目20講
          小白學(xué)視覺公眾號后臺(tái)回復(fù):OpenCV實(shí)戰(zhàn)項(xiàng)目20講,即可下載含有20個(gè)基于OpenCV實(shí)現(xiàn)20個(gè)實(shí)戰(zhàn)項(xiàng)目,實(shí)現(xiàn)OpenCV學(xué)習(xí)進(jìn)階。

          下載4:leetcode算法開源書
          小白學(xué)視覺公眾號后臺(tái)回復(fù):leetcode,即可下載。每題都 runtime beats 100% 的開源好書,你值得擁有!





          交流群


          歡迎加入公眾號讀者群一起和同行交流,目前有SLAM、三維視覺、傳感器自動(dòng)駕駛、計(jì)算攝影、檢測、分割、識(shí)別、醫(yī)學(xué)影像、GAN、算法競賽等微信群(以后會(huì)逐漸細(xì)分),請掃描下面微信號加群,備注:”昵稱+學(xué)校/公司+研究方向“,例如:”張三?+?上海交大?+?視覺SLAM“。請按照格式備注,否則不予通過。添加成功后會(huì)根據(jù)研究方向邀請進(jìn)入相關(guān)微信群。請勿在群內(nèi)發(fā)送廣告,否則會(huì)請出群,謝謝理解~


          瀏覽 44
          點(diǎn)贊
          評論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          評論
          圖片
          表情
          推薦
          點(diǎn)贊
          評論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  黄色一级免费看 | 午夜18 视频在线观看 | 亚欧天堂在线 | 北条麻妃在线观看免费91 | 99人妻精品 |