>加入極市C..." />
<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          CVPR 2020 視覺定位挑戰(zhàn)賽冠軍方案解讀

          共 3133字,需瀏覽 7分鐘

           ·

          2020-10-29 02:39

          ↑ 點擊藍(lán)字?關(guān)注極市平臺

          作者丨Realcat
          來源丨?計算機視覺SLAM
          編輯丨極市平臺

          極市導(dǎo)讀

          ?

          本文介紹了今年CVPR視覺定位挑戰(zhàn)賽的冠軍方案,詳細(xì)介紹了本次賽題:如何在場景變化時進(jìn)行定位,以及冠軍方案思路。?>>加入極市CV技術(shù)交流群,走在計算機視覺的最前沿


          關(guān)于視覺定位挑戰(zhàn)賽


          視覺定位是一個估計6自由度(DoF)相機姿態(tài)的問題,從中獲取一個給定的圖像相對于一個參考場景表示視覺定位是增強、混合和虛擬現(xiàn)實等應(yīng)用以及機器人技術(shù)(如自動駕駛汽車)的關(guān)鍵技術(shù)。

          為了評估較長時間內(nèi)的視覺定位,官方提供了基準(zhǔn)數(shù)據(jù)集,旨在評估由季節(jié)(夏季、冬季、春季等)和照明(黎明、白天、日落、夜晚)條件變化引起的較大外觀變化的6自由度姿態(tài)估計精度。每個數(shù)據(jù)集由一組參考圖像及其相應(yīng)的地面真實姿態(tài)和一組查詢圖像組成。官方為每個數(shù)據(jù)集提供一個三角化的三維模型,并可用于基于結(jié)構(gòu)的定位方法。

          主頁地址[1]:

          https://www.visuallocalization.net


          難點


          上面官方介紹中已經(jīng)說明,該比賽的難點就是如何在場景變化時進(jìn)行定位。場景變化主要在光照變化以及視角變化等。對于光照變化帶來的問題可以通過上圖進(jìn)行闡述。上圖分別展示了三角化的3D模型(上)以及同一個場景但是在不同光照條件下拍攝的圖像(下四圖)。假如建圖時的光照左下圖,定位時為后續(xù)的三種光照,由于光照條件已經(jīng)發(fā)生了較大的差改變,即使使用人眼仍需要仔細(xì)辨別才能判定這是同一個地點,但如何讓計算機理解這是同一個地點同時計算出此時相機的位姿呢?這就是該比賽面對的一個難點。對于視角變化的難點在此不做贅述,各位同學(xué)可以查看數(shù)據(jù)集進(jìn)行查看。
          數(shù)據(jù)集地址:
          https://www.visuallocalization.net/datasets


          冠軍方案

          方案名稱:Hierarchical Localization - SuperPoint + SuperGlue(簡稱,Hloc+SP+SG)[6,7]
          方案介紹

          本方案采用了分級定位(Hierarchical Localization[2])的方案,即先粗定位再細(xì)定位。該方案的主要特點在于特征匹配階段使用了最近比較火的SuperPoint?+?SuperGlue(后續(xù)簡稱「SP+SG」),這兩個網(wǎng)絡(luò)在之前有過介紹(點擊二者名字進(jìn)行查看),當(dāng)時只是提到了二者在大視角特征匹配時效果極佳。本方案的成功應(yīng)用,可見這兩個網(wǎng)絡(luò)在該定位任務(wù)中也能發(fā)光發(fā)熱。
          在官方提供的代碼中給出了使用例程:
          https://github.com/cvg/Hierarchical-Localization/blob/master/pipeline_Aachen.ipynb


          建圖

          由于該比賽官方提供了已經(jīng)用COLMAP+SIFT特征建好的模型(相機位姿以及地圖點),本方案并不是使用「SP+SG」對整個場景重新進(jìn)行,否則時間消耗是巨大的。本方案使用了已經(jīng)建好的模型提供的「scene graph」得到與當(dāng)前幀共視最好的前20張圖像,然后再去提取SP特征+SG進(jìn)行匹配,得到2D-2D數(shù)據(jù)關(guān)聯(lián)。接下來就是三角化,本方案沿用了COLMAP的三角化方案,只是位姿換成了官方模型的位姿,數(shù)據(jù)關(guān)聯(lián)就是「SP+SG」提供的2D-2D關(guān)聯(lián),三角化輸出是3D地圖點。


          定位

          本階段的目標(biāo)是從上面建好地圖中定位輸入的圖像對應(yīng)相機的位姿。

          粗定位:NetVLAD[3,4] retrieval (trained on Pitts-30k, top 50)

          細(xì)定位:SP+SG+RANSAC PnP

          下圖展示了查詢圖像與地圖中圖像的匹配效果。

          下圖展示了根據(jù)Aachen Day-Night數(shù)據(jù)集建立的3D模型 (database (red), day-time query (green), night-time query images (blue))


          結(jié)果

          在上述數(shù)據(jù)集,不同定位閾值下的召回率排名如下圖,本方案能夠以較明顯的優(yōu)勢取勝。


          展望

          上文主要對視覺定位挑戰(zhàn)賽以及CVPR 2020的冠軍方案進(jìn)行了介紹。基于深度學(xué)習(xí)的相似圖像召回,圖像特征點匹配扮演了重要的角色。

          雖然目前方案能夠獲得出色的性能表現(xiàn),但筆者認(rèn)為定位性能仍然具有提升空間。例如,由于目前建圖階段并不考慮實時性,此時可以使用SP+SG對整個場景進(jìn)行重建,這樣可以彌補SIFT在大視角變化時無法應(yīng)對的數(shù)據(jù)關(guān)聯(lián)。此外,相似圖像召回的方法不限于NetVLAD (CVPR 2016),可以使用性能更好的算法如[5]中提到的方案。注意到Hloc使用的是分級定位的思想,這使得分模塊實現(xiàn)/優(yōu)化變得比較輕松,例如上述改進(jìn)方法;但值得思考的是這種“局部最優(yōu)”拼湊起來的效果一定是“全局最優(yōu)”嗎?匹配做的好,位姿結(jié)算一定準(zhǔn)確嗎?后續(xù)的工作可以對此進(jìn)行更多地討論與研究(谷歌公布2020圖像匹配挑戰(zhàn)對該問題進(jìn)行了較為詳細(xì)的說明,建議閱讀[8])。

          參考

          [1]. 視覺定位挑戰(zhàn)賽主頁,?https://www.visuallocalization.net
          [2]. From Coarse to Fine: Robust Hierarchical Localization at Large Scale,?https://arxiv.org/abs/1812.03506
          [3]. NetVLAD: CNN architecture for weakly supervised place recognition,?http://xxx.itp.ac.cn/pdf/1511.07247v3
          [4]. Hloc+SP+SG方案中NetVLAD地址,?https://github.com/uzh-rpg/netvlad_tf_open
          [5]. 深度學(xué)習(xí)圖像召回,?https://github.com/almazan/deep-image-retrieval
          [6]. Hloc+SP+SG源碼,?https://github.com/cvg/Hierarchical-Localization
          [7]. Hloc+SP+SG方案提交地址,?https://www.visuallocalization.net/details/10931
          [8]. 筆記:CVPR2020圖像匹配挑戰(zhàn)賽,新數(shù)據(jù)集+新評測方法,SOTA正瑟瑟發(fā)抖!https://vincentqin.tech/posts/2020-image-matching-cvpr



          推薦閱讀



          添加極市小助手微信(ID : cvmart2),備注:姓名-學(xué)校/公司-研究方向-城市(如:小極-北大-目標(biāo)檢測-深圳),即可申請加入極市目標(biāo)檢測/圖像分割/工業(yè)檢測/人臉/醫(yī)學(xué)影像/3D/SLAM/自動駕駛/超分辨率/姿態(tài)估計/ReID/GAN/圖像增強/OCR/視頻理解等技術(shù)交流群:月大咖直播分享、真實項目需求對接、求職內(nèi)推、算法競賽、干貨資訊匯總、與?10000+來自港科大、北大、清華、中科院、CMU、騰訊、百度等名校名企視覺開發(fā)者互動交流~

          △長按添加極市小助手

          △長按關(guān)注極市平臺,獲取最新CV干貨

          覺得有用麻煩給個在看啦~??
          瀏覽 95
          點贊
          評論
          收藏
          分享

          手機掃一掃分享

          分享
          舉報
          評論
          圖片
          表情
          推薦
          點贊
          評論
          收藏
          分享

          手機掃一掃分享

          分享
          舉報
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  手机在线观看小视频 | 就是色欧美 | 欧美成人黄色网 | 91黑人大屌啪啪 | 亚洲成a人v欧美综合天堂 |