<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          清華&南開出品最新視覺注意力機(jī)制Attention綜述

          共 2271字,需瀏覽 5分鐘

           ·

          2021-11-27 05:45

          ↑ 點(diǎn)擊藍(lán)字?關(guān)注極市平臺(tái)

          來源丨量子位
          編輯丨極市平臺(tái)

          極市導(dǎo)讀

          ?

          清華大學(xué)計(jì)圖團(tuán)隊(duì)和南開大學(xué)程明明教授團(tuán)隊(duì)、卡迪夫大學(xué)Ralph R. Martin教授合作,在ArXiv上發(fā)布關(guān)于計(jì)算機(jī)視覺中的注意力機(jī)制的綜述文章。該綜述系統(tǒng)地介紹了注意力機(jī)制在計(jì)算機(jī)視覺領(lǐng)域中相關(guān)工作?>>加入極市CV技術(shù)交流群,走在計(jì)算機(jī)視覺的最前沿

          清華計(jì)圖胡事民團(tuán)隊(duì)的這篇注意力機(jī)制的綜述火了!

          在上周的arXiv上,這是最熱的一篇論文:

          推特以及GitHub上也有不低的熱度:

          而這篇論文引用近200篇內(nèi)容,對(duì)計(jì)算機(jī)視覺領(lǐng)域中的各種注意力機(jī)制進(jìn)行了全面回顧。

          在大量調(diào)查之后,論文將注意力機(jī)制分為多個(gè)類別,GitHub還給出了各類別下提到內(nèi)容的PDF下載文件:

          現(xiàn)在,就來一起看看這篇論文。

          文章主要內(nèi)容

          論文首先將基于注意力的模型在計(jì)算機(jī)視覺領(lǐng)域中的發(fā)展歷程大致歸為了四個(gè)階段:

          1. 將深度神經(jīng)網(wǎng)絡(luò)與注意力機(jī)制相結(jié)合,代表性方法為RAM

          2. 明確預(yù)測(cè)判別性輸入特征,代表性方法為STN

          3. 隱性且自適應(yīng)地預(yù)測(cè)潛在的關(guān)鍵特征,代表方法為SENet

          4. 自注意力機(jī)制

          同時(shí),注意力機(jī)制也被分為了通道注意、空間注意、時(shí)間注意、分支注意,以及兩個(gè)混合類別:

          針對(duì)不同類別,研究團(tuán)隊(duì)給出了其代表性方法和發(fā)展背景:

          通道注意力(Channel Attention)

          在深度神經(jīng)網(wǎng)絡(luò)中,不同特征圖的不同通道常代表不同對(duì)象。

          而通道注意力作為一個(gè)對(duì)象選擇過程,可以自適應(yīng)地重新校準(zhǔn)每個(gè)通道的權(quán)重,從而決定關(guān)注什么。

          因此,按照類別和出版日期將代表性通道關(guān)注機(jī)制進(jìn)行分類,應(yīng)用范圍有分類(Cls)、語義分割(SSeg)、實(shí)例分割(ISeg)、風(fēng)格轉(zhuǎn)換(ST)、動(dòng)作識(shí)別(Action)。

          其中,(A)代表Channel-wise product,(I)強(qiáng)調(diào)重要通道,(II)捕捉全局信息。

          空間注意力(Spatial Attention)

          空間注意力可以被看作是一種自適應(yīng)的空間區(qū)域選擇機(jī)制。

          其應(yīng)用范圍比通道注意力多出了精細(xì)分類(FGCls)和圖像字幕(ICap)。

          時(shí)間注意力(Temporal Attention)

          時(shí)間注意力可以被看作是一種動(dòng)態(tài)的時(shí)間選擇機(jī)制,決定了何時(shí)進(jìn)行注意,因此通常用于視頻處理。

          分支注意力(Branch Attention)

          分支注意可以被看作是一種動(dòng)態(tài)的分支選擇機(jī)制,通過多分支結(jié)構(gòu)決定去注意什么。

          通道空間注意力(Channel & Spatial Attention)

          通道和空間結(jié)合的注意力機(jī)制可以自適應(yīng)地選擇重要的對(duì)象和區(qū)域,由殘差注意力(Residual Attention)網(wǎng)絡(luò)開創(chuàng)了這一內(nèi)容。

          在殘差注意力之后,為了有效利用全局信息,后來的工作又相繼引入全局平均池化(Global Average Pooling),引入自注意力機(jī)制等內(nèi)容。

          時(shí)空注意力(Spatial & Temporal Attention)

          時(shí)空注意力機(jī)制可以自適應(yīng)地選擇重要區(qū)域和關(guān)鍵幀。

          最后,作者也提出了注意力機(jī)制在未來的一些研究方向:

          • 探索注意力機(jī)制的必要和充分條件

          • 是否可以有一個(gè)通用的注意塊,可以根據(jù)具體的任務(wù)在各類注意力機(jī)制之間進(jìn)行選擇

          • 開發(fā)可定性和可解釋的注意力模型

          • 注意力機(jī)制可以產(chǎn)生稀疏的激活,這促使我們?nèi)ヌ剿髂姆N架構(gòu)可以更好地模擬人類的視覺系統(tǒng)

          • 進(jìn)一步探索基于注意力的預(yù)訓(xùn)練模型

          • 為注意力模型研究新的優(yōu)化方法

          • 找到簡單、高效、有效的基于注意力的模型,使其可以廣泛部署

          關(guān)于作者

          這篇論文來自清華大學(xué)計(jì)算機(jī)系胡事民團(tuán)隊(duì)。

          胡事民為清華大學(xué)計(jì)算機(jī)系教授,教育部長江學(xué)者特聘教授,曾經(jīng)和現(xiàn)任IEEE、Elsevier、Springer等多個(gè)期刊的主編、副主編和編委。同時(shí),他也是清華“計(jì)圖”框架團(tuán)隊(duì)的負(fù)責(zé)人,這是首個(gè)由中國高校開源的深度學(xué)習(xí)框架。

          文章一作為胡事民教授的博士生國孟昊,現(xiàn)就讀于清華大學(xué)計(jì)算機(jī)系,也是清華計(jì)圖團(tuán)隊(duì)的一員。

          各類資源匯總鏈接:
          https://github.com/MenghaoGuo/Awesome-Vision-Attentions

          論文地址:
          https://arXiv.org/abs/2111.07624

          如果覺得有用,就請(qǐng)分享到朋友圈吧!

          △點(diǎn)擊卡片關(guān)注極市平臺(tái),獲取最新CV干貨

          公眾號(hào)后臺(tái)回復(fù)“transformer”獲取最新Transformer綜述論文下載~


          極市干貨
          課程/比賽:珠港澳人工智能算法大賽保姆級(jí)零基礎(chǔ)人工智能教程
          算法trick目標(biāo)檢測(cè)比賽中的tricks集錦從39個(gè)kaggle競(jìng)賽中總結(jié)出來的圖像分割的Tips和Tricks
          技術(shù)綜述:一文弄懂各種loss function工業(yè)圖像異常檢測(cè)最新研究總結(jié)(2019-2020)


          #?CV技術(shù)社群邀請(qǐng)函?#

          △長按添加極市小助手
          添加極市小助手微信(ID : cvmart4)

          備注:姓名-學(xué)校/公司-研究方向-城市(如:小極-北大-目標(biāo)檢測(cè)-深圳)


          即可申請(qǐng)加入極市目標(biāo)檢測(cè)/圖像分割/工業(yè)檢測(cè)/人臉/醫(yī)學(xué)影像/3D/SLAM/自動(dòng)駕駛/超分辨率/姿態(tài)估計(jì)/ReID/GAN/圖像增強(qiáng)/OCR/視頻理解等技術(shù)交流群


          每月大咖直播分享、真實(shí)項(xiàng)目需求對(duì)接、求職內(nèi)推、算法競(jìng)賽、干貨資訊匯總、與?10000+來自港科大、北大、清華、中科院、CMU、騰訊、百度等名校名企視覺開發(fā)者互動(dòng)交流~



          覺得有用麻煩給個(gè)在看啦~??
          瀏覽 91
          點(diǎn)贊
          評(píng)論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          評(píng)論
          圖片
          表情
          推薦
          點(diǎn)贊
          評(píng)論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  乱伦月 大像传媒 | 麻豆传媒一区二区 | 四虎91| 久久国产成人 | 中文字幕AV在线观看 |