<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          超越CBAM,全新注意力機(jī)制!GAM:不計(jì)成本提高精度(附Pytorch實(shí)現(xiàn))

          共 3662字,需瀏覽 8分鐘

           ·

          2021-12-19 09:04

          點(diǎn)擊下方AI算法與圖像處理”,一起進(jìn)步!

          重磅干貨,第一時(shí)間送達(dá)

          作者丨ChaucerG
          來(lái)源丨集智書(shū)童
          編輯丨極市平臺(tái)

          導(dǎo)讀

          ?

          為了提高計(jì)算機(jī)視覺(jué)任務(wù)的性能,人們研究了各種注意力機(jī)制。然而,以往的方法忽略了保留通道和空間方面的信息以增強(qiáng)跨維度交互的重要性。因此,本文提出了一種通過(guò)減少信息彌散和放大全局交互表示來(lái)提高深度神經(jīng)網(wǎng)絡(luò)性能的全局注意力機(jī)制。

          論文鏈接:https://paperswithcode.com/paper/global-attention-mechanism-retain-information

          為了提高計(jì)算機(jī)視覺(jué)任務(wù)的性能,人們研究了各種注意力機(jī)制。然而,以往的方法忽略了保留通道和空間方面的信息以增強(qiáng)跨維度交互的重要性。因此,本文提出了一種通過(guò)減少信息彌散和放大全局交互表示來(lái)提高深度神經(jīng)網(wǎng)絡(luò)性能的全局注意力機(jī)制。


          本文引入了3D-permutation 與多層感知器的通道注意力和卷積空間注意力子模塊。在CIFAR-100和ImageNet-1K上對(duì)所提出的圖像分類(lèi)機(jī)制的評(píng)估表明,本文的方法穩(wěn)定地優(yōu)于最近的幾個(gè)注意力機(jī)制,包括ResNet和輕量級(jí)的MobileNet。

          1 簡(jiǎn)介

          卷積神經(jīng)網(wǎng)絡(luò)已廣泛應(yīng)用于計(jì)算機(jī)視覺(jué)領(lǐng)域的許多任務(wù)和應(yīng)用中。研究人員發(fā)現(xiàn),CNN在提取深度視覺(jué)表征方面表現(xiàn)良好。隨著CNN相關(guān)技術(shù)的改進(jìn),ImageNet數(shù)據(jù)集的圖像分類(lèi)準(zhǔn)確率在過(guò)去9年里從63%提高到了90%。這一成就也歸功于ImageNet數(shù)據(jù)集的復(fù)雜性,這為相關(guān)研究提供了難得的機(jī)會(huì)。由于它覆蓋的真實(shí)場(chǎng)景的多樣性和規(guī)模,有利于傳統(tǒng)的圖像分類(lèi)、表征學(xué)習(xí)、遷移學(xué)習(xí)等研究。特別是,它也給注意力機(jī)制帶來(lái)了挑戰(zhàn)。

          近年來(lái),注意力機(jī)制在多個(gè)應(yīng)用中不斷提高性能,引起了研究興趣。Wang等人使用編碼-解碼器residual attention模塊對(duì)特征圖進(jìn)行細(xì)化,以獲得更好的性能。Hu 等人分別使用空間注意力機(jī)制和通道注意力機(jī)制,獲得了更高的準(zhǔn)確率。然而,由于信息減少和維度分離,這些機(jī)制利用了有限的感受野的視覺(jué)表征。在這個(gè)過(guò)程中,它們失去了全局空間通道的相互作用。

          本文的研究目標(biāo)是跨越空間通道維度研究注意力機(jī)制。提出了一種“全局”注意力機(jī)制,它保留信息以放大“全局”跨維度的交互作用。因此,將所提出的方法命名為全局注意力機(jī)制(GAM)。

          2 相關(guān)工作

          注意力機(jī)制在圖像分類(lèi)任務(wù)中的性能改進(jìn)已經(jīng)有很多研究。

          SENet在抑制不重要的像素時(shí),也帶來(lái)了效率較低的問(wèn)題。

          CBAM依次進(jìn)行通道和空間注意力操作,而B(niǎo)AM并行進(jìn)行。但它們都忽略了通道與空間的相互作用,從而丟失了跨維信息。

          考慮到跨維度交互的重要性,TAM通過(guò)利用每一對(duì)三維通道、空間寬度和空間高度之間的注意力權(quán)重來(lái)提高效率。然而,注意力操作每次仍然應(yīng)用于兩個(gè)維度,而不是全部三個(gè)維度。

          為了放大跨維度的交互作用,本文提出了一種能夠在所有三個(gè)維度上捕捉重要特征的注意力機(jī)制。

          3 GAM注意力機(jī)制

          本文的目標(biāo)是設(shè)計(jì)一種注意力機(jī)制能夠在減少信息彌散的情況下也能放大全局維交互特 征。作者采用序貫的通道-空間注意力機(jī)制并重新設(shè)計(jì)了CBAM子模塊。整個(gè)過(guò)程如圖1 所示, 并在公式1和2。給定輸入特征映射 , 中間狀態(tài) 和輸出 定義為:

          其中 分別為通道注意力圖和空間注意力圖; 表示按元素進(jìn)行乘法操作。

          通道注意力子模塊

          通道注意子模塊使用三維排列來(lái)在三個(gè)維度上保留信息。然后,它用一個(gè)兩層的MLP(多層感知器)放大跨維通道-空間依賴性。(MLP是一種編碼-解碼器結(jié)構(gòu),與BAM相同,其壓縮比為r);通道注意子模塊如圖2所示:

          空間注意力子模塊

          在空間注意力子模塊中,為了關(guān)注空間信息,使用兩個(gè)卷積層進(jìn)行空間信息融合。還從通道注意力子模塊中使用了與BAM相同的縮減比r。與此同時(shí),由于最大池化操作減少了信息的使用,產(chǎn)生了消極的影響。這里刪除了池化操作以進(jìn)一步保留特性映射。因此,空間注意力模塊有時(shí)會(huì)顯著增加參數(shù)的數(shù)量。為了防止參數(shù)顯著增加,在ResNet50中采用帶Channel Shuffle的Group卷積。無(wú)Group卷積的空間注意力子模塊如圖3所示:

          Pytorch實(shí)現(xiàn)GAM注意力機(jī)制

          import?torch.nn?as?nn??
          import?torch??


          class?GAM_Attention(nn.Module):??
          ????def?__init__(self,?in_channels,?out_channels,?rate=4):??
          ????????super(GAM_Attention,?self).__init__()??

          ????????self.channel_attention?=?nn.Sequential(??
          ????????????nn.Linear(in_channels,?int(in_channels?/?rate)),??
          ????????????nn.ReLU(inplace=True),??
          ????????????nn.Linear(int(in_channels?/?rate),?in_channels)??
          ????????)??
          ??????
          ????????self.spatial_attention?=?nn.Sequential(??
          ????????????nn.Conv2d(in_channels,?int(in_channels?/?rate),?kernel_size=7,?padding=3),??
          ????????????nn.BatchNorm2d(int(in_channels?/?rate)),??
          ????????????nn.ReLU(inplace=True),??
          ????????????nn.Conv2d(int(in_channels?/?rate),?out_channels,?kernel_size=7,?padding=3),??
          ????????????nn.BatchNorm2d(out_channels)??
          ????????)??
          ??????
          ????def?forward(self,?x):??
          ????????b,?c,?h,?w?=?x.shape??
          ????????x_permute?=?x.permute(0,?2,?3,?1).view(b,?-1,?c)??
          ????????x_att_permute?=?self.channel_attention(x_permute).view(b,?h,?w,?c)??
          ????????x_channel_att?=?x_att_permute.permute(0,?3,?1,?2)??
          ??????
          ????????x?=?x?*?x_channel_att??
          ??????
          ????????x_spatial_att?=?self.spatial_attention(x).sigmoid()??
          ????????out?=?x?*?x_spatial_att??
          ??????
          ????????return?out??

          ??

          if?__name__?==?'__main__':??
          ????x?=?torch.randn(1,?64,?32,?48)??
          ????b,?c,?h,?w?=?x.shape??
          ????net?=?GAM_Attention(in_channels=c,?out_channels=c)??
          ????y?=?net(x)??

          4實(shí)驗(yàn)

          4.1 CIFAR-100

          4.2 ImageNet-1K

          4.3 消融實(shí)驗(yàn)

          參考

          [1].Global Attention Mechanism: Retain Information to Enhance Channel-Spatial Interactions

          努力分享優(yōu)質(zhì)的計(jì)算機(jī)視覺(jué)相關(guān)內(nèi)容,歡迎關(guān)注:

          交流群


          歡迎加入公眾號(hào)讀者群一起和同行交流,目前有美顏、三維視覺(jué)計(jì)算攝影、檢測(cè)、分割、識(shí)別、醫(yī)學(xué)影像、GAN算法競(jìng)賽等微信群


          個(gè)人微信(如果沒(méi)有備注不拉群!
          請(qǐng)注明:地區(qū)+學(xué)校/企業(yè)+研究方向+昵稱



          下載1:何愷明頂會(huì)分享


          AI算法與圖像處理」公眾號(hào)后臺(tái)回復(fù):何愷明,即可下載。總共有6份PDF,涉及 ResNet、Mask RCNN等經(jīng)典工作的總結(jié)分析


          下載2:終身受益的編程指南:Google編程風(fēng)格指南


          AI算法與圖像處理」公眾號(hào)后臺(tái)回復(fù):c++,即可下載。歷經(jīng)十年考驗(yàn),最權(quán)威的編程規(guī)范!



          下載3 CVPR2021

          AI算法與圖像處公眾號(hào)后臺(tái)回復(fù):CVPR即可下載1467篇CVPR?2020論文 和 CVPR 2021 最新論文



          瀏覽 105
          點(diǎn)贊
          評(píng)論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          評(píng)論
          圖片
          表情
          推薦
          點(diǎn)贊
          評(píng)論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  前后夹击人妻3p绿帽 | 天天爱天天操 | 国产无码精品在线 | 欧美人成人无码 | 五月婷婷综合激情 |