<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          Attention跟一維卷積有什么區(qū)別?

          共 2351字,需瀏覽 5分鐘

           ·

          2021-05-30 01:47

          點(diǎn)擊上方小白學(xué)視覺”,選擇加"星標(biāo)"或“置頂

          重磅干貨,第一時(shí)間送達(dá)

          本文轉(zhuǎn)自:視學(xué)算法

           問題

          Attention跟一維卷積的區(qū)別是啥?

          權(quán)重形成機(jī)制不同?


          高質(zhì)量回答


          莫驚蟄
          前咨詢民工,現(xiàn)苦逼博士
          https://www.zhihu.com/question/288081659/answer/1222002868


          拿NLP中序列建模來做個(gè)例子,有幾點(diǎn)區(qū)別:

          1、Context Window:因?yàn)橐痪S卷積需要指定窗口的大小,比如圖中,就是每次只看3個(gè)詞。而且attention,這里是self-attention,他的context window是“無限”的,無限是指序列的長(zhǎng)度是多少,窗口的大小就是多少,因?yàn)閍ttention權(quán)重的計(jì)算涉及到一個(gè)序列里面所有的詞。如上圖所示,句子有5個(gè)詞,窗口大小就是5. 所以一維卷積是“l(fā)ocal”的,attention可以說是“global”的。

          2、Time Complexity:這個(gè)其實(shí)也是剛才的窗口大小不同導(dǎo)致的,因?yàn)橐痪S卷積只看k個(gè)詞(窗口大小為k),如果序列長(zhǎng)度為n,那么復(fù)雜度就是kn。而attention因?yàn)樵诿總€(gè)位置,每個(gè)詞的權(quán)重計(jì)算都要考慮到所有的詞,所以復(fù)雜度就是n^2.

          3、Dynamic Weights: 和二維卷積一樣,一維卷積的權(quán)重是不變的,就是不會(huì)隨著在序列位置中的變化而改變,但是attention不一樣,每個(gè)位置的權(quán)重都是不一樣的,attention scores(weights)是由dot-product計(jì)算出來的,具體地, softmax(qk/d^1/2).

          但由于self-attention復(fù)雜度高,對(duì)長(zhǎng)序列建模效果沒有那么好,所以對(duì)一維卷積有很多改進(jìn)的工作,比如上圖的Pay Less Attention with Lightweight and Dynamic Convolutions (ICLR19, FAIR)1。還有比較新的Time-aware Large Kernel Convolutions (TaLK)2。

          在NMT,LM等任務(wù)上的效果都能和attention-based模型扳手腕?;旧暇蛷膭?dòng)態(tài)權(quán)重和動(dòng)態(tài)窗口大小上面對(duì)一維卷積進(jìn)行改進(jìn),而另一方面又有一些對(duì)attention的改進(jìn)工作,比如將無限窗口限制一下,或者層次化一下,有太多文章這里就不贅述了。

          Ref:
          https://arxiv.org/abs/1901.10430
          https://arxiv.org/abs/2002.03184

          樹朋
          數(shù)據(jù)分析,自然語言處理
          https://www.zhihu.com/question/288081659/answer/1227308595

          如果只是從運(yùn)算的算子看,也就是矩陣乘法的角度看,區(qū)別不是很大。所以,可以繼承同一個(gè)實(shí)現(xiàn)。


          attention輸入的key vector 和query matrix,得到的是attention score logits。一維卷積也是類似的。卷積操作在自然語言處理中也不算少見,比如TextCNN,還有ELMO中的char CNN,你看過代碼的話,其實(shí)也就是卷積核乘以輸入,然后卷積核高度為1,寬度為對(duì)應(yīng)的嵌入長(zhǎng)度。


          如果說區(qū)別,那么第一就是輸入的特征的意義是什么?第二就是輸出的特征的意義是什么,以及應(yīng)該如何處理這種特征。


          比如key dot product query得到的是相似度,attention list要?dú)w一化,甚至在transformer中要先對(duì)attention score的方差歸一化,然后再做softmax歸一化。一維卷積得到的是信息提取,所以對(duì)于卷積得到的feature map,為了更有效的提取信息,需要池化。


          當(dāng)然,這里只是說了最簡(jiǎn)單的點(diǎn)積attention。你看過Luong論文的話會(huì)了解到更加豐富的attention實(shí)現(xiàn)。


          總的來說,你有這樣的疑問,應(yīng)該也是了解了一些的,在知其然的基礎(chǔ)上多研究一下所以然會(huì)幫助更大,特別是未來某一天你需要定制自己的attention或者有效特征提取器的時(shí)候。

          下載1:OpenCV-Contrib擴(kuò)展模塊中文版教程
          在「小白學(xué)視覺」公眾號(hào)后臺(tái)回復(fù):擴(kuò)展模塊中文教程,即可下載全網(wǎng)第一份OpenCV擴(kuò)展模塊教程中文版,涵蓋擴(kuò)展模塊安裝、SFM算法、立體視覺、目標(biāo)跟蹤、生物視覺、超分辨率處理等二十多章內(nèi)容。

          下載2:Python視覺實(shí)戰(zhàn)項(xiàng)目52講
          小白學(xué)視覺公眾號(hào)后臺(tái)回復(fù):Python視覺實(shí)戰(zhàn)項(xiàng)目,即可下載包括圖像分割、口罩檢測(cè)、車道線檢測(cè)、車輛計(jì)數(shù)、添加眼線、車牌識(shí)別、字符識(shí)別、情緒檢測(cè)、文本內(nèi)容提取、面部識(shí)別等31個(gè)視覺實(shí)戰(zhàn)項(xiàng)目,助力快速學(xué)校計(jì)算機(jī)視覺。

          下載3:OpenCV實(shí)戰(zhàn)項(xiàng)目20講
          小白學(xué)視覺公眾號(hào)后臺(tái)回復(fù):OpenCV實(shí)戰(zhàn)項(xiàng)目20講,即可下載含有20個(gè)基于OpenCV實(shí)現(xiàn)20個(gè)實(shí)戰(zhàn)項(xiàng)目,實(shí)現(xiàn)OpenCV學(xué)習(xí)進(jìn)階。

          交流群


          歡迎加入公眾號(hào)讀者群一起和同行交流,目前有SLAM、三維視覺、傳感器、自動(dòng)駕駛、計(jì)算攝影、檢測(cè)、分割、識(shí)別、醫(yī)學(xué)影像、GAN算法競(jìng)賽等微信群(以后會(huì)逐漸細(xì)分),請(qǐng)掃描下面微信號(hào)加群,備注:”昵稱+學(xué)校/公司+研究方向“,例如:”張三 + 上海交大 + 視覺SLAM“。請(qǐng)按照格式備注,否則不予通過。添加成功后會(huì)根據(jù)研究方向邀請(qǐng)進(jìn)入相關(guān)微信群。請(qǐng)勿在群內(nèi)發(fā)送廣告,否則會(huì)請(qǐng)出群,謝謝理解~


          瀏覽 79
          點(diǎn)贊
          評(píng)論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          評(píng)論
          圖片
          表情
          推薦
          CRM和SCRM有什么區(qū)別?
          點(diǎn)贊
          評(píng)論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  日韩精品一区二区在线观看 | 大鸡吧在线视频 | 国产免费一区二区在线A片视频 | 国产又爽 又黄 A片免费观看 | 大香蕉伊人综合在线观看 |