<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          B站講課視頻,差點翻車

          共 1073字,需瀏覽 3分鐘

           ·

          2021-11-13 10:07

          大家好,我是DASOU

          前幾天我在B站錄制了一期講解SwinTRM模型的視頻:通宵做了近100頁PPT,累趴了
          在這期視頻之后,有幾個小伙伴私下找到我說在一個小細(xì)節(jié)上和我理解的不同。
          在SwinTRM中,一個比較重要的特點是把 self-att 放在一個窗口內(nèi)部,而不再是一整張圖片;
          就好比是下面這個圖:

          一整張圖【8,8】被分為了四個窗口,每個窗口的大小為【4,4】。
          我在講解這一塊之前,專門扒了一下源代碼,然后談到了這么一句話,大致是這么說的:
          SwinTRM block的輸入是單個窗口,而不再是整個圖片;對于單個窗口來說,它是把內(nèi)部的每個像素點當(dāng)成一個token送入到后續(xù)的模型中去;
          好,重點來了,這幾個朋友私下談到和我理解不同的點就是在這里,因為上面這個圖的圖例上,很清楚的表明,在原論文中,灰色的框框,代表的應(yīng)該是一個patch,而不是一個像素點;

          其實這幾個朋友的可能沒有注意到,在我視頻講解中,對這個像素點的定義不僅僅是一個數(shù)值,而是一個向量,也就是輸入到SwinTRM中的是這個像素點的所有通道數(shù),也就是我PPT中的這個圖:

          也就是說,在原論文中的灰色框框,本身就是一個【1,96】元素(注,不同階段可能維度不同),也就是我在視頻中所稱的像素點;
          和我討論的朋友觀點其實分為兩種;
          第一種認(rèn)為,這個灰色框框代表的patch不是【1,96】這種向量,而是patch_size大于1,比如【2,2,96】這種patch_size大小為2的情況;從源碼角度來看,這種思路肯定是不正確的;
          第二種朋友提醒我說CV領(lǐng)域一般把最小處理單元稱之為cell或者patch,很少稱之為像素點;
          其實第二種觀點目前來看,可能會更精準(zhǔn)一點;
          因為在原論文中有這么一句話:
          In?our?implementation,?we?use a?patch?size?of?4?×?4?and?thus?the?feature?dimension?of?each?patch?is?4?×?4×3?=?48.
          也就是原論文也是把【1,48】這種稱之為一個patch,而不是一個像素點
          所以還是我用詞上可能沒用的特別準(zhǔn),所以寫下這個文章,避免給大家?guī)碚`解。
          大家在看視頻的時候,注意我的像素點的意思其實是當(dāng)前此時階段處理的最小單元就可以了;

          瀏覽 58
          點贊
          評論
          收藏
          分享

          手機掃一掃分享

          分享
          舉報
          評論
          圖片
          表情
          推薦
          點贊
          評論
          收藏
          分享

          手機掃一掃分享

          分享
          舉報
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  国内一级免费黄色视频在线网展览器的封 | 好中文天堂网 | 成人电影无码三区 | 亚洲精品无码在线观看 | www.黄色网址 |