<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          性能超越谷歌MobileNet!依圖團(tuán)隊(duì)提出新一代移動(dòng)端網(wǎng)絡(luò)架構(gòu)MobileNeXt ,入選ECCV2020

          共 4742字,需瀏覽 10分鐘

           ·

          2020-10-28 03:06



          ??新智元報(bào)道??

          編輯:白峰、夢(mèng)佳

          【新智元導(dǎo)讀】AIoT的時(shí)代即將來(lái)臨,移動(dòng)端智能應(yīng)用呈爆發(fā)式增長(zhǎng),但是大型神經(jīng)網(wǎng)絡(luò)在移動(dòng)端的性能制約了AI在移動(dòng)端的推廣。最近,依圖團(tuán)隊(duì)發(fā)表在ECCV的一篇論文,提出了新一代移動(dòng)端神經(jīng)網(wǎng)絡(luò)架構(gòu)MobileNeXt,大大優(yōu)于谷歌的MobileNet、何愷明團(tuán)隊(duì)提出的ResNet等使用倒殘差結(jié)構(gòu)的模型,為移動(dòng)端算力帶來(lái)了新的突破。

          《三體》中羅輯沉睡了兩個(gè)世紀(jì)后,在位于地下一千多米的城市中醒來(lái);《流浪地球》中,行星推進(jìn)器下500米的地下城。

          在那里是一樣的人間煙火,只不過(guò)人們生活的場(chǎng)景從地上轉(zhuǎn)移到了地下。
          ?
          ? ? ? ?? ? ? ?
          未來(lái),隨著人類棲息空間的不斷延展和拓寬,現(xiàn)存的城市管理體系注定會(huì)失效,必將需要一個(gè)高度復(fù)雜的智能系統(tǒng)來(lái)維護(hù),而打造智慧城市,要完成交通、供水、供電、供氣、通訊、環(huán)保等等基礎(chǔ)設(shè)施的數(shù)字化建設(shè),但是很少有城市關(guān)注到。
          ?
          而上海的「一網(wǎng)統(tǒng)管」系統(tǒng)做到了,小到每一個(gè)路燈、井蓋、消防栓,大到26000多公里的地下管網(wǎng),都被連接了起來(lái),讓城市的精細(xì)化管理成為可能。
          ?
          這個(gè)「一網(wǎng)統(tǒng)管」得益于依圖自主研發(fā)的人工智能芯片,人工智能算力在城市管理中規(guī)模化落地的可能性被大大釋放,為此還得到了央視《新聞聯(lián)播》“十三五”成就巡禮專題的點(diǎn)贊。
          ?? ? ? ?? ? ??
          一直以來(lái),依圖都在智能基礎(chǔ)設(shè)施的建設(shè)方面狠下功夫,在基礎(chǔ)的算法和芯片方面不斷突破新的邊界。

          移動(dòng)端神經(jīng)網(wǎng)絡(luò)新架構(gòu)MobileNeXt,超越谷歌MobileNet和何愷明團(tuán)隊(duì)ResNet

          基礎(chǔ)網(wǎng)絡(luò)結(jié)構(gòu)是各種算法的基礎(chǔ),直接影響模型最終的性能,這方面高質(zhì)量的研究很稀缺
          ?
          依圖研發(fā)團(tuán)隊(duì)近期在 ECCV 2020 發(fā)表了新論文,通過(guò)分析當(dāng)前主流移動(dòng)端網(wǎng)絡(luò)的倒殘差模塊的優(yōu)勢(shì)與劣勢(shì),提出了一種改良版本MobileNeXt,大大提升了移動(dòng)端神經(jīng)網(wǎng)絡(luò)的性能。
          ?? ? ? ???
          論文:?
          https://arxiv.org/abs/2007.02269
          代碼:?
          https://github.com/yitu-opensource/MobileNeXt
          ?
          在不使用SE等性能提升模塊的條件下,相比于主流的MobileNetV2,MobileNeXt在相同計(jì)算量下可達(dá)到1.7%的分類精度提升。
          ?
          此外,新提出的沙漏模塊可用于改良神經(jīng)網(wǎng)絡(luò)自動(dòng)化搜索的搜索空間,在使用相同搜索算法的情況下,加入沙漏模塊的搜索空間可以在CIFAR10的數(shù)據(jù)集上取得更高效的模型架構(gòu),大大優(yōu)于谷歌的MobileNet、何愷明團(tuán)隊(duì)提出的ResNet等使用倒殘差結(jié)構(gòu)的模型。
          ? ? ? ? ? ? ?
          圖一:ImageNet 測(cè)試結(jié)果

          倒殘差和線性瓶頸,讓移動(dòng)端神經(jīng)網(wǎng)絡(luò)徹底「通車」

          谷歌在2017年提出了專門為移動(dòng)端優(yōu)化的輕量級(jí)CNN網(wǎng)絡(luò),該研究最大的亮點(diǎn)是提出了深度可分離卷積(depthwise separable convolution)。
          ?
          傳統(tǒng)卷積
          ?
          傳統(tǒng)卷積分兩步,每個(gè)卷積核與每個(gè)特征圖按位相乘,然后再相加,此時(shí),計(jì)算量為???????????????,其中??為特征圖尺寸,??為卷積核尺寸,M為輸入通道數(shù),N為輸出通道數(shù)。
          ?
          ? ? ? ?? ? ? ?
          深度可分離卷積
          ?
          而谷歌提出的深度可分離卷積,將普通卷積拆分成了一個(gè)深度卷積depthwise和一個(gè)逐點(diǎn)卷積pointwise。

          首先按通道進(jìn)行按位相乘,通道數(shù)沒(méi)有改變;然后將第一步的結(jié)果,使用1*1的卷積核進(jìn)行傳統(tǒng)的卷積,此時(shí)通道數(shù)可以進(jìn)行改變。使用了深度可分離卷積,其計(jì)算量變?yōu)?????????????+1?1??????????。
          ?? ? ??? ? ? ?
          深度可分離卷積的計(jì)算量下降了,也是MobileNet V1能夠?qū)崿F(xiàn)加速的主要原因
          ?
          MobileNet V1的速度雖然提高了,但是低維信息映射到高維的維度較低,經(jīng)過(guò)ReLU后再映射回低維時(shí)損失比較大,所以谷歌在V1的基礎(chǔ)上,又引入了倒殘差(Inverted Residuals)和線性瓶頸(Linear Bottlenecks)兩個(gè)模塊,使得MobileNetV2降低時(shí)延的同時(shí)精度也有所提升。
          ?
          MobileNetV2 提出的倒殘差模塊現(xiàn)在已經(jīng)成為移動(dòng)端網(wǎng)絡(luò)的基礎(chǔ)構(gòu)建模塊。
          ?
          ? ? ? ? ? ? ?
          倒殘差模塊中間粗兩頭細(xì),擴(kuò)張-卷積-壓縮,提取更高維信息
          ?
          ? ? ? ? ? ? ?
          線性瓶頸模塊,將最后的ReLU替換成線性激活函數(shù),進(jìn)一步降低信息損失
          ?
          通過(guò)在高維度使用深度可分離卷積,倒殘差網(wǎng)絡(luò)可以有效降低計(jì)算開(kāi)銷,保證模型性能。
          ?
          同時(shí),瓶頸結(jié)構(gòu)的連接方式可以有效降低點(diǎn)操作的數(shù)量、減少所需要的內(nèi)存訪問(wèn),進(jìn)而進(jìn)一步減小硬件上的讀取延時(shí),提升硬件執(zhí)行效率。
          ?
          ? ? ? ?? ?
          ?
          倒殘差梯度回傳易「走丟」,沙漏型瓶頸結(jié)構(gòu)讓梯度不「抖動(dòng)」

          倒殘差結(jié)構(gòu)的不足
          ?
          然而,MobileNetV2集中于瓶頸結(jié)構(gòu)的網(wǎng)絡(luò)連接方式可能會(huì)造成優(yōu)化過(guò)程中的梯度回傳抖動(dòng),進(jìn)而影響模型收斂趨勢(shì),導(dǎo)致模型性能降低。
          ?
          現(xiàn)有研究表明:(1) 更寬的網(wǎng)絡(luò)可以緩解梯度混淆問(wèn)題并有助于提升模型性能;(2)逆殘差模塊中的短連接可能會(huì)影響梯度回傳。
          ?
          為了解決MobileNetV2中瓶頸結(jié)構(gòu)導(dǎo)致的優(yōu)化問(wèn)題,依圖團(tuán)隊(duì)重新思考了由ResNet提出的傳統(tǒng)瓶頸結(jié)構(gòu)的鏈接方式,這種連接方式把梯度主要集中在較高維度的網(wǎng)絡(luò)層,可以減少梯度抖動(dòng)、加速網(wǎng)絡(luò)收斂
          ?
          于是便有了一種新的網(wǎng)絡(luò)設(shè)計(jì)模塊--沙漏型瓶頸結(jié)構(gòu),既能保留高維度網(wǎng)絡(luò)加速收斂和訓(xùn)練的優(yōu)勢(shì),又能利用深度卷積帶來(lái)的計(jì)算開(kāi)銷收益,減少高維特征圖的內(nèi)存訪問(wèn)需求,提高硬件執(zhí)行效率。?
          ? ? ? ? ? ? ?
          圖二:a.瓶頸結(jié)構(gòu),b.倒殘差結(jié)構(gòu),c.新的沙漏型瓶頸結(jié)構(gòu)
          ?
          依圖團(tuán)隊(duì)把跳躍鏈接放置在高維度神經(jīng)網(wǎng)絡(luò)層,并使用深度卷積來(lái)降低計(jì)算開(kāi)銷,然后使用兩連續(xù)層1x1卷積來(lái)進(jìn)一步降低計(jì)算開(kāi)銷的效果。
          ?? ? ? ?
          圖三:Sandglass Block的具體原理設(shè)計(jì)
          ?
          可以看到,Sandglass Block可以保證更多的信息從bottom層傳遞給top層,進(jìn)而有助于梯度回傳;執(zhí)行了兩次深度卷積以編碼更多的空間信息。
          ?
          基于上面的分析,我們來(lái)看依圖研發(fā)團(tuán)隊(duì)都做了哪些設(shè)計(jì)優(yōu)化。
          ?
          降維和升維的位置
          ?
          在原始的倒殘差模塊中先進(jìn)行升維再進(jìn)行降維。
          ?
          基于前述分析,為確保高維度特征的短連接,依圖團(tuán)隊(duì)對(duì)兩個(gè)1x1卷積的順序進(jìn)行了調(diào)整。假設(shè)??表示輸入張量,? ?表示輸出張量(注:此時(shí)尚未考慮深度卷積),那么該模塊的計(jì)算可以寫成如下形式,
          ? ? ? ? ? ? ?
          見(jiàn)圖三b中的中間兩個(gè)1x1卷積。
          ?
          高維度短連接
          ?
          依圖團(tuán)隊(duì)并未在瓶頸層間構(gòu)建短連接,而是在更高維特征之間構(gòu)建短連接(見(jiàn)圖三b)。更寬的短連接有助于更多信息從輸入F傳遞給輸出G,從而有更多的梯度回傳。
          ?
          與此同時(shí),由于高維度的跳躍鏈接會(huì)導(dǎo)致更多的點(diǎn)加操作、需求更多的內(nèi)存讀取訪問(wèn),直接連接高維度跳躍鏈接會(huì)降低硬件執(zhí)行效率。
          ?
          一種新穎的殘差跳躍連接可以解決這一問(wèn)題:即只使用一部分信息通道進(jìn)行跳躍鏈接。這一操作可直接減少點(diǎn)加操作和特征圖大小,進(jìn)而直接提升硬件執(zhí)行效率。
          ?
          實(shí)驗(yàn)結(jié)果顯示,僅使用一半的信息通道進(jìn)行跳躍鏈接不會(huì)造成精度損失。
          ?
          引入更豐富的空間信息
          ?
          我們知道,1x1卷積有助于編碼通道間的信息,但難以獲取空間信息,而深度卷積可以。因此依圖團(tuán)隊(duì)沿著倒殘差模塊的思路引入了深度卷積來(lái)編碼空間信息。
          ?
          但跟倒殘差模塊不同的是深度卷積的位置。
          ?
          倒殘差模塊的深度卷積在兩個(gè)1x1卷積之間,而1x1卷積會(huì)降低空域信息編碼,因此依圖團(tuán)隊(duì)將深度卷積置于兩個(gè)1x1卷積之外(見(jiàn)圖三b中的兩個(gè)3x3深度卷積),這樣就能確保深度卷積在高維空間得到處理并獲得更豐富的特征表達(dá)。
          ?
          ? ? ? ? ? ? ?
          (該模塊可以采用如上公式進(jìn)行描述)
          ?
          激活函數(shù)的位置
          ?
          線性瓶頸層有助于避免特征出現(xiàn)零化現(xiàn)象導(dǎo)致的信息損失,因此在降維的1x1卷積后不再添加激活函數(shù)。同時(shí)最后一個(gè)深度卷積后也不添加激活函數(shù),激活函數(shù)只添加在第一個(gè)深度卷積與最后一個(gè)1x1卷積之后。
          ?
          基于上述考慮,得到了該文所設(shè)計(jì)的新穎的倒殘差瓶頸模塊,結(jié)構(gòu)如下表所示。
          ? ? ??
          圖四:新的殘差瓶頸模塊的具體連接方式
          ?
          基于上述所示沙漏瓶頸模塊,依圖團(tuán)隊(duì)提出了一種新的移動(dòng)端網(wǎng)絡(luò)架構(gòu)MobileNeXt。
          ? ? ? ?? ? ? ?圖五:依圖團(tuán)隊(duì)提出的新的移動(dòng)端網(wǎng)絡(luò)架構(gòu)
          ?
          依圖一直是穩(wěn)扎穩(wěn)打型的選手,做研究也很務(wù)實(shí)、不追求多和雜,梯度抖動(dòng)就解決抖動(dòng)的問(wèn)題,損失大就想辦法降低損失,追求的是實(shí)用和落地,而不是去刷各種比賽的榜單。
          ?

          對(duì)標(biāo)MobileNetV2,MobileNeXt參數(shù)更少精度更高

          既然是基于移動(dòng)端的網(wǎng)絡(luò),依圖團(tuán)隊(duì)在Google Pixel手機(jī)上進(jìn)行了測(cè)試,看MobileNeXt跟MobileNet V2相比,性能有多少提升。
          ?
          在PyTorch環(huán)境下,可以看到MobileNeXt在不同大小的模型下,精度均優(yōu)于MobileNetV2,而且模型越小,這種優(yōu)勢(shì)越明顯。
          ?? ? ? ?? ???圖六:與MobileNetV2 對(duì)比的實(shí)驗(yàn)結(jié)果
          ?
          當(dāng)與后訓(xùn)練量化方法結(jié)合時(shí),MobileNeXt也有很大優(yōu)勢(shì)。(后訓(xùn)練量化可以簡(jiǎn)單看做模型壓縮)

          ? ? ? ? ? ? ?
          ?圖七:當(dāng)與量化方法結(jié)合的時(shí)候,MobileNeXt的優(yōu)勢(shì)會(huì)更加明顯
          ?
          硬件執(zhí)行效率方面,僅使用部分新系統(tǒng)進(jìn)行跳躍鏈接可有效提高硬件執(zhí)行效率。值得注意的是,在進(jìn)行殘差信息通道實(shí)驗(yàn)的時(shí)候,沒(méi)有使用任何額外的監(jiān)督信息(比如知識(shí)蒸餾)。
          ?
          ? ? ? ? ? ? ?
          圖八:使用不同信息通道數(shù)目對(duì)模型精度的影響
          ?
          目標(biāo)檢測(cè)方面,相比MobileNetV2, 使用MobileNeXt的基礎(chǔ)架構(gòu),可帶來(lái)0.9mAP的收益。
          ? ? ? ? ? ? ?
          圖九:在PascalVOC 2017 數(shù)據(jù)集上的實(shí)驗(yàn)驗(yàn)證
          ?
          神經(jīng)網(wǎng)絡(luò)搜索方面,為驗(yàn)證信息處沙漏模型的高效性,依圖團(tuán)隊(duì)使用新提出的沙漏模型對(duì)神經(jīng)網(wǎng)絡(luò)搜索的搜索空間進(jìn)行了擴(kuò)充。在使用相同搜索算法的情況下,基于擴(kuò)充空間的搜索結(jié)果可以得到0.13% 的精度提升,同時(shí)減少25% 的參數(shù)量。
          ?
          ? ? ? ? ? ? ?
          圖十:使用相同搜索算法時(shí)基于擴(kuò)充空間的搜索結(jié)果
          ?
          透過(guò)現(xiàn)象看本質(zhì),是研發(fā)團(tuán)隊(duì)成功設(shè)計(jì)沙漏型瓶頸模塊及MobileNeXt的根本所在,可以看到,基礎(chǔ)領(lǐng)域的進(jìn)展最終靠的還是自身扎實(shí)的基本功。
          ?
          從這個(gè)層面講,依圖早已不再是傳統(tǒng)意義上的CV公司,而是憑借基礎(chǔ)算法的優(yōu)勢(shì)和芯片的加持,逐漸成長(zhǎng)為新一代的AI算力廠商。
          ?
          未來(lái),不光移動(dòng)端,云端和邊緣端的廠商也將從依圖的軟硬件協(xié)同算法創(chuàng)新中獲益,節(jié)約自主開(kāi)發(fā)的算力成本,更好地驅(qū)動(dòng)整體業(yè)務(wù)。
          ?
          從看、聽(tīng)再到本質(zhì)的理解,機(jī)器的智能在不斷進(jìn)化中逐漸邁向更高的維度,我們看到,依圖正在努力將智能化的理論不斷付諸實(shí)踐,成為AI落地的引路人。

          參考鏈接:
          https://arxiv.org/abs/2007.02269
          https://github.com/yitu-opensource/MobileNeXt
          https://www.cnblogs.com/dengshunge/p/11334640.html
          https://bbs.cvmart.net/articles/2861



          瀏覽 70
          點(diǎn)贊
          評(píng)論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          評(píng)論
          圖片
          表情
          推薦
          點(diǎn)贊
          評(píng)論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  99ree | 欧美A片免费在线观看 | 一级黄色片视频 | 国产手机自拍视频 | 免费看黄网站 7 7入口 |