<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          剛剛,華人再獲IEEE/ACM微體系頂會(huì)唯一最佳論文獎(jiǎng)!陳怡然組提出APOLLO全新方法

          共 3546字,需瀏覽 8分鐘

           ·

          2021-10-25 15:25



          ??新智元報(bào)道??

          來(lái)源:IEEE/ACM

          編輯:好困 小咸魚(yú)

          【新智元導(dǎo)讀】昨日,第54屆IEEE/ACM計(jì)算機(jī)體系結(jié)構(gòu)頂會(huì)MICRO 2021開(kāi)獎(jiǎng)!杜克大學(xué)的謝知遙、陳怡然教授團(tuán)隊(duì)獲得唯一最佳論文獎(jiǎng)。該研究可能是首次實(shí)現(xiàn)了用AI技術(shù)對(duì)芯片全生命周期進(jìn)行管理。


          又拿大獎(jiǎng)了!


          北京時(shí)間21日晚,杜克大學(xué)的謝知遙榮獲第54屆IEEE/ACM微體系結(jié)構(gòu)國(guó)際研討會(huì)最佳論文獎(jiǎng)(Best Paper Award)。

          恭喜!

          ?
          他的導(dǎo)師陳怡然教授也非常高興地發(fā)了一條微博表示祝賀。
          ?
          ?
          IEEE/ACM微體系結(jié)構(gòu)國(guó)際研討會(huì)是展示和討論先進(jìn)計(jì)算和通信系統(tǒng)的創(chuàng)新微體系結(jié)構(gòu)思想和技術(shù)的首要論壇。
          ?
          接收論文的主題包括硬軟件的很多領(lǐng)域,其中就包括新興應(yīng)用領(lǐng)域的架構(gòu),如深度學(xué)習(xí)、機(jī)器學(xué)習(xí)、關(guān)系計(jì)算、神經(jīng)形態(tài)、量子計(jì)算,還有加速器和異構(gòu)架構(gòu)設(shè)計(jì)等。
          ?
          本次研討會(huì)匯集了與微體系結(jié)構(gòu)、編譯器、芯片和系統(tǒng)相關(guān)領(lǐng)域的研究人員,就傳統(tǒng)微體系結(jié)構(gòu)主題和新興研究領(lǐng)域進(jìn)行技術(shù)交流。
          ?
          2021年,MICRO將作為全球在線活動(dòng)舉辦,由主辦城市希臘雅典轉(zhuǎn)播。主研討會(huì)將于10月19日星期二至10月21日星期四舉行,專(zhuān)題研討會(huì)的時(shí)間為10月18日星期一和10月22日星期五。

          在此之前,中科院計(jì)算所的陳云霽于2014年獲得過(guò)該獎(jiǎng)。
          ?

          獲獎(jiǎng)?wù)撐?/span>


          作為計(jì)算機(jī)的核心部件, CPU的性能每一年都在不斷提高 。而隨著摩爾定律日益失效,獲得每一代CPU性能提升變得越來(lái)越困難。

          為了獲得更好的性能,CPU設(shè)計(jì)師們不得不集成更多的晶體管,并且使用更多的并行計(jì)算模塊。這導(dǎo)致CPU內(nèi)的功耗與電流需求不斷增加,CPU的功耗成為一個(gè)日益嚴(yán)重的問(wèn)題。

          更糟糕的是,相比之下 CPU的輸電(power delivery)技術(shù)進(jìn)展依然緩慢。例如在先進(jìn)的5納米制程上,CPU輸電線(power delivery network)上的電阻會(huì)非常大。另外現(xiàn)有的封裝技術(shù)無(wú)法提供當(dāng)代CPU需要的快速變化的電流。

          這些都會(huì)導(dǎo)致最終CPU獲得的電壓低于設(shè)計(jì)電壓,從而降低CPU運(yùn)算速度,甚至導(dǎo)致功能發(fā)生錯(cuò)誤。這些嚴(yán)峻的挑戰(zhàn)直接限制了CPU的進(jìn)一步性能提升。

          設(shè)計(jì)時(shí)每周期功率分析流程。(a) 商業(yè)應(yīng)用;(b) 基于APOLLO;(c) APOLLO與仿真器輔助相結(jié)合

          要解決這些問(wèn)題,首先在CPU設(shè)計(jì)階段設(shè)計(jì)師需要充分考慮各種復(fù)雜的功耗場(chǎng)景,而在CPU運(yùn)行階段則需要實(shí)時(shí)避免過(guò)高的功耗與過(guò)快的電流需求變化。

          那么,無(wú)論是在CPU設(shè)計(jì)還是運(yùn)行階段,都需要對(duì)功耗進(jìn)行準(zhǔn)確、快速、低開(kāi)銷(xiāo)和高分辨率的分析。而在此之前幾乎沒(méi)有工作能夠同時(shí)滿足這些優(yōu)點(diǎn)。

          由于很多功耗模型是資深設(shè)計(jì)師們針對(duì)每一款CPU人工調(diào)試而成的,這將帶來(lái)巨大的人力成本,同時(shí)隨著CPU設(shè)計(jì)日趨復(fù)雜,想要人工設(shè)計(jì)準(zhǔn)確的功耗模型變得越來(lái)越困難。

          即使功耗模型在過(guò)去二十年里已經(jīng)被反復(fù)充分研究,但準(zhǔn)確、快速、低開(kāi)銷(xiāo)、自動(dòng)化的功耗分析方法也一直沒(méi)有被實(shí)現(xiàn)。

          杜克大學(xué)的團(tuán)隊(duì)與TAMU和工業(yè)界的Arm公司合作,共同提出了一套完整的解決方案。

          團(tuán)隊(duì)的研究論文《可用于大規(guī)模商業(yè)化處理器的全自動(dòng)化功耗模擬架構(gòu)》 (APOLLO: An Automated Power Modeling Framework for Runtime Power Introspection in High-Volume Commercial Microprocessors)獲得了2021年MICRO唯一的最佳論文獎(jiǎng)。
          ?
          https://dl.acm.org/doi/pdf/10.1145/3466752.3480064
          ?
          APOLLO使用一套統(tǒng)一的機(jī)器學(xué)習(xí)模型同時(shí)對(duì)設(shè)計(jì)和運(yùn)行階段的CPU功耗進(jìn)行極低開(kāi)銷(xiāo)的快速實(shí)時(shí)計(jì)算。這個(gè)方法在商業(yè)化的Arm CPU設(shè)計(jì)Neoverse N1和Cortex-A77上得到了充分驗(yàn)證。這種前所未有的功耗計(jì)算能力可能會(huì)極大改變CPU的設(shè)計(jì)和使用方式,同時(shí)開(kāi)啟新的應(yīng)用領(lǐng)域。
          ?
          以Neoverse N1為例,APOLLO提供了一個(gè)設(shè)計(jì)時(shí)功率模擬器和一個(gè)基于一致模型的運(yùn)行OPM
          ?
          另外,APOLLO可能是第一個(gè)AI技術(shù)用來(lái)對(duì)芯片全lifetime做管理的應(yīng)用,同時(shí)這個(gè)方法的整個(gè)流程是完全自動(dòng)化的,不依賴任何工程師的經(jīng)驗(yàn)。

          理論上可以用于任何芯片設(shè)計(jì),除了各種類(lèi)型的CPU,還可用于GPU,NPU,和其他芯片,甚至是芯片的某一部分模塊。團(tuán)隊(duì)認(rèn)為這種方法以后可能會(huì)成為芯片設(shè)計(jì)的標(biāo)準(zhǔn)設(shè)計(jì)。
          ?
          自動(dòng)化APOLLO框架
          ?

          在設(shè)計(jì)階段, APOLLO可以在幾分鐘內(nèi)獲得幾千萬(wàn)時(shí)鐘周期(cycle)的功耗,而傳統(tǒng)基于emulator的工業(yè)界方法需要多達(dá)兩個(gè)星期。APOLLO的準(zhǔn)確率非常之高,可以達(dá)到90%至95%。


          另外APOLLO的功耗分析可以精確到每個(gè)時(shí)鐘周期(cycle),之前任何方法在這種速度下都無(wú)法獲得這樣的高分辨率 (temporal resolution) 的功耗分析。

          ?
          OPM與CPU設(shè)計(jì)的整合
          ?
          在CPU運(yùn)行階段,APOLLO可以對(duì)CPU功耗和溫度進(jìn)行管理。為了實(shí)現(xiàn)這一點(diǎn),作者以極低的開(kāi)銷(xiāo)將APOLLO整合進(jìn)CPU芯片核心內(nèi)部,而這僅僅占用CPU芯片0.2%的面積,遠(yuǎn)低于之前類(lèi)似的工作。
          ?
          另外APOLLO可以在極短時(shí)間內(nèi)對(duì)CPU內(nèi)部的功耗變化進(jìn)行反饋,這樣就保證即使CPU內(nèi)部由于復(fù)雜的交互出現(xiàn)了電壓的快速下降也不怕。這種快速反饋也是傳統(tǒng)的功耗管理模塊所無(wú)法做到的。
          ?
          對(duì)Q=159的APOLLO模型的評(píng)估(Neoverse N1)

          ?

          APOLLO的核心是通過(guò)剪枝(pruning)算法自動(dòng)選取極少量與功耗最相關(guān)的CPU信號(hào)作為輸入,然后建立一個(gè)快速的線性模型,用于對(duì)每個(gè)周期的功耗進(jìn)行預(yù)測(cè)或監(jiān)測(cè)。


          除了信號(hào)選取和模型訓(xùn)練是自動(dòng)完成之外,訓(xùn)練數(shù)據(jù)也是通過(guò)遺傳算法自動(dòng)生成的,另外APOLLO模型的硬件設(shè)計(jì),也可以直接通過(guò)設(shè)置預(yù)先寫(xiě)好的C++ template并且進(jìn)行高層次綜合來(lái)簡(jiǎn)單實(shí)現(xiàn)。


          作者簡(jiǎn)介

          ?
          ?
          謝知遙,2017年在香港城市大學(xué)獲得電子與通信工程學(xué)士學(xué)位。本科畢業(yè)后進(jìn)入陳怡然和李海教授的實(shí)驗(yàn)室,成為杜克大學(xué)計(jì)算機(jī)工程專(zhuān)業(yè)博士生。
          ?
          博士期間他曾在多家半導(dǎo)體公司實(shí)習(xí),包括Cadence,Synopsys,NVIDIA,Arm。研究方向包括機(jī)器學(xué)習(xí)與芯片設(shè)計(jì)自動(dòng)化,尤其是智能化的芯片設(shè)計(jì)方法。
          ?

          ?
          陳怡然,杜克大學(xué)電子與計(jì)算機(jī)工程系教授、計(jì)算進(jìn)化智能實(shí)驗(yàn)室聯(lián)合主任。
          ?
          目前,陳教授的研究聚焦新型存儲(chǔ)系統(tǒng)、機(jī)器學(xué)習(xí)與神經(jīng)形態(tài)計(jì)算、以及移動(dòng)計(jì)算等方向的研究。陳怡然教授發(fā)表過(guò)一本專(zhuān)著及超過(guò)三百篇學(xué)術(shù)論文,獲得過(guò)93項(xiàng)美國(guó)專(zhuān)利,并出任過(guò)多本IEEE和ACM期刊編委以及超過(guò)40個(gè)國(guó)際會(huì)議的組織與技術(shù)委員會(huì)主席和委員。
          ?
          陳怡然教授曾經(jīng)獲得6次國(guó)際會(huì)議最佳論文以及12次最佳論文提名。他曾榮獲美國(guó)國(guó)家自然科學(xué)基金委教授早期職業(yè)發(fā)展獎(jiǎng)(NSF CAREER)和ACM電子自動(dòng)化協(xié)會(huì)新教師獎(jiǎng)。
          ?
          今年1月,陳教授因?yàn)樵诜且资源鎯?chǔ)技術(shù)領(lǐng)域做出杰出貢獻(xiàn),當(dāng)選ACM Fellow。
          ?
          今年4月29號(hào),陳教授的項(xiàng)目「Privacy-preserving representation learning on graphs — a mutual information perspective」(互信息視角的圖上保護(hù)隱私的表征學(xué)習(xí))進(jìn)入亞馬遜研究獎(jiǎng)(Amazon Research Awards, ARA)獲獎(jiǎng)名單。
          ?
          當(dāng)然,強(qiáng)將手下無(wú)弱兵,陳教授組里的最佳論文可不止這一篇。
          ?
          2020年,陳怡然組就曾以一篇「TIPRDC: Task-Independent Privacy-Respecting Data Crowdsourcing Framework for Deep Learning with Anonymized Intermediate Representations」(基于匿名中間表示的任務(wù)無(wú)關(guān)隱私的數(shù)據(jù)眾包框架)榮獲KDD 2020最佳學(xué)生論文獎(jiǎng)。
          ?
          文章的一作Ang Li是杜克大學(xué)電子和計(jì)算機(jī)工程系的一名在讀博士,北京大學(xué)碩士畢業(yè)。
          ?
          再次恭喜謝知遙和陳怡然教授!


          參考資料:
          https://www.microarch.org/micro54/
          https://dl.acm.org/doi/pdf/10.1145/3466752.3480064
          https://weibo.com/2199733231/KDOBo8PGz


          瀏覽 91
          點(diǎn)贊
          評(píng)論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          評(píng)論
          圖片
          表情
          推薦
          點(diǎn)贊
          評(píng)論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  操美女国产| 久久小视频 | 爱搞搞91搞搞 | 国产精品18欠久久久久久 | 丁香五月婷婷色 |