<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          寒武紀:等待下一個爆發(fā)期

          共 6128字,需瀏覽 13分鐘

           ·

          2021-11-12 09:47


          AI芯片市場,巨頭不會通吃一切。


          全文5987字,閱讀約需12分鐘


          文|陳俊一

          編輯|顧彥

          題圖|企業(yè)官網(wǎng)


          前幾日,寒武紀在官網(wǎng)宣布推出第三代云端AI芯片思元370及搭載該芯片的MLU370-S4、MLU370-X4加速卡和全新升級的Cambricon Neuware軟件棧等新品。沒有華麗的發(fā)布會,沒有炫彩的PPT,寒武紀發(fā)布新品的風(fēng)格,依然是典型的樸素“理工男”特點。


          在這個愈發(fā)重視AI芯片自主架構(gòu)、能擁有“殺手級”應(yīng)用場景、能實現(xiàn)算力突破與能耗雙控的時代,思元370其實具有多項領(lǐng)先優(yōu)勢:


          在架構(gòu)上,思元370屬于寒武紀第四代自研智能芯片架構(gòu),第一代架構(gòu)MLUarch00主打智能加速IP核,第二代MLUarch01主打多核架構(gòu),第三代MLUarch02主打多核共享片內(nèi)存儲,第四代MLUarch03更是寒武紀首款采用 chiplet(芯粒)技術(shù)的AI芯片,在國內(nèi)應(yīng)該也屬于行業(yè)首顆chiplet AI芯片。


          在應(yīng)用場景靈活性上,由于思元370在一顆芯片中封裝2顆AI計算芯粒(MLU-Die),每一個MLU-Die都具備獨立的AI計算單元、內(nèi)存、IO以及MLU-Fabric控制和接口,不同MLU-Die可以組合規(guī)格多樣化的產(chǎn)品,為用戶提供適用不同場景的高性價比AI芯片。


          在算力上,基于臺積電 7nm 制程工藝、整體集成390億個晶體管的思元370最大算力達到 256TOPS(INT8),相比上一代思元270算力直接翻倍。


          不到18個月就實現(xiàn)了算力翻倍,在通用處理器領(lǐng)域已經(jīng)失效的摩爾定律,在AI芯片領(lǐng)域還在延續(xù)。



          造芯片,技術(shù)和市場各有多重要


          算力翻倍究竟有多重要?


          現(xiàn)實世界對于算力的需求遠沒有到達頂峰。以英偉達為例,自2017年底英偉達發(fā)布Tesla V100之后,訓(xùn)練最大模型的算力需求增長了3000倍。


          舉例來說,僅是分析3000萬路視頻,以常見的英偉達Tesla P4顯卡為例約需100萬塊,總硬件成本200億元以上,一塊顯卡按照75瓦起步功耗計算總功耗也高達7.5萬千瓦。


          通過如思元370這樣更具效率的AI芯片在云端場景替代傳統(tǒng)GPU,就能夠大幅降低前期基礎(chǔ)設(shè)施建設(shè)成本,減少后期運行能耗。


          可以說,思元370成功推出的背后,不僅是寒武紀研發(fā)人員的日夜努力,也是社會各行各業(yè)對更高效率AI芯片的迫切需求。正如恩格斯所說,“社會一旦有技術(shù)上的需要,則這種需要就會比十所大學(xué)更能把科學(xué)推向前進”。


          隨著新一輪產(chǎn)業(yè)競爭與供應(yīng)鏈爭奪正在展開,對人工智能、數(shù)字化技術(shù)的需求只增不減。而各行各業(yè)更是向科創(chuàng)類產(chǎn)業(yè)企業(yè)界提出了前所未有的技術(shù)需求,在這種需求刺激下,AI創(chuàng)業(yè)企業(yè)的研發(fā)成果獲得落地應(yīng)用的機會更多,市場也更大。


          乘風(fēng)起勢,市場的需求讓AI芯片賽道涌入更多入局者,推動新技術(shù)的不斷迭代,也讓行業(yè)格局逐漸發(fā)生變動。


          目前,英偉達在AI芯片領(lǐng)域仍具有最大的影響力。在全球云端訓(xùn)練芯片市場,英偉達基本是一家獨大,其GPU+CUDA計算平臺是應(yīng)用最多的AI訓(xùn)練方案。在推理芯片領(lǐng)域,則呈現(xiàn)出百家爭鳴的競爭生態(tài),因為推理芯片更注重功耗、時延、成本等因素,且相比于訓(xùn)練芯片需求量更高,使用場景更廣泛。


          英偉達之外,英特爾、谷歌、IBM、AMD等巨頭以及寒武紀等初創(chuàng)企業(yè),都在AI芯片領(lǐng)域耕耘多年,并一步一步進行縱深研發(fā)。


          市場只會留給有準備的人。寒武紀作為初創(chuàng)企業(yè),對客戶需求的把握也精細到全流程跟進。比如思元370,不僅可以作為推理芯片,也可以作為訓(xùn)練芯片使用。這樣做的好處不僅是寒武紀自己的產(chǎn)品能夠兼顧訓(xùn)練與推理,也方便客戶全流程的模型部署、業(yè)務(wù)落地。


          實際上,今年1月寒武紀發(fā)布的首顆訓(xùn)練芯片思元290,在訓(xùn)練為主的同時也可以進行推理。借助Cambricon Neuware軟件棧提供的軟件及應(yīng)用生態(tài),就可以在思元290芯片上實現(xiàn)圖形圖像、語音、NLP、搜索推薦等多種應(yīng)用的訓(xùn)練和推理。


          此次思元370發(fā)布,Cambricon Neuware進一步整合了訓(xùn)練和推理的全部底層軟件棧,包括底層驅(qū)動、運行時庫、算子庫以及工具鏈等,將MagicMind和深度學(xué)習(xí)框架Tensorflow、Pytorch深度融合,實現(xiàn)訓(xùn)推一體。依托于訓(xùn)推一體,在寒武紀全系列計算平臺上,從云端到邊緣端,用戶均可以無縫地完成從模型訓(xùn)練到推理部署的全部流程,進行靈活的訓(xùn)練推理業(yè)務(wù)混布和潮汐式的業(yè)務(wù)切換,加快了用戶端到端業(yè)務(wù)落地的速度,減少模型訓(xùn)練研發(fā)到模型部署之間的繁瑣流程,可快速響應(yīng)業(yè)務(wù)變化,提升算力利用率,降低運營成本。


          推理加速引擎MagicMind是寒武紀軟件棧Cambricon Neuware全新升級的重要組成部分

          圖源:企業(yè)官網(wǎng)


          在巨大的市場需求推動下,技術(shù)進步也愈加快速,硬件上翻倍甚至更多倍的增長比比皆是。比如今年1月發(fā)布的思元290,相比思元270就實現(xiàn)峰值算力提升4倍、內(nèi)存帶寬提高12倍、芯片間通信帶寬提高19倍。


          硬件強只是起步,AI芯片企業(yè)更需要軟件強。比如英偉達在AI芯片領(lǐng)域的強大,除了硬件性能之外,也因為其CUDA生態(tài)已經(jīng)成為眾多人工智能開發(fā)者主流選擇,從而為自己造就了一條護城河。初創(chuàng)企業(yè),同樣需要建立自己的生態(tài)護城河。



          云、邊、端、車四位一體布局中的寒武紀優(yōu)勢


          AI芯片龍頭的優(yōu)勢,毋庸諱言。而寒武紀在最新的布局中,也顯現(xiàn)出一家創(chuàng)業(yè)企業(yè)的獨特優(yōu)勢。


          在今年7月舉辦的2021世界人工智能大會上,寒武紀首次披露了控股子公司行歌科技的進展,并披露研發(fā)中的車載智能芯片關(guān)鍵數(shù)據(jù)——基于7納米制程的車規(guī)級芯片,算力大于200TOPS,具備獨立安全島及成熟軟件工具鏈。


          據(jù)中國汽車工業(yè)協(xié)會數(shù)據(jù),2020年中國汽車銷量為2531.1萬輛。假如未來10年汽車銷量的規(guī)模繼續(xù)維持在2500萬輛左右,智能汽車滲透率能夠達到50%,車載智能芯片單車價值達到5000元,那就是高達625億元的市場規(guī)模。只是現(xiàn)在這一市場可能還不夠大,但未來整個智能駕駛系統(tǒng)的市場規(guī)模一定會堪比手機SOC、云端AI芯片。


          一方面,智能駕駛不僅是車載智能芯片的事情,未來的智能駕駛一定會涉及車路協(xié)同,通過路測的邊緣端智能芯片實現(xiàn)實時收集、低延時傳輸?shù)缆放c車輛、車輛之間的交互信息,將汽車本身獲取不到的盲區(qū)、路側(cè)、他車、超遠距離、全路網(wǎng)實時信息告知汽車端,幫助單個汽車或者智能車隊規(guī)劃路線;邊緣端傳感器采集的許多數(shù)據(jù)還會回傳至云端,利用云端智能芯片處理邊緣端芯片難以處理的復(fù)雜訓(xùn)練、推理任務(wù)。


          IDC半導(dǎo)體研究總監(jiān)Michael J. Palma曾說:“在邊緣系統(tǒng)中,神經(jīng)網(wǎng)絡(luò)做出的即時決策可以創(chuàng)造獨特的價值,不受延遲和連接問題的約束——而這些問題對云解決方案來說是個挑戰(zhàn)。”未來遍布路網(wǎng)的邊緣端智能芯片,將成為智能駕駛完整系統(tǒng)不可或缺的組成部分。整個智能駕駛的實現(xiàn),更需要“云邊端車”四位一體的深度聯(lián)動。


          另一方面,寒武紀本身在云邊端的AI處理器上已經(jīng)有著有代表性的量產(chǎn)產(chǎn)品。2016年成立初期就以IP授權(quán)的形式打入高端智能手機終端市場,在終端智能處理器IP授權(quán)業(yè)務(wù)上一戰(zhàn)成名之后,又迅速拓展云端業(yè)務(wù),通過新業(yè)務(wù)提高了公司的核心競爭力和抗風(fēng)險能力,成功規(guī)避了單一客戶帶來的波動影響。2019年底,寒武紀又發(fā)布了邊緣AI系列芯片及加速卡產(chǎn)品,通過統(tǒng)一的軟件開發(fā)平臺,實現(xiàn)云邊端無縫協(xié)同。


          從“云邊端一體化”走向“云邊端車”四位一體,對智能駕駛行業(yè)來說是一種未來的必然趨勢,對寒武紀自身來說則是一個自然的發(fā)展過程。


          寒武紀的“云邊端車”處理器都是用統(tǒng)一的處理器架構(gòu)和基礎(chǔ)軟件平臺,這意味著開發(fā)者只要在某一端應(yīng)用寒武紀的產(chǎn)品,其他端很容易就能實現(xiàn)互相兼容,大大減少不同平臺的開發(fā)和應(yīng)用遷移成本。


          寒武紀“云邊端車”的協(xié)同優(yōu)勢,在目前國內(nèi)車載智能芯片廠家中是較為獨特的。


          首先就是設(shè)計經(jīng)驗直接復(fù)用。國內(nèi)智能駕駛芯片企業(yè)一般采用12納米、14納米、16納米制程居多,行歌科技卻起步就要做7納米制程、200 TOPS以上算力。這種大算力、先進制程芯片,沒有過7納米制程經(jīng)驗的AI芯片企業(yè)是很難操作的,行歌科技的優(yōu)勢就在于可以直接復(fù)用母公司寒武紀的7納米芯片設(shè)計經(jīng)驗。


          其次,寒武紀的云端AI芯片屬于通用型AI芯片(非通用處理器),具有通用的AI軟件棧,客戶可以根據(jù)需要方便移植或開發(fā)自己的算法。從云端芯片到車載芯片,芯片上要移植新的智能駕駛算法,這種通用型就能夠避免行歌科技重新花大量的時間和精力去做適配工作。


          第三,在車載AI芯片的車規(guī)級要求上,雖然寒武紀此前沒有做過車規(guī)級產(chǎn)品,但從工業(yè)級到車規(guī)級,更多區(qū)別在于車規(guī)級的溫度、振動、侵蝕、電磁兼容、可靠性、一致性、產(chǎn)品生命周期等要求更嚴格,對芯片設(shè)計本身而言結(jié)構(gòu)變化并不大,拓展車載芯片的難度并不會高于此前從終端拓展到云端、邊緣端。


          一家企業(yè)能夠不斷拓展新的領(lǐng)域,且新領(lǐng)域具有足夠的市場空間,值得新入局者來此施展手腳,那么市場格局的新變化就頗值得關(guān)注。


          據(jù)了解,市面上具有“云邊端車”生態(tài)協(xié)同優(yōu)勢的玩家,其實只有兩三家,寒武紀正是其中之一。芯片領(lǐng)域一位投資人認為,車載智能芯片這一賽道在巨頭之外還是容得下五六家初創(chuàng)芯片公司,最終可能會有三家初創(chuàng)公司勝出,寒武紀或許也會是其中之一。



          等待下一個必然中的爆發(fā)期


          從2016年成立至今,寒武紀智能芯片的架構(gòu)已經(jīng)更迭了四代。


          比如最新的第四代智能處理器架構(gòu)MLUarch03,擁有新一代張量運算單元,內(nèi)置Supercharger模塊大幅提升各類卷積效率;采用全新的多算子硬件融合技術(shù),在軟件融合的基礎(chǔ)上大幅減少算子執(zhí)行時間;片上通訊帶寬是上一代MLUarch02的2倍、片上共享緩存容量最高是MLUarch02的2.75倍。配合最新架構(gòu),寒武紀還推出全新MLUv03指令集,更完備,更高效且向前兼容。


          寒武紀智能芯片架構(gòu)演進

          圖源:企業(yè)官網(wǎng)


          以每一代的架構(gòu)為基礎(chǔ),都可以開發(fā)出適合不同端的IP、芯片矩陣。而每一款芯片,又都會分成不同組件,比如按照十幾個組件設(shè)立十幾個研發(fā)小組,每個小組來做一個組件,最后把組件拼起來形成智能芯片。不同的小組可以根據(jù)項目需求,對組件進行多種組合、拼接,并實現(xiàn)不同芯片功能組件上重疊部分的高效復(fù)用。


          一方面,這就使得云、邊、端、車不同芯片擁有很多可以復(fù)用的組件與設(shè)計,讓“云邊端車”協(xié)同優(yōu)勢成為可能;另一方面,這也使得過去的積累不會因為業(yè)務(wù)線變化而浪費,哪怕是現(xiàn)在總營收占比已經(jīng)很小的IP授權(quán)業(yè)務(wù),對于其他覆蓋面更多的業(yè)務(wù)線,仍然有著生態(tài)拓展、技術(shù)復(fù)用的價值,比如在邊緣側(cè)智能芯片設(shè)計上復(fù)用。


          作為國內(nèi)AI芯片領(lǐng)域的先發(fā)者,先發(fā)者總要先去踩坑,但走過的每一步,都算數(shù)。


          寒武紀展示給外界的架構(gòu)更迭,一代又一代,是清晰而確定的。但每一代架構(gòu)更迭的背后,并不是一個重復(fù)造不同輪子的過程。


          從思元100到思元270再到新品思元370的技術(shù)躍遷和時間線來看,芯片架構(gòu)設(shè)計師剛完成這一代就要著手下一代,永遠是滾動推進的過程。寒武紀芯片架構(gòu)設(shè)計師需要一直關(guān)注國際最前沿的芯片設(shè)計、算法,讓寒武紀的智能芯片能夠高效適配未來可能的流行算法,但這也不意味著前一代架構(gòu)就要立即被取代。事實上,這也是國際頂尖芯片企業(yè)所采用的研發(fā)策略。


          在外界看來,一代接著一代是分段的。但對于寒武紀來說,每一代架構(gòu)之間都是互相勾連、鑲嵌、攢接的,雖然每更新一代處理能力提升、效率優(yōu)化都很大,但代際之間并非替代關(guān)系,而是適配不同的市場,從而實現(xiàn)資源的最大化利用。比如思元370和思元290之間就不是替代的關(guān)系,因為前者主要是推理芯片,后者主要是訓(xùn)練芯片,兩者是互補的關(guān)系。


          AI芯片的構(gòu)建很像搭積木,很多企業(yè)會使用ARM的內(nèi)核,這相當(dāng)于用樂高的積木搭建模型,巨頭生產(chǎn)好了積木,企業(yè)只需要搭模型就好。但寒武紀用的是自研內(nèi)核架構(gòu)、自研指令集,相當(dāng)于自己不僅要搭建模型還要生產(chǎn)積木,雖然擁有更高的自主性,但也增加了研發(fā)的成本。


          最新公布的寒武紀三季報顯示,前三季度公司主營收入2.22億元,同比上升41.19%;歸母凈利潤-62945.85萬元,同比下降103.37%;前三季度研發(fā)費用4.33億元,同比增長32.78%;銷售毛利率為50.75%,屬于芯片類企業(yè)正常水準。


          研發(fā)費用上,盡管已經(jīng)超過了營收,但在巨頭同樣投入很多研發(fā)的情況下,為了維持技術(shù)和產(chǎn)品的領(lǐng)先,寒武紀的研發(fā)仍然難以壓縮。


          如何看待寒武紀未來發(fā)展,其實和巨頭能否通吃一切一樣,是同一個問題的兩個面。


          如果未來巨頭通吃一切,那創(chuàng)業(yè)企業(yè)自然都要消亡。而只要巨頭無法通吃一切,AI芯片的市場份額中必然就會有頭部創(chuàng)業(yè)企業(yè)的一份。


          實際上,創(chuàng)業(yè)企業(yè)依然在不斷涌入AI賽道、AI芯片賽道。


          今年3月,全球電子技術(shù)知名媒體集團Aspencore發(fā)布的“中國IC設(shè)計100家排行榜”中,寒武紀入選AI芯片公司Top10。在美國著名半導(dǎo)體雜志《EETimes》發(fā)布的2021年“Silicon100”電子和半導(dǎo)體創(chuàng)業(yè)公司榜單,新上榜了9家中國企業(yè)。CB Insights最新的AI in Numbers報告也顯示,今年第二季度AI初創(chuàng)公司獲得的投資總量超過200億美元,創(chuàng)歷史新高。


          在很多國內(nèi)行業(yè)觀察者看來AI芯片企業(yè)已經(jīng)處于低谷之時,全球范圍內(nèi)對AI企業(yè)的看好與投資其實依然處于高峰期。初創(chuàng)AI芯片企業(yè)SambaNova 6月獲得6.76億美元投資,Graphcore、Groq、Scale AI等也都是AI芯片領(lǐng)域的熱門企業(yè)。


          盡管初創(chuàng)企業(yè)都會面對巨頭英偉達的陰影,但目前市值已經(jīng)突破7000億美元的英偉達,在短短5年前其實還只是一家不到500億美元市值的不被看好的衰落企業(yè)。哪怕英偉達這樣的巨頭,發(fā)展史也是波動起伏的歷史,在熬死和打敗其他的巨頭和初創(chuàng)企業(yè)之后,等到了AI計算的大爆發(fā),最終成為了一個目前任何人都無法繞過的巨頭。


          相比于巨頭,寒武紀目前依然是一家低調(diào)的初創(chuàng)企業(yè)。思元370很早就開始設(shè)計,2020年三季度完成流片,今年二季度完成封裝、測試,部分客戶已完成測試、導(dǎo)入,據(jù)悉在語音、視覺等場景的性能表現(xiàn)超出客戶預(yù)期,浪潮、阿里云、百度、招商銀行等客戶均給出了積極評價,但這些信息直到發(fā)布才告訴外界。


          專業(yè)分工是成熟產(chǎn)業(yè)鏈的特征,只要寒武紀能夠保持“理工男”的樸素作風(fēng),持續(xù)在架構(gòu)保持前瞻性,市場就不缺機會。


          巨頭不可能吃掉所有市場,巨頭不可能所有場景都自研,巨頭也不會購買競對巨頭的芯片產(chǎn)品。那么多初創(chuàng)企業(yè)進入AI芯片賽道,正是看中了巨頭與巨頭之間龐大的市場空間。


          在AI芯片保持技術(shù)先進性的寒武紀,也會像等待到AI計算大爆炸的英偉達一樣,遇到自己的爆發(fā)期。


          正如寒武紀創(chuàng)始人陳天石所說:“作為一家中立的芯片公司,我們走最正統(tǒng)的芯片設(shè)計公司的路徑,把應(yīng)用場景留給人工智能行業(yè)的客戶,而我們自己做大家的墊腳石?!?/strong>


          本文由億歐原創(chuàng),申請文章授權(quán)請后臺回復(fù)“轉(zhuǎn)載”,聯(lián)系相關(guān)運營人員,未經(jīng)授權(quán)不得轉(zhuǎn)載。




          RECOMMEND

          推薦閱讀



          瀏覽 43
          點贊
          評論
          收藏
          分享

          手機掃一掃分享

          分享
          舉報
          評論
          圖片
          表情
          推薦
          點贊
          評論
          收藏
          分享

          手機掃一掃分享

          分享
          舉報
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  99色在线视频 | 电影91久久 | 国内操逼视频 | 大香蕉在线伊 | 中文字幕无码在线播放 |