<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          從全球領(lǐng)先企業(yè)看GPU發(fā)展方向

          共 5727字,需瀏覽 12分鐘

           ·

          2021-10-12 18:19



          GPU的優(yōu)勢在于多核,每個核擁有的緩存相對較小,數(shù)字邏輯運(yùn)算單元少且簡單。GPU市場已經(jīng)進(jìn)入寡頭競爭時(shí)代,PC端方面主要以Intel, NVIDIA,AMD為主。


          下載鏈接:GPU技術(shù)專題匯總

          1、AI芯片之下一代計(jì)算革命基石

          2、從自主可控發(fā)掘國產(chǎn)GPU機(jī)遇,逐步滲透提升市場規(guī)模?

          3、從全球領(lǐng)先企業(yè)看GPU 發(fā)展方向?

          4、人工智能核“芯”,GPU迎來發(fā)展良機(jī)?

          5、人工智能芯片的競爭:GPU、ASIC和FPGA

          6、自動駕駛芯片:GPU的現(xiàn)在和ASIC的未來?

          7、GPU制霸AI數(shù)據(jù)中心市場


          Intel借助其CPU在PC及服務(wù)器的絕對優(yōu)勢,在GPU市場方面也占據(jù)優(yōu)勢地位;NVIDIA與AMD則憑借領(lǐng)先的技術(shù),在獨(dú)立GPU領(lǐng)域占據(jù)優(yōu)勢。我們通過分析GPU的特性,以及NVIDIA與AMD的發(fā)展歷程,得出兩點(diǎn)結(jié)論:第一,外延并購加強(qiáng)研發(fā)才能提升市場競爭力;第二,獨(dú)立顯卡由于其優(yōu)秀的性能將會是未來的主要發(fā)展方向。


          捕捉GPU應(yīng)用的三大方向之一:追求極致的娛樂與性能平衡。全球游戲市場蓬勃發(fā)展,帶動PC出貨量上升。在多種PC當(dāng)中,游戲本受到的關(guān)注最多。游戲本的出貨的上升在較大的程度上是由于支持光追技術(shù)的游戲本增加。但是高性能的GPU相對笨重且功耗大,未來筆記本會向輕薄化與強(qiáng)性能方向發(fā)展。


          捕捉GPU應(yīng)用的三大方向之二:人工智能與深度學(xué)習(xí)。人工智能已經(jīng)成為經(jīng)濟(jì)發(fā)展的助推器。人工智能起始于深度學(xué)習(xí)。深度學(xué)習(xí)分為“訓(xùn)練”與“推理”兩個過程。在“訓(xùn)練”階段,GPU由于其多核特性,適用于并行計(jì)算;在“推理”階段,由于目前FPGA與ASIC的技術(shù)尚未成熟,GPU仍是較為主要芯片。


          捕捉GPU應(yīng)用的三大方向之三:自動駕駛。自動駕駛技術(shù)已經(jīng)成為整個汽車產(chǎn)業(yè)的最新發(fā)展方向,市場空間廣闊。目前,全球多個GPU公司已經(jīng)在自動駕駛方面布局。GPU由于其并行計(jì)算的優(yōu)勢能較好地處理圖像與媒體信息。目前GPU是自動駕駛領(lǐng)域的主流方案。


          GPU的作用與分類

          GPU(Graphic Processing Unit),及圖形處理器,是一種專門在個人電腦、工作站、游戲機(jī)和一些移動設(shè)備(如平板電腦、智能手機(jī)等)上做圖像和圖形相關(guān)運(yùn)算工作的微處理器。在 PC 誕生之初,并存在 GPU的概念,所有的圖形計(jì)算都由 CPU 進(jìn)行計(jì)算。然而,使用 CPU 做圖形計(jì)算速度較慢,于是就設(shè)計(jì)了專門的圖形加速卡用以幫助處理圖形計(jì)算。再后來,NVIDIA 提出了 GPU 的概念,將 GPU 提升帶了一個單獨(dú)的計(jì)算單元的地位。



          CPU 一般由邏輯運(yùn)算單元、控制單元和存儲單元組成。CPU 雖然有多核,但總數(shù)沒有超過兩位數(shù),每個核都有足夠大的緩存;CPU 有足夠多的數(shù)字和邏輯運(yùn)算單元,并輔助有很多加速分支判斷甚至更復(fù)雜的邏輯判斷的硬件。因此,CPU 擁有超強(qiáng)的邏輯能力。GPU的優(yōu)勢在于多核,核數(shù)遠(yuǎn)超 CPU,可以達(dá)到數(shù)百個,每個核擁有的緩存相對較小,數(shù)字邏輯運(yùn)算單元少且簡單。因此,GPU 相對于 CPU 更適用于處理數(shù)據(jù)并行計(jì)算問題。


          GPU 具有兩種分類方式,一種根據(jù)與 CPU 的關(guān)系,另一種是根據(jù) GPU 所在的應(yīng)用端類別。根據(jù)與 CPU 的關(guān)系,GPU 可以分為獨(dú)立 CPU 和 GPU。獨(dú)立 GPU 一般焊接在顯卡的電路板上,位置在顯卡的風(fēng)扇下面。獨(dú)立 GPU 使用的是專用的顯示存儲器,顯存帶寬決定了和GPU 的連接速度。集成 GPU 一般與 CPU 集成在一起。集成 GPU 與 CPU 共有一個風(fēng)扇和緩存。



          集成 GPU 由于設(shè)計(jì)制作、驅(qū)動程序都由 CPU 廠家完成,因此兼容性較好;此外,由 于 CPU 與 GPU 實(shí)現(xiàn)了集成,因此,集成 GPU 的占用空間小;實(shí)現(xiàn) GPU 與 CPU 的適配與兼容,集成 GPU 的性能相對獨(dú)立 GPU 較弱,因此功耗和成本相對獨(dú)立 GPU 較低。獨(dú)立 GPU由于擁有獨(dú)立的顯存,更大的空間和更好的散熱,因此在性能上面獨(dú)立顯卡更好;但需要額外的空間,能夠滿足復(fù)雜龐大的圖形處理需求,并提供高效的視頻編碼應(yīng)用。然而,強(qiáng)勁的性能意味著更高的耗能,獨(dú)立 GPU 需要額外的供電,并且成本也更高。


          根據(jù)應(yīng)用終端類別,可以分為 PC GPU,服務(wù)器 GPU,移動 GPU。PC GPU 應(yīng)用于 PC 端。根據(jù)其所在產(chǎn)品定位既可以使用集成 GPU,也可以使用獨(dú)立 GPU。例如,若 PC 以輕辦公,文字編纂為主,一般產(chǎn)品會選擇搭載集成 GPU;若 PC 需要制作高清圖片,編輯視頻,渲染游戲等,則選擇的產(chǎn)品搭載獨(dú)立 GPU。服務(wù)器 GPU 應(yīng)用于服務(wù)器,可做專業(yè)可視化、計(jì)算加速、深度學(xué)習(xí)等應(yīng)用,根據(jù)云計(jì)算、人工智能等一系列技術(shù)的發(fā)展,服務(wù)器 GPU將會以獨(dú)立 GPU 為主。



          移動端輕薄化已經(jīng)成為趨勢,終端內(nèi)部凈空間由于多種功能模組的增加已經(jīng)快速下降;同時(shí)就目前移動端需要處理的視頻和圖像而言,集成 GPU 已經(jīng)能夠滿足。所以移動 GPU 一般采用集成 GPU。


          GPU市場:寡頭競爭時(shí)代已經(jīng)來臨

          PC GPU市場,Intel優(yōu)勢明顯。Intel 是全球最大的處理器供應(yīng)商。目前主流的處理器架構(gòu)是 X86,主要的供應(yīng)商是 Intel,AMD,VIA。Intel 憑借在 CPU 出貨量上的優(yōu)勢,通過銷售集成 GPU,實(shí)現(xiàn)了在 GPU 市場的霸主地位。AMD 作為全球第二大的 X86 架構(gòu)處理器供應(yīng)商,既受益于 CPU 出貨帶動的集成 GPU 出貨量,也受益于自身優(yōu)秀的獨(dú)立 GPU 的出貨。NVIDIA 是全球領(lǐng)先的獨(dú)立 GPU 供應(yīng)商,同時(shí)結(jié)合 ARM 架構(gòu)處理器,出貨集成GPU.


          獨(dú)立CPU領(lǐng)域,AMD奮起直追。AMD 推出的Radeon 系列部分型號采用 7nm 工藝,并且在與 NVIDIA 的產(chǎn)品對比中(RTX2070 對標(biāo)RX5700,RTX2070S 對標(biāo) 5700XT),同系列 AMD 性能略強(qiáng),價(jià)格更低,重點(diǎn)是功耗一樣。更強(qiáng)的性能,更低的功耗,AMD 的產(chǎn)品無疑對 NVIDIA 的市場份額造成了挑戰(zhàn)。



          五雄爭霸,手機(jī)廠商不甘寂寞。在移動 GPU 領(lǐng)域,主要以 Imagination、ARM、Qualcomm、Vivante、NVIDIA 為主。高通目前是 Android 陣營最大的處理器供應(yīng)商。移動端主要使用集成 GPU,因此,高通 GPU 因其處理器的市場優(yōu)勢也有所受益。ARM Mail GPU 的主要使用者是華為和三星。ARM Mail 的 GPU 性能相對較弱,因此華為在2018年通過推出 GPUTurbo 軟硬件優(yōu)化彌補(bǔ)短板。



          三星方面已經(jīng)與 AMD 前敵多年的 IP 授權(quán),AMD 將向三星授權(quán)最新的 7nm RDNA 架構(gòu) Radeon 顯卡 IP,并且嘗試自研 GPU。蘋果在與 Imagination取消合作兩年后,再次選擇與 Imagination 合作,并給予支付授權(quán)費(fèi)。雖然目前手機(jī)巨頭都是采取購買 GPU 廠商 IP 的方式,但是目前三星、蘋果、華為等有相關(guān)計(jì)劃進(jìn)行 GPU 自研項(xiàng)目。手機(jī)已經(jīng)進(jìn)入同質(zhì)化時(shí)代,手機(jī)之間的差異性已經(jīng)成為手機(jī)廠商競爭優(yōu)勢的關(guān)鍵。公版 GPU 難以使手機(jī)廠商產(chǎn)生本質(zhì)的差異性。因此,手機(jī)需要通過自研 GPU 以及 CPU 實(shí)現(xiàn)手機(jī)性能的差異化,從而獲得市場的競爭優(yōu)勢。


          捕捉GPU 應(yīng)用的三大方向之一:追求極致的娛樂與性能平衡

          移動端占據(jù)主要市場,PC 端游戲市場規(guī)模繼續(xù)擴(kuò)大。近年來,隨著移動終端與 PC 終端的普及率不斷提升,游戲開發(fā)商提供各類吸引玩家的游戲,游戲市場出現(xiàn)了蓬勃發(fā)展。


          中國賽區(qū)具備良好的電競市場土壤,市場規(guī)模巨大。中國電競用戶分布更為分散。根據(jù)前瞻產(chǎn)業(yè)研究院數(shù)據(jù)顯示,中國有 48.1%的電競用戶是在 24 歲以下的學(xué)齡段用戶,更有高達(dá) 28.1%的 30 歲以上用戶。


          捕捉GPU 應(yīng)用的三大方向之二:人工智能與深度學(xué)習(xí)

          人工智能影響深遠(yuǎn),三大因素驅(qū)動發(fā)展。當(dāng)前,人工智能已進(jìn)入新一輪爆發(fā)期,主要驅(qū)動因素來自三個方面:一是互聯(lián)網(wǎng)發(fā)展提供了海量大數(shù)據(jù)資源,大大提升了算法有效性;二是計(jì)算機(jī)變革降低了硬件成本,縮短了運(yùn)算時(shí)間,推動人工智能再次崛起;三是基礎(chǔ)算法和 AI 平臺自身創(chuàng)新加速,克服了傳統(tǒng)算法和人類手工總結(jié)不完備的缺點(diǎn),實(shí)現(xiàn)算法有效性大幅提升。


          人工智能前景廣闊,是經(jīng)濟(jì)社會發(fā)展的一大助推器,吸引世界主要國家爭相布局。近年來,美國、中國、日本、英國、法國、韓國、歐盟委員會都發(fā)布了促進(jìn) AI 研究、開發(fā)和應(yīng)用的戰(zhàn)略,積極在人工智能領(lǐng)域進(jìn)行卡位


          全球人工智能市場將在未來幾年經(jīng)歷現(xiàn)象級的增長。德勤預(yù)測,未來 2025 年世界人工智能市場將超過6萬億美元,2017-2025 年復(fù)合增長率達(dá) 30%。


          人工智能是實(shí)現(xiàn)數(shù)字化和智能化社會必不可少的條件。人工智能的三大要素:數(shù)據(jù)、算力、算法。數(shù)據(jù)是人工智能算法的原材料。人工智能需要對大數(shù)據(jù)的處理與分析,挖掘出數(shù)據(jù)背后的信息與規(guī)律。算力是對大數(shù)據(jù)進(jìn)行處理的能力。算法是計(jì)算機(jī)通過對數(shù)據(jù)的處理獲得的數(shù)據(jù)模型。深度學(xué)習(xí)的本質(zhì)是通過對大數(shù)據(jù)的處理并建立的算法模型,可以實(shí)現(xiàn)各行業(yè)的 AI 應(yīng)用,算法將數(shù)據(jù)和算力連到一起,共同針對不同細(xì)分場景,提供效率優(yōu)化方案。


          人工智能運(yùn)行過程中有兩部分:訓(xùn)練與推理。“訓(xùn)練”可以看作算法產(chǎn)生的過程。具體而言就是,在現(xiàn)有數(shù)據(jù)基礎(chǔ)上,經(jīng)過大量計(jì)算,確定模型參數(shù),即建立算法模型的過程。“推理”可以看作將算法應(yīng)用的過程,即在已建立的算法模型基礎(chǔ)上,將新數(shù)據(jù)通過算法模型處理,得出結(jié)果的過程。



          “訓(xùn)練”階段 GPU 具備明顯優(yōu)勢。雖然 CPU 的功能模塊較多,但是大部分晶體管主要用于構(gòu)建控制電路和高速緩沖存儲器,只有少部分的晶體管可以組成各類專用電路。CPU的優(yōu)點(diǎn)在于調(diào)度、管理、協(xié)調(diào)能力強(qiáng),計(jì)算能力不是重點(diǎn)。因此,從運(yùn)算性能和效率看,CPU 不是計(jì)算芯片的最佳選擇。深度學(xué)習(xí)算法需要處理海量數(shù)據(jù),需要進(jìn)行大量的簡單運(yùn)算,因此,深度學(xué)習(xí)對并行計(jì)算計(jì)算能力有較高的要求。在這一方面,GPU 擁有較強(qiáng)的優(yōu)勢,尤其是在訓(xùn)練過程中。


          “推理”階段 GPU 是其中一種選擇。訓(xùn)練與推理階段對運(yùn)算的要求有所不同,訓(xùn)練階段需要大量繁復(fù)的運(yùn)算,并且為了讓人工智能模型獲得更佳的參數(shù)調(diào)整數(shù)據(jù),運(yùn)算的精準(zhǔn)細(xì)膩度較高,而推理階段則相反,模型已經(jīng)訓(xùn)練完成,不再需要龐大運(yùn)算量,且為了盡快獲得推理結(jié)果,允許以較低的精度運(yùn)算。因此,在推理過程中,芯片有多種選擇,主要用 CPU、GPU、FPGA、ASIC 四種芯片。



          CPU適合進(jìn)行邏輯控制、串行計(jì)算等通用計(jì)算;GPU 并行計(jì)算能力強(qiáng),但是無法單獨(dú)工作,必須由 CPU 進(jìn)行控制調(diào)用才能工作;FPGA 適用于多指令,單數(shù)據(jù)流的分析,因此常用于預(yù)測階段,如云端。但是 FPGA 在實(shí)現(xiàn)復(fù)雜算法方面有一定的難度,運(yùn)算量相對 GPU 小,量產(chǎn)成本高;ASIC 專用性強(qiáng),但是開發(fā)周期較長,開發(fā)環(huán)境需要底層硬件編程,開發(fā)難度極高。


          捕捉GPU 應(yīng)用的三大方向之三:自動駕駛

          智能汽車是指通過搭載先進(jìn)傳感器等裝置,運(yùn)用人工智能等新技術(shù),具有自動駕駛功能,逐步成為智能移動空間和應(yīng)用終端的新一代汽車。當(dāng)前,自動駕駛技術(shù)已經(jīng)成為整個汽車產(chǎn)業(yè)的最新發(fā)展方向。應(yīng)用自動駕駛技術(shù)可以全面提升汽車駕駛的各方面性能,滿足更高層次的市場需求。5G 的加速推進(jìn)使自動駕駛的落地可能性在不斷增大,同時(shí)近兩年隨著感知技術(shù)、算法、芯片、決策控制、系統(tǒng)融合等關(guān)鍵技術(shù)的快速發(fā)展。


          自動駕駛目前以 GPU 為主:一般而言,自動駕駛車身需要配置 12 個攝像頭。為了識別障礙物,處理器需要對多路攝像頭實(shí)時(shí)拍攝的數(shù)據(jù)進(jìn)行解析。因此,單顆 1080P的高清攝像頭每秒可以產(chǎn)生超過 1G 的數(shù)據(jù)。12 個攝像頭每秒產(chǎn)生 12G 數(shù)據(jù)量。


          瞬時(shí)海量的數(shù)據(jù)處理對計(jì)算能力要求非常高,GPU 有著較強(qiáng)的優(yōu)勢。相比 GPU 在傳統(tǒng)的車載儀表盤渲染能力要求,ADAS 更強(qiáng)調(diào) GPU 的并行計(jì)算能力,已實(shí)現(xiàn)對圖像進(jìn)行分析和處理。ADAS 和全自動駕駛平臺將使用 GPU 來分析傳感器數(shù)據(jù),以此迅速做出反應(yīng)。這些數(shù)據(jù)不僅來自傳感器,還來自攝像頭。圖像處理本身需要的是能對計(jì)算密集度較高得并行計(jì)算做出反應(yīng),在并行計(jì)算方面,GPU 有著較強(qiáng)的優(yōu)勢。


          目前,自動駕駛的主流方案是GPU + CPU 。這是由于 FPGA 的技術(shù)門檻較高,處于創(chuàng)業(yè)類自動駕駛公司而言在短期內(nèi)掌握足夠熟練的 FPGA 編程技術(shù)并實(shí)現(xiàn)硬件可靠性設(shè)計(jì)的難度太大,因此使用通用型 CPU+GPU 來做自動駕駛計(jì)算平臺或域控制器的開發(fā)成為當(dāng)前的主流。



          下載鏈接:GPU技術(shù)專題匯總

          1、AI芯片—下一代計(jì)算革命基石

          2、從自主可控發(fā)掘國產(chǎn)GPU機(jī)遇,逐步滲透提升市場規(guī)模?

          3、從全球領(lǐng)先企業(yè)看GPU 發(fā)展方向?

          4、人工智能核“芯”,GPU迎來發(fā)展良機(jī)?

          5、人工智能芯片的競爭:GPU、ASIC和FPGA

          6、自動駕駛芯片:GPU的現(xiàn)在和ASIC的未來?

          7、GPU制霸AI數(shù)據(jù)中心市場


          ARM架構(gòu)參考手冊及文檔

          ARM的體系結(jié)構(gòu)與編程.pdf

          ARM架構(gòu)參考手冊.pdf

          ARM架構(gòu)參考手冊ARM V9.pdf

          CPU之戰(zhàn):ARM vs Intel.pdf

          ARM系列處理器應(yīng)用技術(shù)完全手冊

          CPU和GPU研究框架合集

          本號資料全部上傳至知識星球,更多內(nèi)容請登錄智能計(jì)算芯知識(知識星球)星球下載全部資料。




          免責(zé)申明:本號聚焦相關(guān)技術(shù)分享,內(nèi)容觀點(diǎn)不代表本號立場,可追溯內(nèi)容均注明來源,發(fā)布文章若存在版權(quán)等問題,請留言聯(lián)系刪除,謝謝。



          電子書<服務(wù)器基礎(chǔ)知識全解(終極版)>更新完畢,知識點(diǎn)深度講解,提供182頁完整版下載。

          獲取方式:點(diǎn)擊“閱讀原文”即可查看PPT可編輯版本和PDF閱讀版本詳情。



          溫馨提示:

          請搜索“AI_Architect”或“掃碼”關(guān)注公眾號實(shí)時(shí)掌握深度技術(shù)分享,點(diǎn)擊“閱讀原文”獲取更多原創(chuàng)技術(shù)干貨。


          瀏覽 53
          點(diǎn)贊
          評論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          評論
          圖片
          表情
          推薦
          點(diǎn)贊
          評論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  恨恨干大香蕉 | 最新国产成人小电影 | 97爽无码人妻aⅴ精品牛牛 | 国产美女与美女日逼 | 亚洲欧洲无码在线观看 |