因買(mǎi)不到 RTX 3090,他花 19 萬(wàn)搭了一個(gè)專(zhuān)業(yè)級(jí)機(jī)器學(xué)習(xí)工作站
點(diǎn)擊上方“視學(xué)算法”,選擇加"星標(biāo)"或“置頂”
重磅干貨,第一時(shí)間送達(dá)



GPU
消費(fèi)級(jí):RTX 3080 / RTX 3090 專(zhuān)業(yè)級(jí)(prosumer,或稱(chēng)生產(chǎn)性消費(fèi)級(jí)):A6000 企業(yè)級(jí):A100
消費(fèi)級(jí):兩個(gè)RTX 3080s / RTX 3090s 專(zhuān)業(yè)級(jí):四個(gè)A6000 企業(yè)級(jí):8個(gè)A100或A6000(PCIe),或16個(gè)A100(SXM4),或20個(gè)A100(基于PCIe的模塊化刀片節(jié)點(diǎn))
非企業(yè)級(jí)GPU的限制
PCIe轉(zhuǎn)接卡的主板限制:14個(gè)GPU(每個(gè)GPU x8 Gen 4.0) 每個(gè)插槽的用電量限制:8個(gè)GPU(美國(guó)為4個(gè)) 消費(fèi)級(jí)電源限制:5個(gè)GPU(2000W) 標(biāo)準(zhǔn)PC機(jī)箱尺寸:4個(gè)雙插槽GPU
堆疊的顯卡彼此相鄰:4個(gè)A6000 / 3070或2個(gè)3080/3090 熱量限制:2個(gè)GPU(最好是水冷式) 消費(fèi)者供應(yīng)量:1個(gè)GPU(大多數(shù)商店只允許購(gòu)買(mǎi)一個(gè)消費(fèi)級(jí)GPU,并且通常僅在發(fā)布后3到12個(gè)月內(nèi)可購(gòu)買(mǎi))

為什么存在8-GPU消費(fèi)級(jí)工作站?
2
專(zhuān)業(yè)級(jí)顯卡和企業(yè)級(jí)顯卡的功能
快1.1-2倍(取決于GPU、二進(jìn)制浮點(diǎn)格式和模型) 1.7-3.3倍的內(nèi)存 能耗更低(更適合堆疊卡) 數(shù)據(jù)中心部署(非營(yíng)利組織可以獲取消費(fèi)卡許可)
ECC內(nèi)存(防錯(cuò)內(nèi)存) 每個(gè)GPU和MIG(僅限企業(yè)級(jí))可有多個(gè)用戶 NVSwitch(A100 SXM4),更快的GPU到GPU的通信
3
服務(wù)器限制
帶有消費(fèi)級(jí)部件的服務(wù)器:4個(gè)PCIe GPU PCIe服務(wù)器的限制:10個(gè)雙插槽GPU(標(biāo)準(zhǔn)服務(wù)器的寬度) 重量:10個(gè)PCIe GPU或4個(gè)SMX4 GPU(30千克)
PCIe服務(wù)器機(jī)箱的聯(lián)網(wǎng)限制:8個(gè)雙插槽GPU(2個(gè)雙插槽用于聯(lián)網(wǎng)) SXM4服務(wù)器的機(jī)箱數(shù)量限制:16個(gè)GPU(168千克) PCIe刀片服務(wù)器限制:20個(gè)雙插槽GPU
4
速度基準(zhǔn)
https://lambdalabs.com/blog/tag/benchmarks/ https://lambdalabs.com/gpu-benchmarks



GPU定價(jià)
A100 SMX4(80 GB):€18k A100 SMX4(40 GB):€13k A100 PCIe(40 GB):€9k
RTX A6000 / A40(48GB):€4500 RTX 3090(24 GB):€1500-2000 RTX 3080(10 GB):€800-1300 RTX 3070(12 GB):€700-1000
機(jī)器學(xué)習(xí)工作站預(yù)算
€240-340k:8 x A100 SXM4(80 GB) €120-170k:8 x A100 SXM4(40 GB)
€90k:8 x A100 PCIe(40 GB) €50k:4 x A100 PCIe或8 x RTX A40(無(wú)風(fēng)扇RTX A6000) €25k:4 x RTX A6000(我的裝備) €25k:4 x RTX 3090(液冷) €15k:4 x RTX 3090(加密風(fēng)格或上限性能)
€10k:4 x RTX 3070 €7k:2 x RTX 3090 €5k:1 x RTX 3090或2 x RTX 3080 €4k:1 x RTX 3080 €3k:1 x RTX 3070
CPU
消費(fèi)級(jí):帶有AM4插槽的Ryzen 5000 專(zhuān)業(yè)級(jí):Ryzen Threadripper第三代,帶有sTRX4,以及用于第一代Pro版本的sWRX8插槽 企業(yè)級(jí):帶有SP3插槽的EPYC 2
CPU散熱
銳龍5000:Noctua NH-D15或Corsair H100i RGB PLATINUM Threadripper:Noctua NH-U14S TR4-SP3或Corsair Hydro系列H100x EPYC:Dynatron A26 2U(用于服務(wù)器)
主板
銳龍5000:MSI PRO B550-A PRO AM4(ATX) Threadripper 3rd Gen:華擎TRX40 CREATOR(ATX) Threadripper Pro:ASUS Pro WS WRX80E-SAGE SE(ETAX) EPYC 2:AsRock ROMED8-2T(ATX)(我的主板)
主板尺寸

PCI Express(PCIe)

PCIe物理長(zhǎng)度:圖中每個(gè)插槽的長(zhǎng)度為x16,GPU的標(biāo)準(zhǔn)長(zhǎng)度為89mm。 PCIe帶寬:有時(shí),你有一個(gè)16插槽的長(zhǎng)度,但只有一半的插槽有連接到主板的管腳,使其成為x8帶寬的x16插槽。作為參考,加密鉆機(jī)將使用x16適配器,但x1帶寬。 生成速度:上面的板是4.0代。每一代的速度往往是上一代的兩倍。NVIDIA的最新gpu是gen4.0,但在實(shí)際應(yīng)用中在gen3.0板上的性能相當(dāng)。 多GPU要求:對(duì)于4-10 GPU系統(tǒng),通常建議每個(gè)GPU至少x8 Gen 3.0。
PCIe通道
機(jī)箱


10
PSU、RAM和存儲(chǔ)
搭建和安裝
)結(jié)論

點(diǎn)個(gè)在看 paper不斷!
評(píng)論
圖片
表情
