打破Batch Size的玄學(xué)!有關(guān) batch size 的設(shè)置范圍,其實(shí)不必那么拘謹(jǐn)
導(dǎo)讀
GPU 對(duì) 2 的冪次的 batch 可以發(fā)揮更好性能?今天來(lái)打破這個(gè)認(rèn)知!著名機(jī)器學(xué)習(xí)博主用理論推導(dǎo)和實(shí)驗(yàn)結(jié)果證明:選擇批大小作為 2 的冪或 8 的倍數(shù)在實(shí)踐中會(huì)并不會(huì)產(chǎn)生明顯的差異。

前言
理論背景
內(nèi)存對(duì)齊

矩陣乘法和 Tensor Core



簡(jiǎn)單的 Benchmark
小 Batch Size 基準(zhǔn)

最大 Batch Size 基準(zhǔn)

多GPU訓(xùn)練

基準(zhǔn)測(cè)試注意事項(xiàng)
其他資源和討論
顯卡是否有 Tensor Core; 顯卡是否支持混合精度訓(xùn)練; 在像 DeiT 這樣的無(wú)卷積視覺轉(zhuǎn)換器。
結(jié)論
評(píng)論
圖片
表情
