有bug!PyTorch在AMD CPU的計(jì)算機(jī)上卡死了

極市導(dǎo)讀
AMD,No?PyTorch在AMD CPU的機(jī)器上出現(xiàn)死鎖了。 >>加入極市CV技術(shù)交流群,走在計(jì)算機(jī)視覺(jué)的最前沿

遇到了什么 bug
使用帶有 AMD cpu 和多個(gè) NVIDIA gpu 的機(jī)器;
Linux、Python3.8、cuda 11.0、pytorch 1.7.1、 torchvision 0.8.2;
編寫(xiě)代碼在 torchvision 中訓(xùn)練 resnet18 模型;
可以嘗試測(cè)試數(shù)據(jù)并行 (DP) 和分布式數(shù)據(jù)并行(DDP),以檢查是否都會(huì)出現(xiàn)這種情況。
當(dāng)使用 AMD cpu 時(shí),在訓(xùn)練的第一個(gè) epoch 和第一次迭代的前向傳播時(shí)會(huì)發(fā)生死鎖;
當(dāng)使用 intel cpu 時(shí),相同的代碼運(yùn)行良好。
尚未解決



推薦閱讀
2021-04-02
2021-04-02
2021-04-01

# CV技術(shù)社群邀請(qǐng)函 #
備注:姓名-學(xué)校/公司-研究方向-城市(如:小極-北大-目標(biāo)檢測(cè)-深圳)
即可申請(qǐng)加入極市目標(biāo)檢測(cè)/圖像分割/工業(yè)檢測(cè)/人臉/醫(yī)學(xué)影像/3D/SLAM/自動(dòng)駕駛/超分辨率/姿態(tài)估計(jì)/ReID/GAN/圖像增強(qiáng)/OCR/視頻理解等技術(shù)交流群
每月大咖直播分享、真實(shí)項(xiàng)目需求對(duì)接、求職內(nèi)推、算法競(jìng)賽、干貨資訊匯總、與 10000+來(lái)自港科大、北大、清華、中科院、CMU、騰訊、百度等名校名企視覺(jué)開(kāi)發(fā)者互動(dòng)交流~

