PyTorch 1.10正式版上線:Android NNAPI支持來了
點擊下方卡片,關(guān)注“新機器視覺”公眾號
視覺/圖像重磅干貨,第一時間送達
機器之心報道
廣受人們歡迎的深度學(xué)習(xí)框架 PyTorch 剛剛更新了 1.10 正式版,在 CUDA Graphs API 等方面進行了諸多改進。

集成了 CUDA Graphs API 以減少 CUDA 工作負載的 CPU 開銷; FX、torch.special 和 nn.ModuleParametrization 等幾個前端 API 已從測試版變?yōu)榉€(wěn)定版; 除了 GPU 之外,JIT Compiler 中對自動融合的支持擴展到 CPU; Android NNAPI 支持現(xiàn)已推出測試版。

Remote Module(穩(wěn)定版):此功能允許用戶遠程操作模塊,就像使用本地模塊一樣,其中 RPC 對用戶是透明的; DDP Communication Hook(穩(wěn)定版):此功能允許用戶覆蓋 DDP 如何跨進程同步梯度; ZeroRedundancyOptimizer(穩(wěn)定版):此功能可與 DistributedDataParallel 結(jié)合使用,以減少每個進程優(yōu)化器狀態(tài)的大小。
增強型內(nèi)存視圖:這有助于用戶更好地了解內(nèi)存使用; 增強型內(nèi)核視圖:附加列顯示網(wǎng)格和塊大小以及每個線程共享內(nèi)存使用和寄存器的情況; 分布式訓(xùn)練:Gloo 現(xiàn)在支持分布式訓(xùn)練工作; TensorCore:該工具顯示 Tensor Core(TC) 的使用,并為數(shù)據(jù)科學(xué)家和框架開發(fā)人員提供建議; NVTX:對 NVTX markers 的支持是從舊版 autograd profiler 移植過來的; 支持移動設(shè)備分析:PyTorch profiler 現(xiàn)在與 TorchScript 、移動后端能夠更好的集成,支持移動工作負載的跟蹤收集。

—版權(quán)聲明—
僅用于學(xué)術(shù)分享,版權(quán)屬于原作者。
若有侵權(quán),請聯(lián)系微信號:yiyang-sy 刪除或修改!
評論
圖片
表情
