MindSpore Reinforcement強化學(xué)習(xí)框架
MindSpore Reinforcement是一個開源的強化學(xué)習(xí)框架,支持使用強化學(xué)習(xí)算法對agent進行分布式訓(xùn)練。MindSpore Reinforcement為編寫強化學(xué)習(xí)算法提供了干凈整潔的API抽象,它將算法與部署和執(zhí)行注意事項解耦,包括加速器的使用、并行度和跨worker集群計算的分布。MindSpore Reinforcement將強化學(xué)習(xí)算法轉(zhuǎn)換為一系列編譯后的計算圖,然后由MindSpore框架在CPU、GPU或Ascend AI處理器上高效運行。
架構(gòu):
評論
圖片
表情
