Super-mario-bros-A3C-pytorch超級馬里奧的 A3C 算法
Asynchronous Advantage Actor-Critic (A3C) for playing Super Mario Bros 是超級馬里奧兄弟的 A3C 算法,用于訓練代理玩超級馬里奧兄弟。
它可以:
- 通過運行 python train.py 來訓練模型
- 通過運行 python test.py 來測試已經(jīng)過訓練的模型
樣本示例:
要求:
- python 3.6
- gym
- cv2
- pytorch
- numpy
評論
圖片
表情
