【強(qiáng)化學(xué)習(xí)】開(kāi)源環(huán)境集(魂斗羅、星際爭(zhēng)霸等都有!)
游戲環(huán)境
OpenAI Gym Retro
OpenAI 發(fā)布的增強(qiáng)的游戲強(qiáng)化學(xué)習(xí)研究平臺(tái),Gym Retro。其中包括對(duì)任天堂 Game boy,NES, 世嘉游戲等各種模擬器的支持。通過(guò)附帶的 Integration UI 程序可以加載nes,md,snes等格式并抽取游戲的 reward 和 state。
https://github.com/openai/retro/
經(jīng)典魂斗羅 ? 
F1 賽車

沙羅曼蛇
?
Sonic

Street Fighter

VizDoom
Doom,第一視角射擊游戲?

https://github.com/mwydmuch/ViZDoom
Microsoft Minecraft
Minecraft 游戲環(huán)境

https://github.com/minerllabs/minerl
足球游戲
通過(guò)程序控制一支球隊(duì)
?
https://github.com/google-research/football
星際爭(zhēng)霸 1
星際爭(zhēng)霸1的 python 編程接口。
?
星際爭(zhēng)霸 2
星際爭(zhēng)霸2的 python 編程接口。

rlcard
棋牌游戲集合,包括斗地主,德州撲克,麻將,UNO等。
?
https://github.com/datamllab/rlcard
賽車和自動(dòng)駕駛環(huán)境
Torcs
The Open Racing Car Simulator,3D 賽車模擬游戲。

https://sourceforge.net/projects/torcs/
Microsoft AirSim
Microsoft AI & Research 發(fā)布的基于 Unreal/Unity引擎的自動(dòng)駕駛模擬器環(huán)境。

https://github.com/Microsoft/AirSim
CARLA
另一個(gè)逼真的自動(dòng)駕駛模擬器環(huán)境。
?

http://carla.org/
DeepGTAV
游戲GTAV的插件,將GTAV變成自動(dòng)駕駛模擬器。

https://github.com/aitorzip/DeepGTAV
LGSVL
專業(yè)的自動(dòng)駕駛模擬器,可以和Apollo,Autoware,ROS/ROS2集成。?

https://www.lgsvlsimulator.com/
DeepDrive
基于Linux,OpenGL,Tensorflow 1.x的自動(dòng)駕駛環(huán)境。

https://github.com/deepdrive/deepdrive
物理引擎機(jī)器人環(huán)境
OpenAI Gym Mujoco
不用說(shuō)了,頂會(huì)論文基準(zhǔn)環(huán)境。

https://gym.openai.com/envs/#mujoco
OpenAI Gym Robotics
OpenAI 定義的一套手形機(jī)器人和任務(wù)。


gym-gazebo2
基于ROS2 和 Gazebo 的強(qiáng)化學(xué)習(xí)環(huán)境,達(dá)到現(xiàn)實(shí)工業(yè)機(jī)器人控制的水準(zhǔn)。

https://github.com/AcutronicRobotics/gym-gazebo2
gym-ignition
另一個(gè)和Gazebo相關(guān)的工業(yè)機(jī)器人模擬環(huán)境。

https://github.com/robotology/gym-ignition
Nvidia ISAAC simulator
Nvidia發(fā)布的模擬工廠任務(wù)的物理環(huán)境。

https://developer.nvidia.com/Isaac-sdk
OpenAI RoboSchool
補(bǔ)充 MuJoCo的一些人形機(jī)器人連續(xù)控制任務(wù)。

https://openai.com/blog/roboschool/
RaiSim
一套多物體交互模擬環(huán)境。代碼已經(jīng)非開(kāi)源。

https://raisim.com/
Stanford Osim-rl
控制人體肌肉的強(qiáng)化學(xué)習(xí)環(huán)境。

Full Body Muscle Simulator
另一個(gè)控制人體肌肉的強(qiáng)化學(xué)習(xí)環(huán)境。

https://github.com/lsw9021/MASS
Navigation
DeepMind Lab
游戲Quake III的強(qiáng)化學(xué)習(xí)環(huán)境。

gym-minigrid
一套 grid world 任務(wù)集,包括視野局限的迷宮尋路等。?

https://github.com/maximecb/gym-minigrid
gym-miniworld
第一視角的尋路任務(wù)。?

https://github.com/maximecb/gym-miniworld
MINOS
室內(nèi)的第一視角巡視任務(wù)環(huán)境。

AI2-THOR
另一個(gè)室內(nèi)第一視角巡視任務(wù)環(huán)境。

https://ai2thor.allenai.org/
Facebook Habitat
Facebook發(fā)布的室內(nèi)第一視角巡視任務(wù)環(huán)境。

https://aihabitat.org/
Facebook House3D
Facebook發(fā)布的帶有標(biāo)注的室內(nèi)第一視角巡視環(huán)境,任務(wù)包含通過(guò)NLP詢問(wèn)。

Stanford Gibson
Facebook發(fā)布的室內(nèi)第一視角巡視任務(wù)環(huán)境。

http://gibsonenv.stanford.edu/
往期精彩回顧
本站知識(shí)星球“黃博的機(jī)器學(xué)習(xí)圈子”(92416895)
本站qq群704220115。
加入微信群請(qǐng)掃碼:
