支持Python 3.10,OpenAI強(qiáng)化學(xué)習(xí)工具包Gym迎來(lái)史上最大更新

極市導(dǎo)讀
?近日,Gym 迎來(lái)了迄今為止最大的更新,包括 API 變化、環(huán)境變化和其他變化。?>>加入極市CV技術(shù)交流群,走在計(jì)算機(jī)視覺(jué)的最前沿

env.reset 接受 3 個(gè)新的參數(shù)(options - 對(duì)于無(wú)再次初始化環(huán)境時(shí)控制課程學(xué)習(xí)等操作有用;seed - 未來(lái)環(huán)境 seed 可以傳遞到 reset 參數(shù)。老的 .seed() 方法被棄用,但考慮到向后兼容,該方法在 Gym 1.0 發(fā)布之前仍繼續(xù)如常工作;infos - 當(dāng)設(shè)置為 True,reset 將返回 obs, info。當(dāng)前這種做法默認(rèn)為 False,但將變成 Gym 1.0 版本的默認(rèn)行為);
環(huán)境名稱在注冊(cè)期間不再需要一個(gè)版本,并將智能推薦類似名稱;
Vector 環(huán)境支持 info 中的 terminal_observation 并支持批處理操作空間。
blackjack 和 frozen lake 示例環(huán)境現(xiàn)在使用 PyGame 進(jìn)行了更好的圖形渲染;
機(jī)器人環(huán)境已移動(dòng)到 gym-robotics 包中;
bipedal walker 和 lunar lander 環(huán)境現(xiàn)在被合并稱為一類;
Atari 環(huán)境現(xiàn)在使用標(biāo)準(zhǔn)種子 API 了;
修復(fù)了 car_racing box2d 環(huán)境中的大錯(cuò)誤修復(fù),碰撞版本;
重構(gòu)了所有 box2d 和 classic_control 環(huán)境,以使用 PyGame 而不是 Pyglet。因?yàn)?pyglet 的問(wèn)題一直是 gym 項(xiàng)目生命周期中最常見(jiàn)的 GitHub 問(wèn)題來(lái)源之一。
移除 DiscreteEnv 類,內(nèi)置環(huán)境將不再使用;
增加了大數(shù)類型提示;
支持 Python 3.10 版;
大量額外的代碼重構(gòu)、清理、錯(cuò)誤消息改進(jìn)和小錯(cuò)誤修復(fù);
所有環(huán)境文件的描述文件現(xiàn)在都有了明顯改進(jìn)。
公眾號(hào)后臺(tái)回復(fù)“數(shù)據(jù)集”獲取30+深度學(xué)習(xí)數(shù)據(jù)集下載~

#?CV技術(shù)社群邀請(qǐng)函?#

備注:姓名-學(xué)校/公司-研究方向-城市(如:小極-北大-目標(biāo)檢測(cè)-深圳)
即可申請(qǐng)加入極市目標(biāo)檢測(cè)/圖像分割/工業(yè)檢測(cè)/人臉/醫(yī)學(xué)影像/3D/SLAM/自動(dòng)駕駛/超分辨率/姿態(tài)估計(jì)/ReID/GAN/圖像增強(qiáng)/OCR/視頻理解等技術(shù)交流群
每月大咖直播分享、真實(shí)項(xiàng)目需求對(duì)接、求職內(nèi)推、算法競(jìng)賽、干貨資訊匯總、與?10000+來(lái)自港科大、北大、清華、中科院、CMU、騰訊、百度等名校名企視覺(jué)開發(fā)者互動(dòng)交流~

