RL CoachPython 強(qiáng)化學(xué)習(xí)框架
RL Coach 是一個(gè)Python 強(qiáng)化學(xué)習(xí)框架,由英特爾 2017 年推出,包含許多最先進(jìn)算法的實(shí)現(xiàn)。RL Coach 只是英特爾真正的人工智能生態(tài)系統(tǒng)中的幾個(gè)工具之一。
它以模塊化的方式對(duì)代理和環(huán)境之間的交互進(jìn)行建模。有了 Coach,就可以通過(guò)組合各種構(gòu)建塊并在多個(gè)環(huán)境中對(duì)代理進(jìn)行培訓(xùn)來(lái)對(duì)代理建模。可用的環(huán)境允許在不同的領(lǐng)域測(cè)試代理,如機(jī)器人、自主駕駛、游戲等等。
它公開了一組易于使用的 API,用于試驗(yàn)新的 RL 算法,并允許簡(jiǎn)單地集成新環(huán)境來(lái)解決問(wèn)題。基本 RL 組件(算法、環(huán)境、神經(jīng)網(wǎng)絡(luò)體系結(jié)構(gòu)及勘探策略等等)是很好的解耦,所以擴(kuò)展和重用現(xiàn)有的組件是相當(dāng)方便的。
Coach 從培訓(xùn)過(guò)程中收集統(tǒng)計(jì)數(shù)據(jù),并支持高級(jí)可視化技術(shù)來(lái)調(diào)試正在培訓(xùn)的代理。
支持算法
注意:RL Coach 只在 Ubuntu 16.04 LTS 和 Python 3.5 上進(jìn)行過(guò)測(cè)試。
有關(guān)使用 Python 3.6.3 在 Ubuntu17.10 上安裝的一些信息,請(qǐng)參閱
評(píng)論
圖片
表情
