Facebook Horizon應(yīng)用強(qiáng)化學(xué)習(xí)平臺(tái)
Horizon 是一個(gè)開(kāi)源的端到端的應(yīng)用強(qiáng)化學(xué)習(xí)平臺(tái),在 Facebook 內(nèi)部被大量使用。
Horizon 采用 Python 構(gòu)建,使用 PyTorch 進(jìn)行建模和訓(xùn)練,使用 Caffe2 提供模型服務(wù)。 該平臺(tái)包含主流的訓(xùn)練深度強(qiáng)化學(xué)習(xí)算法的工作流,包括數(shù)據(jù)預(yù)處理、特征轉(zhuǎn)換、分布式訓(xùn)練、反事實(shí)策略評(píng)估和優(yōu)化服務(wù)等。
支持的算法
Discrete-Action DQN
Parametric-Action DQN
DDPG (DDPG)
Soft Actor-Critic (SAC)

評(píng)論
圖片
表情
