TextWorld基于 Python 的強化學習代理訓練環(huán)境
TextWorld 是微軟開源的一個可擴展的引擎,可用于生成和模擬文本游戲。你可以使用它來訓練強化學習(RL)代理,以學習語言理解、記憶、規(guī)劃和探索等。
TextWorld 采用 Python 編寫,可視為用于在基于文本的游戲上進行訓練和測試強化學習(RL)代理的沙盒環(huán)境,它還可運行現(xiàn)有的基于文本的游戲,或用來評估 AI 代理在復雜設置中的表現(xiàn)。
TextWorld 包含兩個主要組件:游戲生成器和游戲引擎。游戲生成器將高級游戲規(guī)范(例如房間數(shù)、對象數(shù)、游戲長度和獲勝條件)轉換為 Inform 7 語言的可執(zhí)行游戲源代碼。游戲引擎是一個簡單的推理機器,通過使用簡單的算法,如一步向前和向后鏈接,確保生成的游戲的每一步都是有效的。
評論
圖片
表情
