簡介
TRL (Transformer Reinforcement Learning) 是 Hugging Face 推出的一個具有強(qiáng)化學(xué)習(xí)功能的全棧 Transformer 語言模型。TRL 是一個完整的堆棧庫,Hugging Face 提供了一組工具來通過強(qiáng)化學(xué)習(xí)訓(xùn)練 Transformer 語言模型... 更多
技術(shù)信息
開源協(xié)議
Apache-2.0
開發(fā)語言
Python
操作系統(tǒng)
跨平臺
軟件類型
開源軟件
所屬分類
神經(jīng)網(wǎng)絡(luò)/人工智能、 LLM(大語言模型)
開源組織
無
地區(qū)
不詳
適用人群
未知
評價
0.0(滿分 10 分)0 個評分
什么是點評分
圖片
表情
全部評價(
0)
推薦率
100%

