無任務(wù)學(xué)習(xí)及在機器人任務(wù)和運動規(guī)劃中的應(yīng)用
共 11713字,需瀏覽 24分鐘
·
2024-04-19 03:02
引言
無任務(wù)學(xué)習(xí)
具體到機器人相關(guān)的研究領(lǐng)域,如果環(huán)境探索方法與最終任務(wù)不直接相關(guān),例如完全隨機的環(huán)境探索、新奇性引導(dǎo)的環(huán)境探索等,我們稱利用此類探索數(shù)據(jù)來引導(dǎo)智能體學(xué)習(xí)知識的方法為基于無任務(wù)學(xué)習(xí)的智能決策方法。
無任務(wù)學(xué)習(xí)在機器人任務(wù)和運動規(guī)劃中的應(yīng)用
圖 2 常用機器人和物理模擬器
未來展望
結(jié)束語
評論
圖片
表情
