【深度學習】深度學習的發(fā)展方向: 深度強化學習!
一、深度學習的反思
二、強化學習原理

2.3 深入淺出強化學習

掌握了狀態(tài)信息,游戲里的馬里奧開始躍躍欲試,準備做出反應了。強化學習也一樣,我們將s(t)作為智能體的輸入,智能體會略加思索,接著就能做出“動作”。這里的動作,就是前面介紹的第四個重要概念。智能體能做出哪些動作呢?這和具體的場景有關,譬如在馬里奧游戲中,動作就是指“頂蘑菇”或者“踩烏龜”,一般記為a(t)。
2.4?強化學習方向分類
當然,除了這兩大方向,強化學習還有其它的腦洞方向,譬如基于模型(Model-Based)的強化學習,不過由于成本和難度較高,用得比較少。而這兩大方向都各自包含了大量的具體實現(xiàn)算法,即使方向相同,各個算法在細節(jié)上仍然有很大差異。
三、深度學習與強化學習的結合
本文參考北京理工大學劉馳教授的《深度強化學習:學術前沿與實戰(zhàn)應用》,本書詳解了深度強化學習領域近年來重要進展及其典型應用場景,涵蓋新的理論算法、工程實現(xiàn)和領域應用。緊跟學術前沿,聯(lián)合工程實踐,值得學習。
往期精彩回顧
獲取一折本站知識星球優(yōu)惠券,復制鏈接直接打開:
https://t.zsxq.com/662nyZF
本站qq群1003271085。
加入微信群請掃碼進群:
評論
圖片
表情
