深度學(xué)習(xí)的發(fā)展方向: 深度強(qiáng)化學(xué)習(xí)!
點(diǎn)擊上方“小白學(xué)視覺”,選擇加"星標(biāo)"或“置頂”
重磅干貨,第一時(shí)間送達(dá)
作者:莫凡&馬晶敏,上海交通大學(xué)
轉(zhuǎn)載自:Datawhale
一、深度學(xué)習(xí)的反思
二、強(qiáng)化學(xué)習(xí)原理


掌握了狀態(tài)信息,游戲里的馬里奧開始躍躍欲試,準(zhǔn)備做出反應(yīng)了。強(qiáng)化學(xué)習(xí)也一樣,我們將s(t)作為智能體的輸入,智能體會略加思索,接著就能做出“動(dòng)作”。這里的動(dòng)作,就是前面介紹的第四個(gè)重要概念。智能體能做出哪些動(dòng)作呢?這和具體的場景有關(guān),譬如在馬里奧游戲中,動(dòng)作就是指“頂蘑菇”或者“踩烏龜”,一般記為a(t)。
當(dāng)然,除了這兩大方向,強(qiáng)化學(xué)習(xí)還有其它的腦洞方向,譬如基于模型(Model-Based)的強(qiáng)化學(xué)習(xí),不過由于成本和難度較高,用得比較少。而這兩大方向都各自包含了大量的具體實(shí)現(xiàn)算法,即使方向相同,各個(gè)算法在細(xì)節(jié)上仍然有很大差異。
三、深度學(xué)習(xí)與強(qiáng)化學(xué)習(xí)的結(jié)合
好消息!
小白學(xué)視覺知識星球
開始面向外開放啦??????
下載1:OpenCV-Contrib擴(kuò)展模塊中文版教程 在「小白學(xué)視覺」公眾號后臺回復(fù):擴(kuò)展模塊中文教程,即可下載全網(wǎng)第一份OpenCV擴(kuò)展模塊教程中文版,涵蓋擴(kuò)展模塊安裝、SFM算法、立體視覺、目標(biāo)跟蹤、生物視覺、超分辨率處理等二十多章內(nèi)容。 下載2:Python視覺實(shí)戰(zhàn)項(xiàng)目52講 在「小白學(xué)視覺」公眾號后臺回復(fù):Python視覺實(shí)戰(zhàn)項(xiàng)目,即可下載包括圖像分割、口罩檢測、車道線檢測、車輛計(jì)數(shù)、添加眼線、車牌識別、字符識別、情緒檢測、文本內(nèi)容提取、面部識別等31個(gè)視覺實(shí)戰(zhàn)項(xiàng)目,助力快速學(xué)校計(jì)算機(jī)視覺。 下載3:OpenCV實(shí)戰(zhàn)項(xiàng)目20講 在「小白學(xué)視覺」公眾號后臺回復(fù):OpenCV實(shí)戰(zhàn)項(xiàng)目20講,即可下載含有20個(gè)基于OpenCV實(shí)現(xiàn)20個(gè)實(shí)戰(zhàn)項(xiàng)目,實(shí)現(xiàn)OpenCV學(xué)習(xí)進(jìn)階。 交流群
歡迎加入公眾號讀者群一起和同行交流,目前有SLAM、三維視覺、傳感器、自動(dòng)駕駛、計(jì)算攝影、檢測、分割、識別、醫(yī)學(xué)影像、GAN、算法競賽等微信群(以后會逐漸細(xì)分),請掃描下面微信號加群,備注:”昵稱+學(xué)校/公司+研究方向“,例如:”張三 + 上海交大 + 視覺SLAM“。請按照格式備注,否則不予通過。添加成功后會根據(jù)研究方向邀請進(jìn)入相關(guān)微信群。請勿在群內(nèi)發(fā)送廣告,否則會請出群,謝謝理解~

