深入淺出強(qiáng)化學(xué)習(xí):原理入門
《深入淺出強(qiáng)化學(xué)習(xí):原理入門》用通俗易懂的語言深入淺出地介紹了強(qiáng)化學(xué)習(xí)的基本原理,覆蓋了傳統(tǒng)的強(qiáng)化學(xué)習(xí)基本方法和當(dāng)前炙手可熱的深度強(qiáng)化學(xué)習(xí)方法。開篇從最基本的馬爾科夫決策過程入手,將強(qiáng)化學(xué)習(xí)問題納入到嚴(yán)謹(jǐn)?shù)臄?shù)學(xué)框架中,接著闡述了解決此類問題最基本的方法——?jiǎng)討B(tài)規(guī)劃方法,并從中總結(jié)出解決強(qiáng)化學(xué)習(xí)問題的基本思路:交互迭代策略評(píng)估和策略改善。基于這個(gè)思路,分別介紹了基于值函數(shù)的強(qiáng)化學(xué)習(xí)方法和基于直接策略搜索的強(qiáng)化學(xué)習(xí)方法。最后介紹了逆向強(qiáng)化學(xué)習(xí)方法和近年具有代表性、比較前沿的強(qiáng)化學(xué)習(xí)方法。
除了系統(tǒng)地介紹基本理論,書中還介紹了相應(yīng)的數(shù)學(xué)基礎(chǔ)和編程實(shí)例。因此,《深入淺出強(qiáng)化學(xué)習(xí):原理入門》既適合零基礎(chǔ)的人員入門學(xué)習(xí)、也適合相關(guān)科研人員作為研究參考。
評(píng)論
圖片
表情
