0粉絲
本書共有19章,分為六大部分,詳細(xì)介紹了強(qiáng)化學(xué)習(xí)中各領(lǐng)域的基本理論和新進(jìn)展,內(nèi)容包括:MDP、動態(tài)規(guī)劃、蒙特卡羅方法、批處理強(qiáng)化學(xué)習(xí)、TD學(xué)習(xí)、Q學(xué)習(xí)、策略迭代的小二乘法、遷移學(xué)習(xí)、貝葉斯強(qiáng)化學(xué)習(xí)、、一階邏輯MDP、層次式強(qiáng)化學(xué)習(xí)、演化計算、預(yù)測性定義狀態(tài)表示、去中心化的部分可觀察MDP、博弈論和多學(xué)習(xí)器強(qiáng)化學(xué)習(xí)等內(nèi)容,并闡述強(qiáng)化學(xué)習(xí)與心理和神經(jīng)科學(xué)、游戲領(lǐng)域、機(jī)器人領(lǐng)域的關(guān)系和應(yīng)用,后提出未來發(fā)
簡介
本書共有19章,分為六大部分,詳細(xì)介紹了強(qiáng)化學(xué)習(xí)中各領(lǐng)域的基本理論和新進(jìn)展,內(nèi)容包括:MDP、動態(tài)規(guī)劃、蒙特卡羅方法、批處理強(qiáng)化學(xué)習(xí)、TD學(xué)習(xí)、Q學(xué)習(xí)、策略迭代的小二乘法、遷移學(xué)習(xí)、貝葉斯強(qiáng)化學(xué)習(xí)、、一階邏輯MDP、層次式強(qiáng)化學(xué)習(xí)、演化計算、預(yù)測性定義狀態(tài)表示、去中心化的部分可觀察MDP、博弈論和多學(xué)習(xí)器強(qiáng)化學(xué)習(xí)等內(nèi)容,并闡述強(qiáng)化學(xué)習(xí)與心理和神經(jīng)科學(xué)、游戲領(lǐng)域、機(jī)器人領(lǐng)域的關(guān)系和應(yīng)用,后提出未來發(fā)... 更多
屬性
出版社
機(jī)械工業(yè)出版社
ISBN
9787111600220
出版年
2018-7-3
頁數(shù)
464
評價
0.0(滿分 10 分)0 個評分
什么是點評分
圖片
表情
全部評價(
0)
推薦率
100%

