多智能體機器學習--強化學習方法
本書主要介紹了多智能體機器人強化學習的相關內容。全書共6章,首先介紹了幾種常用的監(jiān)督式學習方法,在此基礎上,介紹了單智能體強化學習中的學習結構、值函數(shù)、馬爾科夫決策過程、策略迭代、時間差分學習、Q學習和資格跡等概念和方法。然后,介紹了雙人矩陣博弈問題、多人隨機博弈學習問題,并通過3種博弈游戲詳細介紹了納什均衡、學習算法、學習自動機、滯后錨算法等內容,并提出LR-I滯后錨算法和指數(shù)移動平均Q學習算法等,并進行了分析比較。接下來,介紹了模糊系統(tǒng)和模糊學習,并通過仿真示例詳細分析算法。后,介紹了群智能學習進化以及性格特征概念和應用。全書內容豐富,重點突出。
Howard M.Schwartz 博士,在加拿大魁北克蒙特利爾的麥吉爾大學獲得工學學士學位,在美國馬薩諸塞州劍橋麻省理工學院獲得碩士和博士學位,現(xiàn)為加拿大渥太華卡爾頓大學系統(tǒng)與計算機工程系的教授,研究領域包括自適應和智能控制系統(tǒng)、機器人、機器學習、多智能體學習、系統(tǒng)辨識和狀態(tài)估計。
評論
圖片
表情
