爱爱爱爱免费视频,久草A片,99这里只有精品视频,特级西西人体WWWww,欧差XXX性受XYX性爽,高清毛片AAAAAAAAA片,中文字幕青娱乐,99久久免费精品

多智能體機器學習--強化學習方法

聯(lián)合創(chuàng)作 · 2023-09-29 00:58

本書主要介紹了多智能體機器人強化學習的相關內容。全書共6章，首先介紹了幾種常用的監(jiān)督式學習方法，在此基礎上，介紹了單智能體強化學習中的學習結構、值函數(shù)、馬爾科夫決策過程、策略迭代、時間差分學習、Q學習和資格跡等概念和方法。然后，介紹了雙人矩陣博弈問題、多人隨機博弈學習問題，并通過3種博弈游戲詳細介紹了納什均衡、學習算法、學習自動機、滯后錨算法等內容，并提出LR-I滯后錨算法和指數(shù)移動平均Q學習算法等，并進行了分析比較。接下來，介紹了模糊系統(tǒng)和模糊學習，并通過仿真示例詳細分析算法。后，介紹了群智能學習進化以及性格特征概念和應用。全書內容豐富，重點突出。

Howard M.Schwartz 博士，在加拿大魁北克蒙特利爾的麥吉爾大學獲得工學學士學位，在美國馬薩諸塞州劍橋麻省理工學院獲得碩士和博士學位，現(xiàn)為加拿大渥太華卡爾頓大學系統(tǒng)與計算機工程系的教授，研究領域包括自適應和智能控制系統(tǒng)、機器人、機器學習、多智能體學習、系統(tǒng)辨識和狀態(tài)估計。

點贊

評論

編輯分享

舉報