<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          多智能體機器學習--強化學習方法

          聯(lián)合創(chuàng)作 · 2023-09-29 00:58

          本書主要介紹了多智能體機器人強化學習的相關內容。全書共6章,首先介紹了幾種常用的監(jiān)督式學習方法,在此基礎上,介紹了單智能體強化學習中的學習結構、值函數(shù)、馬爾科夫決策過程、策略迭代、時間差分學習、Q學習和資格跡等概念和方法。然后,介紹了雙人矩陣博弈問題、多人隨機博弈學習問題,并通過3種博弈游戲詳細介紹了納什均衡、學習算法、學習自動機、滯后錨算法等內容,并提出LR-I滯后錨算法和指數(shù)移動平均Q學習算法等,并進行了分析比較。接下來,介紹了模糊系統(tǒng)和模糊學習,并通過仿真示例詳細分析算法。后,介紹了群智能學習進化以及性格特征概念和應用。全書內容豐富,重點突出。

          Howard M.Schwartz 博士,在加拿大魁北克蒙特利爾的麥吉爾大學獲得工學學士學位,在美國馬薩諸塞州劍橋麻省理工學院獲得碩士和博士學位,現(xiàn)為加拿大渥太華卡爾頓大學系統(tǒng)與計算機工程系的教授,研究領域包括自適應和智能控制系統(tǒng)、機器人、機器學習、多智能體學習、系統(tǒng)辨識和狀態(tài)估計。

          瀏覽 10
          點贊
          評論
          收藏
          分享

          手機掃一掃分享

          編輯 分享
          舉報
          評論
          圖片
          表情
          推薦
          點贊
          評論
          收藏
          分享

          手機掃一掃分享

          編輯 分享
          舉報
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  成人水蜜桃视频 | 草逼网页 | 搞黄视频网站 | 欧美成人一区免费视频 | 国产视频国产区 |