<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          【學(xué)術(shù)前沿】關(guān)鍵任務(wù)中自動化適應(yīng)的認(rèn)知建模

          共 1765字,需瀏覽 4分鐘

           ·

          2021-04-06 11:23

          聲明:本文只是針對個人學(xué)習(xí)記錄,侵權(quán)可刪。本人自覺遵守《中華人民共和國著作權(quán)法》和《伯爾尼公約》等法律,其他個人或組織等轉(zhuǎn)載請保留此聲明,并自負(fù)法律責(zé)任。論文版權(quán)與著作權(quán)等全歸原作者所有。





          文章摘要

          本文提出一種認(rèn)知模型,模擬在時間緊迫的任務(wù)中對自動化的適應(yīng)過程。本文使用一個簡單的跟蹤任務(wù)(代表車輛操作)來揭示當(dāng)自動模式和手動模式的成功概率變化時,對自動化的依賴如何變化。該模型是通過使用認(rèn)知架構(gòu)ACT -R(自適應(yīng)控制的思想理性)開發(fā)的。我們還介紹了兩種強化學(xué)習(xí)方法:隨著時間的推移獎勵的總和和門控機制。這個模型通過控制感知和運動控制的產(chǎn)品來完成這個任務(wù)。這些產(chǎn)品的效用價值是基于每個感知-行動循環(huán)中的獎勵而更新的。該模型的運行模擬了行為數(shù)據(jù)的總體趨勢,如性能(跟蹤精度)、汽車使用率和兩種模式之間的切換次數(shù),表明我們模型中所做的假設(shè)具有一定的有效性。這項工作展示了如何結(jié)合不同的認(rèn)知建模范式,從而產(chǎn)生自動化的實際表現(xiàn)和解決方案,以及對自動化的信任。



          引言

          自動化技術(shù)近年來取得了顯著進(jìn)展,可以部分替代人類的認(rèn)知功能。雖然這種技術(shù)的應(yīng)用領(lǐng)域是多樣的,但最近一個突出的領(lǐng)域是車輛的自動操作。在我們的社會中,船舶和飛機的操作一般都是自動化的。對于汽車,一些功能的自動化,如速度控制(即自適應(yīng)巡航控制)和制動(防抱死)也已經(jīng)使用了很長時間。近年來,隨著傳感技術(shù)和機器學(xué)習(xí)技術(shù)的飛速發(fā)展,轉(zhuǎn)向自動控制得到了積極的發(fā)展。然而,自動駕駛(自動駕駛汽車)的全面應(yīng)用仍然存在障礙。一段時間以來,人們一直認(rèn)為,自動控制系統(tǒng)將與駕駛員的監(jiān)控系統(tǒng)一起,在自動控制系統(tǒng)無法做出正確反應(yīng)的情況下,隨時進(jìn)行干預(yù)。

          當(dāng)引進(jìn)不限于車輛自動控制的新技術(shù)時,這些技術(shù)的誤用(過度依賴)和廢棄(不充分利用)往往成為一個問題。不使用新技術(shù)會導(dǎo)致創(chuàng)新減少,而濫用新技術(shù)則會導(dǎo)致嚴(yán)重事故。在人為因素領(lǐng)域,這類問題已被反復(fù)討論。

          但是,該領(lǐng)域的先前研究并未充分考慮時間因素涉及新技術(shù)的適應(yīng)過程。與人因中研究的其他一些任務(wù)不同,車輛的操作是一個感知、判斷、行動依次重復(fù)的動態(tài)連續(xù)過程。自動化車輛系統(tǒng)部分地替代了這種人工操作。在一個操作人員可以使用自動操作的情況下,他/她重復(fù)感知和判斷的周期,同時觀察到一個自動化系統(tǒng)執(zhí)行整個周期。當(dāng)操作人員注意到自動控制有問題時,需要立即關(guān)閉自動控制,恢復(fù)手動控制。

          我們認(rèn)為上述對自動化技術(shù)的適應(yīng)機制可以部分解釋為強化學(xué)習(xí),它通過環(huán)境的獎勵更新行為的選擇概率。在更廣泛的背景下,這種范式已經(jīng)被用于建模人與自動化系統(tǒng)之間的交互。如第二節(jié)所述,提出了一種稱為擴展決策場理論的計算模型,用來模擬操作員如何適應(yīng)一個自動化工廠操作的系統(tǒng)。在他們的模型中,自動化系統(tǒng)的選擇概率通過反復(fù)的環(huán)境反饋動態(tài)改變。
          但是,將強化學(xué)習(xí)的范式應(yīng)用于涉及時間關(guān)鍵型決策的任務(wù)并不簡單。通常,強化學(xué)習(xí)已通過馬爾可夫決策過程(MDP)應(yīng)用于離散任務(wù),例如強盜任務(wù)(Sutton and Barto,1998)。與強化學(xué)習(xí)的典型應(yīng)用領(lǐng)域相反,車輛操作并不直接適合于MDPrepresentation,而是可以表示為SMDP(Semi-Markov Decision Process)。SMDP引入了在動作選擇和狀態(tài)轉(zhuǎn)換之間存在時間延遲的概念,以及可以在不同時間點提供的獎勵。

          在本文中,我們提出了一個簡單的任務(wù),該任務(wù)具有帶有自動化的車輛連續(xù)操作的一些特征,并構(gòu)建了一個模型來揭示在像車輛自動操作這樣的時間關(guān)鍵任務(wù)中,什么樣的機制可以模擬人類對自動化的適應(yīng)。我們特別嘗試將傳統(tǒng)的強化學(xué)習(xí)算法與認(rèn)知架構(gòu)相結(jié)合來回答這個問題。使用認(rèn)知架構(gòu),我們將探索這個問題使用適當(dāng)?shù)臅r間限制的行為。


          主要圖表





          主要結(jié)論

          本研究在一個簡單的跟蹤任務(wù)中模擬了自動車輛操作的適應(yīng)性。我們假設(shè)強化學(xué)習(xí)的一般范式可以應(yīng)用于這個問題。基于此假設(shè),我們使用了ACT-R體系結(jié)構(gòu)來探索模擬人類參與者行為數(shù)據(jù)的機制。仿真結(jié)果顯示與實驗數(shù)據(jù)總體上相符,表明我們的假設(shè)的有效性或至少有用性




          瀏覽 65
          點贊
          評論
          收藏
          分享

          手機掃一掃分享

          分享
          舉報
          評論
          圖片
          表情
          推薦
          點贊
          評論
          收藏
          分享

          手機掃一掃分享

          分享
          舉報
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  午夜视频色 | www.青青操 | 久久一级香蕉视频网址 | 丁香婷婷五月激情综合 | 国内精自视频在线观看 |