首篇《深度學(xué)習(xí)不確定性量化: 技術(shù)、應(yīng)用與挑戰(zhàn)》2020綜述論文,61頁pdf582篇文獻

??新智元報道??
??新智元報道??
來源:專知
編輯:SF
【新智元導(dǎo)讀】本研究綜述了UQ方法在深度學(xué)習(xí)中的最新進展。此外,我們還研究了這些方法在強化學(xué)習(xí)(RL)中的應(yīng)用。
在優(yōu)化和決策過程中,不確定性量化(UQ)在減少不確定性方面起著至關(guān)重要的作用。它可以用于解決科學(xué)和工程中的各種實際應(yīng)用。貝葉斯逼近和集成學(xué)習(xí)技術(shù)是目前文獻中使用最廣泛的兩種UQ方法。
在這方面,研究者們提出了不同的UQ方法,并在計算機視覺(如自動駕駛汽車和目標(biāo)檢測)、圖像處理(如圖像恢復(fù))、醫(yī)學(xué)圖像分析(如醫(yī)學(xué)圖像分類和分割)、自然語言處理(如文本分類、社交媒體文本和再犯風(fēng)險評分)、生物信息學(xué)得到廣泛應(yīng)用。
本研究綜述了UQ方法在深度學(xué)習(xí)中的最新進展。此外,我們還研究了這些方法在強化學(xué)習(xí)(RL)中的應(yīng)用。然后,我們概述了UQ方法的幾個重要應(yīng)用。最后,我們簡要地強調(diào)了UQ方法面臨的基本研究挑戰(zhàn),并討論了該領(lǐng)域的未來研究方向。
鏈接:https://arxiv.org/abs/2011.06225
摘要
在日常情景中,我們處理很多領(lǐng)域的不確定性,從投資機會和醫(yī)療診斷到體育比賽和天氣預(yù)報,目的是根據(jù)收集的觀察和不確定的領(lǐng)域知識進行決策。
現(xiàn)在,我們可以依靠使用機器和深度學(xué)習(xí)技術(shù)開發(fā)的模型來量化不確定性來完成統(tǒng)計推斷[1]。在人工智能(AI)系統(tǒng)使用[2]之前,對其效能進行評估是非常重要的。
這種模型的預(yù)測具有不確定性,除了存在不確定性的歸納假設(shè)外,還容易出現(xiàn)噪聲和錯誤的模型推斷。
因此,在任何基于人工智能的系統(tǒng)中,以一種值得信賴的方式表示不確定性是非??扇〉?/strong>。通過有效地處理不確定性,這樣的自動化系統(tǒng)應(yīng)該能夠準(zhǔn)確地執(zhí)行。不確定性因素在人工智能中扮演著重要的角色

不確定性的來源是當(dāng)測試和訓(xùn)練數(shù)據(jù)不匹配,由于類重疊或由于數(shù)據(jù)[6]中存在噪聲而產(chǎn)生的不確定性。估計知識的不確定性要比數(shù)據(jù)的不確定性困難得多,數(shù)據(jù)的不確定性自然是通過極大似然訓(xùn)練來度量的。
預(yù)測中的不確定性來源對于解決不確定性估計問題[7]至關(guān)重要。
不確定性有兩個主要來源,在概念上稱為aleatoric和epistemic不確定性[8](見圖1)。
數(shù)據(jù)中的不可約不確定性導(dǎo)致預(yù)測中的不確定性是一種可選不確定性(也稱為數(shù)據(jù)不確定性)。
這種類型的不確定性不是模型的屬性,而是數(shù)據(jù)分布的固有屬性;因此它是不可約的。不確定性的另一種類型是認知不確定性(也稱為知識不確定性),它是由于知識和數(shù)據(jù)的不足而產(chǎn)生的。
人們可以定義模型來回答基于模型預(yù)測中的不同人類問題。在數(shù)據(jù)豐富的情況下,有大量的數(shù)據(jù)收集,但它可能是信息差的[10]。在這種情況下,可以使用基于人工智能的方法定義有效的模型,表征數(shù)據(jù)特征。
通常這些數(shù)據(jù)是不完整的,有噪聲的,不一致的和多模態(tài)的[1]。
不確定性量化(UQ)是當(dāng)今許多關(guān)鍵決策的基礎(chǔ)。
沒有UQ的預(yù)測通常是不可靠和不準(zhǔn)確的。為了理解深度學(xué)習(xí)(DL)[11],[12]過程生命周期,我們需要理解UQ在DL中的作用。
DL模型首先收集可用于決策過程的最全面和潛在相關(guān)的數(shù)據(jù)集。DL場景的設(shè)計是為了滿足某些性能目標(biāo),以便在使用標(biāo)記數(shù)據(jù)訓(xùn)練模型之后選擇最合適的DL架構(gòu)。
迭代訓(xùn)練過程優(yōu)化不同的學(xué)習(xí)參數(shù),這些參數(shù)將被“調(diào)整”,直到網(wǎng)絡(luò)提供令人滿意的性能水平。
在涉及的步驟中,有幾個不確定因素需要加以量化。很明顯的不確定性這些步驟如下:
(i)選擇和訓(xùn)練數(shù)據(jù)的集合
(ii)訓(xùn)練數(shù)據(jù)的完整性和準(zhǔn)確性
(3)理解DL(或傳統(tǒng)機器學(xué)習(xí))模型與性能范圍及其局限性,和(iv)不確定性對應(yīng)基于操作數(shù)據(jù)的性能模型[13]。
數(shù)據(jù)驅(qū)動的方法,如與UQ相關(guān)的DL提出了至少四組重疊的挑戰(zhàn):
(1)缺乏理論
(2)缺乏臨時模型
(3)對不完美數(shù)據(jù)的敏感性
(4)計算費用
為了緩解這些挑戰(zhàn),有時會采用模型變異性研究和敏感性分析等特殊解決方案。不確定性估計和量化在數(shù)字學(xué)習(xí)和傳統(tǒng)機器學(xué)習(xí)中得到了廣泛的研究。
在下面,我們提供一些最近的研究的簡要總結(jié),這些研究檢驗了處理不確定性的各種方法的有效性。
圖2給出了三種不同不確定度模型[9](MC dropout, Boostrap模型和GMM模型)的示意圖比較。此外,不確定性感知模型(BNN)與OoD分類器的兩種圖形表示如圖3所示。


在大數(shù)據(jù)時代,ML和DL,智能使用不同的原始數(shù)據(jù)有巨大的潛力,造福于廣泛的領(lǐng)域。然而,UQ在不同的ML和DL方法可以顯著提高其結(jié)果的可靠性。Ning等人總結(jié)并分類了不確定性下數(shù)據(jù)驅(qū)動優(yōu)化范式的主要貢獻。
可以看出,本文只回顧了數(shù)據(jù)驅(qū)動的優(yōu)化。在另一項研究中,Kabir等人[16]回顧了基于神經(jīng)網(wǎng)絡(luò)的UQ。作者關(guān)注概率預(yù)測和預(yù)測區(qū)間(pi),因為它們是UQ文獻中最廣泛使用的技術(shù)之一。
我們注意到,從2010年到2020年(6月底),在各個領(lǐng)域(如計算機視覺、圖像處理、醫(yī)學(xué)圖像分析、信號處理、自然語言處理等)發(fā)表了超過2500篇關(guān)于AI中UQ的論文。
與以往UQ領(lǐng)域的文獻綜述不同,本研究回顧了最近發(fā)表的使用不同方法定量AI (ML和DL)不確定性的文章。另外,我們很想知道UQ如何影響真實案例,解決AI中的不確定性有助于獲得可靠的結(jié)果。
與此同時,在現(xiàn)有的研究方法中尋找重要的談話是一種很好的方式,為未來的研究指明方向。在這方面,本文將為ML和DL中UQ的未來研究人員提供更多的建議。我們調(diào)查了UQ領(lǐng)域應(yīng)用于ML和DL方法的最新研究。
因此,我們總結(jié)了ML和DL中UQ的一些現(xiàn)有研究。值得一提的是,本研究的主要目的并不是比較提出的不同UQ方法的性能,因為這些方法是針對不同的數(shù)據(jù)和特定的任務(wù)引入的。
由于這個原因,我們認為比較所有方法的性能超出了本研究的范圍。因此,本研究主要關(guān)注DL、ML和強化學(xué)習(xí)(RL)等重要領(lǐng)域。因此,本研究的主要貢獻如下:?
據(jù)我們所知,這是第一篇關(guān)于ML和DL方法中使用的UQ方法的全面綜述論文,值得該領(lǐng)域的研究人員使用。
對新提出的UQ方法進行了全面調(diào)研。
此外,UQ方法的重要應(yīng)用的主要類別也進行了介紹
?指出了UQ方法的主要研究空白。
最后,討論了很少確定的未來發(fā)展方向。










