清華張鈸院士:邁向第三代人工智能

極市導(dǎo)讀
?清華大學(xué)人工智能研究院院長張鈸教授認為,第三代AI需要結(jié)合前兩代的知識驅(qū)動和數(shù)據(jù)驅(qū)動,利用好知識、數(shù)據(jù)、算法和算力等4個要素,從而使AI更強大。>>加入極市CV技術(shù)交流群,走在計算機視覺的最前沿

1 第一代人工智能
2 第二代人工智能


,對樣本所反映的輸入–輸出關(guān)系 f:X→Y 做出估計,即從備選函數(shù)族(假設(shè)空間)F={fθ:X?→Y;θ∈A}中選出一個函數(shù) f^?使它平均逼近于真實 f。在深度學(xué)習(xí)中這個備選函數(shù)族由深度神經(jīng)網(wǎng)絡(luò)表示:
3 第三代人工智能



出發(fā),取得起始觀察值
,在 t 時刻,智能體根據(jù)其內(nèi)部的推理機制采取行動
之后,獲得回報
,并轉(zhuǎn)移到下一個狀態(tài)
,得到新的觀察
。強化學(xué)習(xí)的目標(biāo)是,選擇策略π(s,a)使累計回報預(yù)期 V^π(s):S→R 最優(yōu)。如果我們考慮簡單的馬爾可夫(Markov)決策過程,即后一個狀態(tài)僅取決于前一個狀態(tài),并且環(huán)境完全可觀察,即觀察值 o 等于狀態(tài)值 s,即 O=S; 并假設(shè)策略穩(wěn)定不變。如圖 5 所示。以 AlphaZero 為例,智能體不依賴人類的標(biāo)注數(shù)據(jù),僅僅通過自我博弈式的環(huán)境交互積累數(shù)據(jù),實現(xiàn)自身策略的不斷改進,最終在圍棋任務(wù)上達到了超越人類頂級大師的水平,代表強化學(xué)習(xí)算法的一個巨大進步[45]。





是詞 c 和詞 w 的向量表示,C 是所有可用文本。參數(shù)
。
,尋找目標(biāo)句(比如英文)
。神經(jīng)翻譯的任務(wù)是,計算詞一級翻譯概率的乘積,
是部分翻譯結(jié)果。詞一級的翻譯概率可用 softmax 函數(shù) f(·)定義:
是目標(biāo)句中第 j 個詞的向量表示,v_x 是源句子的向量表示,
是部分翻譯句的向量表示,y=y_j,j=1,2...,J 是要找的目標(biāo)句。
,模型訓(xùn)練的目標(biāo)是最大化 log 似然:


,用對抗樣本加上負噪聲可以得到去噪圖片
,即
。研究表明該方法不僅去掉了一部分對抗擾動,還增加了一部分「反對抗擾動」,取得了非常好的防御效果,獲得「NIPS2017 對抗性攻防競賽」中對抗防御任務(wù)冠軍,以及 2018 年在拉斯維加斯(LasVegas)舉辦的 CAADCTF 對抗樣本邀請賽冠軍。
;
為每個子模型 k 的交叉熵(cross-entropy)損失函數(shù)。ADP_α,β(x,y)=α·H(F)+β·log(ED)是模型集成多樣性的度量,鼓勵不同的子模型形成盡量差異化的決策邊界。實驗結(jié)果表明,通過鼓勵不同子模型的差異化決策性質(zhì),有效地提升了模型的對抗魯棒性。但是,總體而言,目前多數(shù)的對抗防御方法是基于經(jīng)驗主義的,研究表明很多防御對抗樣本的方法在很短的時間就會被后來的攻擊算法攻破。其重要原因之一是深度學(xué)習(xí)只是在做簡單的函數(shù)擬合,缺乏像人一樣對問題的理解能力[67]。因此通過理解機器學(xué)習(xí)模型的內(nèi)部工作機理,發(fā)展數(shù)據(jù)驅(qū)動和知識驅(qū)動融合的第三代人工智能理論框架,將成為提高人工智能算法魯棒性的重要途徑。






4 總結(jié)






推薦閱讀
?ACCV 2020國際細粒度網(wǎng)絡(luò)圖像識別競賽正式開賽!

評論
圖片
表情
