十分鐘理解Transformer
點擊下方卡片,關(guān)注“新機器視覺”公眾號
視覺/圖像重磅干貨,第一時間送達(dá)
來源|知乎—Jason? 報道|人工智能前沿講習(xí)
地址|https://zhuanlan.zhihu.com/p/82312421
那什么是transformer呢?

那么在這個黑盒子里面都有什么呢?

那么編碼器和解碼器里邊又都是些什么呢?

那么你可能又該問了,那每一個小編碼器里邊又是什么呢?

我們先來看下self-attention是什么樣子的。







self-attention層到這里就結(jié)束了嗎?




假設(shè)詞匯表維度是6,那么輸出最大概率詞匯的過程如下:






本文僅做學(xué)術(shù)分享,如有侵權(quán),請聯(lián)系刪文。
評論
圖片
表情
