十分鐘理解Transformer
點擊上方“程序員大白”,選擇“星標(biāo)”公眾號
重磅干貨,第一時間送達
來源|知乎—Jason 報道|人工智能前沿講習(xí)
地址|https://zhuanlan.zhihu.com/p/82312421
那什么是transformer呢?

那么在這個黑盒子里面都有什么呢?

那么編碼器和解碼器里邊又都是些什么呢?

那么你可能又該問了,那每一個小編碼器里邊又是什么呢?

我們先來看下self-attention是什么樣子的。







self-attention層到這里就結(jié)束了嗎?




假設(shè)詞匯表維度是6,那么輸出最大概率詞匯的過程如下:






推薦閱讀
國產(chǎn)小眾瀏覽器因屏蔽視頻廣告,被索賠100萬(后續(xù))
年輕人“不講武德”:因看黃片上癮,把網(wǎng)站和786名女主播起訴了
關(guān)于程序員大白
程序員大白是一群哈工大,東北大學(xué),西湖大學(xué)和上海交通大學(xué)的碩士博士運營維護的號,大家樂于分享高質(zhì)量文章,喜歡總結(jié)知識,歡迎關(guān)注[程序員大白],大家一起學(xué)習(xí)進步!
評論
圖片
表情


