AI看圖說(shuō)話首超人類(lèi)!微軟認(rèn)知AI團(tuán)隊(duì)提出視覺(jué)詞表預(yù)訓(xùn)練超越Transformer

??新智元報(bào)道??
??新智元報(bào)道??
編輯:白峰
【新智元導(dǎo)讀】能看圖會(huì)說(shuō)話的AI,表現(xiàn)還超過(guò)了人類(lèi)?最近,Azure悄然上線了一個(gè)新的人工智能服務(wù),能精準(zhǔn)的說(shuō)出圖片中的內(nèi)容。而背后的視覺(jué)詞表技術(shù),更是超越了基于Transformer的前輩們,拿到nocaps挑戰(zhàn)賽冠軍。
看圖說(shuō)話(或者叫圖像描述),近年來(lái)受到了很多關(guān)注,它可以自動(dòng)生成圖片描述。但是目前無(wú)論是學(xué)術(shù)界還是工業(yè)界,做的效果都差強(qiáng)人意。



? ? ? ??
? ? ? ?


評(píng)論
圖片
表情
