AI識(shí)圖驢唇不對馬嘴?Google AI:利用交錯(cuò)訓(xùn)練集提升圖像描述準(zhǔn)確性

新智元報(bào)道
【新智元導(dǎo)讀】圖像描述是計(jì)算機(jī)視覺、自然語言處理和機(jī)器學(xué)習(xí)的綜合問題。近日,谷歌AI提出了一個(gè)新的訓(xùn)練集,可以有效提升圖像和文本語義匹配的相似性。









文本-文本(T2T),圖像-文本(I2T)和多任務(wù)(I2T + T2T)雙編碼器模型的CxC檢索結(jié)果


評(píng)論
圖片
表情
