圖像描述(ImageCaption)任務(wù)簡析
本文小媛僅僅介紹了該任務(wù)的背景與相關(guān)研究
希望通過以下的簡單介紹
圖像描述(ImageCaption)任務(wù)是多模態(tài)領(lǐng)域的一個經(jīng)典任務(wù)。
多模態(tài)學(xué)習(xí)從1970年代起步,經(jīng)歷了幾個發(fā)展階段,在2010后全面步入Deep Learning階段。
人其實(shí)是一個多模態(tài)學(xué)習(xí)的總和,所以也有”磚家“說了,多模態(tài)學(xué)習(xí)才是真正的人工智能發(fā)展方向。


官網(wǎng)http://cocodataset.org/ 官網(wǎng)http://cocodataset.org/#download 下提供的代碼地址: https://github.com/cocodataset/cocoapi 其中帶有coco的評估代碼,會隨著當(dāng)初安裝cocoapi時(shí)一同安裝。 但此處的cocoeval只用于keypoint與instances,不能用于caption。
官網(wǎng)http://cocodataset.org/#captions-eval 下提供的代碼地址:https://github.com/tylin/coco-caption 其中帶有coco專用于caption的評估代碼
MS COCO數(shù)據(jù)集目標(biāo)檢測(Detection) MS COCO數(shù)據(jù)集人體關(guān)鍵點(diǎn)(Keypoint)
eval{"BLEU_1"????:?float,??????????????#?(blue常用來測機(jī)翻)"BLEU_2"????:?float,"BLEU_3"????:?float,"BLEU_4"????:?float,"METEOR"????:?float,"ROUGE_L"???:?float,?????????????#??(常用來測文摘)"CIDEr"?????:?float,}
作者:西柚媛
編輯:西柚媛
推薦閱讀:
項(xiàng)目實(shí)戰(zhàn) | Python爬蟲概述與實(shí)踐(二)
投稿、交流&合作 歡迎掃碼進(jìn)群
記得備注?“昵稱-學(xué)校(公司)”呦~
評論
圖片
表情
