超1.2萬人參加CVPR 2024,谷歌研究院獲得最佳論文
共 8505字,需瀏覽 18分鐘
·
2024-06-20 12:30
早在2月27日,CVPR 官網(wǎng)就公布了今年的論文接收結果:CVPR 2024 共有 35691 位注冊作者,11532 篇提交論文,其中 2719 篇被接收,錄用率為 23.6%。
CVPR 2024 頒獎環(huán)節(jié)
https://arxiv.org/pdf/2309.07906
https://imageomics.github.io/bioclip/
圖像視頻生成占領C位
從近期喬治亞理工學院計算機學院(College of Computing, Georgia Institute of Technology)對 CVPR 2024 錄用數(shù)據(jù)的統(tǒng)計分析來看,論文主要涵蓋36個主題領域,排名前十的主題分別是:圖像和視頻合成與生成,三維視覺,人體行為識別,視覺、語言與語言推理,底層視覺,識別(分類、檢測、檢索),遷移學習與多模態(tài)學習。其中,除了自動駕駛與三維視覺這兩位熱點??屯猓衲昱旁谑孜坏年P鍵詞是圖像和視頻合成與生成(Image and video synthesis and generation),總計有 329 篇論文,成為了今年 CVPR 最火的研究主題。
視覺基礎模型點燃現(xiàn)場
基于 Transformer,以及受到語言大模型的啟發(fā),計算機視覺領域在 2023 年以來對視覺基礎模型(VFM)的研究熱情高漲。
分享嘉賓:Tiktok-Chunyuan Li
寫在最后
兩天前,Runway 時隔一年推出 Gen-3 Alpha,宣布視頻生成賽道王者歸來。在 CVPR 2024 的現(xiàn)場,AI 科技評論也聽到了關于 GPT-5 或于 3 個月后發(fā)布的消息,業(yè)內對其推理能力與多模態(tài)能力更是報以期待。
