賈佳亞團隊新模型對標ChatGPT+DALL-E 3王炸組合!讀懂梗圖刷爆榜單,代碼復(fù)現(xiàn)數(shù)學(xué)函數(shù)
共 4555字,需瀏覽 10分鐘
·
2024-04-16 17:05
【導(dǎo)讀】賈佳亞團隊提出VLM模型Mini-Gemini,堪比GPT-4+DALL-E 3王炸組合,一上線就刷爆了多模態(tài)任務(wù)榜單!讀得懂梗圖,做得了學(xué)術(shù),用代碼就能復(fù)現(xiàn)數(shù)學(xué)函數(shù)圖。
Demo地址: http://103.170.5.190:7860/
圖片理解天花板
推理再生成,更精準了
超會玩梗
技術(shù)細節(jié)
如上演示中,Mini-Gemini是怎樣做到這種驚艷的效果呢?
而其中的核心在于三點:
(1)用于高清圖像的雙編碼器機制;
(2)更高質(zhì)量的數(shù)據(jù);
媲美Gemini Pro和GPT-4V
人人在線可玩
評論
圖片
表情
