豆包:視頻生成模型“VideoWorld”可僅靠視覺(jué)認(rèn)知世界,現(xiàn)已開(kāi)源
2025-02-10 13:13
2月10日消息,視頻生成實(shí)驗(yàn)?zāi)P汀癡ideoWorld”由豆包大模型團(tuán)隊(duì)與北京交通大學(xué)、中國(guó)科學(xué)技術(shù)大學(xué)聯(lián)合提出。不同于Sora 、DALL-E 、Midjourney等主流多模態(tài)模型,VideoWorld在業(yè)界首次實(shí)現(xiàn)無(wú)需依賴語(yǔ)言模型,即可認(rèn)知世界。 目前,該項(xiàng)目代碼與模型已開(kāi)源。
瀏覽
7評(píng)論
圖片
表情
視頻
全部評(píng)論
