<kbd id="afajh"><form id="afajh"></form></kbd><strong id="afajh"><dl id="afajh"></dl></strong>

<del id="afajh"><form id="afajh"></form></del>

<th id="afajh"><progress id="afajh"></progress></th>

<b id="afajh"><abbr id="afajh"></abbr></b>

<th id="afajh"><progress id="afajh"></progress></th>

豆包：視頻生成模型“VideoWorld”可僅靠視覺(jué)認(rèn)知世界，現(xiàn)已開(kāi)源

輕識(shí)快訊

2025-02-10 13:13

2月10日消息，視頻生成實(shí)驗(yàn)?zāi)Ｐ汀癡ideoWorld”由豆包大模型團(tuán)隊(duì)與北京交通大學(xué)、中國(guó)科學(xué)技術(shù)大學(xué)聯(lián)合提出。不同于Sora 、DALL-E 、Midjourney等主流多模態(tài)模型，VideoWorld在業(yè)界首次實(shí)現(xiàn)無(wú)需依賴語(yǔ)言模型，即可認(rèn)知世界。目前，該項(xiàng)目代碼與模型已開(kāi)源。

瀏覽 7

點(diǎn)贊

收藏

分享

舉報(bào)

評(píng)論

圖片

表情

阿里云通義開(kāi)源視覺(jué)模型Qwen2.5-VL

1月28日，阿里云通義開(kāi)源視覺(jué)模型Qwen2.5-VL，共推出3B、7B和72B三個(gè)尺寸版本。據(jù)介紹，Qwen2.5-VL不僅擅長(zhǎng)識(shí)別常見(jiàn)物體，如花、鳥(niǎo)、魚(yú)和昆蟲(chóng)，還能夠分析圖像中的文本、圖表、圖標(biāo)、圖形和布局。旗艦版Qwen2.5-VL-72B在13項(xiàng)權(quán)威評(píng)測(cè)中奪得視覺(jué)理解冠軍，全面超越GPT-4o與Claude3.5。

豆包實(shí)時(shí)語(yǔ)音大模型上線

1月20日，豆包實(shí)時(shí)語(yǔ)音大模型于正式推出，并在豆包APP全量開(kāi)放。據(jù)介紹，豆包實(shí)時(shí)語(yǔ)音大模型，是一款語(yǔ)音理解和生成一體化的模型，實(shí)現(xiàn)了端到端語(yǔ)音對(duì)話。相比傳統(tǒng)級(jí)聯(lián)模式，在語(yǔ)音表現(xiàn)力、控制力、情緒承接方面表現(xiàn)驚艷，并具備低時(shí)延、對(duì)話中可隨時(shí)打斷等特性。

豆包大模型1.5正式發(fā)布

1月22日，火山引擎宣布，豆包大模型1.5正式發(fā)布，目前已全面上線火山方舟。

字節(jié)豆包大模型團(tuán)隊(duì)提出稀疏模型架構(gòu)UltraMem

2月12日，據(jù)豆包大模型團(tuán)隊(duì)消息，字節(jié)跳動(dòng)豆包大模型Foundation團(tuán)隊(duì)近期提出UltraMem，一種同樣將計(jì)算和參數(shù)解耦的稀疏模型架構(gòu)，在保證模型效果的前提下解決了推理的訪存問(wèn)題。據(jù)介紹，該架構(gòu)有效解決了MoE推理時(shí)高額的訪存問(wèn)題，推理速度較MoE架構(gòu)提升2-6倍，推理成本最高可降低83%。

聯(lián)想AI桌面助手接入豆包大模型

12月27日，在2024聯(lián)想天禧生態(tài)伙伴大會(huì)上，聯(lián)想宣布與火山引擎正式合作，其AI桌面助手如意（AI Stick），植入豆包大模型，可提供AI搜索、AI寫(xiě)作、AI聊天三大AI新功能。

字節(jié)跳動(dòng)豆包大模型團(tuán)隊(duì)正式開(kāi)源首個(gè)多語(yǔ)言類(lèi)SWE數(shù)據(jù)集

4月10日，字節(jié)跳動(dòng)豆包大模型團(tuán)隊(duì)正式開(kāi)源首個(gè)多語(yǔ)言類(lèi)SWE數(shù)據(jù)集——Multi-SWE-bench，可用于評(píng)估和提升大模型“自動(dòng)修Bug”能力。在SWE-bench基礎(chǔ)上，Multi-SWE-bench首次覆蓋Python之外的7種主流編程語(yǔ)言，是真正面向“全棧工程”的評(píng)測(cè)基準(zhǔn)。其數(shù)據(jù)均來(lái)自GitHub issue，歷時(shí)近一年構(gòu)建，以盡可能準(zhǔn)確測(cè)評(píng)和提高大模型高階編程智能水平。

視覺(jué)中國(guó)完成DeepSeek開(kāi)源大模型接入與本地化部署

近日，視覺(jué)中國(guó)完成深度求索公司開(kāi)源大模型DeepSeek-R1的接入與本地化部署，并在多個(gè)產(chǎn)品中深度應(yīng)用其能力，此舉標(biāo)志著視覺(jué)內(nèi)容服務(wù)領(lǐng)域在AI技術(shù)應(yīng)用上的進(jìn)一步升級(jí)。通過(guò)充分發(fā)揮“視覺(jué)數(shù)據(jù)和應(yīng)用場(chǎng)景”的核心優(yōu)勢(shì)，視覺(jué)中國(guó)正全面推進(jìn)“視覺(jué)數(shù)據(jù)+AI技術(shù)+應(yīng)用場(chǎng)景”的戰(zhàn)略落地，推動(dòng)其在圖片及音視頻數(shù)字版權(quán)交易、以及創(chuàng)作社區(qū)等多個(gè)領(lǐng)域的創(chuàng)新發(fā)展。

豆包正小范圍測(cè)試深度思考模型，但接入模型非DeepSeek

2月25日消息，字節(jié)跳動(dòng)旗下AI助手豆包正在小范圍測(cè)試深度思考模型，但接入的不是DeepSeek模型。據(jù)豆包相關(guān)負(fù)責(zé)人表示，當(dāng)前測(cè)試的是自己深度思考模型的不同實(shí)驗(yàn)版本。據(jù)了解，在豆包對(duì)話頁(yè)面暫未顯示“深度思考”功能的入口，但被灰度到的用戶在詢問(wèn)不同問(wèn)題后，豆包生成的答復(fù)中會(huì)顯示思維鏈。

北京視覺(jué)世界科技有限公司

360兒童機(jī)器人是一款定位于親子互動(dòng)的家庭智能陪伴機(jī)器人，有利于孩子心智成長(zhǎng)、父母與孩子間的親子互動(dòng)。它配備了智能語(yǔ)音助手，還具有人臉跟蹤識(shí)別、多方視頻通話、K故事、益智早教等多元化功能。

通義萬(wàn)相升級(jí)：解決視頻生成模型復(fù)雜運(yùn)動(dòng)、物理定律遵循難題

1月9日消息，阿里云通義萬(wàn)相推出萬(wàn)相2.1視頻生成模型，在大幅度復(fù)雜運(yùn)動(dòng)、物理規(guī)律遵循、藝術(shù)表現(xiàn)等方面全面提升。根據(jù)權(quán)威評(píng)測(cè)榜單VBench的信息顯示，新版通義萬(wàn)相登上榜首位置。

點(diǎn)贊

收藏

分享

舉報(bào)

<kbd id="afajh"><form id="afajh"></form></kbd><strong id="afajh"><dl id="afajh"></dl></strong>

<del id="afajh"><form id="afajh"></form></del>

<th id="afajh"><progress id="afajh"></progress></th>

<b id="afajh"><abbr id="afajh"></abbr></b>

<th id="afajh"><progress id="afajh"></progress></th>

老女人草逼 | 99热在线免费观看 | 婷婷无码在线 | 人妻体体内射精一区二区 | 777无码|