簡介
Macaw-LLM:具有圖像、視頻、音頻和文本集成的多模態(tài)語言建模Macaw-LLM 是一項(xiàng)探索性的嘗試,它通過無縫結(jié)合圖像、視頻、音頻和文本數(shù)據(jù)開創(chuàng)了多模式語言建模,建立在 CLIP、Whisper 和 LLaMA 的基礎(chǔ)上。近年來,語言建模領(lǐng)域取得了顯著進(jìn)步。然而,圖像、視頻、音頻和文本等多種模... 更多
技術(shù)信息
開源協(xié)議
未知
開發(fā)語言
Python
操作系統(tǒng)
跨平臺
軟件類型
開源軟件
所屬分類
神經(jīng)網(wǎng)絡(luò)/人工智能、 LLM(大語言模型)
開源組織
無
地區(qū)
不詳
適用人群
未知
評價(jià)
0.0(滿分 10 分)0 個(gè)評分
什么是點(diǎn)評分
圖片
表情
全部評價(jià)(
0)
推薦率
100%

