<kbd id="afajh"><form id="afajh"></form></kbd><strong id="afajh"><dl id="afajh"></dl></strong>

<b id="afajh"><abbr id="afajh"></abbr></b>

VisualGLM-6B多模態(tài)對(duì)話語(yǔ)言模型

聯(lián)合創(chuàng)作 · 2023-09-25 23:34

VisualGLM-6B 是一個(gè)開源的，支持圖像、中文和英文的多模態(tài)對(duì)話語(yǔ)言模型，語(yǔ)言模型基于 ChatGLM-6B，具有 62 億參數(shù)；圖像部分通過(guò)訓(xùn)練 BLIP2-Qformer 構(gòu)建起視覺模型與語(yǔ)言模型的橋梁，整體模型共 78 億參數(shù)。

VisualGLM-6B 依靠來(lái)自于 CogView 數(shù)據(jù)集的 30M 高質(zhì)量中文圖文對(duì)，與 300M 經(jīng)過(guò)篩選的英文圖文對(duì)進(jìn)行預(yù)訓(xùn)練，中英文權(quán)重相同。該訓(xùn)練方式較好地將視覺信息對(duì)齊到 ChatGLM 的語(yǔ)義空間；之后的微調(diào)階段，模型在長(zhǎng)視覺問答數(shù)據(jù)上訓(xùn)練，以生成符合人類偏好的答案。

點(diǎn)贊

評(píng)論

編輯分享

舉報(bào)

評(píng)論

圖片

表情

VisualGLM-6B多模態(tài)對(duì)話語(yǔ)言模型

VisualGLM-6B是一個(gè)開源的，支持圖像、中文和英文的多模態(tài)對(duì)話語(yǔ)言模型，語(yǔ)言模型基于ChatGLM-6B，具有62億參數(shù)；圖像部分通過(guò)訓(xùn)練BLIP2-Qformer構(gòu)建起視覺模型與語(yǔ)言模型的橋

mPLUG-Owl多模態(tài)大語(yǔ)言模型

阿里達(dá)摩院提出的多模態(tài)GPT的模型：mPLUG-Owl，基于?mPLUG?模塊化的多模態(tài)大語(yǔ)言模型。它不僅能理解推理文本的內(nèi)容，還可以理解視覺信息，并且具備優(yōu)秀的跨模態(tài)對(duì)齊能力。論文：https://

多模態(tài)視覺語(yǔ)言模型 Mini-Gemini

大家好，又見面了，我是 GitHub 精選君！背景介紹隨著大數(shù)據(jù)和人工智能技術(shù)的快速發(fā)展，多模態(tài)視覺語(yǔ)言模型（Multi-modality Vision Language Models）已成為近年來(lái)研究的熱點(diǎn)。這類模型通過(guò)融合圖像和文本信息，能夠更好地理解和生成復(fù)雜的視覺語(yǔ)言內(nèi)容，廣泛應(yīng)用于圖像標(biāo)注

mPLUG-Owl多模態(tài)大語(yǔ)言模型

阿里達(dá)摩院提出的多模態(tài)GPT的模型：mPLUG-Owl，基于?mPLUG?模塊化的多模態(tài)大語(yǔ)言模型。

悟道雙語(yǔ)多模態(tài)大語(yǔ)言模型

“悟道”是雙語(yǔ)多模態(tài)預(yù)訓(xùn)練模型，規(guī)模達(dá)到 1.75 萬(wàn)億參數(shù)。項(xiàng)目現(xiàn)有 7 個(gè)開源模型成果，模型參數(shù)

悟道雙語(yǔ)多模態(tài)大語(yǔ)言模型

“悟道”是雙語(yǔ)多模態(tài)預(yù)訓(xùn)練模型，規(guī)模達(dá)到1.75萬(wàn)億參數(shù)。項(xiàng)目現(xiàn)有7個(gè)開源模型成果，模型參數(shù)文件需到悟道平臺(tái)進(jìn)行下載申請(qǐng)。圖文類CogViewCogView參數(shù)量為40億，模型可實(shí)現(xiàn)文本生成圖像，經(jīng)過(guò)

VLE視覺-語(yǔ)言多模態(tài)預(yù)訓(xùn)練模型

VLE?(Vision-Language?Encoder) 是一種基于預(yù)訓(xùn)練文本和圖像編碼器的圖像-

VLE視覺-語(yǔ)言多模態(tài)預(yù)訓(xùn)練模型

VLE?(Vision-Language?Encoder)是一種基于預(yù)訓(xùn)練文本和圖像編碼器的圖像-文本多模態(tài)理解模型，可應(yīng)用于如視覺問答、圖像-文本檢索等多模態(tài)判別任務(wù)。特別地，在對(duì)語(yǔ)言理解和推理能力

ChatYuan對(duì)話語(yǔ)言大模型

ChatYuan是一個(gè)支持中英雙語(yǔ)的功能型對(duì)話語(yǔ)言大模型。ChatYuan-large-v2使用了和v1版本相同的技術(shù)方案，在微調(diào)數(shù)據(jù)、人類反饋強(qiáng)化學(xué)習(xí)、思維鏈等方面進(jìn)行了優(yōu)化。ChatYuan-la

MOSS對(duì)話大語(yǔ)言模型

MOSS是一個(gè)支持中英雙語(yǔ)和多種插件的開源對(duì)話語(yǔ)言模型，moss-moon系列模型具有160億參數(shù)，在FP16精度下可在單張A100/A800或兩張3090顯卡運(yùn)行，在INT4/8精度下可在單張309

點(diǎn)贊

評(píng)論

編輯分享

舉報(bào)

<kbd id="afajh"><form id="afajh"></form></kbd><strong id="afajh"><dl id="afajh"></dl></strong>

<b id="afajh"><abbr id="afajh"></abbr></b>