<kbd id="afajh"><form id="afajh"></form></kbd><strong id="afajh"><dl id="afajh"></dl></strong>

<b id="afajh"><abbr id="afajh"></abbr></b>

RedPajama大語言模型

聯(lián)合創(chuàng)作 · 2023-09-25 23:18

RedPajama 項(xiàng)目旨在創(chuàng)建一套領(lǐng)先的全開源大語言模型。目前，該項(xiàng)目已完成了第一步，成功復(fù)制了 LLaMA 訓(xùn)練數(shù)據(jù)集超過 1.2 萬億個數(shù)據(jù) token。該項(xiàng)目由Together、Ontocord.ai、ETH DS3Lab、斯坦福大學(xué) CRFM、Hazy Research 和 MILA 魁北克 AI 研究所聯(lián)合開發(fā)。

RedPajama 包含三個主要組成部分：預(yù)訓(xùn)練數(shù)據(jù)、基礎(chǔ)模型和指令調(diào)優(yōu)數(shù)據(jù)與模型。

點(diǎn)贊

評論

編輯分享

舉報

評論

圖片

表情

RedPajama大語言模型

RedPajama項(xiàng)目旨在創(chuàng)建一套領(lǐng)先的全開源大語言模型。目前，該項(xiàng)目已完成了第一步，成功復(fù)制了LLaMA訓(xùn)練數(shù)據(jù)集超過1.2萬億個數(shù)據(jù)token。該項(xiàng)目由Together、Ontocord.ai、E

OPT-175B大語言模型

OPT-175B 是 Meta 開源的大語言模型，擁有超過 1750 億個參數(shù)——和 GPT-3 相

OPT-175B大語言模型

OPT-175B是Meta開源的大語言模型，擁有超過1750億個參數(shù)——和GPT-3相當(dāng)。相比GPT-3，OPT-175B的優(yōu)勢在于它完全免費(fèi)。Meta還公布了代碼庫、開發(fā)過程日志、數(shù)據(jù)、研究論文和其

LLaMA大語言模型

LLaMA語言模型全稱為"LargeLanguageModelMetaAI"，是Meta的全新大型語言模型（LLM），這是一個模型系列，根據(jù)參數(shù)規(guī)模進(jìn)行了劃分（分為70億、130億、330億和650億

LLaMA大語言模型

LLaMA 語言模型全稱為 "Large Language Model Meta AI"，是 Met

BBT-2通用大語言模型

BBT-2 是包含 120 億參數(shù)的通用大語言模型，在 BBT-2 的基礎(chǔ)上訓(xùn)練出了代碼，金融，文生

BBT-2通用大語言模型

BBT-2是包含120億參數(shù)的通用大語言模型，在BBT-2的基礎(chǔ)上訓(xùn)練出了代碼，金融，文生圖等專業(yè)模型。基于BBT-2的系列模型包括：BBT-2-12B-Text：120億參數(shù)的中文基礎(chǔ)模型BBT-2

ChatYuan對話語言大模型

ChatYuan是一個支持中英雙語的功能型對話語言大模型。ChatYuan-large-v2使用了和v1版本相同的技術(shù)方案，在微調(diào)數(shù)據(jù)、人類反饋強(qiáng)化學(xué)習(xí)、思維鏈等方面進(jìn)行了優(yōu)化。ChatYuan-la

CodeFuse-13B代碼大語言模型

CodeFuse-13B是基于GPT-NeoX框架訓(xùn)練的13B參數(shù)代碼生成模型，能夠處理4096個字

CodeFuse-13B代碼大語言模型

CodeFuse-13B是基于GPT-NeoX框架訓(xùn)練的13B參數(shù)代碼生成模型，能夠處理4096個字符的代碼序列。該模型在1000BToken的代碼、中文、英文數(shù)據(jù)數(shù)據(jù)集上進(jìn)行預(yù)訓(xùn)練，覆蓋超過40種編

點(diǎn)贊

評論

編輯分享

舉報

<kbd id="afajh"><form id="afajh"></form></kbd><strong id="afajh"><dl id="afajh"></dl></strong>

<b id="afajh"><abbr id="afajh"></abbr></b>