<kbd id="afajh"><form id="afajh"></form></kbd><strong id="afajh"><dl id="afajh"></dl></strong>

<del id="afajh"><form id="afajh"></form></del>

<th id="afajh"><progress id="afajh"></progress></th>

<b id="afajh"><abbr id="afajh"></abbr></b>

<th id="afajh"><progress id="afajh"></progress></th>

MPT-30B大型語言模型

聯(lián)合創(chuàng)作 · 2023-09-25 23:50

MPT-30B 是 Mosaic Pretrained Transformer (MPT) 模型系列的一部分，它使用了一個為高效訓(xùn)練和推理而優(yōu)化的 transformer 架構(gòu)，并在 1T tokens 的英文文本和代碼上從頭訓(xùn)練。

這個模型使用 MosaicML LLM 代碼庫，是由 MosaicML 的 NLP 團隊在 MosaicML 平臺上進(jìn)行 LLM 預(yù)訓(xùn)練、微調(diào)和推理的。

MPT-30B 特點：

可商業(yè)使用
在大量的數(shù)據(jù)上進(jìn)行訓(xùn)練
由于 ALiBi 的存在，準(zhǔn)備好處理極長的輸入。
能夠進(jìn)行快速訓(xùn)練和推理
通過 llm-foundry 資源庫配備了高效的開源訓(xùn)練代碼

使用

import transformers
model = transformers.AutoModelForCausalLM.from_pretrained(
  'mosaicml/mpt-30b',
  trust_remote_code=True
)

瀏覽 15

點贊

收藏

分享

舉報

評論

圖片

表情

MPT-30B大型語言模型

MPT-30B是MosaicPretrainedTransformer(MPT)模型系列的一部分，它使用了一個為高效訓(xùn)練和推理而優(yōu)化的transformer架構(gòu)，并在1Ttokens的英文文本和代碼上

GPT-2基于 transformer?的大型語言模型

GPT-2是一種基于transformer?的大型語言模型，具有15億個參數(shù)，在800萬網(wǎng)頁數(shù)據(jù)集上進(jìn)行訓(xùn)練。它是論文《語言模型是無人監(jiān)督的多任務(wù)學(xué)習(xí)者》（LanguageModelsareUnsup

書生·浦語多語言大型語言模型

InternLM（書生·浦語）是在過萬億token數(shù)據(jù)上訓(xùn)練的多語千億參數(shù)基座模型。通過多階段的漸進(jìn)式訓(xùn)練，InternLM基座模型具有較高的知識水平，在中英文閱讀理解、推理任務(wù)等需要較強思維能力的場

PaLM 2谷歌下一代大型語言模型

PaLM 2?是谷歌推出的下一代大型語言模型。擅長高級推理任務(wù)，包括代碼和數(shù)學(xué)、分類和問答、翻譯和多

GPT-2基于 transformer?的大型語言模型

GPT-2 是一種基于 transformer?的大型語言模型，具有 15 億個參數(shù)，在 800 萬

PaLM 2谷歌下一代大型語言模型

PaLM2?是谷歌推出的下一代大型語言模型。擅長高級推理任務(wù)，包括代碼和數(shù)學(xué)、分類和問答、翻譯和多語言能力以及自然語言生成。谷歌聲稱PaLM2是一種最先進(jìn)的語言模型，要優(yōu)于其之前所有的LLM，包括Pa

書生·浦語多語言大型語言模型

InternLM（書生·浦語）是在過萬億 token 數(shù)據(jù)上訓(xùn)練的多語千億參數(shù)基座模型。通過多階段的

FinGPT金融領(lǐng)域大型預(yù)訓(xùn)練語言模型

FinGPT 是金融領(lǐng)域大型預(yù)訓(xùn)練語言模型。它能理解和生成財經(jīng)新聞，分析社交媒體上的公眾情緒，解讀金

Lit-Parrot大型語言模型的可破解實現(xiàn)

Lit-Parrot 是基于 nanoGPT 的 StableLM/Pythia/INCITE 語言

Lit-Parrot大型語言模型的可破解實現(xiàn)

Lit-Parrot是基于nanoGPT的StableLM/Pythia/INCITE語言模型的實現(xiàn)。支持flashattention、LLaMA-Adapter微調(diào)、預(yù)訓(xùn)練。最先進(jìn)的開源大型語言模型

點贊

收藏

分享

舉報

<kbd id="afajh"><form id="afajh"></form></kbd><strong id="afajh"><dl id="afajh"></dl></strong>

<del id="afajh"><form id="afajh"></form></del>

<th id="afajh"><progress id="afajh"></progress></th>

<b id="afajh"><abbr id="afajh"></abbr></b>

<th id="afajh"><progress id="afajh"></progress></th>

成人黄色在线看 | 久久国产精品99久久人人澡 | 北条麻妃在线一区二区三区 | 精品一区二区三区四区五区六区 | 欧美操逼精品 |