<kbd id="afajh"><form id="afajh"></form></kbd><strong id="afajh"><dl id="afajh"></dl></strong>

<b id="afajh"><abbr id="afajh"></abbr></b>

WizardLM基于 LLaMA 的微調(diào)大語(yǔ)言模型

聯(lián)合創(chuàng)作 · 2023-09-25 23:23

WizardLM 是一個(gè)經(jīng)過(guò)微調(diào)的 7B LLaMA 模型。它通過(guò)大量具有不同難度的指令跟隨對(duì)話進(jìn)行微調(diào)。這個(gè)模型的新穎之處在于使用了 LLM 來(lái)自動(dòng)生成訓(xùn)練數(shù)據(jù)。

WizardLM 模型使用一種名為 Evol-Instruct（是一種使用 LLM 代人類(lèi)自主批生成各種難度等級(jí)和技術(shù)范圍的開(kāi)放指令，以提高 LLM 能力的新方法）的新方法，通過(guò) 70k 個(gè)計(jì)算機(jī)生成的指令進(jìn)行訓(xùn)練，該方法生成具有不同難度級(jí)別的指令。

Evol-Instruct 使用以下五個(gè)操作來(lái)擴(kuò)展提示：

添加約束
深化
具體化
增加推理步驟
復(fù)雜輸入

這些操作按順序應(yīng)用于初始指令以使其更加復(fù)雜，回復(fù)由 LLM 生成。

點(diǎn)贊

評(píng)論

編輯分享

舉報(bào)

評(píng)論

圖片

表情

WizardLM基于 LLaMA 的微調(diào)大語(yǔ)言模型

WizardLM是一個(gè)經(jīng)過(guò)微調(diào)的7BLLaMA模型。它通過(guò)大量具有不同難度的指令跟隨對(duì)話進(jìn)行微調(diào)。這個(gè)模型的新穎之處在于使用了LLM來(lái)自動(dòng)生成訓(xùn)練數(shù)據(jù)。WizardLM模型使用一種名為Evol-Ins

Chinese-Vicuna基于 LLaMA 的中文大語(yǔ)言模型

Chinese-Vicuna是一個(gè)中文低資源的LLaMA+Lora方案。項(xiàng)目包括finetune模型的代碼推理的代碼僅使用CPU推理的代碼(使用C++)下載/轉(zhuǎn)換/量化Facebookllama.ck

Chinese-Vicuna基于 LLaMA 的中文大語(yǔ)言模型

Chinese-Vicuna 是一個(gè)中文低資源的 LLaMA+Lora 方案。項(xiàng)目包括finetun

LLaMA大語(yǔ)言模型

LLaMA語(yǔ)言模型全稱(chēng)為"LargeLanguageModelMetaAI"，是Meta的全新大型語(yǔ)言模型（LLM），這是一個(gè)模型系列，根據(jù)參數(shù)規(guī)模進(jìn)行了劃分（分為70億、130億、330億和650億

LLaMA大語(yǔ)言模型

LLaMA 語(yǔ)言模型全稱(chēng)為 "Large Language Model Meta AI"，是 Met

本草基于中文醫(yī)學(xué)知識(shí)的 LLaMA 微調(diào)模型

本草【原名：華駝(HuaTuo)】是基于中文醫(yī)學(xué)知識(shí)的 LLaMA 微調(diào)模型。此項(xiàng)目開(kāi)源了經(jīng)過(guò)中文醫(yī)

本草基于中文醫(yī)學(xué)知識(shí)的 LLaMA 微調(diào)模型

本草【原名：華駝(HuaTuo)】是基于中文醫(yī)學(xué)知識(shí)的LLaMA微調(diào)模型。此項(xiàng)目開(kāi)源了經(jīng)過(guò)中文醫(yī)學(xué)指令精調(diào)/指令微調(diào)(Instruct-tuning)的LLaMA-7B模型。通過(guò)醫(yī)學(xué)知識(shí)圖譜和GPT3

YuLan-Chat基于中英文混合指令微調(diào)的大語(yǔ)言對(duì)話模型

YuLan-Chat是基于高質(zhì)量中英文混合指令微調(diào)的大語(yǔ)言對(duì)話模型。YuLan-Chat采用LLaMA作為底座，采用精心優(yōu)化的高質(zhì)量中英文混合指令進(jìn)行微調(diào)。其中YuLan-Chat-65B模型目前能夠

YuLan-Chat基于中英文混合指令微調(diào)的大語(yǔ)言對(duì)話模型

YuLan-Chat 是基于高質(zhì)量中英文混合指令微調(diào)的大語(yǔ)言對(duì)話模型。YuLan-Chat 采用 L

LaWGPT基于中文法律知識(shí)的大語(yǔ)言模型

LaWGPT 是一系列基于中文法律知識(shí)的開(kāi)源大語(yǔ)言模型。該系列模型在通用中文基座模型（如 Chine

點(diǎn)贊

評(píng)論

編輯分享

舉報(bào)

<kbd id="afajh"><form id="afajh"></form></kbd><strong id="afajh"><dl id="afajh"></dl></strong>

<b id="afajh"><abbr id="afajh"></abbr></b>