WizardLM基于 LLaMA 的微調(diào)大語(yǔ)言模型
WizardLM 是一個(gè)經(jīng)過(guò)微調(diào)的 7B LLaMA 模型。它通過(guò)大量具有不同難度的指令跟隨對(duì)話進(jìn)行微調(diào)。這個(gè)模型的新穎之處在于使用了 LLM 來(lái)自動(dòng)生成訓(xùn)練數(shù)據(jù)。
WizardLM 模型使用一種名為 Evol-Instruct(是一種使用 LLM 代人類(lèi)自主批生成各種難度等級(jí)和技術(shù)范圍的開(kāi)放指令,以提高 LLM 能力的新方法)的新方法,通過(guò) 70k 個(gè)計(jì)算機(jī)生成的指令進(jìn)行訓(xùn)練,該方法生成具有不同難度級(jí)別的指令。
Evol-Instruct 使用以下五個(gè)操作來(lái)擴(kuò)展提示:
-
添加約束
-
深化
-
具體化
-
增加推理步驟
-
復(fù)雜輸入
這些操作按順序應(yīng)用于初始指令以使其更加復(fù)雜,回復(fù)由 LLM 生成。
評(píng)論
圖片
表情
