LLaMA大語言模型
LLaMA 語言模型全稱為 "Large Language Model Meta AI",是 Meta 的全新大型語言模型(LLM),這是一個(gè)模型系列,根據(jù)參數(shù)規(guī)模進(jìn)行了劃分(分為 70 億、130 億、330 億和 650 億參數(shù)不等)。
值得注意的是,其中 LaMA-13B(130 億參數(shù)的模型)盡管模型參數(shù)相比 OpenAI 的 GPT-3(1750 億參數(shù)) 要少了十幾倍,但在性能上反而可以超過 GPT-3 模型。更小的模型也意味著開發(fā)者可以在 PC 甚至是智能手機(jī)等設(shè)備上本地運(yùn)行類 ChatGPT 這樣的 AI 助手,無需依賴數(shù)據(jù)中心這樣的大規(guī)模設(shè)施。
目前 LLaMA 的一個(gè)精簡版可在GitHub上找到,Meta 暫時(shí)還沒有要公開發(fā)布完整模型和權(quán)重的計(jì)劃。Meta 提供了一個(gè)登記頁面,感興趣的開發(fā)者可以申請(qǐng)登記,從而獲得完整的代碼和權(quán)重。
評(píng)論
圖片
表情
