10人明星團(tuán)隊(duì)煉出首個(gè)微調(diào)Llama 3.1 405B!角色扮演一秒入戲,代碼全開源
共 6738字,需瀏覽 14分鐘
·
2024-08-16 12:42
新智元報(bào)道
新智元報(bào)道
【新智元導(dǎo)讀】發(fā)布40天后,最強(qiáng)開源模型Llama 3.1 405B等來了微調(diào)版本的發(fā)布。但不是來自Meta,而是一個(gè)專注于開放模型的神秘初創(chuàng)Nous Research。
自從開始人工智能之旅以來,我就想實(shí)現(xiàn)一個(gè)開源前沿模型。
今天,憑借 Hermes 3 405B,我們實(shí)現(xiàn)了這一目標(biāo)。這是一款具有前沿水平的模型型號(hào),真正適合用戶,而非某個(gè)公司或更高的權(quán)威。
憑借在數(shù)據(jù)合成和后訓(xùn)練研究方面的辛勤工作,我們才能用將近1年的時(shí)間構(gòu)建一個(gè)幾乎完全來自合成的數(shù)據(jù)集,并用于訓(xùn)練Hermes 3。未來我們還將有更多發(fā)布。
論文地址:https://nousresearch.com/wp-content/uploads/2024/08/Hermes-3-Technical-Report.pdf
模型概述
出色的對(duì)話表現(xiàn)
經(jīng)我細(xì)數(shù),「草莓」詞中有三重字母「r」棲息在此
絕佳智能體
別問「我是誰(shuí)」,模型立即失憶
訓(xùn)練配方
數(shù)據(jù)集混合
監(jiān)督微調(diào)
DPO
評(píng)估
Nous Research
我們挑戰(zhàn)封閉技術(shù)將永遠(yuǎn)占據(jù)創(chuàng)新頂峰的假設(shè),相反,我們提供強(qiáng)大的開源代碼。
評(píng)論
圖片
表情
