國產(chǎn)ChatGPT又開源了!效果大幅升級,在手機(jī)上也可以跑
?? 新智元報(bào)道??
編輯:好困【新智元導(dǎo)讀】近日,元語智能團(tuán)隊(duì)又開源了一個(gè)ChatYuan系列大模型:ChatYuan-large-v2,支持在單張消費(fèi)級顯卡、PC甚至手機(jī)上進(jìn)行推理使用。
剛剛,「國產(chǎn)ChatGPT」ChatYuan又發(fā)新版本了。
更新的ChatYuan-large-v2不僅支持中英雙語,還支持輸入輸出總長度最長4k。
而這也是繼此前PromptCLUE-base、PromptCLUE- v1-5、ChatYuan-large-v1 模型之后,元語智能再次推出大模型方向的研究成果。
開源項(xiàng)目地址:
https://github.com/clue-ai/ChatYuan
Huggingface:
https://huggingface.co/ClueAI/ChatYuan-large-v2
Modelscope:
https://modelscope.cn/models/ClueAI/ChatYuan-large-v2/summary
01 什么是ChatYuan-large-v2?
ChatYuan-large-v2是一個(gè)支持中英雙語的功能型對話語言大模型,ChatYuan-large-v2使用了和 v1版本相同的技術(shù)方案,在指令微調(diào)、人類反饋強(qiáng)化學(xué)習(xí)、思維鏈等方面進(jìn)行了優(yōu)化。
ChatYuan-large-v2是ChatYuan系列中以輕量化實(shí)現(xiàn)高質(zhì)量效果的代表模型,僅僅通過0.7B參數(shù)量可以實(shí)現(xiàn)業(yè)界10B模型的基礎(chǔ)效果,并且大大降低了推理成本,提高了使用效率。 用戶可以在消費(fèi)級顯卡、 PC甚至手 機(jī)上進(jìn)行推理(INT4 最低只需 400M )。
同時(shí),為了更好的提升使用體驗(yàn),團(tuán)隊(duì)已經(jīng)封裝了工具,Chatyuan-large-v2實(shí)現(xiàn)了本地可運(yùn)行,下載后可以直接在本地使用h5版本,進(jìn)行網(wǎng)頁交互。
02 v2有什么升級?
在chatyuan-large-v1的原有功能的基礎(chǔ)上,v2模型進(jìn)行了如下優(yōu)化:
- 增強(qiáng)了基礎(chǔ)能力:原有上下文問答、創(chuàng)意性寫作能力明顯提升。
- 新增了拒答能力:對于一些危險(xiǎn)、有害的問題,學(xué)會(huì)了拒答處理。
- 新增了代碼生成功能:對于基礎(chǔ)代碼生成進(jìn)行了一定程度優(yōu)化。
- 新增了表格生成功能:優(yōu)化了生成的表格內(nèi)容和格式。
- 增強(qiáng)了數(shù)學(xué)運(yùn)算能力:對基礎(chǔ)數(shù)學(xué)運(yùn)算如加減法做了優(yōu)化。
- 擴(kuò)展輸入輸出總長度:最大長度token數(shù)擴(kuò)展到4096。
- 增強(qiáng)了模擬情景能力:可以模擬多人對話或者具體場景,在情景下進(jìn)行內(nèi)容創(chuàng)作及上下文交互。
-
新增了中英雙語對話能力:新增了中英雙語交互、英文創(chuàng)作、翻譯等功能。

計(jì)算推理

模擬情景


表格生成

代碼生成

03 v2的局限性
由于Chatyuan-large-v1是一個(gè)輕量化的大模型,所以仍會(huì)存在一些局限和不足,請開發(fā)者知悉,包括:
-
對于推理、計(jì)算、代碼生成方面基礎(chǔ)功能基本實(shí)現(xiàn),仍存在訓(xùn)練不充分的問題,在某些場景下會(huì)出現(xiàn)邏輯錯(cuò)誤情況,如代碼基本能夠?qū)崿F(xiàn)且具備注釋能力,但不能保證精簡通順和準(zhǔn)確,可視性還需優(yōu)化。
-
通用知識回答不夠精確,事實(shí)性知識仍存在不準(zhǔn)確的情況。
-
上下文關(guān)聯(lián)信息處理尚有不足。
結(jié)語
總體而言,v2在上下文理解、內(nèi)容生成、代碼表格生成等方面,較v1開源模型有較大提升,僅僅通過0.7B參數(shù)規(guī)模即可實(shí)現(xiàn)行業(yè)內(nèi)百億參數(shù)規(guī)模的基礎(chǔ)效果,大幅降低推理成本,提升了使用效率。
元語智能表示,團(tuán)隊(duì)會(huì)堅(jiān)定的堅(jiān)持開源路線,后續(xù)將持續(xù)開源更好更大的通用大模型,持續(xù)構(gòu)建開源開發(fā)者生態(tài),推動(dòng)國內(nèi)大模型開源發(fā)展,希望各位朋友批評指正。
產(chǎn)品內(nèi)測邀請?
除了本次開源ChatYuan-large-v2模型之外,元語團(tuán)隊(duì)正式開啟KnowX產(chǎn)品內(nèi)測,KnowX搭載了ChatYuan線上最新版本的大模型能力,在上下文理解、內(nèi)容生成、代碼生成、邏輯推理計(jì)算等方面表現(xiàn)優(yōu)異,為實(shí)現(xiàn)版本的可靠、穩(wěn)定及進(jìn)一步優(yōu)化,現(xiàn)已開啟產(chǎn)品內(nèi)測,名額有限,感興趣的朋友可在下方鏈接中申請。
內(nèi)測申請通道:
https://wj.qq.com/s2/11984341/e00b/ 參考資料: https://mp.weixin.qq.com/s/NahO52ZwFDjU0CMxfgRhQw




