直接爆了!阿里Qwen2登頂全球開(kāi)源第一!
共 1830字,需瀏覽 4分鐘
·
2024-07-17 21:59
來(lái)源:網(wǎng)絡(luò)
近日,OpenAI 突然宣布將正式封鎖來(lái)自中國(guó)、朝鮮、俄羅斯等非支持國(guó)家和地區(qū)的 API 流量,終止對(duì)中國(guó)提供 API 服務(wù),進(jìn)一步收緊國(guó)內(nèi)開(kāi)發(fā)者訪問(wèn) GPT 等高水平大模型。
開(kāi)源大模型格局徹底變了!
6月27日凌晨,全球知名的開(kāi)源平臺(tái)Hugging Face的聯(lián)合創(chuàng)始人兼首席執(zhí)行官Clem在社交平臺(tái)激動(dòng)宣布,阿里巴巴最新開(kāi)源的Qwen2-72B指令微調(diào)版本在開(kāi)源模型排行榜上榮登榜首。
HuggingFace聯(lián)合創(chuàng)始人兼CEO Clem發(fā)文表示:“Qwen2是王者,中國(guó)在全球開(kāi)源大模型領(lǐng)域處于領(lǐng)導(dǎo)地位?!?/strong>
他表示,為了提供全新的開(kāi)源大模型排行榜,使用了300塊H100對(duì)目前全球100多個(gè)主流開(kāi)源大模型,例如,Qwen2、Llama-3、mixtral、Phi-3等,在
根據(jù)排行榜的數(shù)據(jù)顯示,Meta開(kāi)源的Llama-3-70B指令微調(diào)版本位列第2;阿里的Qwen2-72B基礎(chǔ)版本排名第3;Mistralai的Mixtral-8x22B指令微調(diào)版本排名第4;第9和第10名,全部都是阿里之前開(kāi)源的Qwen1.5基礎(chǔ)和Chat版本。
令人矚目的是,阿里巴巴開(kāi)源的Qwen-2 72B模型在激烈競(jìng)爭(zhēng)中脫穎而出,不僅超越了科技巨頭Meta的Llama-3,還超越了法國(guó)知名大模型平臺(tái)Mistralai的Mixtral,成為了新的行業(yè)領(lǐng)軍者。這一成績(jī)充分說(shuō)明中國(guó)對(duì)全球開(kāi)源大模型的重要貢獻(xiàn)以及領(lǐng)導(dǎo)地位。
而作為國(guó)產(chǎn)大模型,阿里開(kāi)源的4款大模型也已經(jīng)不是第一次傲視群雄了!
早在今年的6月7日,阿里巴巴通義千問(wèn)團(tuán)隊(duì)發(fā)布了Qwen2系列開(kāi)源模型。發(fā)布兩小時(shí),直接沖上HggingFace開(kāi)源大模型榜單第一。
今天是他們本月第二次發(fā)榜。
這次的榜單是v2版本,HuggingFace一年來(lái)首次全面更新的版本。榜單內(nèi)的測(cè)試集,更難、更好、更快、更強(qiáng)(Harder, better, faster, stronger),對(duì)模型的考察也更有說(shuō)服力。
HuggingFace在技術(shù)博文指出。過(guò)去一年,Open LLM Leaderboard的基準(zhǔn)指標(biāo)已經(jīng)被過(guò)度使用,出現(xiàn)幾個(gè)問(wèn)題:
題目對(duì)模型來(lái)說(shuō)變得太簡(jiǎn)單;
一些新近出現(xiàn)的模型出現(xiàn)數(shù)據(jù)污染跡象;
有些測(cè)評(píng)基準(zhǔn)存在錯(cuò)誤。
因此,平臺(tái)提出了更有挑戰(zhàn)性的V2榜單,基于未受污染、高質(zhì)量數(shù)據(jù)集的新基準(zhǔn),運(yùn)用可靠的度量標(biāo)準(zhǔn)。
當(dāng)然,不論新老榜單,Qwen2-72B都是穩(wěn)穩(wěn)的第一名,再次驗(yàn)證了通義Qwen作為全球最強(qiáng)開(kāi)源模型的實(shí)力。
針對(duì)這一排名結(jié)果,Stability AI的研究總監(jiān)、早年在19歲便獲得博士學(xué)位的Tanishq則表示,他早前就預(yù)測(cè)中國(guó)在開(kāi)源大模型領(lǐng)域具有強(qiáng)大的競(jìng)爭(zhēng)力。除了Qwen2,還有零一萬(wàn)物、InternLM、Deepsseek等眾多優(yōu)秀的中國(guó)開(kāi)源模型,都在國(guó)際舞臺(tái)上嶄露頭角。
Tanishq進(jìn)一步強(qiáng)調(diào),任何關(guān)于中國(guó)在開(kāi)源大模型領(lǐng)域落后的觀點(diǎn)都是站不住腳的。相反,中國(guó)在這一領(lǐng)域正逐漸展現(xiàn)出領(lǐng)導(dǎo)者的姿態(tài),引領(lǐng)著全球開(kāi)源模型的發(fā)展潮流。
更有意思的事是,還有網(wǎng)友自制梗圖慶祝阿里開(kāi)源的Qwen-2 72B,力壓科技、社交巨頭Meta的Llama-3,還超越了法國(guó)知名大模型平臺(tái)Mistralai的Mixtral,成為新的行業(yè)領(lǐng)軍者。
阿里為大模型所付出努力和貢獻(xiàn),無(wú)疑是更進(jìn)一步推動(dòng)了國(guó)內(nèi)大模型的發(fā)展。
Qwen-2開(kāi)源地址:
https://huggingface.co/Qwen/Qwen2-72B-Instruct
