又一中國(guó)模型趕超OpenAI!Qwen2.5-Max數(shù)學(xué)編程能力全球出眾
2025-02-04 18:51
2月4日凌晨,三方基準(zhǔn)測(cè)試平臺(tái)Chatbot Arena公布了最新的大模型盲測(cè)榜單,一周前阿里云通義團(tuán)隊(duì)剛發(fā)布的Qwen2.5-Max超越DeepSeek V3、OpenAI o1-mini和Claude-3.5-Sonnet等模型,以1332分位列全球第七名,也是非推理類的中國(guó)大模型冠軍。同時(shí),Qwen2.5-Max在數(shù)學(xué)和編程等單項(xiàng)能力上排名第一,在硬提示(Hard prompts)方面排名第二。ChatBot Arena官方評(píng)價(jià)稱,Qwen2.5-Max在多個(gè)領(lǐng)域表現(xiàn)強(qiáng)勁,特別是專業(yè)技術(shù)向的,例如編程、數(shù)學(xué)、硬提示等。
瀏覽
12評(píng)論
圖片
表情
