從技術(shù)路徑,縱觀國產(chǎn)大模型逆襲之路
共 3285字,需瀏覽 7分鐘
·
2024-07-22 07:37
OpenAI、Google、Antropic三大廠商競相輪換大模型第一寶座:自23年初GPT-4發(fā)布以來,在1年左右時(shí)間內(nèi)基本穩(wěn)定處于大模型最強(qiáng)位置。2024年海外大模型迭代速度有所加快,龍頭競爭格局悄然發(fā)生變化。
? 1)5月,OpenAI發(fā)布新的旗艦?zāi)P虶PT-4o,實(shí)現(xiàn)跨模態(tài)即時(shí)響應(yīng),相比GPT-4 Turbo,刷新SOTA實(shí)現(xiàn)性能飛躍。
? 2)5月,Google發(fā)布Gemini 1.5 Pro進(jìn)階版,實(shí)現(xiàn)200萬tokens上下文,具備更強(qiáng)大的推理和理解能力。
? 3)6月,Antropic發(fā)布Claude 3.5 Sonnet,具備更強(qiáng)的代碼和視覺能力,基準(zhǔn)測試結(jié)果全方位碾壓Gemini 1.5 Pro和Llama-400b,大部分優(yōu)于 GPT-4o,一定程度上暫時(shí)代表著當(dāng)前大模型性能最高水平。
在傳統(tǒng)基準(zhǔn)測試中,GPT-4o在文本、推理和編碼智能方面實(shí)現(xiàn)了GPT-4 Turbo級別的性能,同時(shí)在多語言、音頻和視覺功能上達(dá)到了新的高水位線。
? 文本推理:GPT-4o在0-shot COT MMLU(常識問題)上創(chuàng)下了88.7%的新高分。此外,在傳統(tǒng)的5-shot no-CoT MMLU上,GPT-4o創(chuàng)下了87.2%的新高分。相較于GPT-4 Turbo而言,GPT-4o文本推理能力有一定提升。
? 多語言識別:與Whisper-v3相比,GPT-4o在多種語言的識別中表現(xiàn)優(yōu)異,尤其是資源匱乏的語言。
? 音頻翻譯:GPT-4o在音頻翻譯表現(xiàn)上達(dá)到新的高水準(zhǔn),且在MLS基準(zhǔn)測試中優(yōu)于Whisper-v3。
? M3Exam測試:M3Exam基準(zhǔn)測試既是多語言評估也是視覺評估,由來自其他國家標(biāo)準(zhǔn)化測試的多項(xiàng)選擇題組成,有時(shí)還
包括圖形和圖表。在所有語言的基準(zhǔn)測試中,GPT-4o都比GPT-4更強(qiáng)。
? 視覺理解:GPT-4o在視覺感知基準(zhǔn)上實(shí)現(xiàn)了最先進(jìn)的性能。具體來看,GPT-4o在MMMU測試中分?jǐn)?shù)達(dá)到69.1,而GPT-4
Turbo、Gemini 1.0 Ultra、Gemini 1.5 Pro、Claude Opus分別為63.1、59.4、58.5、59.4。
? GPT-4o多模態(tài)能力范圍顯著拓展:除了文本、圖像等常用功能,GPT-4o還支持3D物品合成、文本轉(zhuǎn)字體等多樣化功能。與GPT-4 Turbo相比,GPT-4o速度提升2倍、成本卻降低了50%,且速率限制提升5倍。
1、封測行業(yè)研究框架
2、半導(dǎo)體封測專題:封測行業(yè)景氣,先進(jìn)封測驅(qū)動(dòng)芯片成長
3、半導(dǎo)體精華:先進(jìn)封測,價(jià)值增厚
4、裸芯片封測技術(shù)的發(fā)展與挑戰(zhàn)
5、先進(jìn)封測裝與Chiplet共塑后摩爾半導(dǎo)體產(chǎn)業(yè)新格局
6、IC半導(dǎo)體封裝測試流程(精華版)
下載鏈接:
2024年中國安防視頻監(jiān)控SoC芯片行業(yè)研究報(bào)告:安防SoC市場喜迎百億爆發(fā),眾企競逐后海思時(shí)代
邁向巔峰之路:中國成長型AI企業(yè)研究報(bào)告(2024)
AI Agent行業(yè)詞條報(bào)告:驅(qū)動(dòng)智能交互變革,重塑服務(wù)生態(tài)
空間數(shù)據(jù)智能大模型研究:2024年中國空間數(shù)據(jù)智能戰(zhàn)略發(fā)展白皮書
企業(yè)競爭圖譜:2024年量子計(jì)算詞條報(bào)告
2024中國服務(wù)器CPU行業(yè)概覽:信創(chuàng)帶動(dòng)服務(wù)器CPU國產(chǎn)化
HBM專題報(bào)告:跨越帶寬增長極限,HBM賦能AI新紀(jì)元
2024基于標(biāo)準(zhǔn)PCIe接口的人工智能加速卡液冷設(shè)計(jì)白皮書
1、新型智算中心改造系列報(bào)告二:拉動(dòng)全球電力消耗增長,液冷滲透率快速提升 2、新型智算中心改造系列報(bào)告一:網(wǎng)絡(luò)成大模型訓(xùn)練瓶頸,節(jié)點(diǎn)內(nèi)外多方案并存
《國產(chǎn)異構(gòu)處理器定位優(yōu)化技術(shù)合集》
1、面向申威眾核處理器的規(guī)則處理優(yōu)化技術(shù) 2、神威超級計(jì)算機(jī)運(yùn)行時(shí)故障定位方法
面向異構(gòu)硬件架構(gòu)軟件支撐和優(yōu)化技術(shù)
AI大模型賦能手機(jī)終端,擁抱AI手機(jī)新機(jī)遇
全球AI算力行業(yè)首次覆蓋:從云到端,云端協(xié)同,AI開啟科技行業(yè)超級成長周期
2024年中國大模型行業(yè)應(yīng)用研究:大模型引領(lǐng)智能時(shí)代,助力各行業(yè)全面升級
1、半導(dǎo)體行業(yè)系列專題:刻蝕—半導(dǎo)體制造核心設(shè)備,國產(chǎn)化典范
2、半導(dǎo)體行業(yè)系列專題:碳化硅—襯底產(chǎn)能持續(xù)擴(kuò)充,加速國產(chǎn)化機(jī)會
3、半導(dǎo)體行業(yè)系列專題:直寫光刻篇,行業(yè)技術(shù)升級加速應(yīng)用滲透
4、半導(dǎo)體行業(yè)系列專題:先進(jìn)封裝—先進(jìn)封裝大有可為,上下游產(chǎn)業(yè)鏈?zhǔn)芤?/span>
“人工智能+”進(jìn)入爆發(fā)臨界,開啟繁榮生態(tài)前景
《算力網(wǎng)絡(luò):光網(wǎng)絡(luò)技術(shù)合集(1)》
1、面向算力網(wǎng)絡(luò)的新型全光網(wǎng)技術(shù)發(fā)展及關(guān)鍵器件探討
2、面向算力網(wǎng)絡(luò)的光網(wǎng)絡(luò)智能化架構(gòu)與技術(shù)白皮書
3、2023開放光網(wǎng)絡(luò)系統(tǒng)驗(yàn)證測試規(guī)范
4、面向通感算一體化光網(wǎng)絡(luò)的光纖傳感技術(shù)白皮書
《算力網(wǎng)絡(luò):光網(wǎng)絡(luò)技術(shù)合集(2)》
1、數(shù)據(jù)中心互聯(lián)開放光傳輸系統(tǒng)設(shè)計(jì)
2、確定性光傳輸支撐廣域長距算力互聯(lián)
3、面向時(shí)隙光交換網(wǎng)絡(luò)的納秒級時(shí)間同步技術(shù)
4、數(shù)據(jù)中心光互聯(lián)模塊發(fā)展趨勢及新技術(shù)研究
面向AI大模型的智算中心網(wǎng)絡(luò)演進(jìn)白皮書
本號資料全部上傳至知識星球,更多內(nèi)容請登錄智能計(jì)算芯知識(知識星球)星球下載全部資料。
免責(zé)申明:本號聚焦相關(guān)技術(shù)分享,內(nèi)容觀點(diǎn)不代表本號立場,可追溯內(nèi)容均注明來源,發(fā)布文章若存在版權(quán)等問題,請留言聯(lián)系刪除,謝謝。
溫馨提示:
請搜索“AI_Architect”或“掃碼”關(guān)注公眾號實(shí)時(shí)掌握深度技術(shù)分享,點(diǎn)擊“閱讀原文”獲取更多原創(chuàng)技術(shù)干貨。
