Google發(fā)布最強大模型,從評測上Google的評測結(jié)果來看確實很強.
當(dāng)?shù)貢r間12月6日,谷歌發(fā)布迄今為止功能最強大、最通用的多模態(tài) AI 大模型Gemini 1.0系列(中文譯為“雙子座”),共包括Ultra、Pro和Nano三個版本。其中,Gemini Ultra已超越了GPT-4,甚至在MMLU測試得分高達(dá)90.0%,成為第一個超越人類專家水平的 AI 模型。
1)從自然圖像、音頻和視頻理解到數(shù)學(xué)推理,Gemini Ultra 的性能在大型語言模型 (LLM) 研發(fā)中使用的 32 個廣泛使用的學(xué)術(shù)基準(zhǔn)中的 30 個上超過了當(dāng)前最先進(jìn)的結(jié)果。2)Gemini Ultra 的得分高達(dá) 90.0%,是第一個在MMLU(大規(guī)模多任務(wù)語言理解)上超越人類專家的模型,該模型結(jié)合了數(shù)學(xué)、物理、歷史、法律、醫(yī)學(xué)和倫理學(xué)等 57 個科目來測試知識和解決問題的能力。

憑借強大的性能,Gemini一夜爆紅,引來了華爾街的關(guān)注。12月7日,谷歌母公司Alphabet(Nasdaq:GOOG)的股價漲5.31%,收于136.93美元,迎來自今年8月29日以來表現(xiàn)最好的一天,總市值達(dá)到1.72萬億美元。
官方文:
https://blog.google/technology/ai/google-gemini-ai/?utm_source=twitter&utm_medium=social&utm_campaign=GDMGemini#performance
60頁技術(shù)論文:
https://storage.googleapis.com/deepmind-media/gemini/gemini_1_report.pdf
如需, 后臺領(lǐng)取。
但有分析指出,谷歌在Gemini的宣傳資料中存在夸大宣傳的嫌疑。在質(zhì)疑發(fā)酵后,谷歌DeepMind研究和深度學(xué)習(xí)負(fù)責(zé)人副總裁奧里奧爾·維尼亞爾斯(Oriol Vinyals)也在X(原推特)平臺上發(fā)布長文,解釋了團(tuán)隊是如何制作該視頻的:“視頻中的所有用戶提示和輸出都是真實的,只是為了簡潔而進(jìn)行了縮短。”維尼亞爾斯還表示:“該視頻展示了使用Gemini構(gòu)建的多模態(tài)用戶體驗是什么樣子。我們這樣做是為了激勵開發(fā)人員。 因此這一次的視頻事件會讓人們更加懷疑Gemini的可用性。“至少在公眾看來,谷歌已經(jīng)被OpenAI今年的巨大成功打了個措手不及。如果它想激勵開發(fā)人員,就不能通過精心編輯的、可能歪曲人工智能能力的精彩 視頻。”
