<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          OpenAI最新大模型曝光:劍指多模態(tài),GPT-4之后最大升級

          共 2203字,需瀏覽 5分鐘

           ·

          2023-09-21 22:24

          點擊上方視學(xué)算法”,選擇加"星標(biāo)"或“置頂

          重磅干貨,第一時間送達

          克雷西 發(fā)自 凹非寺
          量子位 | 公眾號 QbitAI

          大模型之爭,又卷起來了。

          據(jù)The information爆料稱,OpenAI將推出多模態(tài)模型GPT-vision。

          如果消息為真,這將是OpenAI在GPT-4之后推出的最大更新。

          另一邊,谷歌的多模態(tài)模型進展也在最近傳出,為的就是能和OpenAI抗衡。

          目前為止,OpenAI還沒有對爆料中的傳聞做出回應(yīng),但此前發(fā)布過多模態(tài)模型測試。

          CEO奧特曼在回應(yīng)有關(guān)GPT-5的傳聞時,也暗示過GPT-4“正在增強”。

          究竟誰能更勝一籌,還得讓子彈再飛一會兒。

          不能讓Google搶了先

          我們先回到OpenAI,被爆料的多模態(tài)模型將搭載什么樣的功能呢?

          首先是圖像內(nèi)容識別,比如根據(jù)手繪草圖生成網(wǎng)頁代碼、輸出可視化圖表的文本分析等。

          另一方面則是圖像生成,通過簡單的文本生成繪畫、logo或表情包。

          雖然OpenAI沒有對這次的爆料做出回應(yīng),但做多模態(tài)模型這件事本身只是個時間問題。

          3月份,OpenAI在發(fā)布GPT-4時,就曾推出了一個多模態(tài)GPT的預(yù)覽版本。

          當(dāng)時,OpenAI把DEMO提供給了研究幫助視障群體的機構(gòu)Be My Eyes。

          除了這家機構(gòu)之外,就再也沒有人見過OpenAI的多模態(tài)模型是什么樣子了。

          在此之后,這個多模態(tài)模型更是杳無音訊。

          唯一和圖像有點關(guān)系的,就是GPT-4的升級版代碼解釋器(后改名為高級數(shù)據(jù)分析)可以處理一些圖片任務(wù)。

          但這是通過調(diào)用Python庫實現(xiàn)的,而且也達不到AI中圖像識別的程度,和多模態(tài)模型更是不沾邊了。

          有說法稱GPT-vision遲遲沒有推出的原因可能是對安全的擔(dān)憂,擔(dān)心被用于破解驗證碼和人臉識別系統(tǒng)。

          直到這次Google多模態(tài)模型Gemini的消息傳出。

          安全問題有沒有解決不得而知,但也許OpenAI是真的急了,不能任由谷歌超越,才有了模型發(fā)布的傳聞。

          另據(jù)爆料,OpenAI還在準(zhǔn)備從頭開始開發(fā)一個名為Gobi的多模態(tài)模型,不過訓(xùn)練還未開始。

          那么,谷歌這邊的情況又是怎樣的呢?

          Gemini來勢洶洶

          來勢洶洶的Gemini,讓網(wǎng)友直言其或?qū)⒊蔀橛螒蛞?guī)則的改變者。

          甚至有媒體夸張一些地說將有機會取代GPT-4。

          Gemini主要由谷歌DeepMind團隊開發(fā)。谷歌CEO皮查伊介紹,Gemini集成了多種技術(shù),支持同時輸出文本和圖像,還可以使用工具和API。

          據(jù)悉,Gemini吸取了很多來自AlphaGo的經(jīng)驗教訓(xùn),包括強化學(xué)習(xí)和樹搜索技術(shù)。

          而且,憑借著擁有YouTube這一得天獨厚的優(yōu)勢,海量的訓(xùn)練數(shù)據(jù)可以說是唾手可得。

          實際上,Google也一直把OpenAI視為競爭對手。

          為了和ChatGPT較量,Google此前已經(jīng)在Bard中加入過圖像識別功能,但并未改變ChatGPT的地位。

          但這次推出的Gemini,OpenAI也感到害怕了。

          盡管競爭激烈,有一點倒是讓谷歌和OpenAI不謀而合。

          那就是,把模型的能力變成真金白銀。

          谷歌計劃的Gemini提供方式是通過其Google Cloud Vertex AI云服務(wù)平臺進行,預(yù)期價格為每個用戶每月30美元。

          這一做法預(yù)計將成為谷歌新的收入來源,尤其是針對企業(yè)客戶。

          而OpenAI這邊,也已經(jīng)開始通過金融服務(wù)等各種應(yīng)用程序?qū)PT-4變?yōu)楝F(xiàn)金。

          此次多模態(tài)的角逐究竟鹿死誰手,我們拭目以待。

          參考鏈接:
          [1]https://www.theinformation.com/articles/openai-hustles-to-beat-google-to-launch-multimodal-llm
          [2]https://www.bigtechwire.com/2023/09/18/openai-is-ready-to-take-on-googles-gemini-with-gpt-vision/


          點個在看 paper不斷!

          瀏覽 113
          點贊
          評論
          收藏
          分享

          手機掃一掃分享

          分享
          舉報
          評論
          圖片
          表情
          推薦
          點贊
          評論
          收藏
          分享

          手機掃一掃分享

          分享
          舉報
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  操bbbb | 一级做a爰片性色毛片成人久久久国产 | 风韵十足的良家美少妇酒店偷情 | 天天插天天射 | 精品国产一区二 |