<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          谷歌大模型團(tuán)隊(duì)并入DeepMind!誓要趕上ChatGPT進(jìn)度

          共 2465字,需瀏覽 5分鐘

           ·

          2023-03-03 23:50

          明敏 發(fā)自 凹非寺
          量子位 | 公眾號 QbitAI

          為應(yīng)對ChatGPT,谷歌在大模型方面的動作還在繼續(xù)。
          最新消息,其旗下專注語言大模型領(lǐng)域的“藍(lán)移團(tuán)隊(duì)”(Blueshift Team)宣布,正式加入DeepMind,旨在共同提升LLM能力!

          DeepMind科學(xué)家們在推特下面“列隊(duì)歡迎”,好不熱鬧~

          藍(lán)移團(tuán)隊(duì)隸屬于谷歌研究,和谷歌大腦實(shí)驗(yàn)室同等級。
          之前谷歌耗時2年發(fā)布的大模型新基準(zhǔn)BIG-Bench,就有該團(tuán)隊(duì)的重要貢獻(xiàn)。
          還有谷歌5400億大模型PaLM,背后也有藍(lán)移團(tuán)隊(duì)成員提供建議。
          綜合此前消息,DeepMind表示要在今年發(fā)布聊天機(jī)器人麻雀(Sparrow)內(nèi)測版本。
          如今又有擅長大模型研究的團(tuán)隊(duì)加入,強(qiáng)強(qiáng)聯(lián)手,或許會加快谷歌應(yīng)對ChatGPT的腳步?
          這下有好戲看了。

          藍(lán)移團(tuán)隊(duì)是誰?

          據(jù)官網(wǎng)介紹,藍(lán)移團(tuán)隊(duì)主要關(guān)注的研究點(diǎn)是如何理解和改進(jìn)大語言模型的能力。
          他們專注于了解Transformer的局限性,并挑戰(zhàn)將其能力擴(kuò)展到解決數(shù)學(xué)、科學(xué)、編程、算法和規(guī)劃等領(lǐng)域。
          具體可分為如下幾方面分支。

          團(tuán)隊(duì)的代表性工作有數(shù)學(xué)做題模型Minerva。
          它曾參加數(shù)學(xué)競賽考試MATH,得分超過計(jì)算機(jī)博士水平。
          綜合了數(shù)理化生、電子工程和計(jì)算機(jī)科學(xué)的綜合考試MMLU-STEM,它的分?jǐn)?shù)比以往AI高了20分左右。

          并且它的做題方法也是理科式的,基于谷歌5400億參數(shù)大模型PaLM,Minerva狂讀論文和LaTeX公式后,可可以按照理解自然語言的方式理解數(shù)學(xué)符號。
          作者透露,讓該模型參加波蘭的數(shù)學(xué)高考,成績都超過了全國平均分?jǐn)?shù)。
          還有藍(lán)移團(tuán)隊(duì)曾和MIT的科學(xué)家一起,通過訓(xùn)練大模型學(xué)會程序員debug時“打斷點(diǎn)”的方式,就能讓模型讀代碼的能力大幅提升。
          還有谷歌耗時2年發(fā)布的大模型新基準(zhǔn)BIG-Bench,藍(lán)移團(tuán)隊(duì)全部成員均參與了這項(xiàng)工作。
          BIG-bench由204個任務(wù)組成,內(nèi)容涵蓋語言學(xué)、兒童發(fā)展、數(shù)學(xué)、常識推理、生物學(xué)、物理學(xué)、社會偏見、軟件開發(fā)等方面的問題。

          以及如上提到的谷歌大模型PaLM,藍(lán)移團(tuán)隊(duì)成員Ethan S Dyer也貢獻(xiàn)了建議。
          官網(wǎng)顯示,藍(lán)移團(tuán)隊(duì)目前有4位主要成員。
          Behnam Neyshabur現(xiàn)在是DeepMind的高級研究員。他在豐田工業(yè)大學(xué)(芝加哥)攻讀了計(jì)算機(jī)博士學(xué)位,后來在紐約大學(xué)進(jìn)行博士后工作,同時是普林斯頓大學(xué)高等研究理論機(jī)器學(xué)習(xí)項(xiàng)目組的成員。

          研究領(lǐng)域是大語言模型的推理和算法能力、深度學(xué)習(xí)和泛化等。
          Vinay Ramasesh在加州大學(xué)伯克利分校獲得物理學(xué)博士學(xué)位,曾致力于研究基于超導(dǎo)量子比特的量子處理器,碩士畢業(yè)于麻省理工學(xué)院。
          最近他主要在研究語言模型,職位是研究科學(xué)家。
          Ethan Dyer博士畢業(yè)于麻省理工學(xué)院,2018年加入谷歌工作至今。
          Anders Johan Andreassen同樣是物理專業(yè)出身,博士畢業(yè)于哈佛大學(xué)。在哈佛大學(xué)、加州大學(xué)伯克利分校都做過博士后,2019年起加入谷歌。

          谷歌還有多少后手?

          這次藍(lán)移團(tuán)隊(duì)的調(diào)動,也不免讓外界猜測是否是谷歌為應(yīng)對ChatGPT的最新舉措。


          ChatGPT引爆大模型趨勢后,谷歌幾乎是最先打響“阻擊戰(zhàn)”的大廠。

          盡管加急發(fā)布的Bard效果確實(shí)有失水準(zhǔn),但這并不意味著谷歌會就此喪失競爭力。

          誠如OpenAI之于微軟,谷歌也有DeepMind。

          DeepMind還是上一輪AI浪潮的引爆者。

          消息顯示,DeepMind手里也有聊天機(jī)器人。

          去年9月,他們介紹了一個對話AI麻雀(Sparrow),它的原理同樣是基于人類反饋的強(qiáng)化學(xué)習(xí),能夠依據(jù)人類偏好訓(xùn)練模型。

          DeepMind創(chuàng)始人兼CEO哈薩比在今年早些時候說,麻雀的內(nèi)測版本將在2023年發(fā)布。

          他表示,他們將會“謹(jǐn)慎地”發(fā)布模型,以實(shí)現(xiàn)模型可以開發(fā)強(qiáng)化學(xué)習(xí)功能,比如引用資料等——這是ChatGPT不具備的功能。

          但具體的發(fā)布時間還沒有透露。

          藍(lán)移團(tuán)隊(duì)的加入公告中提到,他們是為了加速提升DeepMind乃至谷歌的LLM能力,不知這一動向是否會加速該對話模型的發(fā)布。

          與此同時,谷歌也沒有把目光完全局限在自家開發(fā)能力上。

          本月初,劈柴哥重磅宣布,斥資3億美元,緊急投資ChatGPT競品公司Anthropic——由GPT-3核心成員出走創(chuàng)辦。

          1月底,該公司內(nèi)測聊天機(jī)器人Claude,

          這是一個超過520億參數(shù)的大模型,自稱基于前沿NLP和AI安全技術(shù)打造。
          它同ChatGPT一樣,靠強(qiáng)化學(xué)習(xí)(RL)來訓(xùn)練偏好模型,并進(jìn)行后續(xù)微調(diào)。
          但又與ChatGPT采用的人類反饋強(qiáng)化學(xué)習(xí)(RLHF)不同,Claude訓(xùn)練時,采用了基于偏好模型而非人工反饋的原發(fā)人工智能方法(Constitutional AI),這種方法又被稱為AI反饋強(qiáng)化學(xué)習(xí)(RLAIF)。
          如今,Claude尚未作為商業(yè)產(chǎn)品正式發(fā)布,但已有人(如全網(wǎng)第一個提示工程師Riley Goodside)拿到了內(nèi)測資格。有人說效果比ChatGPT要好。

          目前,這家公司的最新估值已經(jīng)達(dá)到50億美元。

          總而言之,谷歌雖然在Bard上栽了跟頭,但也沒把雞蛋放在一個籃子里。接下來它在大模型上還有哪些新動作?還很有看頭。

          參考鏈接:
          [1]https://twitter.com/bneyshabur/status/1629150056715816962
          [2]https://research.google/teams/blueshift/
          [3]https://www.deepmind.com/blog/building-safer-dialogue-agents

          推薦閱讀:

          世界的真實(shí)格局分析,地球人類社會底層運(yùn)行原理

          不是你需要中臺,而是一名合格的架構(gòu)師(附各大廠中臺建設(shè)PPT)

          企業(yè)IT技術(shù)架構(gòu)規(guī)劃方案

          論數(shù)字化轉(zhuǎn)型——轉(zhuǎn)什么,如何轉(zhuǎn)?

          華為干部與人才發(fā)展手冊(附PPT)

          企業(yè)10大管理流程圖,數(shù)字化轉(zhuǎn)型從業(yè)者必備!

          【中臺實(shí)踐】華為大數(shù)據(jù)中臺架構(gòu)分享.pdf

          華為的數(shù)字化轉(zhuǎn)型方法論

          華為如何實(shí)施數(shù)字化轉(zhuǎn)型(附PPT)

          超詳細(xì)280頁Docker實(shí)戰(zhàn)文檔!開放下載

          華為大數(shù)據(jù)解決方案(PPT)

          瀏覽 44
          點(diǎn)贊
          評論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          評論
          圖片
          表情
          推薦
          點(diǎn)贊
          評論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  男女XX网站 | 做爰 视频毛片下载蜜桃 | 思思热视频在线观看 | 波多野在线| 亚洲AV天天射 |