<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          馬斯克突然開源Grok:3140億參數(shù)巨無霸,免費(fèi)可商用

          共 6810字,需瀏覽 14分鐘

           ·

          2024-04-11 19:31

          馬斯克說到做到:

          旗下大模型Grok現(xiàn)已開源!

          代碼和模型權(quán)重已上線GitHub。官方信息顯示,此次開源的Grok-1是一個3140億參數(shù)的混合專家模型——

          就是說,這是當(dāng)前開源模型中參數(shù)量最大的一個。

          消息一出,Grok-1的GitHub倉庫已攬獲4.5k標(biāo)星,并且還在庫庫猛漲。

          表情包們,第一時間被吃瓜群眾們熱傳了起來。

          而ChatGPT本Chat,也現(xiàn)身Grok評論區(qū),開始了和馬斯克新一天的斗嘴……

          那么,話不多說,來看看馬斯克這波為懟OpenAI,究竟拿出了什么真東西。


          Grok-1說開源就開源


          此次開源,xAI發(fā)布了Grok-1的基本模型權(quán)重和網(wǎng)絡(luò)架構(gòu)。

          具體來說是2023年10月預(yù)訓(xùn)練階段的原始基礎(chǔ)模型,沒有針對任何特定應(yīng)用(例如對話)進(jìn)行微調(diào)。

          結(jié)構(gòu)上,Grok-1采用了混合專家(MoE)架構(gòu),包含8個專家,總參數(shù)量為314B(3140億),處理Token時,其中的兩個專家會被激活,激活參數(shù)量為86B。

          單看這激活的參數(shù)量,就已經(jīng)超過了密集模型Llama 2的70B,對于MoE架構(gòu)來說,這樣的參數(shù)量稱之為龐然大物也毫不為過。

          不過,在GitHub頁面中,官方也提示,由于模型規(guī)模較大(314B參數(shù)),需要有足夠GPU和內(nèi)存的機(jī)器才能運(yùn)行Grok。



          這里MoE層的實(shí)現(xiàn)效率并不高,選擇這種實(shí)現(xiàn)方式是為了避免驗(yàn)證模型的正確性時需要自定義內(nèi)核。



          模型的權(quán)重文件則是以磁力鏈接的形式提供,文件大小接近300GB。

          而且這個“足夠的GPU”,要求不是一般的高——YC上有網(wǎng)友推測,如果是8bit量化的話,可能需要8塊H100。

          除了參數(shù)量前所未有,在工程架構(gòu)上,Grok也是另辟蹊徑——

          沒有采用常見的Python、PyTorch或Tensorflow,而是選用了Rust編程語言以及深度學(xué)習(xí)框架新秀JAX。

          而在官方通告之外,還有許多大佬通過扒代碼等方式揭露了Grok的更多技術(shù)細(xì)節(jié)。

          比如來自斯坦福大學(xué)的Andrew Kean Gao,就針對Grok的技術(shù)細(xì)節(jié)進(jìn)行了詳細(xì)解釋。

          首先,Grok采用了使用旋轉(zhuǎn)的embedding方式,而不是固定位置embedding,旋轉(zhuǎn)位置的embedding大小為 6144,與輸入embedding相同。

          當(dāng)然,還有更多的參數(shù)信息:

          • 窗口長度為8192tokens,精度為bf16

          • Tokenizer vocab大小為131072(2^17),與GPT-4接近;

          • embedding大小為6144(48×128);

          • Transformer層數(shù)為64,每層都有一個解碼器層,包含多頭注意力塊和密集塊;

          • key value大小為128;

          • 多頭注意力塊中,有48 個頭用于查詢,8 個用于KV,KV 大小為 128;

          • 密集塊(密集前饋塊)擴(kuò)展因子為8,隱藏層大小為32768。


          除了Gao,還有英偉達(dá)AI科學(xué)家Ethan He(何宜暉)指出,在專家系統(tǒng)的處理方面,Grok也與另一知名開源MoE模型Mixtral不同——

          Grok對全部的8個專家都應(yīng)用了softmax函數(shù),然后從中選擇top2專家,而Mixtral則是先選定專家再應(yīng)用softmax函數(shù)。

          而至于有沒有更多細(xì)節(jié),可能要看官方會不會發(fā)布進(jìn)一步的消息了。

          另外,值得一提的是,Grok-1采用的是Apache 2.0 license,也就是說,商用友好。


          為懟OpenAI怒而Open


          大家伙知道,馬斯克因?yàn)镺penAI不Open,已經(jīng)向舊金山高等法院提起訴訟,正式把OpenAI給告了。

          不過當(dāng)時馬斯克自己搞的Grok也并沒有開源,還只面向??的付費(fèi)用戶開放,難免被質(zhì)疑雙標(biāo)。

          大概是為了堵上這個bug,馬斯克在上周宣布:



          本周,xAI將開源Grok。



          雖然時間點(diǎn)上似乎又是馬斯克一貫的遲到風(fēng)格,但xAI的這波Open如今看來確實(shí)不是口嗨,還是給了網(wǎng)友們一些小小的震撼。

          有xAI新晉員工感慨說:



          這將是激動人心的一年,快系好安全帶吧。



          有人已經(jīng)期待起Grok作為一個開源模型,進(jìn)一步攪動大模型競爭的這一池水。

          不過,也并不是每個人都買馬斯克的賬:

          不過說歸說,多線并進(jìn)的馬斯克,最近大事不止開源Grok這一件。

          作為多公司、多業(yè)務(wù)的時間管理大師,馬斯克旗下,特斯拉剛剛?cè)€推出了端到端純視覺的自動駕駛系統(tǒng)FSD V12,所有北美車主用戶,都OTA更新升級,可以實(shí)現(xiàn)所有道路場景的任意點(diǎn)到點(diǎn)AI駕駛。

          SpaceX則完成了第三次星艦發(fā)射,雖然最后功敗垂成,但又史無前例地邁進(jìn)了一大步。

          推特則開源了推薦算法,然后迎來了一波自然流量新高峰。

          別人都是 you can you up, no can no bb…馬斯克不一樣,bb up不選擇,邊喊邊干,還都干成了。

          參考鏈接:

          [1]https://github.com/xai-org/grok-1

          [2]https://x.ai/blog/grok-os

          >End
          >>>                        
          本文轉(zhuǎn)載自“量子位”,原標(biāo)題《馬斯克突然開源Grok:3140億參數(shù)巨無霸,免費(fèi)可商用》。
          為分享前沿資訊及有價值的觀點(diǎn),太空與網(wǎng)絡(luò)微信公眾號轉(zhuǎn)載此文,并經(jīng)過編輯。
          未按照規(guī)范轉(zhuǎn)載及引用者,我們保留追究相應(yīng)責(zé)任的權(quán)利
          部分圖片難以找到原始出處,故文中未加以標(biāo)注,如若侵犯了您的權(quán)益,請第一時間聯(lián)系我們。

          HISTORY/往期推薦




          堅(jiān)持道路自信 直面未來挑戰(zhàn)——“對標(biāo)SpaceX”的思考



          混合所有制模式:新型舉國體制在商業(yè)航天發(fā)展中的邏輯演進(jìn)和實(shí)踐路徑(之一)



          混合所有制模式:商業(yè)航天領(lǐng)域推進(jìn)新型舉國體制的重要途徑



          迪斯尼傳播快樂,美麗星球點(diǎn)亮夢想



          >>>                  

          充滿激情的新時代,

          充滿挑戰(zhàn)的新疆域,

          與踔厲奮發(fā)的引領(lǐng)者,

          卓爾不群的企業(yè)家,

          一起開拓,

          一起體驗(yàn),

          一起感悟,

          共同打造更真品質(zhì),

          共同實(shí)現(xiàn)更高價值,

          共同見證商業(yè)航天更大的跨越!

          ——《太空與網(wǎng)絡(luò)》,觀察,記錄,傳播,引領(lǐng)。

          >>>                                           

          ·《衛(wèi)星與網(wǎng)絡(luò)》編輯委員會

          高級顧問:王國玉、劉程、童旭東、相振華、王志義、楊烈

          · 《衛(wèi)星與網(wǎng)絡(luò)》創(chuàng)始人:劉雨菲

          · 《衛(wèi)星與網(wǎng)絡(luò)》副社長:王俊峰

          ·  微信公眾號(ID:satnetdy)團(tuán)隊(duì)
          編輯:艷玲、哈玫,周泳、邱莉、黃榕
          主筆記者:李剛、魏興、張雪松、霍劍、樂瑜刀子、趙棟
          策劃部:楊艷、若?、李真子
          視覺總監(jiān):董濘
          專業(yè)攝影:馮小京、宋偉
          設(shè)計(jì)部:顧錳、潘希峎、楊小明
          行政部:姜河、林紫
          業(yè)務(wù)部:王錦熙、瑾怡
          原創(chuàng)文章轉(zhuǎn)載授權(quán)、轉(zhuǎn)載文章侵權(quán)、投稿等事宜,請加微信:18600881613
          商務(wù)合作;展覽展廳設(shè)計(jì)、企業(yè)VI/CI及室內(nèi)設(shè)計(jì)、企業(yè)文化建設(shè)及品牌推廣;企業(yè)口碑傳播及整體營銷傳播等,請加微信:13811260603
          雜志訂閱,請加微信:wangxiaoyu9960
          · 衛(wèi)星與網(wǎng)絡(luò)各分部:
          成都分部負(fù)責(zé)人:沈淮
          長沙分部負(fù)責(zé)人:賓鴻浦
          西安分部負(fù)責(zé)人:郭朝暉
          青島分部負(fù)責(zé)人:江偉
          · 衛(wèi)星與網(wǎng)絡(luò)總部負(fù)責(zé)人:農(nóng)燕
          · 會議活動部負(fù)責(zé)人喬顥益、許克新、董今福
          · 投融資及戰(zhàn)略層面合作:劉雨菲
          · 本平臺簽約設(shè)計(jì)公司:一畫開天(北京)文化創(chuàng)意設(shè)計(jì)有限公司
          · 航天加(深圳)股權(quán)投資基金管理負(fù)責(zé)人:楊艷

          瀏覽 25
          點(diǎn)贊
          評論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          評論
          圖片
          表情
          推薦
          點(diǎn)贊
          評論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  午夜毛片毛片 | 影音先锋色噜噜av | 青青草大香蕉视频 | 97色色婷婷 | 国产97色在线 | 国产 |