李彥宏:開源大模型不如閉源,后者會持續(xù)領(lǐng)先;周鴻祎:“開源不如閉源” 的言論是胡說八道
共 3272字,需瀏覽 7分鐘
·
2024-04-26 18:00
0、李彥宏:開源大模型不如閉源,后者會持續(xù)領(lǐng)先
當(dāng)今流行的開源大模型主要由 Meta 和 Google 之類的巨頭發(fā)布,而 OpenAI 等則轉(zhuǎn)向了閉源,此外中國很多 AI 公司的大模型是在 Meta 的 Llama 開源模型基礎(chǔ)上開發(fā)的。百度 CEO 李彥宏站在了 OpenAI 閉源這邊。
李彥宏表示,關(guān)于文心是否需要開源,百度內(nèi)部有過非常激烈的討論,最終決定不開源。當(dāng)時的判斷是,市場上一定會有開源的模型,而且不止一家會開源。在這種情況下,多百度一家開源不多,少百度一家開源也不少。
“這個市場上不缺我們這一家開源的模型。我們要開源還得自己去維護(hù)一套開源的版本,這是不劃算的。”他認(rèn)為,模型開源的意義其實(shí)不是很大,這些開源模型在外零散、小規(guī)模地去做各種驗(yàn)證應(yīng)用,卻沒有經(jīng)過大算力的驗(yàn)證。
在他看來,與傳統(tǒng)的軟件開源不同,大模型開源并非眾人拾柴火焰高。反而是閉源模型在能力上會持續(xù)領(lǐng)先,而不是一時的領(lǐng)先。
有行業(yè)人士同樣表示,此前開源軟件的優(yōu)勢在于大家共享代碼,可以做到多人共同修復(fù)bug,使得軟件不斷更新。然而大模型本身是一個黑盒,在有人提交修改后就有重新訓(xùn)練的可能,每次訓(xùn)練都會消耗大量的算力和資金,并不像從前開源軟件一樣在多人共同開發(fā)方面有如此大的受益。
上述人士判斷,長期來看,閉源更能集中智力、算力等資源對大模型進(jìn)行迭代,比起開源效率更高。
李彥宏也強(qiáng)調(diào),閉源的優(yōu)勢還在于有真正的商業(yè)模式,能賺到錢去聚集算力、聚集人才。在成本上,同等能力下,閉源模型的推理成本更低、響應(yīng)速度更快。同等參數(shù)的情況下,閉源模型的能力也更強(qiáng)。
1、 亞馬遜被控侵犯數(shù)據(jù)存儲專利,賠款額達(dá) 38 億元
4 月 11 日,美國伊利諾斯州聯(lián)邦陪審團(tuán)表示,AWS 因侵犯 Kove 在數(shù)據(jù)存儲技術(shù)方面的專利權(quán)而必須賠付 5.25 億美元(約 38 億元人民幣)。Kove 指控 AWS 的 Amazon S3 存儲服務(wù)、DynamoDB 數(shù)據(jù)庫服務(wù)及其他產(chǎn)品侵犯了其云存儲專利。Kove 稱,AWS 云數(shù)據(jù)存儲產(chǎn)品建立在 Kove 申請專利的可擴(kuò)展云系統(tǒng)技術(shù)的基礎(chǔ)上。
訴狀稱:“正是通過侵犯 Kove 的專利,AWS 得以提供如此廣范圍、如此大規(guī)模的云服務(wù),為 AWS 成為亞馬遜最大的利潤中心鋪平了道路。”
2、《Descent 3》源代碼在 MIT 許可證下公布
開發(fā)者 Kevin Bentley 公開了科幻射擊游戲《Descent 3》的源代碼(C++ ),采用 MIT 許可證托管在 GitHub 上。
https://github.com/kevinbentley/Descent3
《Descent 3》由 Outrage Entertainment 開發(fā) Interplay Entertainment 發(fā)行,1999 年發(fā)布,玩家扮演一位雇傭兵組織去阻止被外星病毒感染的機(jī)器人。游戲獲得了好評,其 Metacritic 評分為 89/100。
公開的源代碼屬于最新版本,包含了未發(fā)布的 1.5 版本,剝離了 Interplay 的部分私有音頻和視頻庫,支持 Windows、Linux 和 Mac。 (Solidot)
3、安全工程師因竊取價值 1200 萬美元加密貨幣被判三年徒刑
安全工程師 Shakeeb Ahmed 因入侵兩家交易所竊取價值 1200 萬美元的加密貨幣而被判三年徒刑,外加三年的監(jiān)督釋放,沒收 1240 萬美元和大量加密貨幣,向受害者賠償逾 500 萬美元。
Ahmed 曾在亞馬遜工作過,但被捕時已經(jīng)離開。他是在 2022 年 7 月上旬入侵了位于 Solana 的加密貨幣交易所 Crema Finance,幾周后入侵了 Nirvana Finance。在兩次行動中分別竊取了價值 900 萬美元和 360 萬美元的加密貨幣。
他盜走的加密貨幣相當(dāng)于 Nirvana 的全部資產(chǎn),導(dǎo)致了該交易所的倒閉。在入侵 Crema 之后他聯(lián)絡(luò)該公司尋求獲得 150 萬美元的漏洞發(fā)現(xiàn)賞金,交換歸還被盜資金,以及不向執(zhí)法機(jī)構(gòu)舉報(bào)。Crema 拒絕了,Ahmed 最終被捕。(Solidot)
4、周鴻祎:“開源不如閉源” 的言論是胡說八道
360 公司創(chuàng)始人周鴻祎日前應(yīng)邀在哈佛大學(xué)第二十七屆哈佛中國論壇發(fā)表演講稱,發(fā)展專業(yè)大模型可能是中國的一個巨大機(jī)會,所有企業(yè)都值得讓專業(yè)大模型重塑一遍。
并談到了開源大模型的發(fā)展。他認(rèn)為,雖然現(xiàn)在開源模型的能力達(dá)不到 GPT 4。但是專注在一個方向上,用企業(yè)內(nèi)部的專有數(shù)據(jù)加上專有工具進(jìn)行能力的加強(qiáng)之后,它就有可能在專業(yè)能力上超過 GPT 4。
“我是一直相信開源的力量,至于說網(wǎng)上有些胡說八道,你們也別被他們忽悠了,說開源不如閉源好。一句話,今天沒有開源就沒有 Linux,沒有 Linux 就沒有互聯(lián)網(wǎng),連說實(shí)話的公司自己都是借助了開源力量才成長到今天。開源社區(qū)聚集的工程師和科學(xué)家的數(shù)量是閉源的數(shù)百倍。所以今年開源只做了一年就已經(jīng)超過了 GPT-3.5 的能力,所以我覺得未來一兩年內(nèi),我認(rèn)為開源的力量很有可能會達(dá)到或者超過閉源的水平。”
針對此前李彥宏所說的百度大模型已經(jīng)超過了 GPT4 這一言論,周鴻祎則表示,李彥宏指的是在寫古詩的能力方面。“前兩天百度的李彥宏說他們超過了 GPT 4,然后王小川就不相信,他就出來懟李彥宏。其實(shí)你仔細(xì)聽聽李總說的有道理,他前面是說在寫古詩方面。”
