用Kimi總結(jié)了張小珺訪問月之暗面的那篇文章
Kimi應(yīng)該是國內(nèi)最好的大模型toC應(yīng)用了,沒有之一。

隨著Kimi的大火,也遇到了幸福的煩惱,請(qǐng)求太多,訪問掛了。
我用Kimi對(duì)張小珺訪問月之暗面的那篇文章進(jìn)行了總結(jié)。
這篇文章是關(guān)于楊植麟,月之暗面(Moonshot AI)的創(chuàng)始人兼CEO,以及他在人工智能領(lǐng)域的創(chuàng)業(yè)經(jīng)歷和對(duì)大模型技術(shù)的深刻見解的深度訪談。以下是對(duì)文章內(nèi)容的3000字摘要:
創(chuàng)業(yè)背景與挑戰(zhàn)
楊植麟在硅谷進(jìn)行了一次關(guān)鍵的計(jì)算,意識(shí)到要啟動(dòng)以人工通用智能(AGI)為目標(biāo)的大模型創(chuàng)業(yè),需要在短時(shí)間內(nèi)籌集超過1億美金的資本。一年后,這個(gè)數(shù)字翻了13倍。大模型公司的競(jìng)爭(zhēng)首先是資本的角力,需要領(lǐng)先對(duì)手找到更多的資金、購買更多的硬件資源、搶奪更多的人才。
月之暗面成立于2023年3月1日,是一家專注于大模型技術(shù)的公司。沒有像其他對(duì)手那樣,做更穩(wěn)妥的toB生意,或者在醫(yī)療、游戲等細(xì)分場(chǎng)景中找落地,盡管團(tuán)隊(duì)規(guī)模不大,但專注于開發(fā)面向消費(fèi)者的toC的智能助手Kimi,這是一個(gè)支持長文本輸入的產(chǎn)品。楊植麟將公司視為科學(xué)、工程和商業(yè)的結(jié)合體,旨在通過與人類的互動(dòng)找到應(yīng)用機(jī)會(huì),并將這些應(yīng)用商業(yè)化。
融資與市場(chǎng)變化
月之暗面在2024年2月完成了一筆大額融資,以15億美金的投前估值完成超10億美元B輪,成為估值最高的一家獨(dú)角獸。楊植麟分享了他的融資經(jīng)歷,強(qiáng)調(diào)時(shí)機(jī)的重要性,并分享了他對(duì)技術(shù)發(fā)展的深刻洞察。
個(gè)人經(jīng)歷與學(xué)術(shù)背景
楊植麟的學(xué)習(xí)與工作履歷與通用AI緊密相關(guān),他的論文引用超過22000次。他曾在Google實(shí)習(xí),與圖靈獎(jiǎng)得主合作發(fā)表論文,并從他們身上學(xué)到了合作的重要性和如何從宏觀角度看待技術(shù)發(fā)展。
對(duì)未來的展望
楊植麟對(duì)大模型行業(yè)的未來充滿信心,他認(rèn)為盡管目前存在技術(shù)挑戰(zhàn)和市場(chǎng)不確定性,但大模型技術(shù)將繼續(xù)發(fā)展,帶來更多的應(yīng)用場(chǎng)景和商業(yè)機(jī)會(huì)。他預(yù)測(cè),未來幾年將出現(xiàn)更多的技術(shù)突破,特別是在視頻生成和多模態(tài)領(lǐng)域。
Kimi未來不想去卷搜索場(chǎng)景,搜索只是這個(gè)產(chǎn)品價(jià)值很小的一部分,這個(gè)產(chǎn)品配得上更大增量,比如傳統(tǒng)搜索好10%、20%沒有什么太大價(jià)值,只有一個(gè)顛覆性的東西,才配得上AGI。
獨(dú)特性價(jià)值是你增量的智能,要抓住這個(gè)點(diǎn),智能永遠(yuǎn)是最核心的增量價(jià)值,如果這個(gè)產(chǎn)品最核心價(jià)值只有10%、20%來自于AI,就不成立。
對(duì)行業(yè)的深刻見解
楊植麟分享了他對(duì)大模型技術(shù)的看法,包括對(duì)開源模型的看法、大模型公司與巨頭的關(guān)系、以及大模型創(chuàng)業(yè)公司的未來。他認(rèn)為,未來最成功的AGI公司將比現(xiàn)在所有公司都大,并且可能會(huì)出現(xiàn)更多用戶量級(jí)更大的產(chǎn)品。
對(duì)創(chuàng)業(yè)的感受
楊植麟表達(dá)了他對(duì)創(chuàng)業(yè)的感受,包括他的興奮、激動(dòng)以及對(duì)未來的樂觀態(tài)度。他接受了失敗的可能性,并表示創(chuàng)業(yè)已經(jīng)完全改變了他的生活。
這篇文章提供了對(duì)大模型技術(shù)和AGI發(fā)展的深入分析,以及一位年輕AI科學(xué)家和創(chuàng)業(yè)者的視角。通過楊植麟的故事,我們可以窺見中國大模型行業(yè)的快速發(fā)展,以及全球AI領(lǐng)域的未來趨勢(shì)。
技術(shù)發(fā)展與挑戰(zhàn)
楊植麟討論了大模型技術(shù)的發(fā)展,包括檢索增強(qiáng)生成(RAG)技術(shù),這是一種結(jié)合檢索到的外部信息來增強(qiáng)LLM生成響應(yīng)的技術(shù)。他提到了大模型面臨的技術(shù)挑戰(zhàn),如上下文限制、模型能力限制和數(shù)據(jù)缺陷等。
Scaling law為什么成為第一性原理?只要找到一個(gè)結(jié)構(gòu),滿足兩個(gè)條件:一是足夠通用,二是可規(guī)?;Mㄓ檬悄惆阉袉栴}放到這個(gè)框架,可規(guī)?;侵灰阃度胱銐蚨嗨懔?,它就能變好。
在谷歌學(xué)到了:如果能被更底層的東西解釋,就不應(yīng)該在上層過度雕花。能用scale解決的問題,就不要用新的算法解決。新算法最大的價(jià)值是讓它怎么更好的scale。
要model scaling和user scaling。
長文本是登月的第一步,它很本質(zhì),它是新的計(jì)算機(jī)內(nèi)存。過去幾十年,老的計(jì)算機(jī)內(nèi)存漲了好幾個(gè)數(shù)量級(jí),這些一樣會(huì)發(fā)生在新的計(jì)算機(jī)上。
context不夠,就沒那么通用,要變成通用的世界模型,就需要long context。
登月的第二步是真正的統(tǒng)一的世界模型,能夠統(tǒng)一各種不同模態(tài)。同時(shí)在沒有人類數(shù)據(jù)輸入的情況下,AI可以持續(xù)進(jìn)化。
達(dá)到這種狀態(tài),可能需要兩三年。
