AI搜索的諸神之戰(zhàn) |IDCF
共 5680字,需瀏覽 12分鐘
·
2024-05-31 07:58
點這里??星標關(guān)注,獲取最新資訊!
有幾個網(wǎng)站,教你如何對谷歌搜索進行“復古”。
它教你如何對滿屏的shit進行disenshittification。
它教你如何回到并默認十多年前的谷歌,那時第一屏只有干凈清爽的10個鏈接。
最近,谷歌興沖沖地推出了新的AI搜索體驗:在出現(xiàn)鏈接之前,先顯示一個Overview,即提供一段答案,后面再附上十個鏈接,再往下可以看到相關(guān)的廣告。
什么是最好的搜索?谷歌CEO皮查伊認為,最好的搜索,是總結(jié)成文的答案,再加上深究答案的鏈接。
但是,谷歌提供成文的答案,很快就翻車。
有人搜索如何讓番茄醬粘在Pizza上,答案是用1/8杯無毒膠水。后來人們發(fā)現(xiàn)這是來自社區(qū)Reddit上11年前有人開玩笑的回答。谷歌自去年開始試用生成式AI搜索后,它總結(jié)出來的答案不時出錯,這次全面推出Overview功能,立刻翻車了。
是不是推理不夠,就用搜索來湊?這也是大模型幻覺的老問題,只是因為谷歌搜索的量太大了,問題會更加突出。還有一個把Reddit上的玩笑當科學的回答:貓?zhí)蚰愕氖?,是想先嘗下你能否被消費。
人們搜索到的東西越來越豐富、也越來越智能,但也令人產(chǎn)生花里呼哨的浮夸之感。
人們開始懷念十多年前的谷歌,那時第一頁上只出現(xiàn)十個藍色的鏈接,并附有每個結(jié)果的頁面標題和簡短的文本片段。這種只有大約10個網(wǎng)頁鏈接的簡約設計,在第一頁被稱為“十個藍色鏈接”格式。那時沒有那么多的Shit。
現(xiàn)在,搜索引擎結(jié)果頁面已經(jīng)遠遠超越了僅僅列出10個藍色鏈接。它們現(xiàn)在包括但不限于:
付費廣告
優(yōu)先展示的片段
知識面板
圖像/視頻輪播
本地商家列表
相關(guān)問題
等等
現(xiàn)在,又加上了一段總結(jié)內(nèi)容。
盡管谷歌在第一時間手動修復了,但是,人們再一次對于AI的大規(guī)模應用難以放心。
谷歌時刻,而不是iPhone時刻
18個月前,當ChatGPT出世時,人們本能地想到,它將替代搜索,谷歌的顛覆者來了。其實大家爭奪的是谷歌時刻,而不是iPhone時刻。
這是微軟夢寐以求的時刻。納德拉當初在微軟就是做搜索必應起家的。他從搜索看到了云計算,也看到了AI將是技術(shù)的未來,將對搜索產(chǎn)生降維打擊。這一次,“我要讓谷歌起舞?!?/span>
人們以為,必應加上ChatGPT,或者ChatGPT的提示+答案本身,都足以顛覆傳統(tǒng)的搜索。但是,一年多過去了,必應的市場份額的增長幾乎可以忽略,ChatGPT的流量,自去年5月達到高點后,就一直沒有增長。人們到處在談論ChatGPT,它也以史上最快的速度成為突破1億用戶的應用,但是,它的用戶留存率很低。而谷歌對搜索市場的統(tǒng)治,巋然不動。
現(xiàn)在,ChatGPT也不得不考慮用戶對于搜索的剛需。API服務,以及對幫助用戶深度定制和集成GPT大模型服務,可以讓OpenAI的收入達到年化的40億美元,但是與當今科技巨頭千億美元的收入或者十億級的用戶相比,OpenAI只是一只獨角獸,它需要證明它不僅有好的AI技術(shù),而且能做出好的產(chǎn)品。
人們不禁要問,生成式AI究竟是顛覆搜索,還僅僅是搜索的一次迭代?搜索是不是依然在統(tǒng)治著AI?
微軟在搜索和AI方面,一直被谷歌壓抑著。其中最重要的一個原因,是微軟錯過了移動時代。谷歌的搜索覆蓋了安卓和iOS兩大操作系統(tǒng)——它甚至每年要把在蘋果設備上搜索廣告收入的36%、每年高達200億美元上交給蘋果,就是為了獲得在Safari瀏覽器上獲得了一個默認搜索的待遇。
基于搜索的壟斷性優(yōu)勢,谷歌在AI方面睥睨群雄,它把DeepMind收至麾下,在科技巨頭中最早提出AI First;收購了深度學習之父辛頓的公司和團隊,包括后來OpenAI首席科學家和聯(lián)合創(chuàng)始人蘇茨克沃;它幾乎囊括了全球最頂尖的AI研究人才,并且發(fā)表了Transformer論文,引發(fā)了一場深度學習的革命。谷歌還最早推出了自研芯片TPU,建立起了自己的AI訓練平臺TensorFlow。
OpenAI的創(chuàng)辦,一個最直接的原因,就是抗衡谷歌對AI的主導優(yōu)勢。蘇茨克沃等一批大牛從谷歌跳槽OpenAI,影響了AI的技術(shù)力量格局,并且迅速崛起為與DeepMind抗衡的初創(chuàng)公司。
但微軟的考慮更為直接地出自商業(yè)和戰(zhàn)略。
2019年,OpenAI推出GPT-3之前,微軟首席技術(shù)官斯科特(Kevin Scott)給CEO納德拉和創(chuàng)始人比爾·蓋茨發(fā)了封郵件,對微軟與谷歌之間大模型訓練能力的差距感到“非常、非常的擔憂”。
“我們在機器學習的規(guī)模方面已經(jīng)落后了好幾年?!?/span>
面對OpenAI和DeepMind在AI領(lǐng)域取得的進展,微軟感覺無能為力,即沒有基礎設施、也缺乏開發(fā)的速度,如果不采取措施,差距可能會加大。
在最近美國司法部訴谷歌的反壟斷案中,司法部認為如果沒有谷歌對搜索的壟斷,OpenAI的ChatGPT和其他創(chuàng)新會更早出世。
斯科特建議投資OpenAI,得到了納德拉的同意。于是,有了微軟最初的10億美元現(xiàn)金加算力的投入,OpenAI迅速推出了1750億參數(shù)的GPT-3,直到2023年初,微軟對OpenAI投資加碼到130億美元后,推出了1.8萬億參數(shù)的GPT-4。
人們一度以為谷歌搜索會陷入困境。微軟的盤算是,集成了GPT-4的新必應,市場份額每增加一個百分點,就能從谷歌那里搶走20億美元的廣告收入。而谷歌搜索如果也集成AI功能,每天十億量級的搜索量,巨額的推理成本,將會讓谷歌的利潤減少數(shù)百億美元。
尤其是Meta開源大模型Llama的推出,讓谷歌處于慌亂之中,內(nèi)部員工發(fā)出了“我們都沒有護城河”的危言。
但是,新必應推出一年之后,它增加的搜索市場份額微不足道,仍在3.5%左右,而谷歌仍然占據(jù)了90%以上的市場份額。微軟在個人AI方面,依然落后于谷歌。
最近,微軟把DeepMind的聯(lián)合創(chuàng)始人蘇萊曼 (Mustafa Suleyman)招致麾下,負責消費AI業(yè)務,其實主要就是把搜索搞上去。
微軟采取的另外一招,是自己研發(fā)大模型MAI-1,參數(shù)在5000億以上,負責人正是蘇萊曼。看來微軟正在考慮另起爐灶,圍繞自己研發(fā)的大模型,全面部署面向C端的應用。
再看谷歌
谷歌唯一的選擇,是把生成式AI做到搜索里,而不是把搜索變成生成式AI。由于ChatGPT最初的驚艷沒有轉(zhuǎn)化為AI產(chǎn)品體驗:幻覺、速度慢、推理能力弱等,它的留存率比起當今天依然統(tǒng)治的、互聯(lián)網(wǎng)時代的超級應用還有差距。
而生成式AI的助手發(fā)展方向,也很難擺脫搜索。既然擺脫不了,就套殼搜索。從某種意義上說,從喬姆斯基到楊立昆對目前階段的生成式AI的批評,仍然不無道理,它更像是檢索與搜索技術(shù)的增強,而那種已經(jīng)發(fā)生質(zhì)變的、基于互聯(lián)網(wǎng)數(shù)據(jù)訓練出來的AI,只是處于非常早期——它甚至不足以成為AI的未來。
這樣谷歌就可以松一口氣。谷歌擁有來自互聯(lián)網(wǎng)的最大的索引數(shù)據(jù)庫,組織和維護著超過30萬億個網(wǎng)頁的索引,并不斷更新這一索引,以確保搜索結(jié)果的相關(guān)性和時效性。這個索引是谷歌能夠快速檢索和呈現(xiàn)結(jié)果的基礎。
谷歌的索引范圍非常廣泛,涵蓋了大量的網(wǎng)頁、圖片、視頻和其他內(nèi)容類型,這是它得天獨厚的數(shù)據(jù)來源。難怪OpenAI不敢正面回答它是否在訓練Sora大模型時用了Youtube的數(shù)據(jù)。
谷歌是互聯(lián)網(wǎng)內(nèi)容的向?qū)?,而OpenAI是內(nèi)容的創(chuàng)造者,但目前僅就AI助理產(chǎn)生的大量內(nèi)容來看,仍然不時露出內(nèi)容的搬運者的馬腳。
AI企業(yè)正在把助理產(chǎn)品做得越來越像搜索,如Perplexity,它能迅速搜索到相關(guān)的內(nèi)容鏈接,加以概括和總結(jié),同時把這些來源加以標注,還提供進一步的源鏈接。
Perplexity自稱為“回答引擎”,它從相關(guān)的網(wǎng)站搜到相關(guān)內(nèi)容后,再用一個大語言模型進行總結(jié)提煉,為用戶提供一個答案,同時標出一些關(guān)鍵信息的來源。
另外一個可能創(chuàng)造新的推理與搜索體驗的是Groq。打開它的網(wǎng)頁,也是一個搜索框。它用自研的芯片和軟件建立起一個強大的推理引擎,運行各種SOTA開源大模型,以每秒近千個tokens,秒殺所有的大模型推理速度。
GPT-4水平的推理能力,為用戶生成的內(nèi)容,對于比較專業(yè)的用戶來說,許多令人不免產(chǎn)生套路感、空泛感。
近來ChatGPT做出了一些改變,生成的內(nèi)容往往也會附上來源鏈接標注。
而中國以Kimi為代表的智能助理,問題稍微復雜一點,它就會先是瘋狂搜索一堆網(wǎng)站,然后再費力地總結(jié)概括。
AI搜索
如果你看了下面Copilot的這個回答,可能會明白,為什么生成式AI要超越搜索,依然面臨著極大的困難。
介紹下著名的人工智能專家邁克爾·喬丹,就會得出關(guān)于籃球巨星喬丹的內(nèi)容。顯然,問題要么出在必應,要么就是OpenAI。
OpenAI已經(jīng)在主頁為ChatGPT建立了一個搜索框,”問我任何事情”。搜索依然是生成式AI最重要的入口。
谷歌已經(jīng)有一年半的“喘息”時間,AI推理的成本已經(jīng)下降了80%以上,它可以向用戶提供生成式搜索體驗。谷歌憑借基于自研TPU的算力集群,可以在巨頭中領(lǐng)先繼續(xù)降低推理成本;接下來將通過多步的推理提升結(jié)果的準確性;谷歌在大模型的研究方面也不讓OpenAI,下一代大模型也會進一步提升推理能力。
搜索依然是生成式AI最大的應用場景之一,從這個角度來看,真正對谷歌搜索帶來威脅的,可能是Meta這樣擁有數(shù)十億用戶的巨頭。
雖然Meta的開源大模型還沒有找到盈利的方法,但Meta AI已經(jīng)在Facebook、Instagram、Whatsapp上線,擴展到包括美國在內(nèi)的14個國家,大量用戶可以訪問媲美ChatGPT免費模型的服務。Meta AI正處于其增長曲線的早期階段,目前只覆蓋其全部32.4億日活躍用戶的三分之一。
雖然Llama 3 70B在許多功能上無法與閉源大模型相比,但對于那些以移動為中心的用戶來說,這很可能正是恰當?shù)漠a(chǎn)品市場定位。
移動用戶的剛需,可能是簡短的常識性查詢,沒有必要用復雜輸入和經(jīng)過代理產(chǎn)生輸出。Meta和谷歌的生態(tài),各有超過30億用戶,也許真正的對決是在它們之間,而不是必應/GPT或Perplexity之類。
在AI搜索真正立起來之前,人們依然會想復古搜索,卻已經(jīng)無法兩次踏入同一條河流:
默認使用“網(wǎng)絡”搜索將讓你使用谷歌僅顯示10個藍色鏈接,雖然這感覺像是將界面回滾到2011年,但請記住,你仍然不會將谷歌的搜索結(jié)果質(zhì)量回滾到2011年。你仍然會使用一個感覺完全向SEO垃圾信息投降的搜索引擎。( Ron Amadeo)
