人形機器人的萬億市場,中國競爭力如何?
共 14765字,需瀏覽 30分鐘
·
2024-08-05 21:13
中國古籍《列子·湯問》中,曾經(jīng)記載過一個神奇的《偃師造人》的故事。
說的是周穆王在外游歷時,遇到了一個工匠偃師,向他獻上了一個自己制作的人偶。這個人偶外貌栩栩如生,可以像人一樣自如地站立行走。
周穆王見了大為吃驚,叫來自己的寵妃一起觀看。
只見偃師一聲令下,人偶竟開口唱起了歌來,歌聲婉轉悠揚,十分動人。唱到高潮處,人偶又舒展四肢跳起了舞。
如此精彩的表演,逗得周穆王哈哈大笑。但演出快結束時,出事了!
這個人偶,竟然含情脈脈地向周穆王身邊的寵妃眨了眨眼!
周穆王大怒,竟敢調(diào)戲我的愛妃!于是下令處死偃師。
偃師趕緊向周穆王解釋,這只是一個人偶,怎么可能調(diào)戲您的愛妃呢?
見周穆王不信,他當場把人偶拆散。周穆王看到眼前一堆七零八落的零件,才終于相信了剛才“調(diào)戲愛妃”的確實不是人。
于是不禁感嘆:“人之巧,乃可與造化者同功乎?”
雖然這個故事和中國歷史典籍中很多玄幻的故事一樣,不具備任何史料價值,不過起碼證明了一點:
中國人對人形機器人的思考,早在3000年前就開始了。
誰能想到,3000年后,中國即將在人形機器人領域,掀起一場革命。
為什么非要搞人形機器人?
如果我們把視野從中國轉向世界,就會發(fā)現(xiàn),人類似乎對人形機器人有著一種異乎尋常的執(zhí)著和迷戀。
比如在古埃及,埃及祭司會使用一種機械的神像,可以做出如張嘴、伸手等簡單動作,可以大幅增加祭祀儀式的神秘性。而達·芬奇也曾造出過一個機器騎士,可以完成包括張嘴、搖頭、擺手、坐起等動作。
當然了,因為技術的限制,這些機器人仍然處于一種“無智能機械”的范疇,真正的“智能機器人”,一直到70年代才誕生,是日本早稻田大學發(fā)布的WABOT-1。
這種機器人與真人差不多大小,可以雙腳行走,完成搬運物品等工作,還可以簡單交談,但是,除了得到很多喝彩,WABOT-1并沒有得到商業(yè)應用。
為什么?
一方面,雖然WABOT-1具備一定的智能化,但這種智能化非常初級,它的處理器實在太原始,無法處理視覺、聽覺,以及觸覺傳感器的大量數(shù)據(jù),也就沒法準確地進行科學決策,簡單來說就是智商太低。
另一方面,它的應用場景太少了,除了能走兩步,說說話之外,其他啥也干不了,就連搬運的東西重一點,也容易燒電機。
所以,WABOT-1之后,世界機器人研究的另一條路興起:非人形機器人。
非人型機器人路線支持者認為,我需要的是機器人為我工作,至于它長得像不像人,完全不重要。
所以,發(fā)明家約瑟夫·恩格爾伯格研發(fā)出了第一個汽車裝配機器人Unimate#001,重達2700磅。
這個機器人完全不像人,說白了它就是一個機械臂,靠設定好的程序,進行操作。
說實話,相比那些花里胡哨的人形機器人,這個機械臂簡直太優(yōu)秀了,穩(wěn)定、精準、可長時間工作,很快就被應用在了工業(yè)領域,執(zhí)行裝配、噴漆等多種任務,這也就是工業(yè)機器人的前身。
發(fā)展到現(xiàn)在,這種工業(yè)機器人已經(jīng)遍地開花了,焊接機器人、檢測機器人、裝配機器人、搬運機器人、堆垛機器人、分類機器人等等。
在家用領域,掃地機器人、送餐機器人,寫作業(yè)機器人等等也開始商用化。
但是,人形機器人仍然被很多實驗室和投資機構所關注,相關的研發(fā)也一直沒停。
為什么?
因為現(xiàn)在的工業(yè)機器人或者家用機器人,無非就是人類某一項工作的替代和優(yōu)化、分解、精準化,但是卻無法通用化。
簡單來說,你讓一個工業(yè)機器人去擰螺絲,就要編寫一個擰螺絲的程序,但你如果讓它進行門鎖質檢、車燈蓋、板檢測、安全帶檢測、貼車標等工作,不給它寫程序,它就搞不定了。
同樣,冬奧會食堂中的炒菜機器人,能炒出一份完美的蛋炒飯,但你要是高血壓患者,想讓它做出一份低鹽的蛋炒飯,它也辦不倒。
如果能有一個機器人,它既可以干這個,也可以干那個,它可以擰螺絲,可以炒菜,也可以泡咖啡,甚至不需要人去編程,你給它下個指令,他就能又快又好地把任務完成,那該有多好?這才是完美的機器人。
那么,這種機器人應該是什么樣子的呢?
毫無疑問,人形最合適。
因為我們生活的物理世界中各種場景、設備、任務、工具,都是為人體形態(tài)量身打造的,只有機器人像人,具備類似的身體結構和能力,才能夠幫助機器人更好地融入人類的生活和工作環(huán)境,并且無需對機器人做任何改造。
所以,雖然工業(yè)機器人已經(jīng)在各種燈塔工廠中遍地開花了,但關于人形機器人的研究,一直都沒有停止,也出現(xiàn)了很多非常類人的機器人。
最典型的,就是波士頓動力發(fā)布的人形機器人佩特曼(Petman),它最具革命性的創(chuàng)新就是,實現(xiàn)了雙腿行走。
對于人類來說,雙腿走路幾乎是本能,可以輕松越過障礙、爬斜坡或樓梯。但對機器人就不一樣了,雙足機器人需要通過各種傳感器獲取機器人體態(tài)及重心變換的數(shù)據(jù),再運算出合理有效的運動指令,然后再反饋再運算,這就涉及非常龐大的運算量和非常難得姿態(tài)控制,一旦某個環(huán)節(jié)計算錯誤,某個關節(jié)電機力量無法完全提供防傾倒力矩,就一定會摔倒。
從這個角度來說,波士頓動力的機器人做的不錯,新一代的版本已經(jīng)可以完成跑酷、后空翻、側滾翻、前滾翻、180度空中轉體、空中劈叉、360度空中轉體等高難度動作。
但是,這些能力距離商用,還遠遠不夠。
原因很簡單,人在行走時,往往會遇到各種突發(fā)情況,然后下意識做出閃避動作,比如腳被絆了一下能迅速找回平衡,有時候僅憑酒瓶在桌上傾倒的趨勢,就能眼疾手快扶住酒瓶。
但是機器人呢?咱們且不說傳感器有沒有那么高的靈敏度,就算有,其控制系統(tǒng)有沒有這么快的響應速度?
而且最關鍵的是,這時的波士頓機器人,其實還是按照代碼來完成動作,它所做的一切動作,其實都來源于程序員的設想,但設想的場景總是有限的,這也就決定了其缺乏足夠的“學習能力”,所以無法根據(jù)人的不同指令,做出各種各樣的動作,它也許能跳躍,能轉體,但你讓它快摔倒時扶一下,它就搞不定了。
所以,雖然波士頓機器人已經(jīng)搞出來十幾年了,連老板都換了三家,但遲遲沒有得到商用。
正當所有研究者都為人形機器人的發(fā)展感到絕望的時候,AI的革命給人形機器人帶來了新的機會。
根據(jù)控制論的觀點,真正的人工智能機器人,必須具備三個能力,感知、運動和思考。
現(xiàn)在的機器人,感知和運動是沒啥問題了,但思考卻一直不太行。
而AI的革命,則為人形機器人補上了最后一個短板。
隨著深度學習、強化學習、大模型理論和技術研究的深入,AI技術進入一個快速發(fā)展的階段,原先一些難以處理的視覺識別、自然語言交互、翻譯以及復雜決策等問題,通過深度學習和強化學習等技術的應用,都可以較好地解決。
這樣一來,如果把AI大模型技術應用于人形機器人,那么就相當于給機器人裝上了一顆會“思考”的大腦。
具體來說,AI給人形機器人帶來的兩個方面的提升。
第一是學習能力。
大模型加上傳感器數(shù)據(jù),可以讓機器人更好地理解世界規(guī)律。
比如,你去冰箱里拿點喝的,捏紙質包裝牛奶和捏啤酒瓶的力度,顯然不一樣。
而通過大模型學習后,機器人就會理解,紙質包裝軟,啤酒瓶硬。所以,拿牛奶要輕輕捏,而拿啤酒瓶則可以重一些。
有了這種理解能力,機器人在雙腿行走時,就可以通過海量人體行走的數(shù)據(jù),學習如何走的更穩(wěn)、反應更快。
第二是基于自然語言的理解能力。
嵌入大語言模型后,機器人才能聽懂語言,真正理解人類的需求。
比如,你跟機器人說,我發(fā)燒了。你的意圖是讓機器人給你拿藥,但在過去,機器人是理解不了這種命令的,它也不知道應該給你拿什么藥,你只有說“給我拿退燒藥”,他才會去執(zhí)行。
而基于大語言模型人形機器人呢?你說一句我發(fā)燒了,它就會理解你的狀態(tài),給你量體溫,然后給你拿藥,如果你高燒不退陷入昏迷,它還能幫你撥打120。
甚至你對他說“我和你媽掉水里了你先救誰”,它也能理解你想要的是情緒價值,而不是你真的掉水里了。
有了這兩種能力之后,基于大模型的人形機器人才算得上真正智能化,可以根據(jù)感知系統(tǒng)的數(shù)據(jù),由大模型做出肢體運動的決策,從“寫一段代碼做一件事”,真正具備“感知-決策-執(zhí)行”的能力。
雖然這個場景中機器人很厲害,但其實是假的
也正因為如此,自從2023年AI爆發(fā)后,2024年人形機器人也迎來了爆發(fā),而且誕生了不少具備商用價值的機器人產(chǎn)品,其中比較典型的有兩款。
第一款是Figure AI與Open AI公司聯(lián)合研發(fā)的Figure 01,這種機器人內(nèi)置了Open AI的GPT-4多模態(tài)大型模型,不僅能能理解人類的需求并完成具體行動,還能給人類遞食物、撿垃圾、收拾碗筷等等。
更強大的是,F(xiàn)igure 01具備很強的學習能力,2024年1月,F(xiàn)igure 01看了十幾個小時的視頻,就能夠脫離人為遙控,獨立操作沖煮咖啡,甚至咖啡膠囊沒有擺正,都能自主修正進行調(diào)整。
這也就意味著,只要你給它足夠的時間學習豆腐腦的做法,它完全可以給你做一份咸豆腐腦出來!而如果你說想吃甜的,他也會根據(jù)你的需要,不放鹵子改放糖!
第二款是特斯拉的人形機器人擎天柱(Optimus)
其實擎天柱早在2022年9月就亮相了,但一直進展緩慢。一直到2024年5月,特斯拉公布了第二代擎天柱的視頻,大家驚訝地發(fā)現(xiàn),當Figure 01還在實驗室階段時,特斯拉的擎天柱已經(jīng)“進廠打工”了!
在特斯拉的工廠里,擎天柱已經(jīng)承擔了特斯拉工廠的分揀電池工作,能夠精準地放在收納盒子里,有時候電池放歪了,還會自主糾正,再正確將其放回準確的位置。
而這些,主要是根據(jù)人類操作的動作訓練集,基于神經(jīng)網(wǎng)絡的訓練,并針對各種任務進行擴展而得來的。
更關鍵的是,擎天柱僅通過2D攝像頭,以及手部觸覺,和力傳感器,就可以做到這一切。
說白了,這和特斯拉的FSD如出一轍,拋棄掉價格昂貴的激光雷達,直接用純視覺方案,就能搞定一切,完全可以所以把擎天柱看做一個兩條腿走路的特斯拉汽車。
馬斯克對擎天柱非常看好,在2024特斯拉股東大會上,馬斯克雄心勃勃地說:“人形機器人將成為工業(yè)主力,數(shù)量有望超越人類,預計達到100億-200億。特斯拉目標年產(chǎn)10億臺,占據(jù)市場10%以上份額。其成本控制在1萬美元左右,售價預計2萬美元。”
顯然,馬斯克在這個賽道上行動更快,延續(xù)了其電動車的經(jīng)營方案,通過快速量產(chǎn)壓低成本,在所有對手都沒反應過來的時候,快速占領市場。
有人可能懷疑,人形機器人再好,現(xiàn)在看起來還是有點智障,真生產(chǎn)出來了,會有人買嗎?
其實吧,你可以懷疑馬斯克的婚戀觀,但永遠不要懷疑馬斯克在商業(yè)上的前瞻性,更不要低估世界各大投資機構的敏銳嗅覺。
從現(xiàn)階段觀察,人形機器人起碼有三大應用領域,市場前景十分開闊。
第一是進廠。
現(xiàn)在的世界普遍存在的問題是什么?老齡化。
按聯(lián)合國標準,現(xiàn)階段日本(29.1%)、德國(22.1%)、法國(21.7%)、美國(17.1%)、中國(14.9%)等多個國家均已步入老齡社會,勞動力供給將面臨短缺。
這也就意味著,用機器人代替人工作,不是可不可能的問題,是廠商必須去考慮的問題。
現(xiàn)在雖然很多燈塔工廠已經(jīng)實現(xiàn)了黑燈生產(chǎn),但其實有很多銜接的環(huán)節(jié),還是離不開人,而且大部分自動化生產(chǎn)線是專用的,產(chǎn)品需求一旦發(fā)生改變,就需要改動整條生產(chǎn)線,成本高昂,反而是人形機器人的泛用性更強,不論你怎么改,他都能滿足你。
而且,人力成本越來越貴,也就迫使廠方想辦法用機器人來代替人類。
比如今年4月,亞馬遜就已經(jīng)啟用了人形機器人Digit進入物流倉工作,Digit已經(jīng)可以連續(xù)工作7.5個小時(和人類差不多),效率為人類速度的75%,任務成功率達到97%。
此外,在一些特種行業(yè),特別是危險環(huán)境作業(yè)中,人形機器人也具有廣闊的應用前景。例如,在核電站事故現(xiàn)場、化工廠爆炸區(qū)域、礦山救援等高危環(huán)境中,人形機器人可以代替人類,在復雜危險的環(huán)境中執(zhí)行任務,減少人員傷亡。
第二是服務業(yè)。
在商務環(huán)境中,人形機器人可以用于客戶服務、導購、迎賓甚至炒菜、做咖啡等任務,這類任務使用門檻比較低,應用場景也比較簡單,比較適合人形機器人。
第三是家政。
咱們都知道,這一代年輕人,是不愿意結婚的一代,那么幾十年后,必然爆發(fā)出巨大的養(yǎng)老需求。
但問題在于,他們連結婚都不愿意,又有誰愿意去給別人當保姆呢?
這時候,如果出現(xiàn)一個可以掃地、擦窗、擦馬桶、炒菜、洗碗筷、陪人出去遛彎的人形機器人,你猜會不會有海量的需求?
而且從心理層面來說,人形機器人因為更像人,所以天然會有一種親和力,人類愿意把其視為陪伴者的存在。
至于“貓女”機器人,就更不用說了。
雖然現(xiàn)在人形機器人還比較貴,但通過做大市場,實現(xiàn)量產(chǎn),走低成本、快速迭代的“特斯拉”路線,相信市場會是很大的。
根據(jù)高盛在2024年初發(fā)布的《人形機器人專題報告》的預測:
到2025年/2030年/2035年,全球人形機器人市場的總規(guī)模將分別達到15億美元/120億美元/380億美元,預計人形機器人的出貨量將分別為2萬臺/25.6萬臺/137.8萬臺。
也就是說,人形機器人,有望在未來十年內(nèi)迎來爆炸性的增長。
對于這種預期,中國其實也早有準備了。
2023年10月,工業(yè)和信息化部發(fā)布《人形機器人創(chuàng)新發(fā)展指導意見》中,提出了到2025年初步建立人形機器人創(chuàng)新體系并實現(xiàn)批量生產(chǎn)的目標,計劃在特種、制造、民生服務等多個場景中進行示范應用。
看著很玄乎是么?但是別忘了,當年中國發(fā)布電動車規(guī)劃的時候,覺得玄乎的人更多,現(xiàn)在看看呢?
在這場即將來臨的革命面前,誰搶到了先手,誰就能成為下一個行業(yè)顛覆者。
所以目前,一些AI軟件廠商、家電廠商甚至汽車廠商,都開始入局人形機器人,而創(chuàng)新型企業(yè)更多,近年來,中國人形機器人領域新成立公司20多萬家。資本的熱情也很高,紅杉中國、高瓴創(chuàng)投等投資機構也都紛紛進入人形機器人領域。
在政策和資本的雙重加持下,中國的智元機器人、逐際動力、星動紀元、月泉仿生、加速進化等等公司進展神速,已經(jīng)陸續(xù)有成果誕生了。
當然,中國機器人公司也沒死磕雙腳路線,畢竟在很多規(guī)則路面的場景中,輪式和履帶式機器人更有優(yōu)勢,成本更低,比如銀河通用的雙臂+輪式仿生機器人、1X的EVE輪式仿真機器人等等,甚至還有可以更換下肢戴盟Sparky 1人形機器人,輪式還是足式隨你選!
更可貴的是,中國人形機器人也和特斯拉一樣,開始進廠“學習”了,在合肥蔚來的組裝工廠,優(yōu)必選人形機器人Walker S已經(jīng)可以完成車輛車門鎖質檢、后車燈蓋板質檢,高精度柔順貼車標等任務,甚至還能伸手進車進行安全帶檢測,可以說泛化性非常高了。
咱們可以算筆賬,人形機器人其實機體材料并不值錢,值錢的是控制器、傳感器、電池系統(tǒng)等,看到?jīng)]?這和中國新能源汽車的供應鏈有很大的重復性,中國只要用好這一供應鏈,只要產(chǎn)品成熟,中國就完全具備低成本、大規(guī)模量產(chǎn)能力。
馬斯克的擎天柱機器人,聲稱可以降到2萬美元,那么以中國的規(guī)模優(yōu)勢,壓到10萬人民幣沒問題吧?
目前,汽車總裝線自動化率明顯低于沖壓、焊接和涂裝環(huán)節(jié),而總裝線一個工人的成本,一年差不多也要10萬元。
當買一臺人形機器人的價錢,和一個工人年薪差不多的時候,這一應用場景一定會得到推廣。
那么,在未來世界汽車大戰(zhàn)當中,誰先運用人形機器人,誰就能在競爭中拔得頭籌。
當然,關于人形機器人的發(fā)展,中國雖然有不少優(yōu)勢,但同樣也面臨兩大挑戰(zhàn)。
第一是算力,目前,隨著美國對中國AI的打壓,國內(nèi)AI企業(yè)已經(jīng)很難再使用Open AI的資源,而國內(nèi)主導開發(fā)的AI大模型企業(yè),起碼在人形機器人領域,還沒有一家能比得上Open AI。
而且,因為芯片的制裁,中國也很難再拿到高性能算力芯片,這也就導致中國就算能大規(guī)模量產(chǎn)人形機器人,也很難躲過美國的卡脖子,就如同現(xiàn)在的中國智駕一樣。
第二是就業(yè),毫無疑問,當人形機器人普及后,必然會帶來大量的失業(yè)問題,先是制造業(yè)、物流等行業(yè),緊接著就是服務業(yè)、家政業(yè)等等。
雖然人形機器人的普及也會帶來一些新崗位,但新崗位的數(shù)量一定比不上舊崗位,如果發(fā)生大規(guī)模的失業(yè)潮,對社會穩(wěn)定也會造成極大影響。
所以,人形機器人雖然可能會帶來一場顛覆式的生產(chǎn)力變革,但如何產(chǎn)業(yè)化,如何突破卡脖子,如何避免對社會造成沖擊,才是我們在人形機器人的萬億風口中,真正需要思考的。
>End
>>>
充滿激情的新時代,
充滿挑戰(zhàn)的新疆域,
與踔厲奮發(fā)的引領者,
卓爾不群的企業(yè)家,
一起開拓,
一起體驗,
一起感悟,
共同打造更真品質,
共同實現(xiàn)更高價值,
共同見證商業(yè)航天更大的跨越!
——《太空與網(wǎng)絡》,觀察,記錄,傳播,引領。
>>>
·《衛(wèi)星與網(wǎng)絡》編輯委員會
高級顧問:王國玉、劉程、童旭東、相振華、王志義、楊烈
· 《衛(wèi)星與網(wǎng)絡》創(chuàng)始人:劉雨菲
· 《衛(wèi)星與網(wǎng)絡》副社長:王俊峰
