造一臺人形機(jī)器人,或許正在成為2025年最炙手可熱的事情。
從去年第四季度開始,伴隨著大模型應(yīng)用的深入,具身智能概念被點(diǎn)燃,其中最鮮明的一個(gè)特點(diǎn)是,大量自動駕駛大佬的轉(zhuǎn)行加入。
隨便說幾個(gè)比較有分量的,智駕芯片上市公司地平線創(chuàng)始成員、副總裁、前軟件平臺產(chǎn)品線總裁余軼南(博士)聯(lián)手理想汽車前智能駕駛產(chǎn)品總監(jiān)趙哲倫成立具身智能領(lǐng)域初創(chuàng)公司維他動力;
百度集團(tuán)資深副總裁、CEO助理、原百度智能駕駛事業(yè)群組(IDG)負(fù)責(zé)人李震宇加盟具身智能賽道初創(chuàng)公司它石智航;
前小米其次自動駕駛產(chǎn)品技術(shù)負(fù)責(zé)人和量產(chǎn)負(fù)責(zé)人劉方成立具身智能概念公司阿米奧機(jī)器人……
左手造車,右手造人,自動駕駛“老炮”們的創(chuàng)業(yè)沒有止境。
01車企也來分羹
事實(shí)上,除了上文提到了幾位近期涉足具身智能行業(yè)的前自動駕駛從業(yè)者之外,還有不少自動駕駛行業(yè)重量級大佬在很早之前就已經(jīng)入局。
原文遠(yuǎn)知行COO張力2023年6月離職后不到半年即加入人形機(jī)器人公司逐際動力,擔(dān)任聯(lián)合創(chuàng)始人兼COO,全面負(fù)責(zé)公司在全球范圍內(nèi)的戰(zhàn)略規(guī)劃、渠道拓展、項(xiàng)目實(shí)施、市場營銷以及政府關(guān)系事務(wù)。
曾在Waymo和Momenta擔(dān)任重要技術(shù)職位的高繼揚(yáng)2023年5月創(chuàng)立了具身智能公司星海圖(StarSeer AI),并擔(dān)任CEO。公司成立后不就即獲得了由IDG資本、BV百度風(fēng)投等在內(nèi)的頂級投資機(jī)構(gòu)千萬級美元的投資。
2023年4月,曾在小鵬汽車和OPPO擔(dān)任首席科學(xué)家的郭彥東創(chuàng)立智平方(Shenzhen AI Square)科技有限公司,擔(dān)任創(chuàng)始人兼首席執(zhí)行官,如今公司自研的多模態(tài)大模型——AI2R Brain,能夠驅(qū)動Alpha Bot機(jī)器人在多樣化的場景中實(shí)現(xiàn)高精度感知與自然交互。
此外,還有其他一些轉(zhuǎn)行到具身智能賽道的自動駕駛精英。
孫兆治:珞博智能高管,曾任小鵬機(jī)器人產(chǎn)品設(shè)計(jì)負(fù)責(zé)人,滴滴出行的造車項(xiàng)目中擔(dān)任產(chǎn)品負(fù)責(zé)人。
王凡:原縱目科技CTO,后加入北斗智聯(lián)科技有限公司,出任CTO。
王榮興:Momenta負(fù)責(zé)產(chǎn)品工程研發(fā)的副總裁,離職后進(jìn)行大模型創(chuàng)業(yè),2023年6月創(chuàng)立萬仞AI。
陳俊波:菜鳥網(wǎng)絡(luò)“E.T.物流實(shí)驗(yàn)室”無人車算法負(fù)責(zé)人,離開阿里之后,與前阿里機(jī)器人CEO谷祖林等人共同創(chuàng)辦了“有鹿機(jī)器人”,進(jìn)軍戶外清潔機(jī)器人領(lǐng)域。
肖軍:前京東集團(tuán)副總裁、京東物流X事業(yè)部總裁,選擇了倉儲機(jī)器人領(lǐng)域進(jìn)行創(chuàng)業(yè),創(chuàng)辦天下先智創(chuàng)機(jī)器人,并獲得了來自零一創(chuàng)投、經(jīng)緯創(chuàng)投、紅點(diǎn)中國的2億元投資。
一個(gè)有意思的現(xiàn)象,自動駕駛“老炮”們轉(zhuǎn)入具身智能賽道扎堆創(chuàng)業(yè),車企們也不甘落后,也集體布局具身智能。
去年12月26日,廣汽集團(tuán)發(fā)布自主研發(fā)的第三代具身智能人形機(jī)器人——GoMate是車企布局具身智能賽道的最新動態(tài)。
GoMate是一款全尺寸的輪足人形機(jī)器人,全身擁有38個(gè)自由度。廣汽集團(tuán)機(jī)器人研發(fā)團(tuán)隊(duì)負(fù)責(zé)人張愛民博士表示,廣汽集團(tuán)計(jì)劃2025年實(shí)現(xiàn)自研零部件批量生產(chǎn),并率先在廣汽傳祺、埃安等主機(jī)廠車間生產(chǎn)線和產(chǎn)業(yè)園區(qū)開展整機(jī)示范應(yīng)用;2026年實(shí)現(xiàn)整機(jī)小批量生產(chǎn),并逐步擴(kuò)展至大規(guī)模量產(chǎn)。
稍早前的2024理想AI Talk中,理想汽車CEO李想回應(yīng)是否會做人形機(jī)器人時(shí)表示,概率上肯定是100%,李想還強(qiáng)調(diào),理想是一家人工智能企業(yè),要做的不是汽車的智能化,而是人工智能的汽車化,并將推動人工智能普惠到每一個(gè)家庭。
11月6日的小鵬汽車“AI科技日”上,小鵬汽車也亮相了全新一代人形機(jī)器人“Iron艾倫”,該款人形機(jī)器人已經(jīng)進(jìn)入小鵬汽車廣州工廠進(jìn)行了小鵬P7+車型的生產(chǎn)實(shí)訓(xùn),未來將會聚焦在工廠和線下門店等場景。
除了親自下場之外,還有車企通過聯(lián)合合作伙伴或者投資的形式來布局具身智能。
奇瑞汽車就聯(lián)手AI公司Aimoga共同研發(fā)了人形機(jī)器人Mornine,進(jìn)軍人形機(jī)器人賽道;上汽創(chuàng)投則參與了人形機(jī)器人本體企業(yè)智元機(jī)器人的A3輪戰(zhàn)略融資,上汽集團(tuán)以投資機(jī)器人企業(yè)的形式切入人形機(jī)器人領(lǐng)域。
02相同的技術(shù)內(nèi)核
造車和造人兩條賽道之所以能夠隨意融合,很大程度還是源于技術(shù)的同源,即都是基于對環(huán)境的感知和交互,對外界信息進(jìn)行計(jì)算后,指導(dǎo)機(jī)器進(jìn)行運(yùn)動的過程,從本質(zhì)來看,兩者都需要具有智慧的大腦,只是外在表現(xiàn)的物理形體的不同。
原特斯拉自動駕駛部門的負(fù)責(zé)人Andrej Karpathy近期接受訪談時(shí)也表示:汽車也是機(jī)器人,在從汽車到人形機(jī)器人Optimus的技術(shù)轉(zhuǎn)移中,工作量其實(shí)不大,而且工具都是現(xiàn)成的,只是從汽車轉(zhuǎn)移到機(jī)器人上,系統(tǒng)被重新配置,但本質(zhì)上還是相同的。
雖然技術(shù)同源,然而在實(shí)際應(yīng)用層面,自動駕駛和具身智能還是要面對不同類型、不同等級的數(shù)據(jù)處理需求和計(jì)算能力。
從計(jì)算規(guī)模來看,自動駕駛的高速場景較多,并且和安全關(guān)系緊密,所以需要較高算力的芯片支持實(shí)時(shí)計(jì)算;而智能機(jī)器人,在現(xiàn)階段通常在相對低速環(huán)境中工作,相應(yīng)的計(jì)算需求會降低。
地平線聯(lián)合創(chuàng)始人&CTO黃暢曾對自動駕駛領(lǐng)域行業(yè)的基礎(chǔ)算力進(jìn)行過說明,L2級需10 TOPS左右;L2+則需要幾十TOPS;L3需要100 TOPS以上;L4需要1000 TOPS,要充分滿足L4級要求,甚至需要幾千個(gè)TOPS。
然而對機(jī)器人大模型來說,以能夠推理7B大模型的單張NVIDIA A100舉例,其TOPS峰值達(dá)1248,因而,建立云邊端協(xié)同的數(shù)字算力環(huán)境,對保障各類機(jī)器人的感知、計(jì)算和處理能力至關(guān)重要。
在運(yùn)動控制的維度上,自動駕駛只需要控制2D維度的運(yùn)動,而人形機(jī)器人僅手部的抓取這一項(xiàng),就需要模仿生物體多達(dá)20個(gè)以上的關(guān)節(jié)運(yùn)動,這對計(jì)算和控制提出了更高的挑戰(zhàn)。
此外,自動駕駛面對的數(shù)據(jù)相對“標(biāo)準(zhǔn)化“,大多是車道線、信號燈等在一定規(guī)則內(nèi)運(yùn)行的內(nèi)容,機(jī)器人不同,它們工作的場景復(fù)雜多變,這就導(dǎo)致數(shù)據(jù)種類也會相應(yīng)變多且發(fā)散,這同樣對計(jì)算能力提出了一定的要求。
以當(dāng)前已經(jīng)有規(guī)模應(yīng)用的酒店服務(wù)機(jī)器人為例,雖然工程師們通過強(qiáng)化機(jī)器人的地圖構(gòu)建能力,應(yīng)用VSLAM技術(shù)進(jìn)行機(jī)器識別并標(biāo)定禁行線,強(qiáng)化避障算法和傳感等方式,已經(jīng)能夠讓機(jī)器人極可能的避免與行人發(fā)生沖突,并能更好、更靈敏地識別地面上障礙物。
現(xiàn)在,酒店場景下至少有三種環(huán)境的變化會對機(jī)器人的運(yùn)行產(chǎn)生影響。
物理環(huán)境方面,因清洗地毯、會議設(shè)備設(shè)施、裝飾品擺放等地面環(huán)境的改變,或造成機(jī)器人識別故障,使得機(jī)器人路徑識別錯(cuò)誤;
社會環(huán)境方面,在電梯中與人或其他發(fā)生優(yōu)先乘坐電梯的糾紛;
數(shù)字環(huán)境方面,酒店組網(wǎng)方式讓機(jī)器人在電梯或角落位置出現(xiàn)的通信失敗等等。
馬斯克曾表示,特斯拉現(xiàn)有的 FSD 技術(shù),可以在未來和機(jī)器人模塊進(jìn)行一定程度的算法復(fù)用,但仍然只是在“底層模塊”中進(jìn)行,“更高階的計(jì)算和場景還是需要針對機(jī)器人平臺進(jìn)行專項(xiàng)開發(fā)。”
李想也說,如果我們連L4級跟自動駕駛的汽車都解決不了,怎么去解決更復(fù)雜的?因?yàn)檐囀莻(gè)無接觸機(jī)器人,而且道路是標(biāo)準(zhǔn)化的,包括道路上的提示和參與者都是標(biāo)準(zhǔn)化的,而且每個(gè)人都受交通規(guī)則的 訓(xùn)練,我覺得這已經(jīng)是最簡單的機(jī)器人了,如果車沒法實(shí)現(xiàn),其實(shí)其他人工智能機(jī)器人,還是非常有限的。
03把價(jià)格打下來
在具身智能的競爭中,商業(yè)化是創(chuàng)業(yè)者們面對的共同難題,特斯拉去年的股東大會上,馬斯克首次談到人形機(jī)器人初創(chuàng)公司,“原型很容易,批量生產(chǎn)很難,甚至不可能”,其中的原因不光在于軟件算法和硬件傳感器等,更在于生產(chǎn)和工程能力,說的直白一些,就是生產(chǎn)出來的產(chǎn)品有合適的價(jià)格,能夠被用戶所接受。
我們先來看軟件算法。
從底層算法模型來看,具身智能的軟件可以分為大腦和小腦。
大腦負(fù)責(zé)感知并模擬人類的思維決策過程,小腦則是模仿生物進(jìn)行復(fù)雜的運(yùn)動控制。
大腦算法中的環(huán)境感知和理解和自動駕駛一樣,都主要基于機(jī)器視覺,發(fā)展已經(jīng)比較成熟了,目前很多具身智能創(chuàng)業(yè)公司多依托科技大廠的多模態(tài)大模型賦能。
比如,F(xiàn)igure AI旗下Figure 02和1X Technologies旗下EVE、NEO均接入OpenAl端到端的大語言-視覺(VLM)模型;
樂聚機(jī)器人旗下“夸父”接入華為盤古具身智能大模型;
優(yōu)必選旗下walker S接入百度文心一言大模型;
星動紀(jì)元旗下“小星”系列接入阿里通義千問和智譜清言兩家大模型;
智元機(jī)器人多模態(tài)通用大模型用的是訊飛星火大模型(操作大模型自研)等。
這些大廠的大模型在基礎(chǔ)能力上都有不錯(cuò)的表現(xiàn),也各有自己擅長的長板,在這方面,創(chuàng)業(yè)公司們的起點(diǎn)大致相同,差異不大。
可是在運(yùn)動控制的小腦算法方面,各家就顯示出不同的技術(shù)路徑。
最典型的案例,人形機(jī)器人的控制算法發(fā)展,已經(jīng)經(jīng)歷了基于模型的控制算法(LIPM+ZMP)、動態(tài)模型控制和最優(yōu)控制算法(MPC+WBC)、模擬學(xué)習(xí)+強(qiáng)化學(xué)習(xí)(IL+RL)等幾個(gè)階段。
目前的主流是MPC+WBC方案,但I(xiàn)L+RL路線被行業(yè)普遍認(rèn)為是未來主流的控制方式,但由于該方案經(jīng)過創(chuàng)業(yè)公司們的無數(shù)次嘗試后,進(jìn)入到技術(shù)瓶頸期,且在短期內(nèi)難以突破,這也是諸多人形機(jī)器人本體公司推出輪式仿生機(jī)器人而不是雙足人形機(jī)器人的主要原因。
硬件方面則主要包括芯片、傳感器、執(zhí)行運(yùn)動控制操作的“手”“腳”等。
目前算力芯片在人形機(jī)器人身上的成本占比大概是幾十分之一,地平線分拆出來的芯片及解決方案廠商地瓜機(jī)器人開發(fā)者生態(tài)負(fù)責(zé)人胡春旭在接受媒體采訪時(shí)表示,在不同類型的機(jī)器人中,芯片成本占比差別不大,大約在7%~10%之間,一臺人形機(jī)器人均價(jià)50萬的情況下,芯片這一層的成本不超過1萬元。不過,未來在人形機(jī)器人電機(jī)等部件成本下行的情況下,芯片部分成本占比預(yù)計(jì)有所增加。
相比之下,運(yùn)動控制與執(zhí)行部分的“手”就要貴很多。
由于手需要執(zhí)行抓取、放置、推拉等動作,對操作精度的要求也很高,上肢操作的自由度自然就相應(yīng)增加了。
有專業(yè)人士表示,人形機(jī)器人不算上“手”,全身自由度可能在27個(gè)左右,然而去年11月底,特斯拉展示的Optimus人形機(jī)器人能用手接住網(wǎng)球并放下,動作靈活,其采用的靈巧手自由度比前一代增加了11個(gè),達(dá)到22個(gè)。
在行業(yè)對高自由度形成共識的大背景下,做靈巧的手相當(dāng)于再造一個(gè)機(jī)器人,這也是“手”的價(jià)格居高不下的原因之一。
星動紀(jì)元聯(lián)合創(chuàng)始人席悅曾介紹過自家產(chǎn)品,“手占人形機(jī)器人全身成本大概1/5到1/4”,其中的主要原因在于現(xiàn)在的觸覺傳感器還很貴,甚至比整只不帶觸覺傳感器的“手”更貴,“一只手用到的觸覺傳感器可能要大幾千元,一只手上的觸覺傳感器只有在占手的成本10%左右的時(shí)候才可能大規(guī)模應(yīng)用”,有專業(yè)人士如是表示。
從上文的分析中不難看出,就像無人車一樣,從最開始的幾十、上百萬一輛,到逐漸下降到20萬左右的Robotaxi,甚至10萬以下的無人配送車,自動駕駛的普及與滲透這才加快了速度。
對于具身智能創(chuàng)業(yè)企業(yè)們來說,如何將機(jī)器人的價(jià)格打下來,將是他們在未來競爭中能夠占據(jù)主動的關(guān)鍵。
文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹(jǐn)慎對待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。
2024年的Adobe MAX 2024發(fā)布會上,Adobe推出了最新版本的Adobe Creative Cloud。
奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。
“以前都要去窗口辦,一套流程下來都要半個(gè)月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。
華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準(zhǔn)的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實(shí)質(zhì)性的幫助,雙十一期間低至2799元,性價(jià)比很高,簡直是創(chuàng)作者們的首選。
9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會——工業(yè)互聯(lián)網(wǎng)標(biāo)識解析專題論壇在沈陽成功舉辦。