半年兩次大融資后,這家具身智能黑馬再次獲得融資!作為柏睿資本首次投資的具身智能企業(yè),千尋智能不僅擁有出身自伯克利系聯(lián)創(chuàng),在技術、硬件、商業(yè)化上,也讓人極有信心。
最近,我們意外發(fā)現(xiàn),具身智能領域的明星初創(chuàng)公司千尋智能,悄悄完成了工商變更。
根據工商信息顯示,本輪融資由柏睿資本獨家投資。至此,千尋智已經在半年多時間里獲得了三次大額融資,一躍成為具身智能領域明星公司之一。
值得一提的是,柏睿資本是寧德時代聯(lián)合創(chuàng)始人,副董事長李平創(chuàng)立的產業(yè)投資基金。
全國具身智能領域多家明星,為何首次下場便獨獨選中了千尋智能?
從下面這些demo中,便可窺見一斑。
仔細看,桌面上撒滿了五顏六色形狀各異的糖豆。如何將這些不同顏色和大小的物體進行分類,可不是件容易的事。
只見,在極其強大的識別和精準操作能力的加持下,千尋智能的機器人用靈巧的手指輕松地將糖豆捏起,并準確地放入指定的碗里。
不僅如此,它還可以一手拿起桌上透明的玻璃杯,一手從滿滿一筐雞蛋中抓出一個并準確無誤地放進杯中。
甚至,它還能接過手中的文件并進行裝訂,然后再交還給人類。
在這個過程中,AI基于視覺大模型的任務理解與規(guī)劃,實現(xiàn)了人機交互及協(xié)同作業(yè)。
繼續(xù)觀看
清華團隊破解具身智能Scaling Law,GPT時刻在即!寧德時代聯(lián)創(chuàng)終于出手
具身智能行業(yè),到底在卷什么
其實,如今的具身智能領域可謂是百花齊放,各種酷炫的演示demo層出不窮。但對于不懂的外行人來說,只能看個熱鬧,很難理解背后真正的技術邊界是怎么樣的。
同一個動作,是提前編程好的,還是機器人自主完成的?機器人只能在特定的某個位置、某個光照做一件事,還是能夠真正泛化到各個條件、各個場景?
看似相差不多的demo下,背后的技術能力實則相差甚遠。
不過,對于未來的技術走向,業(yè)界的認知正在逐漸清晰——最核心的還是大腦的能力。
隨著時間的發(fā)展,可能再過一兩年,競爭就會回到這個本質,因為唯有大腦,才能決定具身智能能在什么場景落地。
目前,大語言模型賽道已經接近后期,投資人開始關注回報的問題,但相比之下,機器人賽道可以說才剛剛開始。尤其涉及到軟硬結合,以及整套系統(tǒng)的復雜度,賽道周期顯然會更長。
在這樣的背景下,柏睿資本的此次下場,顯然是經過了深思熟慮。
寧德時代聯(lián)創(chuàng)首次出手
自創(chuàng)立之初,柏睿資本就專注于人工智能、具身智能領域的發(fā)展,且一直非?春眠@一技術將帶來的一系列變革。
具體到千尋智能,柏睿資本看重的正是其團隊在AI、硬件、商業(yè)化三個方面的綜合優(yōu)勢。
首先,針對高陽在算法和模型方面的持續(xù)創(chuàng)新和產出能力,柏睿資本抱有極大的信心;其次,千尋智能的創(chuàng)始團隊在硬件領域有著扎實的背景和積累;第三則是多達上百個場景、數萬臺機器人的商業(yè)化落地經驗。
作為柏睿資本投資的首家具身智能企業(yè),千尋智能將借助柏睿資本和背后的產投資源,快速切入市場化落地并進行具身智能泛化性作業(yè)驗證,成為國內首家實現(xiàn)具身智能商業(yè)化的公司。
把水壺里的水倒進玻璃杯,并讓水位達到指定的刻度(實拍原速)
縱觀當下機器人領域的現(xiàn)狀,各種技術的理論驗證基本都已完成,但工程化卻還在起步階段。
怎樣一條途徑是最優(yōu)方案,率先做到在工程上可行?
從Physical Intelligence、Skild AI等優(yōu)秀的國外先行者身上,我們可以隱約窺見一條逼近真理的技術路徑。
端到端就是下一個前沿
最近,成立僅8個月的初創(chuàng)Physical Intelligence(Pi)發(fā)布了一款通用機器人基礎模型π0。
這個在8個機器人平臺上,完成訓練的3B模型,能夠執(zhí)行各種靈巧的任務,包括洗衣服、收納整理......
與LLM不同的是,π0跨越了視覺、語言、動作(VLA),并通過訓練機器人的具身經驗中,獲得物理智能。
它基于3B VLM完成的預訓練,隨后又根據靈巧任務(洗衣服、組裝盒子、桌面任務)進行了微調。
VLM的優(yōu)勢在于能夠集成互聯(lián)網規(guī)模的語義知識和視覺理解,有助于動作預測
Pi聯(lián)創(chuàng)之一,也是UC伯克利副教授Sergey Levine看到,如今的機器人是一種狹隘的專家系統(tǒng)。比如,工業(yè)機器人通過編程,在裝配線上同個地點進行重復的工作。
即便是這樣簡單的行為,也需要耗費大量的人工編程,更不用提在復雜環(huán)境(家庭等)中的應用了。
有了大模型,就很容易讓機器人做到這點。然而這一切實現(xiàn)的前提是——數據。
就像人類可以憑借經驗快速學習新技能一樣,模型也僅需少量數據,就能適應新的任務。
這便是π0的核心思想。
另一家由CMU大牛Deepak Pathak(博士出身是UC伯克利)創(chuàng)立的Skild AI,也遵循了同樣的技術路線。
他們打造出了一款能夠泛化的機器人基礎模型「Skild Brain」,背后用到的訓練數據是競爭對手的1000倍,可以適用到任何機器人本體和任務中。
從以上伯克利系大牛們所做的研究來看,端到端架構已成為具身智能的主要技術路線。
無獨有偶,國內的千尋智能也在技術路線上與這兩家美國的具身智能頂尖初創(chuàng),不謀而合。
在讀博士、博士后期間,千尋智能團隊的首席科學家高陽,還曾與Sergey Levine和Pieter Abbeel教授展開深入合作。
尤其是,他們的模型可以在訓練過程中,同時利用監(jiān)督微調、強化學習、模擬學習等技術,并將Sim2Real數據作為補充。
結果就是,剛成立半年多的千尋智能,就已經能實現(xiàn)業(yè)內Top的靈巧手操作了。
伯克利系稱霸具身智能
毫不夸張地說,UC伯克利已被公認為是最近這波具身智能浪潮的主要發(fā)源地。而Sergey、Pieter這些教授,是當之無愧的機器人學習領域最近十年的領頭人。
同時,出身伯克利系的高徒們,如今已經在各個相關領域散作滿天星,不斷推高業(yè)界前沿的技術水平。
比如,千尋智能聯(lián)合創(chuàng)始人高陽在攻讀計算機視覺博士學位期間,便是師從Trevor Darrell教授,和Deepak Pathak同組。
最近,高陽帶領團隊發(fā)現(xiàn)了具身智能領域的「圣杯」——Data Scaling Laws,堪稱機器人的ChatGPT時刻。
而且,在CoRL2024上,這項研究榮獲X-Embodiment workshop最佳論文獎!
這一方法讓機器人實現(xiàn)了真正的零樣本泛化,也就意味著無需任何微調,就能泛化到全新場景中,徹底改變了開發(fā)通用機器人的方式。
就連谷歌DeepMind大牛Ted Xiao也對這項研究贊賞有加,稱其對機器人大模型時代具有里程碑意義。
這位具身智能領域大咖,有著怎樣的學術背景?
2014年,高陽獲得了清華計算機科學本科學位,師從國內ML領域享有盛譽的著名學者朱軍教授。
在大二的時候,也正是深度學習(2012年)爆發(fā)之際,高陽做的了很多關于傳統(tǒng)ML的研究。
憑借出色的成績,他成為了計算機系的第二位大神。
到了大三,高陽拿到了去斯坦福做交換的暑期學習資格,導師是David L. Dill教授。
本科畢業(yè)前,得益于老師的推薦信,以及自身各方面優(yōu)異表現(xiàn),高陽最終收獲了美國多所頂尖高校的offer。
面對這些同樣優(yōu)秀的學府,他決定親赴美國實地考察,做出最適合自己的選擇。
在走訪過程中,UC伯克利給他留下了深刻的印象。作為四大名校之一,這所學校具備了濃厚的學術氛圍。
再加上,自身專攻機器學習領域的原因,UC伯克利最適合不過了。
作為一名機器學習領域的學生,他對UC伯克利格外青睞,很大程度上還因為引領ML時代技術的Michael Jordan教授的存在。
原本初到伯克利時,高陽計劃跟隨Michael Jordan開展研究。然而,再參加了幾次他的組會,并與其學生交流后,他發(fā)現(xiàn)Michael研究方向與自己的與其有所差異。
因為,Michael Jordan的工作更加偏重數學理論,組會多圍繞數學公式推導,這與高陽所期待的實踐導向研究路徑不盡相同。
在探索其他可能性過程中,他意外接觸到了Trevor Darrell教授的研究組。
Trevor專注于計算機視覺領域,其魅力在于直觀性——可以清晰看到輸入的圖片,觀察神經網絡訓練過程,并得到可視化結果。
值得一提的是,當時深度學習的浪潮已經持續(xù)了大約2年的時間,業(yè)界也普遍認可了這項技術的卓越性。
也是基于這些原因,更加堅定了高陽在這一方向上深耕的原因。
在他的博士生涯初期,跟隨Trevor教授做了很多在純視覺領域的研究。
直到博士二年級下學期開始,高陽的研究興趣發(fā)生了微妙的轉變。
這一轉變源于,實驗室內部一系列關于人類智能起源的深度探討。
而令他印象深刻的是CV圈里另一位大咖Jitendra Malik觀點:他從進化角度提出,人類智能本質與靈巧的雙手密不可分。
正是因為擁有了精細的手部動作能力,人類才得以完成更為復雜的任務,反過來推動了大腦的進化,使得智力水平得以適應更復雜的活動需求。
再到貓狗之間對于人類指令理解力的差別,說明了狗的群居特性,使得它們溝通協(xié)調力強于貓。
最終,他們在智能本質討論中,逐漸達成共識:機器視覺的終極發(fā)展方向,應該由具身智能體驅動。
自然而然地,高陽開始將研究中心轉向了具身智能領域。
他認為,具身智能與視覺、強化學習有著密切的聯(lián)系,這種聯(lián)系可以類比人類的認知過程。
即通過視覺感知環(huán)境,理解周圍狀況,繼而做出相應的行為。
基于這種認識,高陽開始與Sergey Levine教授展開合作,深入去研究具身智能的形成機制。
得益于前期在計算機視覺領域的積累,在實際研究中,高陽能夠很好地將CV技術與RL結合起來,并交出了碩果累累的成績單。
在機器人研究領域的頂級學術會議CoRL2024中,團隊更是連中了4篇論文。
回到北美,如今頭部的具身智能創(chuàng)業(yè)公司,除了Figure AI之外,創(chuàng)始人都屬于伯克利系。
比如,Physical Intelligence的聯(lián)創(chuàng)Sergey Levine,便是UC伯克利電氣工程與計算機科學系的副教授。
Pi的另一位聯(lián)創(chuàng)Chelsea Finn,也是UC伯克利的博士。
Skild AI的聯(lián)創(chuàng)Deepak Pathak,同樣是在UC伯克利獲得的博士學位,師從國際計算機視覺大師Trevor Darrell教授(曾培養(yǎng)了包括賈揚清在內的多位視覺領域知名學者)。
隨后,Pathak繼續(xù)在UC伯克利做博士后研究,導師是機器人學習領域的頂尖學者Pieter Abbeel——擴散模型(Sora、SD背后核心技術)的提出者之一。
爆火AI搜索初創(chuàng)Perplexity AI的創(chuàng)始人Aravind Srinivas,以及前OpenAI聯(lián)創(chuàng)John Schulman,皆是他的學生。
博士研究期間,Pathak開發(fā)了一種向機器人灌輸「好奇心」方法。具體做法是,當系統(tǒng)無法預測其行動結果時,系統(tǒng)反而會因未知結果而獲得獎勵。
這種方法驅使AI去探索更多場景,并收集更多數據。
其實回看2014到2016年這段時間,無論機器狗還是雙足機器人,在業(yè)內的進展都比較緩慢。
雖然當時的人形機器人已經可以跑酷、跳樁,但其中使用的技術棧其實非常傳統(tǒng),是基于傳統(tǒng)的MPC、WPC這類手工控制器去做的。
也就是說,并不是基于機器學習這條路線。
在2017年左右,Pieter Abbeel和三個學生一起創(chuàng)立了Covariant(原名Embodied Intelligence),可以說是體現(xiàn)了具身智能的縮影。
在當年,大語言模型并沒有出現(xiàn),因此即使這個公司早于時代,也依然像今天的非端到端自動駕駛一樣,技術棧并沒有特別大的進步。
而隨后大模型的出現(xiàn),才終于讓具身智能的推理能力、多模態(tài)感知融合、自主學習和知識遷移能力等得到了顯著提升,翻開了全新的篇章。
如今,具身智能技術已經走向了深度融合和迭代優(yōu)化的新階段。擁有技術領先性和應用場景積累的企業(yè),將迎來大展拳腳的機會。
而千尋智能,恰恰有著清晰的端到端技術路線,有頂尖人才、有應用場景。
具身智能這盤大棋,接下來就看千尋智能如何交卷了。
文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。
京東11.11采銷直播探廠為消費者揭開答案。近日,京東3C數碼采銷走進武漢攀升工廠、合肥聯(lián)想工廠和科大訊飛展廳,通過直播帶貨廠商爆款產品,并為消費者帶來超值低價與福利。
奧維云網(AVC)推總數據顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。
“以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關材料,僅幾秒鐘,重慶市民曾某的賬戶就打進了21600元。
華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實質性的幫助,雙十一期間低至2799元,性價比很高,簡直是創(chuàng)作者們的首選。