應用來了!李彥宏發(fā)布兩大“超級有用”AI技術!直播電商交易額達3325億元 同比大增超50% 成主戰(zhàn)場iPhone SE 4預計明年3月發(fā)布 相機模塊12月份開始量產Nordic宣布裁員8%,取消收購UWB專業(yè)芯片公司Novelda芯片設備大廠TEL凈利潤將暴漲45%,中國市場占比達45%朱江明回應零跑汽車被稱為半價理想:好的競品我們都會學習、借鑒全能旗艦相機索尼A1M2官宣:11月19日發(fā)布老將依舊能打,EOS R7秋季拍照體驗華為乾崑智駕加持,方程豹豹8正式上市,開啟智能越野新時代騰訊“網絡廣告”板塊更名“營銷服務”,Q3收入同比增17%上海外服發(fā)布多款人力資源解決方案近萬人參賽,百度英偉達合辦的全球最大規(guī)模智能體賽事落幕騰訊發(fā)布Q3財報 毛利、經營利潤同比增16%、19%2024車企年關時刻:裁員、轉型和迷茫消息稱叮咚買菜啟動出海:首站選定沙特,主要銷售預制菜LG與Tenstorrent合作開發(fā)全新“情感智能”芯片谷歌擴大AI洪水預警系統(tǒng)覆蓋范圍,惠及全球7億人零一萬物與華為啟動合作,將基于昇騰硬件底座開發(fā)原生大模型應用第十三屆中國創(chuàng)新創(chuàng)業(yè)大賽顛覆性技術創(chuàng)新大賽(未來材料領域賽)在大連高新區(qū)開賽中國移動2.6GHz廣電專用核心網二期工程設備集采:華為、中興兩家分食
  • 首頁 > 云計算頻道 > 大模型

    清華團隊破解具身智能Scaling Law,GPT時刻在即!寧德時代聯(lián)創(chuàng)終于出手

    2024年11月11日 14:25:32   來源:新智元公眾號

      半年兩次大融資后,這家具身智能黑馬再次獲得融資!作為柏睿資本首次投資的具身智能企業(yè),千尋智能不僅擁有出身自伯克利系聯(lián)創(chuàng),在技術、硬件、商業(yè)化上,也讓人極有信心。

      最近,我們意外發(fā)現(xiàn),具身智能領域的明星初創(chuàng)公司千尋智能,悄悄完成了工商變更。

      根據工商信息顯示,本輪融資由柏睿資本獨家投資。至此,千尋智已經在半年多時間里獲得了三次大額融資,一躍成為具身智能領域明星公司之一。

      值得一提的是,柏睿資本是寧德時代聯(lián)合創(chuàng)始人,副董事長李平創(chuàng)立的產業(yè)投資基金。

      全國具身智能領域多家明星,為何首次下場便獨獨選中了千尋智能?

      從下面這些demo中,便可窺見一斑。

      仔細看,桌面上撒滿了五顏六色形狀各異的糖豆。如何將這些不同顏色和大小的物體進行分類,可不是件容易的事。

      只見,在極其強大的識別和精準操作能力的加持下,千尋智能的機器人用靈巧的手指輕松地將糖豆捏起,并準確地放入指定的碗里。

      不僅如此,它還可以一手拿起桌上透明的玻璃杯,一手從滿滿一筐雞蛋中抓出一個并準確無誤地放進杯中。

      甚至,它還能接過手中的文件并進行裝訂,然后再交還給人類。

      在這個過程中,AI基于視覺大模型的任務理解與規(guī)劃,實現(xiàn)了人機交互及協(xié)同作業(yè)。

      繼續(xù)觀看

      清華團隊破解具身智能Scaling Law,GPT時刻在即!寧德時代聯(lián)創(chuàng)終于出手

      具身智能行業(yè),到底在卷什么

      其實,如今的具身智能領域可謂是百花齊放,各種酷炫的演示demo層出不窮。但對于不懂的外行人來說,只能看個熱鬧,很難理解背后真正的技術邊界是怎么樣的。

      同一個動作,是提前編程好的,還是機器人自主完成的?機器人只能在特定的某個位置、某個光照做一件事,還是能夠真正泛化到各個條件、各個場景?

      看似相差不多的demo下,背后的技術能力實則相差甚遠。

      不過,對于未來的技術走向,業(yè)界的認知正在逐漸清晰——最核心的還是大腦的能力。

      隨著時間的發(fā)展,可能再過一兩年,競爭就會回到這個本質,因為唯有大腦,才能決定具身智能能在什么場景落地。

      目前,大語言模型賽道已經接近后期,投資人開始關注回報的問題,但相比之下,機器人賽道可以說才剛剛開始。尤其涉及到軟硬結合,以及整套系統(tǒng)的復雜度,賽道周期顯然會更長。

      在這樣的背景下,柏睿資本的此次下場,顯然是經過了深思熟慮。

      寧德時代聯(lián)創(chuàng)首次出手

      自創(chuàng)立之初,柏睿資本就專注于人工智能、具身智能領域的發(fā)展,且一直非?春眠@一技術將帶來的一系列變革。

      具體到千尋智能,柏睿資本看重的正是其團隊在AI、硬件、商業(yè)化三個方面的綜合優(yōu)勢。

      首先,針對高陽在算法和模型方面的持續(xù)創(chuàng)新和產出能力,柏睿資本抱有極大的信心;其次,千尋智能的創(chuàng)始團隊在硬件領域有著扎實的背景和積累;第三則是多達上百個場景、數萬臺機器人的商業(yè)化落地經驗。

      作為柏睿資本投資的首家具身智能企業(yè),千尋智能將借助柏睿資本和背后的產投資源,快速切入市場化落地并進行具身智能泛化性作業(yè)驗證,成為國內首家實現(xiàn)具身智能商業(yè)化的公司。

      把水壺里的水倒進玻璃杯,并讓水位達到指定的刻度(實拍原速)

      縱觀當下機器人領域的現(xiàn)狀,各種技術的理論驗證基本都已完成,但工程化卻還在起步階段。

      怎樣一條途徑是最優(yōu)方案,率先做到在工程上可行?

      從Physical Intelligence、Skild AI等優(yōu)秀的國外先行者身上,我們可以隱約窺見一條逼近真理的技術路徑。

      端到端就是下一個前沿

      最近,成立僅8個月的初創(chuàng)Physical Intelligence(Pi)發(fā)布了一款通用機器人基礎模型π0。

      這個在8個機器人平臺上,完成訓練的3B模型,能夠執(zhí)行各種靈巧的任務,包括洗衣服、收納整理......

      與LLM不同的是,π0跨越了視覺、語言、動作(VLA),并通過訓練機器人的具身經驗中,獲得物理智能。

      它基于3B VLM完成的預訓練,隨后又根據靈巧任務(洗衣服、組裝盒子、桌面任務)進行了微調。

      VLM的優(yōu)勢在于能夠集成互聯(lián)網規(guī)模的語義知識和視覺理解,有助于動作預測

      Pi聯(lián)創(chuàng)之一,也是UC伯克利副教授Sergey Levine看到,如今的機器人是一種狹隘的專家系統(tǒng)。比如,工業(yè)機器人通過編程,在裝配線上同個地點進行重復的工作。

      即便是這樣簡單的行為,也需要耗費大量的人工編程,更不用提在復雜環(huán)境(家庭等)中的應用了。

      有了大模型,就很容易讓機器人做到這點。然而這一切實現(xiàn)的前提是——數據。

      就像人類可以憑借經驗快速學習新技能一樣,模型也僅需少量數據,就能適應新的任務。

      這便是π0的核心思想。

      另一家由CMU大牛Deepak Pathak(博士出身是UC伯克利)創(chuàng)立的Skild AI,也遵循了同樣的技術路線。

      他們打造出了一款能夠泛化的機器人基礎模型「Skild Brain」,背后用到的訓練數據是競爭對手的1000倍,可以適用到任何機器人本體和任務中。

      從以上伯克利系大牛們所做的研究來看,端到端架構已成為具身智能的主要技術路線。

      無獨有偶,國內的千尋智能也在技術路線上與這兩家美國的具身智能頂尖初創(chuàng),不謀而合。

      在讀博士、博士后期間,千尋智能團隊的首席科學家高陽,還曾與Sergey Levine和Pieter Abbeel教授展開深入合作。

      尤其是,他們的模型可以在訓練過程中,同時利用監(jiān)督微調、強化學習、模擬學習等技術,并將Sim2Real數據作為補充。

      結果就是,剛成立半年多的千尋智能,就已經能實現(xiàn)業(yè)內Top的靈巧手操作了。

      伯克利系稱霸具身智能

      毫不夸張地說,UC伯克利已被公認為是最近這波具身智能浪潮的主要發(fā)源地。而Sergey、Pieter這些教授,是當之無愧的機器人學習領域最近十年的領頭人。

      同時,出身伯克利系的高徒們,如今已經在各個相關領域散作滿天星,不斷推高業(yè)界前沿的技術水平。

      比如,千尋智能聯(lián)合創(chuàng)始人高陽在攻讀計算機視覺博士學位期間,便是師從Trevor Darrell教授,和Deepak Pathak同組。

      最近,高陽帶領團隊發(fā)現(xiàn)了具身智能領域的「圣杯」——Data Scaling Laws,堪稱機器人的ChatGPT時刻。

      而且,在CoRL2024上,這項研究榮獲X-Embodiment workshop最佳論文獎!

      這一方法讓機器人實現(xiàn)了真正的零樣本泛化,也就意味著無需任何微調,就能泛化到全新場景中,徹底改變了開發(fā)通用機器人的方式。

      就連谷歌DeepMind大牛Ted Xiao也對這項研究贊賞有加,稱其對機器人大模型時代具有里程碑意義。

      這位具身智能領域大咖,有著怎樣的學術背景?

      2014年,高陽獲得了清華計算機科學本科學位,師從國內ML領域享有盛譽的著名學者朱軍教授。

      在大二的時候,也正是深度學習(2012年)爆發(fā)之際,高陽做的了很多關于傳統(tǒng)ML的研究。

      憑借出色的成績,他成為了計算機系的第二位大神。

      到了大三,高陽拿到了去斯坦福做交換的暑期學習資格,導師是David L. Dill教授。

      本科畢業(yè)前,得益于老師的推薦信,以及自身各方面優(yōu)異表現(xiàn),高陽最終收獲了美國多所頂尖高校的offer。

      面對這些同樣優(yōu)秀的學府,他決定親赴美國實地考察,做出最適合自己的選擇。

      在走訪過程中,UC伯克利給他留下了深刻的印象。作為四大名校之一,這所學校具備了濃厚的學術氛圍。

      再加上,自身專攻機器學習領域的原因,UC伯克利最適合不過了。

      作為一名機器學習領域的學生,他對UC伯克利格外青睞,很大程度上還因為引領ML時代技術的Michael Jordan教授的存在。

      原本初到伯克利時,高陽計劃跟隨Michael Jordan開展研究。然而,再參加了幾次他的組會,并與其學生交流后,他發(fā)現(xiàn)Michael研究方向與自己的與其有所差異。

      因為,Michael Jordan的工作更加偏重數學理論,組會多圍繞數學公式推導,這與高陽所期待的實踐導向研究路徑不盡相同。

      在探索其他可能性過程中,他意外接觸到了Trevor Darrell教授的研究組。

      Trevor專注于計算機視覺領域,其魅力在于直觀性——可以清晰看到輸入的圖片,觀察神經網絡訓練過程,并得到可視化結果。

      值得一提的是,當時深度學習的浪潮已經持續(xù)了大約2年的時間,業(yè)界也普遍認可了這項技術的卓越性。

      也是基于這些原因,更加堅定了高陽在這一方向上深耕的原因。

      在他的博士生涯初期,跟隨Trevor教授做了很多在純視覺領域的研究。

      直到博士二年級下學期開始,高陽的研究興趣發(fā)生了微妙的轉變。

      這一轉變源于,實驗室內部一系列關于人類智能起源的深度探討。

      而令他印象深刻的是CV圈里另一位大咖Jitendra Malik觀點:他從進化角度提出,人類智能本質與靈巧的雙手密不可分。

      正是因為擁有了精細的手部動作能力,人類才得以完成更為復雜的任務,反過來推動了大腦的進化,使得智力水平得以適應更復雜的活動需求。

      再到貓狗之間對于人類指令理解力的差別,說明了狗的群居特性,使得它們溝通協(xié)調力強于貓。

      最終,他們在智能本質討論中,逐漸達成共識:機器視覺的終極發(fā)展方向,應該由具身智能體驅動。

      自然而然地,高陽開始將研究中心轉向了具身智能領域。

      他認為,具身智能與視覺、強化學習有著密切的聯(lián)系,這種聯(lián)系可以類比人類的認知過程。

      即通過視覺感知環(huán)境,理解周圍狀況,繼而做出相應的行為。

      基于這種認識,高陽開始與Sergey Levine教授展開合作,深入去研究具身智能的形成機制。

      得益于前期在計算機視覺領域的積累,在實際研究中,高陽能夠很好地將CV技術與RL結合起來,并交出了碩果累累的成績單。

      在機器人研究領域的頂級學術會議CoRL2024中,團隊更是連中了4篇論文。

      回到北美,如今頭部的具身智能創(chuàng)業(yè)公司,除了Figure AI之外,創(chuàng)始人都屬于伯克利系。

      比如,Physical Intelligence的聯(lián)創(chuàng)Sergey Levine,便是UC伯克利電氣工程與計算機科學系的副教授。

      Pi的另一位聯(lián)創(chuàng)Chelsea Finn,也是UC伯克利的博士。

      Skild AI的聯(lián)創(chuàng)Deepak Pathak,同樣是在UC伯克利獲得的博士學位,師從國際計算機視覺大師Trevor Darrell教授(曾培養(yǎng)了包括賈揚清在內的多位視覺領域知名學者)。

      隨后,Pathak繼續(xù)在UC伯克利做博士后研究,導師是機器人學習領域的頂尖學者Pieter Abbeel——擴散模型(Sora、SD背后核心技術)的提出者之一。

      爆火AI搜索初創(chuàng)Perplexity AI的創(chuàng)始人Aravind Srinivas,以及前OpenAI聯(lián)創(chuàng)John Schulman,皆是他的學生。

      博士研究期間,Pathak開發(fā)了一種向機器人灌輸「好奇心」方法。具體做法是,當系統(tǒng)無法預測其行動結果時,系統(tǒng)反而會因未知結果而獲得獎勵。

      這種方法驅使AI去探索更多場景,并收集更多數據。

      其實回看2014到2016年這段時間,無論機器狗還是雙足機器人,在業(yè)內的進展都比較緩慢。

      雖然當時的人形機器人已經可以跑酷、跳樁,但其中使用的技術棧其實非常傳統(tǒng),是基于傳統(tǒng)的MPC、WPC這類手工控制器去做的。

      也就是說,并不是基于機器學習這條路線。

      在2017年左右,Pieter Abbeel和三個學生一起創(chuàng)立了Covariant(原名Embodied Intelligence),可以說是體現(xiàn)了具身智能的縮影。

      在當年,大語言模型并沒有出現(xiàn),因此即使這個公司早于時代,也依然像今天的非端到端自動駕駛一樣,技術棧并沒有特別大的進步。

      而隨后大模型的出現(xiàn),才終于讓具身智能的推理能力、多模態(tài)感知融合、自主學習和知識遷移能力等得到了顯著提升,翻開了全新的篇章。

      如今,具身智能技術已經走向了深度融合和迭代優(yōu)化的新階段。擁有技術領先性和應用場景積累的企業(yè),將迎來大展拳腳的機會。

      而千尋智能,恰恰有著清晰的端到端技術路線,有頂尖人才、有應用場景。

      具身智能這盤大棋,接下來就看千尋智能如何交卷了。

      文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。

    即時

    京東11.11跟著采銷走進科大訊飛 直播間享專享價與超值福利

    京東11.11采銷直播探廠為消費者揭開答案。近日,京東3C數碼采銷走進武漢攀升工廠、合肥聯(lián)想工廠和科大訊飛展廳,通過直播帶貨廠商爆款產品,并為消費者帶來超值低價與福利。

    新聞

    明火炊具市場:三季度健康屬性貫穿全類目

    奧維云網(AVC)推總數據顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。

    企業(yè)IT

    重慶創(chuàng)新公積金應用,“區(qū)塊鏈+政務服務”顯成效

    “以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關材料,僅幾秒鐘,重慶市民曾某的賬戶就打進了21600元。

    3C消費

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,高能實力,創(chuàng)

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實質性的幫助,雙十一期間低至2799元,性價比很高,簡直是創(chuàng)作者們的首選。

    研究

    中國信通院羅松:深度解讀《工業(yè)互聯(lián)網標識解析體系

    9月14日,2024全球工業(yè)互聯(lián)網大會——工業(yè)互聯(lián)網標識解析專題論壇在沈陽成功舉辦。