會(huì)沖咖啡,還要進(jìn)寶馬工廠打工的Figure01又又又進(jìn)化了!
ChatGPT成了它的“大腦”,配合神經(jīng)網(wǎng)絡(luò),這個(gè)機(jī)器人不僅能聽、會(huì)看、與人對(duì)話,還能按照人類指令完成任務(wù)。展示Figure01新技能的畫面讓人覺得它已經(jīng)極度擬人。
進(jìn)化版的這款人形機(jī)器人由FigureAI與OpenAI合作開發(fā),demo展示迅速在科技圈炸鍋,讓網(wǎng)友不禁感慨:機(jī)器人保姆走進(jìn)千家萬戶的科幻場景正在照進(jìn)現(xiàn)實(shí)。
Figure01的締造公司也迅速獲得資本的青睞。目前,F(xiàn)igureAI已經(jīng)完成了新一輪約6.75億美元(約合人民幣48.7億元)的融資,成了硅谷科企和資本力捧的新星。
在機(jī)器人賽道,前有波士頓動(dòng)力這樣的老玩家,后有馬斯克力主向智能機(jī)器人公司定位的特斯拉,F(xiàn)igureAI剛成立了3年,為何成為估值20億美元的新獨(dú)角獸?
13天學(xué)會(huì)“聽、說、看” 還能思考
僅僅訓(xùn)練13天,F(xiàn)igure01已經(jīng)學(xué)會(huì)了與人類對(duì)話,執(zhí)行相關(guān)任務(wù),還能自主決策。
官方發(fā)布的demo視頻充分展示了Figure01對(duì)環(huán)境的感知力以及交互能力,它甚至能完成復(fù)雜的家務(wù)勞動(dòng),遞送食物、收拾碗筷、清理垃圾統(tǒng)統(tǒng)不在話下。
先來看一下Figure01令人震驚的環(huán)境感知力,也就是它的“視覺”。視頻中的測試者問:“Figure01,告訴我你看到了什么?”
幾秒鐘后,F(xiàn)igure01開口說話了,并精準(zhǔn)的描述出了眼前的景象:“我看到桌子中間有一個(gè)紅蘋果,瀝水架上有幾個(gè)盤子和一個(gè)杯子,你站在旁邊,手放在桌子上。”
可以看到Figure01近乎滿分地完成了視覺測試,接下來就是與環(huán)境以及人的交互。測試者接著問:“我可以吃點(diǎn)東西嗎?”同樣,響應(yīng)幾秒種后Figure01回答:“當(dāng)然可以。”緊接著,F(xiàn)igure01動(dòng)作連貫地將桌子上的蘋果遞到了人的手中。
注意,這里埋著個(gè)細(xì)節(jié)。測試時(shí),測試者沒有直接給出食物、位置及動(dòng)作等指令性信息,比如“我想吃桌子上的蘋果,請(qǐng)遞給我”,而是用了人與人交流的社交語言,以一種詢問、委婉的語氣,測試Figure01是否理解。而這個(gè)機(jī)器人準(zhǔn)確Get到了測試者的點(diǎn),并從桌子上找到了唯一的食物——蘋果,遞給了男人。不得不說,F(xiàn)igure01有點(diǎn)懂人了。
這只是“開胃菜”,下面的測試中,你會(huì)發(fā)現(xiàn)Figure01還會(huì)像人一樣“思考”。
接下來,測試者一邊把一筐垃圾倒在機(jī)器人面前,一邊讓它解釋“剛才為什么這么做(給蘋果)”,還要求把垃圾收拾干凈。緊接著,F(xiàn)igure01回答“我這么做是因?yàn)樘O果是我在桌上看到的唯一能吃的東西。”說話間,它也把垃圾裝到了筐子里,還不忘把筐子推向測試者。
Figure01已經(jīng)可以實(shí)現(xiàn)“邊說邊做”這種人類常見的行為方式了。
最后,F(xiàn)igure01還將杯子與盤子復(fù)歸原位,并復(fù)盤評(píng)價(jià)了自己剛才所做的一切:“我覺得我做得很好,我把蘋果遞給了你,把垃圾丟掉了,桌上的東西也都放到了該放的地方。”測試者也表示肯定后,F(xiàn)igure01張開雙臂:“不客氣,下次有需要幫忙的,請(qǐng)隨時(shí)告訴我。”
看完這一整套交互過程,你有沒有感到驚訝?有網(wǎng)友驚嘆,這是目前見過的在語言、動(dòng)作上最智能、最像人的機(jī)器人。也有人調(diào)侃道,“波士頓動(dòng)力(另一家機(jī)器人公司)只能再多編一些舞蹈動(dòng)作了。”有人既遂附和,“機(jī)器人應(yīng)該像這樣做做家務(wù),而不是只會(huì)花拳繡腿。”
更令人震驚的是,這些訓(xùn)練在13天就完成了。也就說,F(xiàn)igure01的行為不依賴遠(yuǎn)程操控,而是通過學(xué)習(xí)得來。
那么,到底是什么讓Figure01有了“視覺”、“聽覺”和“大腦”?
FigureAI解釋,F(xiàn)igure01的操作系統(tǒng)整合了OpenAI提供的視覺語言大模型(VLM),以此實(shí)現(xiàn)機(jī)器人對(duì)圖像和語言的深度理解;而智能系統(tǒng)部分融合了OpenAI的視覺推理和語言理解能力。
還有一個(gè)技術(shù)也十分重要——FigureAI自家的神經(jīng)網(wǎng)絡(luò)技術(shù),這確保了機(jī)器人動(dòng)作的流暢和精確,并賦予了這款機(jī)器人前所未有的自主性。
融資6.7億美元 FigureAI為何受資本青睞?
Figure01的進(jìn)化讓世界看到了機(jī)器人在家庭服務(wù)、工廠作業(yè)的潛力,創(chuàng)建它的機(jī)器人公司FigureAI也迅速炙手可熱。
據(jù)FigureAI官方消息,今年2月底,該公司完成新一輪約6.75億美元(約合人民幣48.7億元)的融資,估值已經(jīng)不只20億美元了,亞馬遜創(chuàng)始人貝索斯、英偉達(dá)、微軟和OpenAI等硅谷科技巨頭都為FigureAI提供了資金支持。
機(jī)器人領(lǐng)域里,前有波士頓動(dòng)力,后有馬斯克定位為機(jī)器人公司的特斯拉,2021年才成立的FigureAI為何受到資本青睞、占據(jù)一席之地?
主要因?yàn)镕igureAI抓住了開發(fā)人形機(jī)器人的重點(diǎn)需求:夠?qū)嵱茫矇蛑悄堋?/p>
要知道,F(xiàn)igureAI之前,最受矚目的機(jī)器人公司是波士頓動(dòng)力,其開發(fā)的機(jī)器人Atlas也曾因“能蹦會(huì)跳”刷屏社交媒體。到現(xiàn)在,Atlas的“絕活兒”從滾地翻跟頭進(jìn)化到了空中180度轉(zhuǎn)體?赐暌曨l,有人發(fā)出了靈魂一問:這有什么用?
波士頓動(dòng)力的確在不斷打磨機(jī)器人的運(yùn)動(dòng)技能,提升平衡力。但這還處在基礎(chǔ)研究的范疇,并沒有跡象表明要把人形機(jī)器人投入到人類生活的場景中。
特斯拉開發(fā)的人形機(jī)器人“擎天柱”倒是注意到了生活場景。此前,馬斯克發(fā)布的視頻顯示,擎天柱機(jī)器人站在桌子旁,可以靈活地疊起一件黑色襯衫。
結(jié)果沒過多久,這個(gè)視頻被指出存在造假嫌疑,有人從視頻中看到機(jī)械臂。也就是說,擎天柱的動(dòng)作可能是人為操控而做出的,并非自主智能。面對(duì)質(zhì)疑,馬斯克也表示,擎天柱并不如外界所想象得那么厲害。
與這兩家公司不同,F(xiàn)igureAI一直在沿著機(jī)器人自主學(xué)習(xí)做開發(fā),也一直在朝著協(xié)助人類生活工作的愿景發(fā)展。這從公司對(duì)Figure01的研發(fā)重點(diǎn)中就可見一般。前期,F(xiàn)igureAI的重點(diǎn)是機(jī)器人的手指靈活性。
我們?cè)谝曨l中看到“遞蘋果”環(huán)節(jié),F(xiàn)igureAI就有意展現(xiàn)他家機(jī)器人靈敏的手指——Figure01用右手的大拇指、食指和中指拿起碟子上的蘋果,然后遞給了左手,用大拇指和食指掐住后傳遞給測試者。整個(gè)過程充分展示了Figure01的關(guān)節(jié)靈活度和力度控制能力。
Figure01能靈活抓取物體
這一次,F(xiàn)igure01展現(xiàn)了它對(duì)人類指令、語言的理解能力,是它作為家庭服務(wù)機(jī)器人的潛力;而此前計(jì)劃投入到寶馬工廠的消息,則是它可能作為工業(yè)機(jī)器人替代危險(xiǎn)工作崗位的能力。
這些都意味著,F(xiàn)igure01有望快速投產(chǎn)、實(shí)現(xiàn)商業(yè)化,這對(duì)投資人來說可太重要了,不然投資的錢什么時(shí)候才能得到回報(bào)?
可以說,F(xiàn)igure01有機(jī)會(huì)實(shí)現(xiàn)Atlas和“擎天柱”目前都還沒做到的事,即讓機(jī)器人落地到人類生產(chǎn)生活的具體場景中去。
如果照著這個(gè)路線發(fā)展下去,F(xiàn)igureAI大概率將成為第一家把人形機(jī)器人送到家庭中的公司。對(duì)于資本來說,變現(xiàn)也將指日可待。
文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請(qǐng)謹(jǐn)慎對(duì)待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。
2024年的Adobe MAX 2024發(fā)布會(huì)上,Adobe推出了最新版本的Adobe Creative Cloud。
奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。
“以前都要去窗口辦,一套流程下來都要半個(gè)月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。
華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準(zhǔn)的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實(shí)質(zhì)性的幫助,雙十一期間低至2799元,性價(jià)比很高,簡直是創(chuàng)作者們的首選。
9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會(huì)——工業(yè)互聯(lián)網(wǎng)標(biāo)識(shí)解析專題論壇在沈陽成功舉辦。