百川智能發(fā)布全鏈路領域增強金融大模型 Baichuan4-Finance年末家電消費觀察:品質生活類產(chǎn)品熱賣,將持續(xù)迎來剛需式普及?GPT-5研發(fā)受阻:OpenAI 新一代模型難見突破性進展新一代語言模型ModernBERT發(fā)布,RAG等任務處理速度快四倍、成本低新研究顯示:Anthropic 的 Claude AI 在合作能力上領先于 OpenAI 和谷歌模型谷歌向投資者保證人工智能本月將迎來“驚人”表現(xiàn)多模態(tài)大模型引爆應用場景 階躍星辰完成數(shù)億美元融資星動紀元發(fā)布端到端原生機器人大模型ERA-42 實現(xiàn)機器人復雜場景操作免費模式強攻下,快手、抖音用“短劇VIP”反擊?低碳存儲助力算力產(chǎn)業(yè) 富士膠片首次亮相IDC大會行業(yè)唯一!海爾熱聲熱泵技術獲全國顛覆性技術創(chuàng)新大賽最高獎OPPO A5 Pro首創(chuàng)獵手天線架構:信號能穿十堵墻一加 Ace 5 Pro首發(fā)電競Wi-Fi芯片G1 帶來「穿墻王」和「搶網(wǎng)王」般的網(wǎng)絡體驗電視市場又出黑馬!TCL同檔Mini LED音畫王P12K,萬象分區(qū)打造超強控光!零下25℃如何取暖?海爾水暖通溫暖驛站亮相冰雪大世界馬太效應,強者恒強?——《中國企業(yè)科創(chuàng)力研究報告(2024)》美團年度報告竟然用上了AI和短。窟@下是真出圈了消息稱上汽大眾正開發(fā)三款新車,技術分別來自小鵬、智己和榮威鴻蒙智行泊車代駕VPD正式開啟全量推送!升級自動泊車/接駕等多項功能華為官方翻新手機最高降價4000元
  • 首頁 > 云計算頻道 > 大模型

    國產(chǎn)大模型卷翻機器人!這些火遍全網(wǎng)的機器人,都裝上了星火「大腦」

    2024年04月25日 14:29:12   來源:新智元公眾號

      大模型這把火點燃了整個機器人行業(yè)的熱情?v觀全世界,過去幾個月,國內(nèi)外大模型大廠和機器人初創(chuàng)公司的合作也是動作不斷?磥,機器人的元年真的來了!

      大模型,已然卷入機器人領域。

      3月初,初創(chuàng)公司Figure發(fā)布了首個由OpenAI大模型加持的人形機器人Figure01的演示。

      憑借LLM「大腦」,F(xiàn)igure01可以看到桌面上的蘋果,動手收拾餐具,并與人類進行無縫交流。

      在電動Atlas官宣當天,初創(chuàng)公司Mentee Robotics也展示了首個Menteebot人形機器人,通過自然語言即可交流。

      同樣,得到大模型加持的Menteebot,能解釋命令,并思考、決策、完成任務。

      在大模型浪潮下,類似的案例近一年來層出不窮。

      反觀國內(nèi),大模型助推下,機器人領域也是熱度不減。

      年初,具有「人形機器人第一股」之稱的優(yōu)必選股價創(chuàng)下2天3倍的暴漲走勢,與之呼應的是大模型廠商近期與機器人行業(yè)的合作也是動作不斷。

      有行業(yè)專家表示,具備多模態(tài)LLM大腦的機器人時代終于來臨了。這些機器人將能夠理解指令并執(zhí)行任務:可以使用筆記本、刷碗、沖泡咖啡,妥妥的AGI!

      顯然,大模型賦能機器人蘊藏著巨大的潛力,成為科技大廠為數(shù)不多的一個共識。

      「具身智能」大爆發(fā),元年已來

      人們都說,2024年是機器人的元年。

      大模型的橫空出世,無疑讓機器人行業(yè)再次成為研究界和產(chǎn)業(yè)界的一大亮點。

      先來看一張圖,直觀地感受下,當前全世界取得進展的機器人公司。

      正如許多人期待的那樣,AGI真正到來的那天,「具身智能」正是不可或缺的重要硬件載體。

      從過去一年至今,機器人領域的投資市場不斷持續(xù)升溫,迎來了高光時刻。

      研究公司Robot Report數(shù)據(jù)顯示,今年前3個月,機器人初創(chuàng)公司籌集了32億美元資金,去年同期為17億美元。

      在國外,OpenAI押注的兩家人形機器人初創(chuàng)公司1X、Figure紛紛得到新一輪的融資。

      還有硅谷服務機器人Bear Robotics、專為機器人開發(fā)大腦Physical Intelligence、還未創(chuàng)收的Skild等機器人初創(chuàng)公司,同樣受到資本的追捧。

      國內(nèi)以優(yōu)必選為代表,2023年12月底上市即成為人形機器人第一股;如前所述,股票一路攀升。

      不久前,工業(yè)版人形機器人Walker S都已經(jīng)進入車間開始打工了。

      此外,宇樹人形機器人在今年2月完成了近10億元的B2輪融資,其產(chǎn)品宇樹H1更是火到了國外。

      根據(jù)網(wǎng)友的統(tǒng)計,僅在今年第一季度,國內(nèi)機器人市場就有20多起融資案例。

      可見,大量資本的注入,將機器人行業(yè)的熱潮推向了最高點。

      實際上,對于每個人來說,機器人早已不是什么新鮮事物。

      為什么大模型的加入,讓其迎來了ChatGPT時刻?

      為什么需要多模態(tài)LLM

      眾所周知,傳統(tǒng)機器人有著一個明顯的局限性——需要明確的指令。

      掌握單個技能,諸如開門、拉抽屜、拾取和操縱某物,對于它們來說,并不難。

      然而,想要讓機器人去完成多個技能結合的任務,是非常困難的。

      這就是為什么大模型的出現(xiàn),破解了傳統(tǒng)機器人需要明確指令,才能執(zhí)行任務的僵化問題。

      簡單來說,LLM可以將松散定義的指令,映射到機器人技能范圍內(nèi)的特定任務序列。

      比如,當你對機器人點頭時,如何讓它也能友好地向你點頭?

      來自多倫多大學、谷歌DeepMind等機構開發(fā)的GenEM,利用GPT-4豐富的知識儲備,將「點頭」這一抽象行為,轉化為機器人可輸出的特定動作。

      然而,通往具身智能AGI的路上,僅依靠大語言模型是不夠的。

      這是因為,圖像、文字、語音、視頻等各種多模態(tài)信息,構成了我們的現(xiàn)實世界。而人類的感受、溝通,都是在以多模態(tài)形式進行。

      對于智能機器人來說,也是必須具備的能力。

      比如,當機器人想要正確執(zhí)行「有點累,幫我去拿一杯提神的飲品」這條指令時,最關鍵是完成「多模理解」。

      看到桌面上的一堆食物,哪個才是咖啡呢?

      在理解語音指令、拆解任務步驟之后,機器人需要識別「視線」里的物體,判斷推理出哪瓶飲料是符合指令意思需要拿取的。

      不僅如此,嗅覺、味覺之類的智能,也將是機器人未來逐漸擴展的領域。

      總而言之,多模態(tài)能力對于真正要進入家庭的機器人來說必不可少,尤其是多模理解尤為重要。

      國產(chǎn)頂流:訊飛星火大模型

      看得出,市場對機器人的熱情,已完全被AI大模型點燃。

      國內(nèi)一家成立25年的公司,曾在2022年就啟動了「超腦2030計劃」,暢想著能夠讓機器人走進每個家庭。

      這一計劃共分為三個階段,通過逐步推進,讓AI可以懂知識、善學習、能進化。

      一直以來,基于對前沿技術的不斷探索,背后這家公司——科大訊飛正朝著目標前進。

      先是在2022年科大訊飛全球1024開發(fā)者大會上,首次發(fā)布了「訊飛機器人超腦平臺」。

      這一平臺面向開發(fā)者,提供了全棧的工具鏈,包括模型訓練、資產(chǎn)生成和軟硬件接入等等。

      ChatGPT引爆大模型熱潮之后,科大訊飛在23年5月首次發(fā)布「訊飛星火大模型」,并在一年多的時間完成了5次迭代。

      而初代訊飛星火大模型就具備了體現(xiàn)通用人工智能的七大維度,包括文本生成、語言理解、知識問答、邏輯推理、數(shù)學能力、代碼能力以及多模態(tài)能力。

      在接下來的6月、8月、和10月以及今年1月,訊飛星火大模型完成了從V1.5、V2.0,到V3.0、V3.5的迭代升級。

      大模型打破傳統(tǒng)認知智能的天花板,為機器人更加深入地理解世界奠定了堅實的基礎。

      然而,要充分整合這些先進技術,以促進機器人在人機互動、任務規(guī)劃和環(huán)境適應等方面的顯著進步,還需要依賴專門的系統(tǒng)。

      為「機器人超腦平臺」注入靈魂

      為此,科大訊飛在2023年7月正式將訊飛星火大模型與「機器人超腦平臺」進行了深度的融合。

      具體來說,科大訊飛機器人超腦平臺,是以訊飛超腦2030技術為底座打造的,一個面向物理世界、虛擬世界和元宇宙的機器人開發(fā)平臺。

      它以多模態(tài)感知表達、開放式語義理解、大小腦協(xié)同運動控制和軟硬件接入為核心,可以幫開發(fā)者快速搭建實體機器人和虛擬數(shù)字人產(chǎn)品。

      如今,人形機器人在實際應用時,面臨的挑戰(zhàn)更多了。

      你是不是經(jīng)常在商場遇到機器人,雞同鴨講,根本講不了兩句話,就被逼瘋了?

      在這樣的嘈雜環(huán)境中,人與機器人的交互,簡直難上加難。

      又或是,當你讓機器人講一個笑話時,那一本正經(jīng)的播音腔,簡直就是尷尬氛圍組上線。

      而破解這些問題的關鍵是,讓機器人更好地「拾音」,且說話不再有那么重的「機器味兒」。

      訊飛機器人超腦平臺從「視聽融合的多模態(tài)感知交互」和「大模型理解決策」兩個方面,解決了這一難題。

      首先,就是打造機器人交互的新范式。

      為此,訊飛機器人超腦平臺融合了語音、視覺、語義等多個維度的信息。

      通過升級麥克風陣列算法,融合聲音、人臉、和唇形信息,即使在嘈雜、高噪的場景下,機器人都能精準拾音,實現(xiàn)復雜場景「聽得清」。

      同時,通過語音大模型和超擬人合成技術,機器人「聽得準」,「答得自然」,讓機器人聊起天來更有生命力和感染力了!

      其次,就是機器人的交互大腦。

      這個大腦,毫無疑問就是基于訊飛星火大模型,實現(xiàn)了控制級指令、官方技能、核心業(yè)務功能、快速知識問答、閑聊陪伴等多交互場景的統(tǒng)一。

      對于每個孩子來說,如果機器人能以媽媽的聲音、口吻講睡前故事,才堪稱真正的「陪伴」機器人。

      但若要實現(xiàn)這一點,還需要機器人具備情感化和高表現(xiàn)力的合成能力。

      對此,訊飛機器人超腦平臺還設計了多風格、多情感的AI人設,能夠讓每個機器人都與眾不同。

      順便提一句,訊飛機器人超腦平臺的虛擬人驅動協(xié)議已全面開放。

      三方數(shù)字人產(chǎn)品通過接入該驅動協(xié)議,可以實現(xiàn)與訊飛數(shù)字人同等的交互效果。

      訊飛機器人超腦平臺已賦能四大領域398家機器人客戶,深度鏈接1.3萬名機器人開發(fā)者。

      星火加持,機器人飛升

      為了進一步擴大合作生態(tài),2024年4月15日,科大訊飛正式啟動「星河行動」計劃,招募生態(tài)合作伙伴共同推進機器人產(chǎn)業(yè)的繁榮。

      而在此之前,有很多來自不同細分領域的國內(nèi)頭部機器人廠商,就已經(jīng)用上了科大訊飛星火大模型的強大能力。

      當前,在許多人看來,人形機器人是最好的通用具身形態(tài)。

      當機器人走向落地,人形并不一定是完成任務最好的形態(tài)。它可以是一個機械臂,也可以是輪式......

      科大訊飛與穿山甲機器人公司合作已久,一直共同探索AI技術與機器人的融合,不斷拓寬服務機器人應用新的邊界。

      這家公司旗下新款小魚、艾米、小雪等AI服務機器人,全都搭載了訊飛機器人超腦平臺,以及訊飛星火大模型技術。

      基于訊飛先進的語音識別、AI技術,機器人可以流暢地進行自然語言對話,迅速理解并給出準確回答。

      同時,憑借著豐富的技術儲備,它們還能提供各類信息和建議。

      穿山甲機器人已廣泛應用到餐飲、政務、教育、醫(yī)療等領域

      當然還有家庭服務機器人,樂天派便是其中的代表之一。

      通過接入訊飛星火大模型和多模態(tài)交互,這款桌面黑科技機器人成為孩子們的貼心「小管家」。

      只需要一聲呼喚,不論是娛樂、還是遇到學習生活難題,它都能以前所未有交互能力陪伴孩子。

      而在頭部人形機器人中,也少不了科大訊飛核心技術的身影。

      我們熟知的,智元機器人、優(yōu)必選、宇樹科技等公司,都得到了訊飛全鏈路語音,以及訊飛星火大模型的加持。

      還有近日官宣合作的EX機器人,更是將雙方各自優(yōu)勢完美結合。

      基于訊飛機器人超腦平臺,將訊飛星火大模型和多模態(tài)交互技術應用到EX仿生機器人中,實現(xiàn)了與人一樣的思考、對話和動作。

      除以上的案例之外,科大訊飛生態(tài)「朋友圈」還在不斷擴大。

      機器人開發(fā),最好的時代

      我們還應該看到,機器人的發(fā)展不僅依靠AI大腦的技術迭代,還需要「身體」并行。

      隨著機器人行業(yè)的逐步發(fā)展,機器人行業(yè)內(nèi)的組件供應也開始向專業(yè)化、成熟化方向發(fā)展。

      4月2日,在上海召開的中國人形機器人生態(tài)大會上,可以看到機器人部件廠商也獲得了長足的發(fā)展——

      人形機器人通用底座、機器狗通用底座、機器人超腦板、多模態(tài)語音交互、3D視覺芯片、靈活機械手、機器人伺服電機、3D打印框架等廠商均參加展出。

      會場進行了多項專題報告,比如「多模態(tài)+大模型,構建人形機器人新交互」、「人形機器人感知技術與發(fā)展」等細分領域的成果展示。

      對于機器人行業(yè)的創(chuàng)業(yè)者和開發(fā)者來說,這將是最好的時代!

      大量模塊化、可快速整合的行業(yè)平臺及部件,讓機器人的開發(fā)不再需要像過去一樣,從0開始做算法。

      尤其是,像訊飛機器人超腦平臺已經(jīng)引入大模型的通用開放平臺,進一步將機器人的常規(guī)算法和人機交互開發(fā)難度降低到了「拿來即用」的地步。

      再加上,訊飛機器人超腦平臺已經(jīng)打通了對接鏈路公司(宇樹、智元、EX機器人等)的成熟機器人硬件體系。

      這意味著,二次應用開發(fā)將會成為入行最快、產(chǎn)品最快滿足客戶需求的方式之一。

      顯然,機器人底層硬件配套已初步具備,LLM技術更是賦予了機器人交互的核心。

      接下來,針對客戶需求的挖掘、痛點解決方案和用戶貼身服務的內(nèi)容,尚需進一步打磨。

      這,將是機器人行業(yè)萬眾創(chuàng)業(yè)的開端。

      大模型+機器人,前景一片大好

      下一步,就是在LLM和機器人加速融合后,如何推動商業(yè)化落地?

      從認知能力上來看,AI機器人的發(fā)展愈加接近人類。甚至,在外表方面,也變得更像人類了。

      波士頓咨詢公司(BCG)估計,到2030年,全球機器人市場規(guī)模將達到1600億美元-2600億美元。

      也就說,LLM+機器人未來的市場前景非常廣闊,可以深入應用于各種工業(yè)領域和人類生活場景。

      在制造業(yè)領域,裝配線上的機器人能夠生產(chǎn)出,人類工人無法比擬的高質量和一致性的商品。

      在倉庫和物流公司中,AI機器人能夠完成重型搬運工作,諸如運送產(chǎn)品、放置在貨架等任務,大大減輕了人類勞動力的負擔。

      就比如,亞馬遜物流倉庫中的75萬機器人大軍,已全面投入了使用。

      除了工業(yè)領域的機器人,AI醫(yī)療機器人還可以幫助醫(yī)生做手術,做出更準確的診斷,也能引導患者完成物理治療和康復。

      展望未來,在餐館、太空探索、教育、養(yǎng)老院等諸多場景中,都將得到AI機器人的全面覆蓋。

      不難料到,機器人的曙光已經(jīng)到來,它正在以我們幾十年前只能想象的方式重塑整個世界。

      科大訊飛所做的,就是用技術革新,讓機器人走進每個家庭。

      文章內(nèi)容僅供閱讀,不構成投資建議,請謹慎對待。投資者據(jù)此操作,風險自擔。

    即時

    新聞

    明火炊具市場:三季度健康屬性貫穿全類目

    奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。

    企業(yè)IT

    重慶創(chuàng)新公積金應用,“區(qū)塊鏈+政務服務”顯成效

    “以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關材料,僅幾秒鐘,重慶市民曾某的賬戶就打進了21600元。

    3C消費

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,高能實力,創(chuàng)

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實質性的幫助,雙十一期間低至2799元,性價比很高,簡直是創(chuàng)作者們的首選。

    研究

    中國信通院羅松:深度解讀《工業(yè)互聯(lián)網(wǎng)標識解析體系

    9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會——工業(yè)互聯(lián)網(wǎng)標識解析專題論壇在沈陽成功舉辦。