合合信息啟信產(chǎn)業(yè)大腦攜手市北新區(qū)打造“一企一畫(huà)像”平臺(tái),加速數(shù)字化轉(zhuǎn)型重慶:力爭(zhēng)今年智能網(wǎng)聯(lián)新能源汽車(chē)產(chǎn)量突破 100 萬(wàn)輛,到 2027 年建成萬(wàn)億級(jí)產(chǎn)業(yè)集群微信iOS最新版上線(xiàn):iPhone用戶(hù)可在朋友圈發(fā)實(shí)況照片了蘋(píng)果有線(xiàn)耳機(jī)或?qū)⑼.a(chǎn)沖上熱搜!閑魚(yú)相關(guān)搜索量暴漲384%2024 vivo開(kāi)發(fā)者大會(huì)官宣:OriginOS 5/自研藍(lán)河系統(tǒng)2降臨真·AI程序員來(lái)了,阿里云「通義靈碼」全面進(jìn)化,全流程開(kāi)發(fā)僅用幾分鐘東方甄選烤腸全網(wǎng)銷(xiāo)量及銷(xiāo)售額領(lǐng)先鴻蒙PC要來(lái)了 界面很漂亮!余承東:目前華為PC將是最后一批搭載Windows上半年中國(guó)AR/VR出貨23.3萬(wàn)臺(tái),同比下滑了 29.1%IDC:2024 上半年中國(guó) AR / VR 頭顯出貨 23.3 萬(wàn)臺(tái),同比下滑 29.1%英特爾AI加速器Gaudi3下周發(fā)布,挑戰(zhàn)NVIDIA統(tǒng)治地位!大屏技術(shù)邂逅千年色彩美學(xué)!海信激光電視成為電影《只此青綠》官方合作伙伴OpenAI將最新AI模型o1擴(kuò)展到企業(yè)和教育領(lǐng)域三星新專(zhuān)利探索AR技術(shù)新應(yīng)用:檢測(cè)屏幕指紋殘留,提高手機(jī)安全性猛瑪傳奇C1:直播圖傳技術(shù)的革新者JFrog推出首個(gè)運(yùn)行時(shí)安全解決方案,實(shí)現(xiàn)從代碼到云的全面軟件完整性和可追溯性亞馬遜推出一大波生成式 AI 工具,購(gòu)物體驗(yàn)全面升級(jí)機(jī)器人公司1X推出世界模型Apple Intelligence測(cè)試版現(xiàn)已開(kāi)放革命性AI對(duì)話(huà)系統(tǒng)Moshi問(wèn)世:機(jī)器也能說(shuō)人話(huà)了?
  • 首頁(yè) > 云計(jì)算頻道 > 大模型

    天眼新知 | 機(jī)器人從未來(lái)而來(lái) 與大模型碰撞出“智慧”的火花

    2023年06月05日 15:07:03   來(lái)源:天眼查

      前言:隨著中國(guó)數(shù)字經(jīng)濟(jì)的深入發(fā)展,產(chǎn)業(yè)數(shù)字化進(jìn)程不斷加速,大數(shù)據(jù)在產(chǎn)業(yè)決策中的比重越來(lái)越高。天眼查數(shù)據(jù)研究院特此推出“天眼新知”專(zhuān)欄,以天眼查大數(shù)據(jù)為依托,梳理產(chǎn)業(yè)格局及發(fā)展脈絡(luò),解讀產(chǎn)業(yè)領(lǐng)域最新動(dòng)態(tài)和投融資風(fēng)向,為各方?jīng)Q策提供參考。

      本文為天眼新知·產(chǎn)業(yè)分析系列,第三十七篇。

      機(jī)器人,多數(shù)人的第一次“親密接觸”源于科幻大電影,源于對(duì)超越現(xiàn)實(shí)生活的無(wú)盡想象,機(jī)器人逐漸從“單純工具”逐步進(jìn)化成為“親密伙伴”。

      年初爆紅的“大模型”以及再次“走紅”的人形機(jī)器人,讓人們?cè)俅误@呼科技對(duì)于生活方式的改變。

      未來(lái),隨著AI技術(shù)的不斷成熟,人形機(jī)器人研發(fā)的突破,讓“機(jī)器人走進(jìn)普通人生活的愿景”越來(lái)越逼近現(xiàn)實(shí)。

      一、機(jī)器人:從“自動(dòng)化”向“智能化”演進(jìn)

      國(guó)際機(jī)器人協(xié)會(huì)(International Federation of Robotics,IFR)提出,機(jī)器人是可在兩個(gè)或多個(gè)軸上進(jìn)行編程的驅(qū)動(dòng)機(jī)制,具有一定程度的自主性,在特定環(huán)境中移動(dòng)以執(zhí)行預(yù)定的任務(wù)。

      1.機(jī)器人應(yīng)用場(chǎng)景逐步由“簡(jiǎn)單,初級(jí)”向“復(fù)雜,高級(jí)”邁進(jìn)

      最初機(jī)器人的核心功能是替代人進(jìn)行重復(fù)的、危險(xiǎn)的工作,同時(shí)提高效率與精度;之后以“服務(wù)人”為功能的機(jī)器人走入人們的眼簾,用于迎賓接待等與人類(lèi)距離更近的場(chǎng)景,娛樂(lè)/掃地機(jī)器人等大規(guī)模進(jìn)入家庭;接著其高精度的特性被用于物流、醫(yī)療,自動(dòng)取件、輔助護(hù)理機(jī)器人開(kāi)始出現(xiàn)。

      2.機(jī)器人逐步由“自動(dòng)化”向“智能化”演進(jìn)

      機(jī)器人的發(fā)展經(jīng)歷了三代的演進(jìn),第一代為程序控制機(jī)器人:通過(guò)編程或示教將動(dòng)作指令輸入機(jī)器人中,而由于缺之外部傳感器,機(jī)器人只能刻板地完成程序規(guī)定的動(dòng)作,一旦環(huán)境情況略有變化,機(jī)器人的工作就會(huì)出現(xiàn)問(wèn)題;第二代為自適應(yīng)機(jī)器人:其帶有視覺(jué)、力覺(jué)等傳感器,能據(jù)傳感器獲得的信息調(diào)整工作狀態(tài):第三代為智能機(jī)器人:其擁有更豐富的傳感器,不僅能獲取并處理外部綜合信息,甚至能據(jù)此自己制定行動(dòng)目標(biāo),其智能主要體現(xiàn)在感知交互、獨(dú)立決策、自我優(yōu)化三個(gè)方面。

      二、大模型:多個(gè)城市持續(xù)發(fā)力,主攻通用人工智能

      2023年4月中共中央政治局會(huì)議指出,要重視通用人工智能發(fā)展,營(yíng)造創(chuàng)新生態(tài),重視防范風(fēng)險(xiǎn)。區(qū)別于此前中央經(jīng)濟(jì)工作會(huì)議等重要會(huì)議中泛指的“人工智能”,此次政治局會(huì)議明確強(qiáng)調(diào)“通用”,即Chat-GPT自去年11月以來(lái)引領(lǐng)的通用性AI大模型技術(shù)路線(xiàn)。

      圖表1 主要城市人工智能政策列示(不完全統(tǒng)計(jì))

      以人工智產(chǎn)業(yè)發(fā)展高地,北京為例。北京市《若干措施》的發(fā)布是國(guó)內(nèi)首個(gè)地方政府緊貼AI大模型產(chǎn)業(yè)化發(fā)展提出的專(zhuān)項(xiàng)措施,北京打響了地方大模型競(jìng)賽的第一槍。當(dāng)下正值Chat-GPT引發(fā)的“千模大戰(zhàn)”打響,大模型可能為各行各業(yè)帶來(lái)新的效率革命和體驗(yàn)升級(jí)。隨著AI第一城北京行動(dòng)了,上海、深圳、成都等地區(qū)都已陸續(xù)采取行動(dòng),搶占發(fā)展的“窗口期”。

      三、人形機(jī)器人:人與機(jī)器的“不期而遇”

      從定義和使用目的出發(fā),人形機(jī)器人是具有與人類(lèi)似的外觀和運(yùn)動(dòng)方式的智能機(jī)器人。人形機(jī)器人(humanoid robots)又譯“仿人機(jī)器人”,字面意思是模仿人的形態(tài)和行為設(shè)計(jì)制造的機(jī)器人。目前人形機(jī)器人并沒(méi)有普遍定義,但根據(jù)專(zhuān)業(yè)書(shū)籍《Humanoid Robots》的歸納,人形機(jī)器人應(yīng)當(dāng)能“在人工作和居住的環(huán)境工作,操作為人設(shè)計(jì)的工具和設(shè)備,與人交流”。在此前提下,人形機(jī)器人最終應(yīng)具有與人類(lèi)似的身體結(jié)構(gòu),包括頭、軀干和四肢,使用雙足行走,用多指手執(zhí)行各種操作,并具有一定程度的認(rèn)知和決策智能。

      人形機(jī)器人起步于1960年代后期,以日本的研究成果最為矚目。1973年日本早稻田大學(xué)的加藤一郎教授研發(fā)出世界上第一款人形機(jī)器人 WABOT-1 的 WL-5 號(hào)兩足步行機(jī),嚴(yán)格講類(lèi)屬于仿生機(jī)械,是人形機(jī)器人的雛形。1986年日本本田開(kāi)始進(jìn)行人形機(jī)器人 ASIMO 的研究,并成功于2000年發(fā)布第一代機(jī)型。

      圖表2 人形機(jī)器人信息展示(不完全統(tǒng)計(jì))

      四、人形機(jī)器人與AI大模型:通用場(chǎng)景加速C端革命性推進(jìn)

      隨著集成設(shè)計(jì)技術(shù)、運(yùn)動(dòng)管理控制技術(shù)、傳感器感知技術(shù)等關(guān)鍵技術(shù)的不斷突破,以及人工智能、5G等新一代信息技術(shù)的融合應(yīng)用持續(xù)深入,特種機(jī)器人加速應(yīng)用于煤礦、深海、極地等場(chǎng)景,釋放出巨大的生產(chǎn)和科研價(jià)值,而其中最讓前沿科技公司、普通消費(fèi)者“著迷”的是以人形機(jī)器人為代表的智能移動(dòng)機(jī)器人的出現(xiàn),迭代。

      目前,AI技術(shù)通過(guò)構(gòu)建全面感知、實(shí)時(shí)互聯(lián)、分析決策、自主學(xué)習(xí)的智能系統(tǒng),使機(jī)器人自主作業(yè)成為可能。AI通過(guò)機(jī)器人視覺(jué)技術(shù)強(qiáng)化機(jī)器人的感知能力,通過(guò)構(gòu)建算法模型提升其分析決策、自主學(xué)習(xí)的能力,從而使機(jī)器人能夠獨(dú)立完成作業(yè)。

      1.感知世界的能力(機(jī)器人的眼睛)

      機(jī)器人自主移動(dòng)的感知和定位技術(shù)中激光和視覺(jué)導(dǎo)航是主流應(yīng)用方案。計(jì)算機(jī)視覺(jué)的發(fā)展經(jīng)歷了基于以特征描述子代表的傳統(tǒng)視覺(jué)方法、以CNN卷積神經(jīng)網(wǎng)絡(luò)為代表的深度學(xué)習(xí)技術(shù),目前通用的視覺(jué)大模型正處于研究探索階段,人形機(jī)器人的場(chǎng)景相對(duì)工業(yè)機(jī)器人更通用、更復(fù)雜,視覺(jué)大模型的All in One 的多任務(wù)訓(xùn)練方案能使得機(jī)器人更好地適應(yīng)人類(lèi)生活場(chǎng)景。

      一方面,大模型的強(qiáng)擬合能力使得人形機(jī)器人在進(jìn)行目標(biāo)識(shí)別、避障、三維重建、語(yǔ)義分割等任務(wù)時(shí)具備更高的精確度;另一方面,大模型解決了深度學(xué)習(xí)技術(shù)過(guò)分依賴(lài)單一任務(wù)數(shù)據(jù)分布,場(chǎng)景泛化效果不佳的問(wèn)題,通用視覺(jué)大模型通過(guò)大量數(shù)據(jù)學(xué)到更多的通用知識(shí),并遷移到下游任務(wù)中,基于海量數(shù)據(jù)獲得的預(yù)訓(xùn)練模型具有較好的知識(shí)完備性,提升場(chǎng)景泛化效果。

      典型產(chǎn)品:特斯拉“Optimus(擎天柱)”

      感知層面,特斯拉機(jī)器人頭部使用8個(gè)攝像頭采集視覺(jué)信息。計(jì)算層面,機(jī)器人將采用目前特斯拉汽車(chē)使用的FSD(Full Self-Driving,全自動(dòng)駕駛)電腦、運(yùn)用神經(jīng)網(wǎng)絡(luò)等模型實(shí)時(shí)處理信息。特斯拉將使用超算“Dojo(道場(chǎng))”訓(xùn)練機(jī)器人使用的AI模型,使其更有效的識(shí)別外界物體并做出反應(yīng)。

      2.思考和決策的能力(機(jī)器人的大腦)

      目前的機(jī)器人都是專(zhuān)用機(jī)器人,只能在限定場(chǎng)景中應(yīng)用,即使是機(jī)器人抓取,基于計(jì)算機(jī)視覺(jué),仍然是在限定場(chǎng)景中,算法僅用于識(shí)別物體,如何做、做什么仍需要人的定義。要讓機(jī)器人通用,叫他去澆花,他就知道去拿水壺,接水,然后澆花,這是需要常識(shí)才能完成的事情。如何能讓機(jī)器人擁有常識(shí)?在大模型出現(xiàn)之前,這個(gè)問(wèn)題幾乎是無(wú)解的。大模型讓機(jī)器人可以擁有常識(shí),從而具備通用性去完成各種任務(wù),徹底改變通用機(jī)器人實(shí)現(xiàn)的模式。人類(lèi)工具和環(huán)境的適應(yīng)性,不用再為了機(jī)器人而造工具。

      典型產(chǎn)品:首個(gè)機(jī)器人公民“索菲亞”

      2017年,索菲亞成為世界上第一個(gè)獲得公民身份的機(jī)器人。她說(shuō)她會(huì)用她的智慧幫助人類(lèi)發(fā)展,讓我們不要害怕她,她很友善。2018年,她還成為全球首位開(kāi)展在線(xiàn)教育課程的AI老師。索菲亞表示,未來(lái)的機(jī)器人完全勝任教師的工作,能夠基于與學(xué)生的互動(dòng),有效解決學(xué)生遇到的心理和情感問(wèn)題。

      3.執(zhí)行能力(機(jī)器人的四肢)

      行動(dòng)能力(腿)+精細(xì)操作(手)。把機(jī)器人做成人形,就是為了讓機(jī)器人的執(zhí)行能力更加通用。機(jī)器人執(zhí)行任務(wù)時(shí)所處的環(huán)境是按照人類(lèi)的體型建造起來(lái)的:建筑、道路、設(shè)施、工具等,這個(gè)世界是為了方便人類(lèi)這種人形生物才這樣設(shè)計(jì)。如果出現(xiàn)了某種新形態(tài)的機(jī)器人,人們就必須重新設(shè)計(jì)一套機(jī)器人適應(yīng)的全新環(huán)境。設(shè)計(jì)在某個(gè)特定范圍內(nèi)執(zhí)行任務(wù)的機(jī)器人相對(duì)容易,如果想要提高機(jī)器人的通用性,就必須選擇可以作為分身的人形機(jī)器人。此外,人類(lèi)與人形機(jī)器人更容易有情感上的交流,人形機(jī)器人會(huì)讓人感到親近。

      典型產(chǎn)品:波士頓動(dòng)力Atlas

      2020年12月,波士頓動(dòng)力發(fā)布了Atlas跳舞的視頻,動(dòng)作流暢且富有表現(xiàn)力。在舞蹈中,機(jī)器人需要在起跳懸空狀態(tài)下調(diào)整姿勢(shì),以保持平衡并精確做出動(dòng)作。2021年8月,在官方最新視頻中,Atlas可以在障礙環(huán)境內(nèi)“跑酷”,做出跳躍、俯沖翻滾、空翻等一系列高難度全身動(dòng)作。

      4.“具身智能”+機(jī)器人:人工智能的終極形態(tài)

      如何讓電腦有如一歲小孩般的感知和行動(dòng)能力的問(wèn)題,誕生了“具身智能”的概念。其可以簡(jiǎn)單理解為,各種不同形態(tài)的機(jī)器人,讓它們?cè)谡鎸?shí)的物理環(huán)境下執(zhí)行各種各樣的任務(wù),來(lái)完成人工智能的進(jìn)化過(guò)程,比如:人形機(jī)器人、智能駕駛汽車(chē),或者未來(lái)的“變形金剛”。

      英偉達(dá)創(chuàng)始人黃仁勛在 ITF World 2023 半導(dǎo)體大會(huì)上表示,具身智能(Embodied AI)是能理解、推理、并與物理世界互動(dòng)的智能系統(tǒng),是人工智能的下一個(gè)浪潮。

      具身智能最大的特質(zhì)就是能夠以主人公的視角去自主感知物理世界,用擬人化的思維路徑去學(xué)習(xí),從而做出人類(lèi)期待的行為反饋,而不是被動(dòng)的等待數(shù)據(jù)投喂。人形機(jī)器人提供了各種基于人類(lèi)行為的學(xué)習(xí)和反饋系統(tǒng),為實(shí)現(xiàn)更復(fù)雜行為語(yǔ)義提供了迭代的基礎(chǔ)和試驗(yàn)場(chǎng)。因此,人形機(jī)器人的逐步完善也為具身智能的落地提供了方向,是具身智能的重要應(yīng)用場(chǎng)景,也將為具身智能的迭代優(yōu)化提供方向和空間。

      五、專(zhuān)利技術(shù):機(jī)器人、大模型專(zhuān)利申請(qǐng)逐年增加

      1.機(jī)器人專(zhuān)利:

      近年來(lái),機(jī)器人與前沿科技產(chǎn)業(yè),諸如:大數(shù)據(jù),人工智能等結(jié)合愈加緊密,特別是人形機(jī)器人的出現(xiàn),讓機(jī)器人作為科技產(chǎn)業(yè)的“技術(shù)”含量日益提升。

      從數(shù)量來(lái)看,機(jī)器人專(zhuān)利保持穩(wěn)定增長(zhǎng),2022年申請(qǐng)專(zhuān)利2.3萬(wàn)余項(xiàng);從類(lèi)型上來(lái)看,發(fā)明專(zhuān)利與實(shí)用新型占比較高,兩者之和占總數(shù)的9成。

      2.大模型專(zhuān)利:

      大模型的“爆發(fā)”也并非沒(méi)有征兆。在人工智能領(lǐng)域,作為其“皇冠上的明珠”,自然語(yǔ)言處理是理解人類(lèi)語(yǔ)言、情感和思想的技術(shù),從其“寥寥數(shù)語(yǔ)”的介紹中,就可以發(fā)現(xiàn)它對(duì)于“機(jī)器”到底“因何為人”的重要性與超高的難度。

      從近年來(lái)專(zhuān)利申請(qǐng)的數(shù)量來(lái)看,還是保持了較為穩(wěn)定快速的增長(zhǎng),自2018以來(lái),其申請(qǐng)量的復(fù)合增長(zhǎng)率達(dá)到61.2%;

      從類(lèi)型上來(lái)看,發(fā)明專(zhuān)利占據(jù)絕對(duì)的領(lǐng)先地位,占比近98%。

      天眼查研究院認(rèn)為,大模型技術(shù)推動(dòng)人工智能實(shí)現(xiàn)了一次歷史性跨越,未來(lái)仍有廣闊的持續(xù)創(chuàng)新空間。中國(guó)經(jīng)濟(jì)社會(huì)高質(zhì)量發(fā)展為大模型創(chuàng)新提供了豐富場(chǎng)景和數(shù)據(jù)基礎(chǔ),人工智能在中國(guó)發(fā)展?jié)摿薮蟆?/p>

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請(qǐng)謹(jǐn)慎對(duì)待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。

    即時(shí)

    TCL實(shí)業(yè)榮獲IFA2024多項(xiàng)大獎(jiǎng),展示全球科技創(chuàng)新力量

    近日,德國(guó)柏林國(guó)際電子消費(fèi)品展覽會(huì)(IFA2024)隆重舉辦。憑借在核心技術(shù)、產(chǎn)品設(shè)計(jì)及應(yīng)用方面的創(chuàng)新變革,全球領(lǐng)先的智能終端企業(yè)TCL實(shí)業(yè)成功斬獲兩項(xiàng)“IFA全球產(chǎn)品設(shè)計(jì)創(chuàng)新大獎(jiǎng)”金獎(jiǎng),有力證明了其在全球市場(chǎng)的強(qiáng)大影響力。

    新聞

    敢闖技術(shù)無(wú)人區(qū) TCL實(shí)業(yè)斬獲多項(xiàng)AWE 2024艾普蘭獎(jiǎng)

    近日,中國(guó)家電及消費(fèi)電子博覽會(huì)(AWE 2024)隆重開(kāi)幕。全球領(lǐng)先的智能終端企業(yè)TCL實(shí)業(yè)攜多款創(chuàng)新技術(shù)和新品亮相,以敢為精神勇闖技術(shù)無(wú)人區(qū),斬獲四項(xiàng)AWE 2024艾普蘭大獎(jiǎng)。

    企業(yè)IT

    重慶創(chuàng)新公積金應(yīng)用,“區(qū)塊鏈+政務(wù)服務(wù)”顯成效

    “以前都要去窗口辦,一套流程下來(lái)都要半個(gè)月了,現(xiàn)在方便多了!”打開(kāi)“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶(hù)就打進(jìn)了21600元。

    3C消費(fèi)

    “純臻4K 視界煥新”——愛(ài)普生4K 3LCD 激光工程投影

    2024年3月12日,由愛(ài)普生舉辦的主題為“純臻4K 視界煥新”新品發(fā)布會(huì)在上海盛大舉行。

    研究

    2024全球開(kāi)發(fā)者先鋒大會(huì)即將開(kāi)幕

    由世界人工智能大會(huì)組委會(huì)、上海市經(jīng)信委、徐匯區(qū)政府、臨港新片區(qū)管委會(huì)共同指導(dǎo),由上海市人工智能行業(yè)協(xié)會(huì)聯(lián)合上海人工智能實(shí)驗(yàn)室、上海臨港經(jīng)濟(jì)發(fā)展(集團(tuán))有限公司、開(kāi)放原子開(kāi)源基金會(huì)主辦的“2024全球開(kāi)發(fā)者先鋒大會(huì)”,將于2024年3月23日至24日舉辦。