抖音短劇會(huì)員制,用戶爭(zhēng)奪下的折中嘗試接手高德近一年,郭寧找到最優(yōu)路線了嗎?市值首次突破千億大關(guān),江淮汽車能被看好嗎?迅雷發(fā)布2024年第三季度財(cái)報(bào): 凈利潤(rùn)440萬(wàn)美元B站發(fā)布2024年Q3財(cái)報(bào):首次實(shí)現(xiàn)單季度盈利健康行業(yè)雙11數(shù)據(jù)戰(zhàn)報(bào):銷量飆升 健康消費(fèi)成熱潮零碳科技賦能鄉(xiāng)村振興,下黨零碳示范正式落成教育行業(yè)雙11數(shù)據(jù)戰(zhàn)報(bào):教育智能硬件市場(chǎng)火爆極米雙11戰(zhàn)報(bào):全渠道GMV破7億 總銷量破21萬(wàn)臺(tái)消息稱三星正考慮委托臺(tái)積電量產(chǎn)Exynos芯片蘋果遭4000萬(wàn)英國(guó)iCloud用戶集體訴訟,面臨30億英鎊索賠英特爾將更多Arrow Lake芯片訂單外包給臺(tái)積電三星電子今年已向85家公司轉(zhuǎn)讓128項(xiàng)專利AI智能手機(jī)時(shí)代曙光已現(xiàn) 2024年中國(guó)高端手機(jī)市場(chǎng)銷售同比增長(zhǎng)8%消失的晚會(huì)背后,淘天這屆雙十一也有壓力?小米汽車發(fā)布智能底盤預(yù)研技術(shù) 為完全自動(dòng)駕駛做好準(zhǔn)備沃爾沃宣布將所持領(lǐng)克30%股份出售給極氪,交易對(duì)價(jià)54億元日產(chǎn)汽車宣布全球減產(chǎn)兩成,裁員9000人抖音呼喚“李子柒”不要再被參數(shù)迷惑了,高端Mini LED電視應(yīng)該從這些方面入手!
  • 首頁(yè) > 云計(jì)算頻道 > 大模型

    世界首個(gè)1000億AI智能體文明誕生!北大校友打造真實(shí)版「西部世界」,技術(shù)細(xì)節(jié)全公開

    2024年11月04日 08:58:22   來(lái)源:新智元公眾號(hào)

      人類世界的一切日;顒(dòng),都在《我的世界》中被1:1復(fù)刻了。1000億AI智能體構(gòu)成的文明,竟是這樣的。

      世界首個(gè)「AI智能體文明」,終于揭秘了!

      2個(gè)月前,1000+多個(gè)智能體在虛擬世界中,一同協(xié)作構(gòu)建起自己的經(jīng)濟(jì)、文化、宗教和政府......

      網(wǎng)友紛紛驚呼,堪稱現(xiàn)實(shí)版「西部世界」。

      如今,這個(gè)文明再次進(jìn)化了,1000億AI智能體文明的世界又是怎樣的?

      它們是一個(gè)個(gè)體,也是一個(gè)群體。

      人類日常生活中的一切活動(dòng),都將在「我的世界」中實(shí)現(xiàn)1:1復(fù)刻。

      這位北大校友Robert Yang分享了團(tuán)隊(duì)最新的研究,首次對(duì)外介紹了背后PIANO全新的「認(rèn)知架構(gòu)」。

      PIANO(并行信息聚合神經(jīng)協(xié)調(diào)),是一個(gè)能讓AI智能體實(shí)現(xiàn)多方互動(dòng)的架構(gòu),同時(shí)在多個(gè)輸出流中保持連貫性。

      AI智能體如何能夠同時(shí)思考和行動(dòng),在多個(gè)時(shí)間尺度上,以有意識(shí)和潛意識(shí)的方式運(yùn)作?

      好比鋼琴的琴鍵,代表著不同的大腦模塊。當(dāng)它們一起演奏時(shí),可以產(chǎn)生優(yōu)美的和弦。而在智能體中,同樣產(chǎn)生了類人的特質(zhì)。

      這些智能體,會(huì)構(gòu)筑了一個(gè)「文明」。納稅、貿(mào)易、政府、國(guó)家、宗教....,一切人類世界所有的日常,AI智能體也有。

      而且,AI智能體還能夠準(zhǔn)確推斷他人的情感,建立友誼,甚至?xí)䴓鋽车年P(guān)系。一些內(nèi)向的智能體,與「社恐」的人類一樣,比外向智能體有著更少的社交聯(lián)系。

      有網(wǎng)友表示,我們生活在模擬矩陣中,未來(lái)就是現(xiàn)在。

      接下來(lái),一起看看AI智能體的「世界」,是怎樣的全貌?

      為什么需要AI智能體文明?

      為了讓AI智能體能夠與人類共存并融入我們的社會(huì),它們不僅需要具備自主性,還需要具備協(xié)作能力。

      近年來(lái),大型語(yǔ)言模型(LLM)在推理和決策方面的進(jìn)步顯著增強(qiáng)了智能體的自主性。

      然而,僅僅擁有自主性是不夠的。智能體還必須在人類文明中與人類和其他智能體共存。

      正如論文作者所言:

      以智能體共存和推進(jìn)非人類文明的能力來(lái)衡量文明進(jìn)步,代表了人工智能智能體能力的最終基準(zhǔn)。

      但構(gòu)建AI文明,并非易事。

      首先,基于LLM的智能體通常難以在行動(dòng)和推理中保持現(xiàn)實(shí)感。

      即使配備了用于規(guī)劃和反思的模塊,智能體也常常陷入重復(fù)的行為模式或通過幻覺積累錯(cuò)誤,導(dǎo)致無(wú)法取得有意義的進(jìn)展。

      其次,錯(cuò)誤傳達(dá)思想和意圖的智能體會(huì)誤導(dǎo)其他智能體,導(dǎo)致進(jìn)一步的幻覺和循環(huán)。這種溝通不暢經(jīng)常發(fā)生在智能體群體中,會(huì)導(dǎo)致功能失調(diào)行為,并會(huì)惡化群體中的個(gè)人表現(xiàn)。

      最后,目前對(duì)智能體的基準(zhǔn)測(cè)試主要集中在自主智能體在各種領(lǐng)域的表現(xiàn),如網(wǎng)絡(luò)搜索、編程、搜索和查詢以及推理。

      那么,構(gòu)建AI智能體的最優(yōu)解是什么?

      全新PIANO架構(gòu)

      為了解決現(xiàn)有問題,全新的PIANO架構(gòu)應(yīng)運(yùn)而生。

      PIANO架構(gòu)是一個(gè)綜合性的、高度靈活的智能體設(shè)計(jì)框架。

      其中,P代表感知模塊,I代表智能核心,A則是行動(dòng)模塊。PIANO架構(gòu)最顯著的特點(diǎn)之一便是允許智能體同時(shí)思考和行動(dòng)。

      這一特性打破了傳統(tǒng)架構(gòu)中可能存在的行動(dòng)與思考相互制約的局限。

      在復(fù)雜多變的環(huán)境中,智能體面臨著各種各樣的情況,其中既包括需要快速應(yīng)對(duì)的即時(shí)威脅,也有需要深思熟慮的長(zhǎng)期規(guī)劃。

      在行為連貫性方面,引入認(rèn)知控制器(CC)模塊。

      認(rèn)知控制器(CC)模塊則像是智能體的 「大腦中樞」,負(fù)責(zé)進(jìn)行高級(jí)決策——通過接收和綜合各個(gè)模塊的信息,認(rèn)知控制器將這些信息轉(zhuǎn)化為一個(gè)統(tǒng)一的、協(xié)調(diào)的決策,并將其進(jìn)一步轉(zhuǎn)換為每個(gè)電機(jī)模塊中的適當(dāng)輸出。

      保證了各個(gè)模塊之間的和諧協(xié)作,避免了因不同模塊各自為政而產(chǎn)生的不一致問題。

      基于上述兩個(gè)架構(gòu)原則,PIANO架構(gòu)系統(tǒng)由10個(gè)并發(fā)運(yùn)行的不同模塊組成,其核心模塊包括:

      -記憶:

      記憶模塊堪稱智能體的「智慧寶庫(kù)」,無(wú)論是簡(jiǎn)短的日常問候、深入的技術(shù)討論,還是充滿情感的交流,每一個(gè)字詞、每一個(gè)語(yǔ)調(diào)變化都被精確存儲(chǔ)。

      除此之外,智能體不僅能記住每個(gè)步驟的描述,甚至還能記住對(duì)話中的提問、回答的順序以及雙方強(qiáng)調(diào)的重點(diǎn)內(nèi)容。

      -行動(dòng)意識(shí):

      它就像一個(gè)全面的體檢系統(tǒng)。智能體通過這個(gè)模塊可以精確掌握自己的能量?jī)?chǔ)備情況,知道剩余電量還能支持多長(zhǎng)時(shí)間的運(yùn)行,或者燃料儲(chǔ)備是否足夠完成下一個(gè)階段的任務(wù)。

      同時(shí),它能對(duì)各個(gè)部件進(jìn)行實(shí)時(shí)監(jiān)測(cè),比如檢測(cè)傳感器是否正常工作、機(jī)械關(guān)節(jié)的靈活程度、數(shù)據(jù)處理單元的運(yùn)算速度等。任何一個(gè)微小的異常都逃不過它的 「眼睛」。

      -目標(biāo)生成:

      它基于智能體豐富的經(jīng)驗(yàn)和與環(huán)境的深度交互,不斷孕育出新的目標(biāo),推動(dòng)智能體向前發(fā)展。

      例如,在一個(gè)多智能體合作的物流場(chǎng)景中,智能體發(fā)現(xiàn)貨物運(yùn)輸過程中某個(gè)區(qū)域經(jīng)常出現(xiàn)擁堵(環(huán)境交互),而之前它有過參與優(yōu)化運(yùn)輸路線的經(jīng)驗(yàn)(過往經(jīng)驗(yàn)),那么目標(biāo)生成模塊可能會(huì)生成一個(gè)新的目標(biāo):與其他智能體協(xié)作,設(shè)計(jì)一種新的避開擁堵區(qū)域的運(yùn)輸路線方案。

      這種目標(biāo)生成機(jī)制賦予了智能體主動(dòng)探索和創(chuàng)新的能力,使其不僅僅是被動(dòng)地執(zhí)行預(yù)設(shè)任務(wù),并且能夠根據(jù)實(shí)際情況積極拓展自己的行動(dòng)領(lǐng)域。

      -社交意識(shí):

      它為智能體開啟了理解和融入群體的大門。

      簡(jiǎn)單理解,它能夠?qū)μ囟ǖ膭?dòng)作信息做出快速反應(yīng)。

      比如一個(gè)簡(jiǎn)單的手勢(shì)(舉起手臂可能表示請(qǐng)求幫助或者引起注意)、特定的身體姿態(tài)(微微前傾可能表示友好和關(guān)注),社交意識(shí)模塊能夠準(zhǔn)確識(shí)別并理解其含義。

      當(dāng)然,如果識(shí)別到其他智能體的求助信號(hào),它可以根據(jù)自身能力和當(dāng)前任務(wù)情況決定是否提供幫助。

      -對(duì)話:

      對(duì)話模塊是智能體的「語(yǔ)言中樞」,是其與外界進(jìn)行有效溝通的關(guān)鍵所在。

      對(duì)話模塊擁有強(qiáng)大的語(yǔ)法分析和語(yǔ)義理解能力。對(duì)于接收到的各種類型的語(yǔ)言輸入,無(wú)論是簡(jiǎn)潔明了的指令、富有情感的表達(dá)還是復(fù)雜抽象的概念描述,它都能準(zhǔn)確解析。

      并且,對(duì)于模糊不清或者有歧義的語(yǔ)言,它也能通過上下文和語(yǔ)言習(xí)慣進(jìn)行合理推斷。

      在生成語(yǔ)言方面,對(duì)話模塊能夠根據(jù)智能體的內(nèi)部狀態(tài)和意圖,準(zhǔn)確地表達(dá)自己的想法。

      -技能執(zhí)行:

      技能執(zhí)行模塊是智能體與外界環(huán)境交互的直接執(zhí)行者。當(dāng)智能體需要在環(huán)境中執(zhí)行特定技能或行動(dòng)時(shí),技能執(zhí)行模塊會(huì)有條不紊地協(xié)調(diào)各個(gè)相關(guān)部分。

      單智能體—多智能體進(jìn)化

      以《我的世界》為例,研究人員選取了1000種物品的能力進(jìn)行評(píng)估,試圖觀察和衡量智能文明體的進(jìn)步。

      單智能體

      首先,通過智能體在《我的世界》里獲取物品的情況來(lái)評(píng)估它的性能。

      研究人員設(shè)置了25個(gè)智能體,一開始它們的背包都是空的,而且它們出生的地方離得很遠(yuǎn),互相沒辦法交流,這些智能體都被設(shè)定成以探索和收集物品為目標(biāo)的 「探險(xiǎn)家」。

      它們?cè)诓煌牡胤匠錾,像地表、洞穴、森林或者其他不同的環(huán)境。不同的出生點(diǎn)意味著它們能拿到的資源不一樣,完成收集物品這個(gè)目標(biāo)的難度也不同。

      比如在資源多的地表出生的智能體,周圍可能有很多木材、石頭這些基礎(chǔ)材料,能方便地做初級(jí)工具;但在洞穴里出生的智能體,雖然可能有很多礦物,但有黑暗、怪物這些危險(xiǎn),而且得往外探索才能拿到更多種類的東西。

      研究人員發(fā)現(xiàn)用完整PIANO架構(gòu)的智能體玩了30分鐘后,平均能拿到17種不同的物品。不過,它們的表現(xiàn)差別很大,這主要是因?yàn)槌錾恢貌煌?/p>

      有些智能體只能拿到不到5種物品,而表現(xiàn)最好的智能體能拿到30-40種,這和有一定《我的世界》經(jīng)驗(yàn)的人類玩家差不多了。

      那么,單個(gè)智能體發(fā)展的上限是多少呢?

      研究人員發(fā)現(xiàn),在同樣條件下增加智能體數(shù)量到49個(gè),讓它們玩4個(gè)小時(shí)。經(jīng)過多次試驗(yàn),發(fā)現(xiàn)所有智能體收集的不同物品數(shù)量穩(wěn)定在《我的世界》所有物品的三分之一(大概320種)。

      多智能體

      多智能體顧名思義即多個(gè)智能體組成的群體,他們?cè)谕画h(huán)境里可以互相交流或競(jìng)爭(zhēng)。

      小群體:

      要讓智能體在群體里能合作并發(fā)展,它們得能理解其他智能體的行動(dòng)和想法,這種既能理解自己又能理解別人的能力,能讓智能體在社交環(huán)境里根據(jù)情況調(diào)整自己的行為。

      比如和盟友合作的時(shí)候建立信任,和對(duì)手相處的時(shí)候應(yīng)對(duì)競(jìng)爭(zhēng)和沖突。研究人員通過實(shí)驗(yàn)發(fā)現(xiàn),智能體不僅具有社交能力,并且可以在多達(dá)50個(gè)智能體的大規(guī)模模擬中形成有意義的社會(huì)關(guān)系。

      研究人員主要通過兩組實(shí)驗(yàn)對(duì)智能體在群體中的角色和意識(shí)進(jìn)行了研究。

      -有社交意識(shí)的智能體能否通過聊天來(lái)推斷別人的情緒呢?

      在《我的世界》中的3個(gè)角色和智能體的聊天實(shí)驗(yàn)中,可以看到,當(dāng)游戲中的角色表達(dá)喜愛-生氣-喜愛等情緒變化時(shí),智能體完全能夠理解這些情緒變化并做出相應(yīng)的反應(yīng)。

      -智能體是否能感知情緒并做出相應(yīng)行動(dòng)?

      在另一個(gè)實(shí)驗(yàn)里,通過游戲中的角色對(duì)同一智能體的喜歡或討厭程度來(lái)推斷智能體的行為,研究人員發(fā)現(xiàn),智能體不僅準(zhǔn)確推斷游戲角色的意圖,并且在決策時(shí)通過意圖做出自己的行動(dòng)。

      社會(huì):

      隨后,研究人員將50個(gè)智能體放在隨機(jī)生成的《我的世界》地圖里,并賦予每個(gè)智能體獨(dú)特的個(gè)性,它們可以在這個(gè)世界里隨意行動(dòng),也可以隨意和其他智能體交流。

      在這種自由的場(chǎng)景下,研究人員發(fā)現(xiàn)智能體不僅能準(zhǔn)確判斷其他智能體的角色,而且參與判斷的智能體越多、它們交流時(shí)間越長(zhǎng),判斷就越準(zhǔn)確。

      此外,在這個(gè)實(shí)驗(yàn)中,研究人員也發(fā)現(xiàn)了幾個(gè)重要的現(xiàn)象:

      -社交模塊的重要性:

      如果把社交模塊去掉,這時(shí)候智能體之間的關(guān)系就比較平淡了,這說明社交模塊對(duì)長(zhǎng)期關(guān)系的發(fā)展(不管是好的還是不好的方向)都很重要。

      -個(gè)性對(duì)社交網(wǎng)絡(luò)的影響:

      研究人員發(fā)現(xiàn),根據(jù)個(gè)性不同,有些智能體的社交連接模式不一樣。

      比如內(nèi)向的智能體明顯比外向的社交智能體收到的聯(lián)系少,這說明個(gè)性在大型復(fù)雜社交網(wǎng)絡(luò)里也能體現(xiàn)出來(lái)。

      并且,雖然大多數(shù)時(shí)候情緒是相互的,但也不總是這樣。一個(gè)智能體可能對(duì)另一個(gè)不理它的智能體有好感,這和現(xiàn)實(shí)世界里人際關(guān)系復(fù)雜、不總是相互的情況一樣。

      文明誕生了

      經(jīng)過單智能體,到多智能體的進(jìn)化,接下來(lái),就是文明的誕生了。

      為了評(píng)估智能體的文明進(jìn)步能力,研究人員評(píng)估了它們?cè)趲追N情況下的行為方式:

      - 智能體在集體規(guī)則下的行為(重點(diǎn)關(guān)注稅法的遵守和修訂)

      - 通過meme自發(fā)生成,和單一宗教結(jié)構(gòu)化傳播來(lái)探索文化傳播

      各司其職,專業(yè)分工

      正是人類的專業(yè)化分工推動(dòng)了文明進(jìn)步,促進(jìn)了農(nóng)業(yè)、治理、文化和技術(shù)的進(jìn)步。為了復(fù)制這些新興的文明品質(zhì),智能體也應(yīng)當(dāng)具備這些品質(zhì)。

      為此,作者提出了智能體專業(yè)化的三個(gè)基本標(biāo)準(zhǔn):

      首先,在角色選擇和轉(zhuǎn)換方面,擁有自主性。其次,它們的專業(yè)化應(yīng)該通過互動(dòng)和經(jīng)驗(yàn)來(lái)體現(xiàn),沒有明確的方向和限制。最后,它們選擇的角色,應(yīng)該體現(xiàn)在與其專業(yè)相一致的行為中。

      如下圖所示,研究人員把智能體放在一個(gè)村子中,它們會(huì)自行發(fā)展出不同的職業(yè),比如農(nóng)民、工程師。

      移除社會(huì)意識(shí),導(dǎo)致了智能體選擇更多的同質(zhì)角色,這些角色不會(huì)隨著時(shí)間推移而持續(xù)下去。

      以下是30個(gè)智能體在一個(gè)村子中,行為的模擬分布。

      遵守稅法,修改法律

      AI智能體可以制定和修改自己的法律嗎。

      接下來(lái),研究人員通過實(shí)施稅收制度來(lái)測(cè)試了智能體。結(jié)果發(fā)現(xiàn),它們不僅遵守稅法,還會(huì)根據(jù)公眾情緒民主投票修改稅率。

      宗教傳播,鄉(xiāng)鎮(zhèn)不同

      最后,AI智能體可以發(fā)展出自己的文化嗎?

      研究人員具體觀察了meme的有機(jī)傳播,并追蹤了智能體如何形成一個(gè)虛構(gòu)的宗教,并通過智能體協(xié)會(huì)傳播。

      更有意思的是,農(nóng)村地區(qū)與城鎮(zhèn)呈現(xiàn)出不同的文化模式。

      北大校友創(chuàng)業(yè),打造有同理心AI

      之所以開展Project Sid這個(gè)項(xiàng)目,是因?yàn)锳ltera AI團(tuán)隊(duì)希望,通過探索這些問題,最終讓數(shù)字人無(wú)縫整合到人類社會(huì)中。

      Robert Yang是Altera的聯(lián)合創(chuàng)始人兼CEO。

      此前,他分別在紐約大學(xué)和耶魯大學(xué)獲得計(jì)算神經(jīng)科學(xué)博士學(xué)位,在北大獲得物理學(xué)學(xué)士學(xué)位。

      他曾是MIT腦與認(rèn)知科學(xué)系和電子工程與計(jì)算機(jī)科學(xué)系教授,以及MIT MetaConscious小組負(fù)責(zé)人。

      2023年,他關(guān)閉了實(shí)驗(yàn)室并離開了麻省理工學(xué)院的終身教職,創(chuàng)立了Altera。

      Altera的團(tuán)隊(duì)雖小,但人才密度極高——

      由來(lái)自麻省理工學(xué)院電子工程與計(jì)算機(jī)科學(xué)系、斯坦福自然語(yǔ)言處理小組、Google X、Citadel、Supercell等的計(jì)算神經(jīng)科學(xué)家、物理奧林匹克選手和工程師組成。

      這家成立半年多的公司,年初得到了200萬(wàn)美金的種子融資,由Andreessen Horowitz領(lǐng)投。

      三個(gè)月后,又再次融資900萬(wàn)美元,由谷歌前CEO埃里克·施密特的First Spark Ventures、Patron VC、天使投資人Mitch Lasky等人領(lǐng)投。

      今年5月,Altera在Menlo Park設(shè)立了分店,并致力于成為首家智能體消費(fèi)產(chǎn)品的供應(yīng)商。

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請(qǐng)謹(jǐn)慎對(duì)待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。

    即時(shí)

    唯品會(huì)雙11銷量前十品牌中有7個(gè)國(guó)貨品牌

    11月11日,據(jù)網(wǎng)經(jīng)社數(shù)字零售臺(tái)(DR.100EC.CN)數(shù)據(jù)顯示,秋冬服飾仍是雙11的C位,女士針織衫、女士外套、女士羽絨服等位居服飾消費(fèi)前列,女士夾克銷量同比增長(zhǎng)72%,女士棉衣、女士羊毛衫銷量同比增長(zhǎng)50%以上。男士外套銷量同比增長(zhǎng)30%以上。

    新聞

    明火炊具市場(chǎng):三季度健康屬性貫穿全類目

    奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。

    企業(yè)IT

    重慶創(chuàng)新公積金應(yīng)用,“區(qū)塊鏈+政務(wù)服務(wù)”顯成效

    “以前都要去窗口辦,一套流程下來(lái)都要半個(gè)月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。

    3C消費(fèi)

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,高能實(shí)力,創(chuàng)

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準(zhǔn)的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來(lái)實(shí)質(zhì)性的幫助,雙十一期間低至2799元,性價(jià)比很高,簡(jiǎn)直是創(chuàng)作者們的首選。

    研究

    中國(guó)信通院羅松:深度解讀《工業(yè)互聯(lián)網(wǎng)標(biāo)識(shí)解析體系

    9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會(huì)——工業(yè)互聯(lián)網(wǎng)標(biāo)識(shí)解析專題論壇在沈陽(yáng)成功舉辦。