還能再漲23%!AI寵兒NVIDIA成大摩明年首選AMD FSR 4.0將與RX 9070 XT顯卡同步登場羅永浩細紅線最新進展,暫別AR,迎來AI Jarvis構(gòu)建堅實數(shù)據(jù)地基,南京打造可信數(shù)據(jù)空間引領(lǐng)數(shù)字城市建設(shè)下單前先比價不花冤枉錢 同款圖書京東價低于抖音6折日媒感慨中國電動汽車/智駕遙遙領(lǐng)先:本田、日產(chǎn)、三菱合并也沒戲消委會吹風機品質(zhì)檢測結(jié)果揭曉 徠芬獨占鰲頭 共話新質(zhì)營銷力,2024梅花數(shù)據(jù)峰會圓滿落幕索尼影像專業(yè)服務(wù) PRO Support 升級,成為會員至少需注冊 2 臺 α 全畫幅相機、3 支 G 大師鏡頭消息稱vivo加碼電池軍備競賽:6500mAh 旗艦機+7500mAh中端機寶馬M8雙門轎跑車明年年初將停產(chǎn),后續(xù)無2026款車型比亞迪:2025 款漢家族車型城市領(lǐng)航智駕功能開啟內(nèi)測雷神預告2025年首次出席CES 將發(fā)布三款不同技術(shù)原理智能眼鏡realme真我全球首發(fā)聯(lián)發(fā)科天璣 8400 耐玩戰(zhàn)神共創(chuàng)計劃iQOO Z9 Turbo長續(xù)航版手機被曝電池加大到6400mAh,搭驍龍 8s Gen 3處理器普及放緩 銷量大跌:曝保時捷將重新評估電動汽車計劃來京東參與榮耀Magic7 RSR 保時捷設(shè)計預售 享365天只換不修國補期間電視迎來換機潮,最暢銷MiniLED品牌花落誰家?美團旗下微信社群團購業(yè)務(wù)“團買買”宣布年底停運消息稱微軟正與第三方廠商洽談,試圖合作推出Xbox游戲掌機設(shè)備
  • 首頁 > 企業(yè)IT頻道 > 人工智能

    斯坦福&谷歌研發(fā)“生成式智能體” 讓游戲NPC“活了”

    2023年04月27日 20:27:51   來源:DoNews

      撰文 | 李   熙

      編輯 | 楊博丞

      電子游戲業(yè)經(jīng)歷了三十多年的牛市,游戲中的NPC在畫面視效上有了飛躍,然而互動智能上并沒有給玩家相似的體驗提升。

      玩家們在1995年的國產(chǎn)角色扮演游戲里,見過漁夫NPC只會重復一句“今天是釣魚的好天氣”;在2017年的育碧開放沙盒游戲里,聽過玻利維亞鄉(xiāng)民NPC反復只說單調(diào)的西語粗口。

      其他領(lǐng)域的人工智能已經(jīng)改頭換面,但用在游戲NPC上的人工智能長久以來還像復讀機。“身邊槍林彈雨,NPC八風不動”的哏,已經(jīng)讓瑞恩·雷諾茲老師拍成熱賣電影了。

      在大語言模型風靡的當下,以之改造游戲NPC成為可能。然而2023年4月7日,斯坦福大學和谷歌的研究者在預印本平臺上發(fā)布的論文,成就遠過于業(yè)界期待:NPC豈止更聰明,簡直算是“活過來了”。

      一、開游戲業(yè)與AI界40年未有之先河

      生成式AI和大語言模型興起前,用AI改善游戲NPC的努力,一般是在更易實現(xiàn)的強化學習方向,其中最出名的是2019年在DOTA2里擊敗人類世界冠軍的OpenAI 公司制作的5個AI。

      這種思路的概括,是用有清晰爭勝目標的對抗性環(huán)境來作為獎懲機制來訓練NPC,最終完成的AI架構(gòu)能讓NPC自我修正行為以取得勝利目標。

      不過游戲業(yè)的產(chǎn)品生態(tài)不止于此。不少游戲產(chǎn)品以奪旗、清空敵手等可以明確定義的對抗性勝利目標為基礎(chǔ),但很多游戲沒有這種對抗性,游戲機制是模擬下廚、賣雜貨、拖拉機耕地、校園戀愛等隨機度更高的活動。更多游戲的機制是開放性沙盒,沒有明確定義的取勝路徑與規(guī)則。

      這些游戲的NPC功能如何從AI技術(shù)革命中獲益,很長時間內(nèi)業(yè)內(nèi)大公司暫時還沒明確答案。

      然而2023年4月中旬谷歌與斯坦福大學研究者的論文《生成式行為體:人際行為的交互式互動》,給出了通往答案的路徑:用大語言模型,讓沙盒模擬游戲里的NPC“獲得生命”。

      研究者稱,過去四十年來,學界嘗試過創(chuàng)造行為可信的NPC的各種途徑,但在實際應(yīng)用中,這些途徑基于簡單環(huán)境或智能體行為的單調(diào)維度,否則無法運行。而此研究的成功,突破了上述局限。

      二、原理:ChatGPT讓NPC“思考”,本地數(shù)據(jù)庫讓NPC“記憶”

      簡單來說,研究者通過普通編程,為一個《模擬人生》類型游戲的虛擬小鎮(zhèn)中的NPC們寫好了虛擬環(huán)境設(shè)定、智能體人物設(shè)定、記憶庫架構(gòu)、擬定計劃等各方面程序代碼。然后在NPC與虛擬環(huán)境間、多名NPC之間的每次接觸時,將以上各方面基礎(chǔ)數(shù)據(jù)、互動環(huán)境等以自然語言描述后,通過應(yīng)用程序接口輸入給ChatGPT,再將ChatGPT的答案作為NPC下一步行為的指令。

      具體而言,研究中的“生成式行為體”NPC,其決策路徑如下圖所示:感知-錄入記憶流-檢索記憶庫-反思/計劃-行為

      “生成式行為體” 決策路徑簡圖

      “感知”是NPC行為體對互動、虛擬環(huán)境等的信息輸入,錄入“記憶流”后,與記憶數(shù)據(jù)庫對比。

      然后“檢索”是從數(shù)據(jù)庫中提取相關(guān)的記憶事項,NPC行為體會用自然語言將事項輸入給ChatGPT,由大語言模型來決策事項的優(yōu)先級,優(yōu)先級由事項的晚近程度、ChatGPT判斷的重要度與相關(guān)性為判斷基準。給出的答案作為NPC思維流程的下一步輸入詞。

      接著,數(shù)據(jù)庫與大語言模型會開始NPC的“反思”過程,數(shù)據(jù)庫將行為體最近100條記憶事項以自然語言輸入ChatGPT,讓大模型來推斷出由此可知最重要/相關(guān)的觀點。

      “檢索”獲取的答案、“反思”得出的觀點、結(jié)合NPC本身的人設(shè)數(shù)據(jù),都以自然語言自動再次輸入ChatGPT,用大模型得出最符合人類行為邏輯的行動指令。

      試運行截圖

      如此設(shè)計的用意,是因為大語言模型在訓練期間已經(jīng)被寫入了廣泛的人類行為資料,在給出背景涵義足夠精準的提示詞時,ChatGPT等大模型可以生成高擬真度的人類行為預測答案。

      然而在這個迅速驚艷世界的功能后,大語言模型存在小瑕疵:它不能記住每個用戶的個性化錄入內(nèi)容,所有用戶與模型間的對話都不能直接修改模型的參數(shù),任何顯得ChatGPT有記憶的表現(xiàn)都是算法在復讀最時新的用戶錄入內(nèi)容緩存。

      所以谷歌與斯坦福的研究者,結(jié)合存儲在云服務(wù)器上的數(shù)據(jù)庫與ChatGPT,來制作出能完成前述“思維步驟”的NPC,讓它們可以實時模擬人類的自主決策。固定數(shù)據(jù)庫與軟件架構(gòu)是NPC佐助連續(xù)性思考的“記憶”,而大語言模型是NPC用來即時性思考的“靈魂”。

      三、效果:NPC能自行談戀愛和選鎮(zhèn)長了

      在研究者的試運行中,NPC智能體可以做到?jīng)]有人工干預微操、只給簡單指令,就能自行完成復雜事件。當研究者讓名叫伊莎貝拉的NPC籌劃情人節(jié)聚會時,她自行在虛擬小鎮(zhèn)中開始逐個邀請自己的朋友和熟人,并自行裝飾作為聚會場所的咖啡館。

      智能體與虛擬環(huán)境間的互動可以完全自發(fā)且自洽。在環(huán)境狀況設(shè)置為“食物引燃”的狀況下,“伊莎貝拉”能自主做出“關(guān)閉燃氣灶”的決策。如果這用普通編程也可以做到的話,智能體接下來的“重做早飯”行為,就是較前有顯著突破的AI自發(fā)決策。

      智能體之間的互動,已經(jīng)達到可以模擬實際人際關(guān)系中的“信息擴散”與“協(xié)作”行為。

      例如“伊莎貝拉”宣布要開情人節(jié)聚會后,她邀請到的AI智能體們又進一步邀請其他與伊莎貝拉無直接接觸的AI,例如名叫瑪麗婭的AI就邀請自己的“暗戀對象”克勞斯一同赴會。

      情人節(jié)聚會消息在NPC中擴散的過程

      再如名叫“山姆”的AI宣布要競選虛擬小鎮(zhèn)鎮(zhèn)長后,AI“伊莎貝拉”與“湯姆”對此有自發(fā)的議論:“伊莎貝拉”詢問“湯姆”的意見,“湯姆”答出自己的觀點:“老實說我不看好山姆,他與本社區(qū)已經(jīng)脫節(jié),也并不真把我們的攸關(guān)利益放在心上“。

      在研究者的兩日試運行中,虛擬小鎮(zhèn)的25個NPC里,得知“山姆”參選鎮(zhèn)長的從單個擴散到8個、得知“伊莎貝拉”辦聚會的從單個擴散的12個,過程中完全無人工干預。并且NPC們在互動內(nèi)容的置信度上部分超過了真人玩家。

      論文里各種狀態(tài)下NPC與人類的行為置信度對比量表

      當然,論文出圈后的“《西部世界》實現(xiàn)“熱議并不準確。仔細的觀察者們大都發(fā)現(xiàn),不管所用的ChatGPT還是自制的NPC程序,并沒有真正的自主人類意識,只是將大模型的相關(guān)性引擎性能潛力進一步發(fā)掘。

      由于大語言模型的現(xiàn)有局限,研究中的NPC也經(jīng)常有無厘頭的“幻覺”缺陷。例如NPC觀測到虛擬小鎮(zhèn)中有“公廁”,就不認為是“單人廁所”,出現(xiàn)了“AI使用洗手間時常被其他AI闖入”的互動場景。虛擬小鎮(zhèn)上的商店是下午五點關(guān)門,然而NPC們時常在歇業(yè)時間試圖進入。有AI看到其他NPC的名字是亞當·史密斯,就說:“啊我曉得你,你就是那個18世紀的經(jīng)濟學宗師。”

      論文中提到了這些缺陷,還說“提示詞黑客手段-即人類玩家用仔細準備好的對話內(nèi)容來迷惑NPC行為體,可以讓AI幻覺出從未發(fā)生的事件的記憶。”

      現(xiàn)在很多游戲業(yè)者認為生成式AI的技術(shù)還在襁褓期,暴炒Chatgpt的人很多五六年前在狂吹加密貨幣。有名的波蘭游戲公司CD Projekt Red,其動作游戲系列的內(nèi)容開發(fā)者領(lǐng)軍人在2023年1月說,NPC離自行建立一個生態(tài)活躍的虛擬社區(qū),還太過遙遠。

      生成式AI的確是在襁褓期,但襁褓中的生物,最突出特征就是飛快的生長速度。AI大模型將如何改變游戲業(yè),實在讓人充滿憧憬。

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹慎對待。投資者據(jù)此操作,風險自擔。

    即時

    新聞

    明火炊具市場:三季度健康屬性貫穿全類目

    奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。

    企業(yè)IT

    重慶創(chuàng)新公積金應(yīng)用,“區(qū)塊鏈+政務(wù)服務(wù)”顯成效

    “以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進了21600元。

    3C消費

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,高能實力,創(chuàng)

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實質(zhì)性的幫助,雙十一期間低至2799元,性價比很高,簡直是創(chuàng)作者們的首選。

    研究

    中國信通院羅松:深度解讀《工業(yè)互聯(lián)網(wǎng)標識解析體系

    9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會——工業(yè)互聯(lián)網(wǎng)標識解析專題論壇在沈陽成功舉辦。