谷歌發(fā)布雙思維AI Agent：像人類(lèi)一樣思考，重大技術(shù)突破！

2024年11月29日 09:05:53 來(lái)源：AIGC開(kāi)放社區(qū)公眾號(hào)

　　今年10月，OpenAI高級(jí)研究科學(xué)家、德?lián)銩I之父Noam Brown，曾在美國(guó)舊金山舉辦的TED AI大會(huì)上提出了一個(gè)驚人的理論——讓AI模型思考20秒所帶來(lái)的性能提升，相當(dāng)于將模型擴(kuò)大100，000倍并訓(xùn)練100，000倍的時(shí)間。

　　Noam所指的技術(shù)便是System1/2thinking，也是OpenAI最新模型o1正在使用的技術(shù)。

　　谷歌DeepMind研究人員則直接把這項(xiàng)技術(shù)集成到AI Agent中開(kāi)發(fā)了Talker-Reasoner框架，讓其具備“快”、“慢”兩種擬人化思考方式。這對(duì)于解決復(fù)雜、冗長(zhǎng)的任務(wù)來(lái)說(shuō)幫助巨大，也突破了傳統(tǒng)AI Agent執(zhí)行業(yè)務(wù)流程的方法，極大提升了效率。

　　像人類(lèi)一樣思考——快、慢思維

　　在介紹谷歌的雙思維AI Agent之前，「AIGC開(kāi)放社區(qū)」先為大家簡(jiǎn)單介紹一下System1/2的快、慢思維的由來(lái)和技術(shù)特性，對(duì)于理解Talker-Reasoner框架很有幫助。

　　快、慢思維最早是由諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)得主-丹尼爾·卡內(nèi)曼在其著作《思考，快與慢》中提出，并被廣泛接受為理解人類(lèi)思維的一種重要理論框架。

　　這兩種思維方式分別被稱(chēng)為“System1”和“System2”，它們各自承擔(dān)著不同的認(rèn)知任務(wù)，并以獨(dú)特的方式影響著我們的決策過(guò)程。

　　System1，所謂的“快思考”，是一種自動(dòng)化的、迅速的思維模式，幾乎不需要消耗大量的認(rèn)知資源，也不需要個(gè)體付出明顯的努力。

　　當(dāng)我們面對(duì)一個(gè)熟悉的場(chǎng)景或問(wèn)題時(shí)，System1會(huì)迅速作出反應(yīng)，提供即時(shí)的答案或解決方案。例如，當(dāng)我們看到一輛車(chē)突然向我們駛來(lái)時(shí)，我們會(huì)本能地做出躲避的動(dòng)作;或者當(dāng)我們聽(tīng)到一個(gè)笑話時(shí)，我們可能會(huì)立即感到好笑并發(fā)出笑聲。

　　這些反應(yīng)都是System1在起作用的結(jié)果，它依賴(lài)于直覺(jué)和經(jīng)驗(yàn)積累，能夠在短時(shí)間內(nèi)處理大量信息，但同時(shí)也可能因?yàn)槿狈ι钊敕治龆a(chǎn)生偏見(jiàn)或錯(cuò)誤判斷。

　　相比之下，System2則代表著“慢思考”，這是一種更為復(fù)雜和謹(jǐn)慎的思維過(guò)程。System2負(fù)責(zé)執(zhí)行那些需要更多注意力和努力的任務(wù)，如解決復(fù)雜的數(shù)學(xué)問(wèn)題、進(jìn)行邏輯推理或是制定長(zhǎng)期計(jì)劃等。

　　如果你使用過(guò)OpenAI的o1或者國(guó)內(nèi)的Deepseek、阿里最新開(kāi)源的QwQ-32B模型，它們?cè)趫?zhí)行超復(fù)雜問(wèn)題時(shí)，便會(huì)進(jìn)入短暫的思考時(shí)間。

　　System2的特點(diǎn)在于其能夠?qū)π畔⑦M(jìn)行細(xì)致的分析和評(píng)估，從而得出更加準(zhǔn)確和全面的結(jié)論。然而，由于這種思考方式需要消耗較多的認(rèn)知資源，所以比System1要慢得多。

　　此外，在面對(duì)緊急情況或壓力較大的情境下，System2的表現(xiàn)可能會(huì)受到影響，導(dǎo)致決策效率降低。

　　谷歌雙思維AI Agent——Talker-Reasoner

　　而谷歌DeepMind研究人員提出的Talker-Reasoner中，巧妙地將System1/2集成到了AI Agent上。

　　Talker-Reasoner架構(gòu)的核心思想是將AI Agent分為兩個(gè)獨(dú)立的模塊:Talker和Reasoner。這兩個(gè)模塊分別對(duì)應(yīng)于人類(lèi)的System1和System2，各自承擔(dān)著不同的任務(wù)和功能。

　　Talker模塊，類(lèi)似于System1，負(fù)責(zé)快速、直觀的對(duì)話生成，它能夠迅速響應(yīng)用戶的需求，生成自然語(yǔ)言的回答。而Reasoner模塊，類(lèi)似于System2，負(fù)責(zé)復(fù)雜的多步推理和規(guī)劃，它需要更多的時(shí)間和計(jì)算資源來(lái)處理復(fù)雜的任務(wù)，如調(diào)用外部工具、檢索信息和解決問(wèn)題。

　　在Talker模塊中，AI Agent被設(shè)計(jì)為能夠理解和處理自然語(yǔ)言，生成連貫和自然的對(duì)話。這需要AI Agent具備強(qiáng)大的語(yǔ)言理解和生成能力，以及對(duì)上下文的敏感性。Talker模塊需要能夠快速地從記憶中提取相關(guān)信息，以支持其對(duì)話生成。

　　這種記憶可以是對(duì)話歷史、用戶偏好或其他相關(guān)信息。Talker模塊的設(shè)計(jì)使其能夠模擬人類(lèi)的直覺(jué)反應(yīng)，即使在信息不完全的情況下也能做出合理的回應(yīng)。

　　與Talker模塊的快速反應(yīng)不同，Reasoner模塊的設(shè)計(jì)重點(diǎn)在于深度思考和復(fù)雜問(wèn)題解決。Reasoner模塊需要能夠執(zhí)行多步推理，這可能涉及到對(duì)大量信息的分析和處理。它需要調(diào)用各種工具和數(shù)據(jù)庫(kù)，以獲取外部知識(shí)，支持其推理過(guò)程。

　　Reasoner模塊還需要能夠形成和更新關(guān)于用戶狀態(tài)的信仰，這些信仰以結(jié)構(gòu)化語(yǔ)言對(duì)象的形式存儲(chǔ)在記憶中。這種信仰建模是Reasoner模塊的關(guān)鍵特征，它使得AI Agent能夠更好地理解用戶的需求和意圖，從而提供更準(zhǔn)確的服務(wù)。

　　在實(shí)際應(yīng)用中，Talker和Reasoner模塊之間的交互是通過(guò)記憶來(lái)實(shí)現(xiàn)的。Reasoner模塊負(fù)責(zé)生成新的信仰狀態(tài)，并將其存儲(chǔ)在記憶中。Talker模塊在需要時(shí)從記憶中檢索這些信仰狀態(tài)，以支持其對(duì)話生成。

　　這種設(shè)計(jì)允許Talker模塊即使在Reasoner模塊尚未完成其推理過(guò)程時(shí)，也能夠繼續(xù)與用戶進(jìn)行互動(dòng)。該分工類(lèi)似于人類(lèi)的大腦，System1始終活躍，而System2則在需要時(shí)介入。

　　Talker-Reasoner測(cè)試數(shù)據(jù)

　　為了測(cè)試Talker-Reasoner的雙思維性能，研究人員用這個(gè)開(kāi)發(fā)了一個(gè)睡眠輔導(dǎo)Agent。在這個(gè)場(chǎng)景中，AI Agent需要與用戶進(jìn)行對(duì)話，提供關(guān)于改善睡眠習(xí)慣的建議和計(jì)劃。

　　Talker模塊負(fù)責(zé)與用戶的直接互動(dòng)，而Reasoner模塊則負(fù)責(zé)制定和調(diào)整睡眠輔導(dǎo)計(jì)劃。這種分工使得AI Agent能夠同時(shí)進(jìn)行快速的對(duì)話和復(fù)雜的規(guī)劃，提高了用戶體驗(yàn)。

　　在測(cè)試中，Talker模塊通過(guò)一系列指令編碼專(zhuān)家知識(shí)，指導(dǎo)其完成睡眠輔導(dǎo)的各個(gè)階段。這些指令不僅包括了與用戶互動(dòng)的規(guī)則，還包括了睡眠輔導(dǎo)的具體步驟和策略。Talker模塊需要能夠理解和回應(yīng)用戶的需求，同時(shí)保持對(duì)話的連貫性和自然性。

　　Reasoner模塊則需要根據(jù)用戶的反饋和需求，調(diào)整和優(yōu)化睡眠輔導(dǎo)計(jì)劃。這可能涉及到調(diào)用外部資源，如睡眠相關(guān)的研究和建議，以及根據(jù)用戶的具體情況制定個(gè)性化的計(jì)劃。Reasoner模塊的設(shè)計(jì)使其能夠處理復(fù)雜的邏輯和推理，為用戶提供最合適的建議。

　　在實(shí)際對(duì)話中，Talker和Reasoner模塊的協(xié)同工作被證明是有效的。Talker模塊能夠流暢地與用戶對(duì)話，而Reasoner模塊則能夠根據(jù)用戶的反饋調(diào)整和優(yōu)化輔導(dǎo)計(jì)劃。這種分工執(zhí)行使得AI Agent能夠同時(shí)處理快速的對(duì)話和復(fù)雜的規(guī)劃，極大提高了用戶體驗(yàn)。

　　文章內(nèi)容僅供閱讀，不構(gòu)成投資建議，請(qǐng)謹(jǐn)慎對(duì)待。投資者據(jù)此操作，風(fēng)險(xiǎn)自擔(dān)。

[No. ]
分享到微信