今年10月,OpenAI高級(jí)研究科學(xué)家、德?lián)銩I之父Noam Brown,曾在美國(guó)舊金山舉辦的TED AI大會(huì)上提出了一個(gè)驚人的理論——讓AI模型思考20秒所帶來(lái)的性能提升,相當(dāng)于將模型擴(kuò)大100,000倍并訓(xùn)練100,000倍的時(shí)間。
Noam所指的技術(shù)便是System1/2thinking,也是OpenAI最新模型o1正在使用的技術(shù)。
谷歌DeepMind研究人員則直接把這項(xiàng)技術(shù)集成到AI Agent中開(kāi)發(fā)了Talker-Reasoner框架,讓其具備“快”、“慢”兩種擬人化思考方式。這對(duì)于解決復(fù)雜、冗長(zhǎng)的任務(wù)來(lái)說(shuō)幫助巨大,也突破了傳統(tǒng)AI Agent執(zhí)行業(yè)務(wù)流程的方法,極大提升了效率。
像人類(lèi)一樣思考——快、慢思維
在介紹谷歌的雙思維AI Agent之前,「AIGC開(kāi)放社區(qū)」先為大家簡(jiǎn)單介紹一下System1/2的快、慢思維的由來(lái)和技術(shù)特性,對(duì)于理解Talker-Reasoner框架很有幫助。
快、慢思維最早是由諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)得主-丹尼爾·卡內(nèi)曼在其著作《思考,快與慢》中提出,并被廣泛接受為理解人類(lèi)思維的一種重要理論框架。
這兩種思維方式分別被稱(chēng)為“System1”和“System2”,它們各自承擔(dān)著不同的認(rèn)知任務(wù),并以獨(dú)特的方式影響著我們的決策過(guò)程。
System1,所謂的“快思考”,是一種自動(dòng)化的、迅速的思維模式,幾乎不需要消耗大量的認(rèn)知資源,也不需要個(gè)體付出明顯的努力。
當(dāng)我們面對(duì)一個(gè)熟悉的場(chǎng)景或問(wèn)題時(shí),System1會(huì)迅速作出反應(yīng),提供即時(shí)的答案或解決方案。例如,當(dāng)我們看到一輛車(chē)突然向我們駛來(lái)時(shí),我們會(huì)本能地做出躲避的動(dòng)作;或者當(dāng)我們聽(tīng)到一個(gè)笑話時(shí),我們可能會(huì)立即感到好笑并發(fā)出笑聲。
這些反應(yīng)都是System1在起作用的結(jié)果,它依賴(lài)于直覺(jué)和經(jīng)驗(yàn)積累,能夠在短時(shí)間內(nèi)處理大量信息,但同時(shí)也可能因?yàn)槿狈ι钊敕治龆a(chǎn)生偏見(jiàn)或錯(cuò)誤判斷。
相比之下,System2則代表著“慢思考”,這是一種更為復(fù)雜和謹(jǐn)慎的思維過(guò)程。System2負(fù)責(zé)執(zhí)行那些需要更多注意力和努力的任務(wù),如解決復(fù)雜的數(shù)學(xué)問(wèn)題、進(jìn)行邏輯推理或是制定長(zhǎng)期計(jì)劃等。
如果你使用過(guò)OpenAI的o1或者國(guó)內(nèi)的Deepseek、阿里最新開(kāi)源的QwQ-32B模型,它們?cè)趫?zhí)行超復(fù)雜問(wèn)題時(shí),便會(huì)進(jìn)入短暫的思考時(shí)間。
System2的特點(diǎn)在于其能夠?qū)π畔⑦M(jìn)行細(xì)致的分析和評(píng)估,從而得出更加準(zhǔn)確和全面的結(jié)論。然而,由于這種思考方式需要消耗較多的認(rèn)知資源,所以比System1要慢得多。
此外,在面對(duì)緊急情況或壓力較大的情境下,System2的表現(xiàn)可能會(huì)受到影響,導(dǎo)致決策效率降低。
谷歌雙思維AI Agent——Talker-Reasoner
而谷歌DeepMind研究人員提出的Talker-Reasoner中,巧妙地將System1/2集成到了AI Agent上。
Talker-Reasoner架構(gòu)的核心思想是將AI Agent分為兩個(gè)獨(dú)立的模塊:Talker和Reasoner。這兩個(gè)模塊分別對(duì)應(yīng)于人類(lèi)的System1和System2,各自承擔(dān)著不同的任務(wù)和功能。
Talker模塊,類(lèi)似于System1,負(fù)責(zé)快速、直觀的對(duì)話生成,它能夠迅速響應(yīng)用戶的需求,生成自然語(yǔ)言的回答。而Reasoner模塊,類(lèi)似于System2,負(fù)責(zé)復(fù)雜的多步推理和規(guī)劃,它需要更多的時(shí)間和計(jì)算資源來(lái)處理復(fù)雜的任務(wù),如調(diào)用外部工具、檢索信息和解決問(wèn)題。
在Talker模塊中,AI Agent被設(shè)計(jì)為能夠理解和處理自然語(yǔ)言,生成連貫和自然的對(duì)話。這需要AI Agent具備強(qiáng)大的語(yǔ)言理解和生成能力,以及對(duì)上下文的敏感性。Talker模塊需要能夠快速地從記憶中提取相關(guān)信息,以支持其對(duì)話生成。
這種記憶可以是對(duì)話歷史、用戶偏好或其他相關(guān)信息。Talker模塊的設(shè)計(jì)使其能夠模擬人類(lèi)的直覺(jué)反應(yīng),即使在信息不完全的情況下也能做出合理的回應(yīng)。
與Talker模塊的快速反應(yīng)不同,Reasoner模塊的設(shè)計(jì)重點(diǎn)在于深度思考和復(fù)雜問(wèn)題解決。Reasoner模塊需要能夠執(zhí)行多步推理,這可能涉及到對(duì)大量信息的分析和處理。它需要調(diào)用各種工具和數(shù)據(jù)庫(kù),以獲取外部知識(shí),支持其推理過(guò)程。
Reasoner模塊還需要能夠形成和更新關(guān)于用戶狀態(tài)的信仰,這些信仰以結(jié)構(gòu)化語(yǔ)言對(duì)象的形式存儲(chǔ)在記憶中。這種信仰建模是Reasoner模塊的關(guān)鍵特征,它使得AI Agent能夠更好地理解用戶的需求和意圖,從而提供更準(zhǔn)確的服務(wù)。
在實(shí)際應(yīng)用中,Talker和Reasoner模塊之間的交互是通過(guò)記憶來(lái)實(shí)現(xiàn)的。Reasoner模塊負(fù)責(zé)生成新的信仰狀態(tài),并將其存儲(chǔ)在記憶中。Talker模塊在需要時(shí)從記憶中檢索這些信仰狀態(tài),以支持其對(duì)話生成。
這種設(shè)計(jì)允許Talker模塊即使在Reasoner模塊尚未完成其推理過(guò)程時(shí),也能夠繼續(xù)與用戶進(jìn)行互動(dòng)。該分工類(lèi)似于人類(lèi)的大腦,System1始終活躍,而System2則在需要時(shí)介入。
Talker-Reasoner測(cè)試數(shù)據(jù)
為了測(cè)試Talker-Reasoner的雙思維性能,研究人員用這個(gè)開(kāi)發(fā)了一個(gè)睡眠輔導(dǎo)Agent。在這個(gè)場(chǎng)景中,AI Agent需要與用戶進(jìn)行對(duì)話,提供關(guān)于改善睡眠習(xí)慣的建議和計(jì)劃。
Talker模塊負(fù)責(zé)與用戶的直接互動(dòng),而Reasoner模塊則負(fù)責(zé)制定和調(diào)整睡眠輔導(dǎo)計(jì)劃。這種分工使得AI Agent能夠同時(shí)進(jìn)行快速的對(duì)話和復(fù)雜的規(guī)劃,提高了用戶體驗(yàn)。
在測(cè)試中,Talker模塊通過(guò)一系列指令編碼專(zhuān)家知識(shí),指導(dǎo)其完成睡眠輔導(dǎo)的各個(gè)階段。這些指令不僅包括了與用戶互動(dòng)的規(guī)則,還包括了睡眠輔導(dǎo)的具體步驟和策略。Talker模塊需要能夠理解和回應(yīng)用戶的需求,同時(shí)保持對(duì)話的連貫性和自然性。
Reasoner模塊則需要根據(jù)用戶的反饋和需求,調(diào)整和優(yōu)化睡眠輔導(dǎo)計(jì)劃。這可能涉及到調(diào)用外部資源,如睡眠相關(guān)的研究和建議,以及根據(jù)用戶的具體情況制定個(gè)性化的計(jì)劃。Reasoner模塊的設(shè)計(jì)使其能夠處理復(fù)雜的邏輯和推理,為用戶提供最合適的建議。
在實(shí)際對(duì)話中,Talker和Reasoner模塊的協(xié)同工作被證明是有效的。Talker模塊能夠流暢地與用戶對(duì)話,而Reasoner模塊則能夠根據(jù)用戶的反饋調(diào)整和優(yōu)化輔導(dǎo)計(jì)劃。這種分工執(zhí)行使得AI Agent能夠同時(shí)處理快速的對(duì)話和復(fù)雜的規(guī)劃,極大提高了用戶體驗(yàn)。
文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請(qǐng)謹(jǐn)慎對(duì)待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。
2024年的Adobe MAX 2024發(fā)布會(huì)上,Adobe推出了最新版本的Adobe Creative Cloud。
奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。
“以前都要去窗口辦,一套流程下來(lái)都要半個(gè)月了,現(xiàn)在方便多了!”打開(kāi)“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。
華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準(zhǔn)的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來(lái)實(shí)質(zhì)性的幫助,雙十一期間低至2799元,性價(jià)比很高,簡(jiǎn)直是創(chuàng)作者們的首選。
9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會(huì)——工業(yè)互聯(lián)網(wǎng)標(biāo)識(shí)解析專(zhuān)題論壇在沈陽(yáng)成功舉辦。