零下25℃如何取暖?海爾水暖通溫暖驛站亮相冰雪大世界馬太效應(yīng),強(qiáng)者恒強(qiáng)?——《中國(guó)企業(yè)科創(chuàng)力研究報(bào)告(2024)》美團(tuán)年度報(bào)告竟然用上了AI和短?這下是真出圈了消息稱(chēng)上汽大眾正開(kāi)發(fā)三款新車(chē),技術(shù)分別來(lái)自小鵬、智己和榮威鴻蒙智行泊車(chē)代駕VPD正式開(kāi)啟全量推送!升級(jí)自動(dòng)泊車(chē)/接駕等多項(xiàng)功能華為官方翻新手機(jī)最高降價(jià)4000元曝蘋(píng)果研發(fā)帶Face ID的智能家居門(mén)鈴:內(nèi)置自研W-Fi芯片李斌回應(yīng)螢火蟲(chóng)外觀設(shè)計(jì):看過(guò)實(shí)車(chē)的人都喜歡這個(gè)設(shè)計(jì)林杰:未來(lái) A 級(jí)、A0 級(jí)、A00 級(jí)車(chē)型都將是領(lǐng)克純電的“主場(chǎng)”豐巢存包柜亮相南寧地鐵站,助力城市韌性建設(shè)與智慧出行萬(wàn)象分區(qū)、絢彩XDR、量子點(diǎn)Pro 2025齊出手,TCL引領(lǐng)觀影體驗(yàn)新變革!QQ音樂(lè)年度聽(tīng)歌報(bào)告發(fā)布:誰(shuí)是你最喜歡的歌手?OpenAI正式發(fā)布o(jì)3 - 通往AGI的路上,已經(jīng)沒(méi)有了任何阻礙「送禮物」難撬動(dòng)社交電商,微信小店缺的是供給微軟Phi-4封神,14B小模型數(shù)學(xué)擊敗GPT-4o,合成數(shù)據(jù)占比40%,36頁(yè)技術(shù)報(bào)告出爐2024年結(jié)束,哪里是原創(chuàng)動(dòng)畫(huà)的應(yīng)許之地?深扒一個(gè)正被游戲行業(yè)「搶占」的流量帝國(guó)百思買(mǎi)重新進(jìn)軍跨境電商領(lǐng)域視頻生成大模型賽道,只是看上去擁擠GGII:預(yù)計(jì)2024年中國(guó)工業(yè)機(jī)器人全年銷(xiāo)量約30萬(wàn)臺(tái),同比下滑5%左右
  • 首頁(yè) > 云計(jì)算頻道 > 大模型

    谷歌發(fā)布雙思維AI Agent:像人類(lèi)一樣思考,重大技術(shù)突破!

    2024年11月29日 09:05:53   來(lái)源:AIGC開(kāi)放社區(qū)公眾號(hào)

      今年10月,OpenAI高級(jí)研究科學(xué)家、德?lián)銩I之父Noam Brown,曾在美國(guó)舊金山舉辦的TED AI大會(huì)上提出了一個(gè)驚人的理論——讓AI模型思考20秒所帶來(lái)的性能提升,相當(dāng)于將模型擴(kuò)大100,000倍并訓(xùn)練100,000倍的時(shí)間。

      Noam所指的技術(shù)便是System1/2thinking,也是OpenAI最新模型o1正在使用的技術(shù)。

      谷歌DeepMind研究人員則直接把這項(xiàng)技術(shù)集成到AI Agent中開(kāi)發(fā)了Talker-Reasoner框架,讓其具備“快”、“慢”兩種擬人化思考方式。這對(duì)于解決復(fù)雜、冗長(zhǎng)的任務(wù)來(lái)說(shuō)幫助巨大,也突破了傳統(tǒng)AI Agent執(zhí)行業(yè)務(wù)流程的方法,極大提升了效率。

      像人類(lèi)一樣思考——快、慢思維

      在介紹谷歌的雙思維AI Agent之前,「AIGC開(kāi)放社區(qū)」先為大家簡(jiǎn)單介紹一下System1/2的快、慢思維的由來(lái)和技術(shù)特性,對(duì)于理解Talker-Reasoner框架很有幫助。

      快、慢思維最早是由諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)得主-丹尼爾·卡內(nèi)曼在其著作《思考,快與慢》中提出,并被廣泛接受為理解人類(lèi)思維的一種重要理論框架。

      這兩種思維方式分別被稱(chēng)為“System1”和“System2”,它們各自承擔(dān)著不同的認(rèn)知任務(wù),并以獨(dú)特的方式影響著我們的決策過(guò)程。

      System1,所謂的“快思考”,是一種自動(dòng)化的、迅速的思維模式,幾乎不需要消耗大量的認(rèn)知資源,也不需要個(gè)體付出明顯的努力。

      當(dāng)我們面對(duì)一個(gè)熟悉的場(chǎng)景或問(wèn)題時(shí),System1會(huì)迅速作出反應(yīng),提供即時(shí)的答案或解決方案。例如,當(dāng)我們看到一輛車(chē)突然向我們駛來(lái)時(shí),我們會(huì)本能地做出躲避的動(dòng)作;或者當(dāng)我們聽(tīng)到一個(gè)笑話時(shí),我們可能會(huì)立即感到好笑并發(fā)出笑聲。

      這些反應(yīng)都是System1在起作用的結(jié)果,它依賴(lài)于直覺(jué)和經(jīng)驗(yàn)積累,能夠在短時(shí)間內(nèi)處理大量信息,但同時(shí)也可能因?yàn)槿狈ι钊敕治龆a(chǎn)生偏見(jiàn)或錯(cuò)誤判斷。

      相比之下,System2則代表著“慢思考”,這是一種更為復(fù)雜和謹(jǐn)慎的思維過(guò)程。System2負(fù)責(zé)執(zhí)行那些需要更多注意力和努力的任務(wù),如解決復(fù)雜的數(shù)學(xué)問(wèn)題、進(jìn)行邏輯推理或是制定長(zhǎng)期計(jì)劃等。

      如果你使用過(guò)OpenAI的o1或者國(guó)內(nèi)的Deepseek、阿里最新開(kāi)源的QwQ-32B模型,它們?cè)趫?zhí)行超復(fù)雜問(wèn)題時(shí),便會(huì)進(jìn)入短暫的思考時(shí)間。

      System2的特點(diǎn)在于其能夠?qū)π畔⑦M(jìn)行細(xì)致的分析和評(píng)估,從而得出更加準(zhǔn)確和全面的結(jié)論。然而,由于這種思考方式需要消耗較多的認(rèn)知資源,所以比System1要慢得多。

      此外,在面對(duì)緊急情況或壓力較大的情境下,System2的表現(xiàn)可能會(huì)受到影響,導(dǎo)致決策效率降低。

      谷歌雙思維AI Agent——Talker-Reasoner

      而谷歌DeepMind研究人員提出的Talker-Reasoner中,巧妙地將System1/2集成到了AI Agent上。

      Talker-Reasoner架構(gòu)的核心思想是將AI Agent分為兩個(gè)獨(dú)立的模塊:Talker和Reasoner。這兩個(gè)模塊分別對(duì)應(yīng)于人類(lèi)的System1和System2,各自承擔(dān)著不同的任務(wù)和功能。

      Talker模塊,類(lèi)似于System1,負(fù)責(zé)快速、直觀的對(duì)話生成,它能夠迅速響應(yīng)用戶的需求,生成自然語(yǔ)言的回答。而Reasoner模塊,類(lèi)似于System2,負(fù)責(zé)復(fù)雜的多步推理和規(guī)劃,它需要更多的時(shí)間和計(jì)算資源來(lái)處理復(fù)雜的任務(wù),如調(diào)用外部工具、檢索信息和解決問(wèn)題。

      在Talker模塊中,AI Agent被設(shè)計(jì)為能夠理解和處理自然語(yǔ)言,生成連貫和自然的對(duì)話。這需要AI Agent具備強(qiáng)大的語(yǔ)言理解和生成能力,以及對(duì)上下文的敏感性。Talker模塊需要能夠快速地從記憶中提取相關(guān)信息,以支持其對(duì)話生成。

      這種記憶可以是對(duì)話歷史、用戶偏好或其他相關(guān)信息。Talker模塊的設(shè)計(jì)使其能夠模擬人類(lèi)的直覺(jué)反應(yīng),即使在信息不完全的情況下也能做出合理的回應(yīng)。

      與Talker模塊的快速反應(yīng)不同,Reasoner模塊的設(shè)計(jì)重點(diǎn)在于深度思考和復(fù)雜問(wèn)題解決。Reasoner模塊需要能夠執(zhí)行多步推理,這可能涉及到對(duì)大量信息的分析和處理。它需要調(diào)用各種工具和數(shù)據(jù)庫(kù),以獲取外部知識(shí),支持其推理過(guò)程。

      Reasoner模塊還需要能夠形成和更新關(guān)于用戶狀態(tài)的信仰,這些信仰以結(jié)構(gòu)化語(yǔ)言對(duì)象的形式存儲(chǔ)在記憶中。這種信仰建模是Reasoner模塊的關(guān)鍵特征,它使得AI Agent能夠更好地理解用戶的需求和意圖,從而提供更準(zhǔn)確的服務(wù)。

      在實(shí)際應(yīng)用中,Talker和Reasoner模塊之間的交互是通過(guò)記憶來(lái)實(shí)現(xiàn)的。Reasoner模塊負(fù)責(zé)生成新的信仰狀態(tài),并將其存儲(chǔ)在記憶中。Talker模塊在需要時(shí)從記憶中檢索這些信仰狀態(tài),以支持其對(duì)話生成。

      這種設(shè)計(jì)允許Talker模塊即使在Reasoner模塊尚未完成其推理過(guò)程時(shí),也能夠繼續(xù)與用戶進(jìn)行互動(dòng)。該分工類(lèi)似于人類(lèi)的大腦,System1始終活躍,而System2則在需要時(shí)介入。

      Talker-Reasoner測(cè)試數(shù)據(jù)

      為了測(cè)試Talker-Reasoner的雙思維性能,研究人員用這個(gè)開(kāi)發(fā)了一個(gè)睡眠輔導(dǎo)Agent。在這個(gè)場(chǎng)景中,AI Agent需要與用戶進(jìn)行對(duì)話,提供關(guān)于改善睡眠習(xí)慣的建議和計(jì)劃。

      Talker模塊負(fù)責(zé)與用戶的直接互動(dòng),而Reasoner模塊則負(fù)責(zé)制定和調(diào)整睡眠輔導(dǎo)計(jì)劃。這種分工使得AI Agent能夠同時(shí)進(jìn)行快速的對(duì)話和復(fù)雜的規(guī)劃,提高了用戶體驗(yàn)。

      在測(cè)試中,Talker模塊通過(guò)一系列指令編碼專(zhuān)家知識(shí),指導(dǎo)其完成睡眠輔導(dǎo)的各個(gè)階段。這些指令不僅包括了與用戶互動(dòng)的規(guī)則,還包括了睡眠輔導(dǎo)的具體步驟和策略。Talker模塊需要能夠理解和回應(yīng)用戶的需求,同時(shí)保持對(duì)話的連貫性和自然性。

      Reasoner模塊則需要根據(jù)用戶的反饋和需求,調(diào)整和優(yōu)化睡眠輔導(dǎo)計(jì)劃。這可能涉及到調(diào)用外部資源,如睡眠相關(guān)的研究和建議,以及根據(jù)用戶的具體情況制定個(gè)性化的計(jì)劃。Reasoner模塊的設(shè)計(jì)使其能夠處理復(fù)雜的邏輯和推理,為用戶提供最合適的建議。

      在實(shí)際對(duì)話中,Talker和Reasoner模塊的協(xié)同工作被證明是有效的。Talker模塊能夠流暢地與用戶對(duì)話,而Reasoner模塊則能夠根據(jù)用戶的反饋調(diào)整和優(yōu)化輔導(dǎo)計(jì)劃。這種分工執(zhí)行使得AI Agent能夠同時(shí)處理快速的對(duì)話和復(fù)雜的規(guī)劃,極大提高了用戶體驗(yàn)。

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請(qǐng)謹(jǐn)慎對(duì)待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。

    即時(shí)

    新聞

    明火炊具市場(chǎng):三季度健康屬性貫穿全類(lèi)目

    奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。

    企業(yè)IT

    重慶創(chuàng)新公積金應(yīng)用,“區(qū)塊鏈+政務(wù)服務(wù)”顯成效

    “以前都要去窗口辦,一套流程下來(lái)都要半個(gè)月了,現(xiàn)在方便多了!”打開(kāi)“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。

    3C消費(fèi)

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,高能實(shí)力,創(chuàng)

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準(zhǔn)的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來(lái)實(shí)質(zhì)性的幫助,雙十一期間低至2799元,性價(jià)比很高,簡(jiǎn)直是創(chuàng)作者們的首選。

    研究

    中國(guó)信通院羅松:深度解讀《工業(yè)互聯(lián)網(wǎng)標(biāo)識(shí)解析體系

    9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會(huì)——工業(yè)互聯(lián)網(wǎng)標(biāo)識(shí)解析專(zhuān)題論壇在沈陽(yáng)成功舉辦。