審視AI Agent：追捧、落地，和2024年的To B破局點

2023年12月27日 09:39:50 作者|斗斗編輯|皮爺 來源：產(chǎn)業(yè)家

　　“十個AI應用里面，五個辦公Agent，三個AIGC，還有兩成是回春的數(shù)字人。”那么，Agent到底是不是大模型的AGI終局產(chǎn)品?

　　作者|斗斗

　　編輯|皮爺

　　出品|產(chǎn)業(yè)家

　　今年4月份，斯坦福和谷歌的研究者共同創(chuàng)建了一個“西部世界小鎮(zhèn)(Westworldsimulation)”，在這個小鎮(zhèn)里，25個智能體可執(zhí)行類似人類的日常行為，比如起床后做早餐然后去上班，藝術(shù)家作畫，作家寫作。

　　一組數(shù)據(jù)顯示，截止11月中旬，AI Agent賽道發(fā)生融資事件13起，總?cè)谫Y金額約735億人民幣，公司融資均值為56.54億人民幣。這些就是如今人們共同談論的“AI Agent實驗”。而在國內(nèi)的今年下半年，大模型市場的玩家們，似乎正齊刷刷地轉(zhuǎn)向AI Agent——這個清晰可見的AGI終局產(chǎn)品。

　　而在國外，這一領域亦是火爆。“至少有100個項目正致力于將AI代理商業(yè)化，近10萬名開發(fā)人員正在構(gòu)建自主Agent。”外媒MattSchlicht曾表示。

　　AI Agent為何如此火爆?

　　關于AI Agent的想象力，一個高贊回答是：“大語言模型只能編個貪吃蛇，而AI Agent可以整出一個王者榮耀。”

　　成熟的AI Agent可以使軟件生產(chǎn)大幅降低成本。未來Coding工作流中會很多Agent臨時寫成的軟件和測試方案，不追求長期的可復用性，可以隨用隨拋。目前一家軟件行業(yè)巨頭動輒上萬甚至十萬人，有了AI Agent之后研發(fā)、交付需要耗費的人力和資金將大幅降低。而且使得軟件可以靈活地解決更多長尾需求。

　　此外，AI Agent或?qū)長LM搭建一套框架來進行深度思考和分析，從而做出更復雜和可靠的決策。

　　總之，就像微軟創(chuàng)始人比爾·蓋茨所說的那樣：“誰能主宰個人助理Agent，那才是大事。因為你將永遠不去搜索網(wǎng)站，不去生產(chǎn)力網(wǎng)站，不去亞馬遜。”

　　值得注意的是，在這種巨大的技術(shù)變革下，目前我們?nèi)詻]有切身體會到AI Agent所帶來的紅利和變化。很明顯，AI Agent的發(fā)展仍面臨一些難題。

　　一些值得探討的問題是，國內(nèi)外AI Agent的發(fā)展現(xiàn)狀如何?AI Agent落地的關鍵點是什么?以及AI Agent未來是怎樣的?

　　一、AI Agent現(xiàn)狀，海外VS本土

　　目前，國內(nèi)一些科技公司已經(jīng)產(chǎn)出了數(shù)個知名大模型，因此孕育而生的Agent智能體應用也開始逐漸進入大眾視野。

　　例如百度將文心大模型應用到智能搜索、自動駕駛;阿里將通義千問模型應用到高德地圖、優(yōu)酷，盒馬等產(chǎn)品。華為將其盤古模型應用到智能氣象、語音識別等。

　　一家叫面壁智能的創(chuàng)業(yè)也公司推出了他們的AI Agent產(chǎn)品ChatDev，可以在短時間內(nèi)完成一個軟件或者一個小游戲的開發(fā)，用戶所需要做的，只是提供給它一個要求。

　　例如釘釘魔法棒套件中，從聊天AI、文檔AI、會議AI、宜搭AI、TeambitionAI等都匯集了釘釘AI產(chǎn)品能力;騰訊會議中的“會議助理”功能提供了一些智能化的支持，如自動總結(jié)會議紀要、轉(zhuǎn)錄和翻譯;百度推出的智能工作平臺如流搭載了文心大模型，可以實現(xiàn)智能創(chuàng)作、智能推薦等功能;字節(jié)跳動旗下的辦公軟件飛書宣布推出智能AI助手“MyAI”，旨在提升團隊協(xié)作效率。值得注意的是，協(xié)同辦公領域似乎是巨頭們做AI Agent的“必經(jīng)之地”。

　　曾有投資人對媒體調(diào)侃：“十個AI應用里面，五個辦公Agent，三個AIGC，還有兩成是回春的數(shù)字人。”這不僅是國內(nèi)AI Agent發(fā)展的現(xiàn)狀，其實從國外一些諸如谷歌、微軟等企業(yè)也在將AI Agent落于協(xié)同辦公場景。

　　其實在海外，AI Agent概念從出現(xiàn)到爆發(fā)，已經(jīng)邁過多個階段。

　　在單一Agent階段，主要是針對不同領域和場景的特定任務，開發(fā)和部署專門的智能體。以GPTengineer為例，給它一個需求，其就可以把代碼寫個大概。

　　而多Agent合作階段，是由不同角色的Agent自動合作完成復雜的任務。例如在MetaGPT上，如果讓其做一個股票分析的工具，它會把這個任務分別翻譯給產(chǎn)品經(jīng)理、架構(gòu)師、項目經(jīng)理等5個角色，模擬整個的軟件開發(fā)中所有決策工作流。

　　不過，隨著微軟全新工具AutoGen的發(fā)布，AI Agent很快翻開了新的篇章。

　　AutoGen允許多個LLM智能體通過聊天來解決任務。LLM智能體可以扮演各種角色，如程序員、設計師，或者是各種角色的組合，對話過程就把任務解決了。這與MetaGPT不同，MetaGPT的角色模型是被定義好的，而AutoGen可以讓開發(fā)者自己定義Agent，還可以讓他們相互對話。

　　微軟在AI Agent的布局較早。2023年3月Microsoft365Copilot發(fā)布，在當時便提示了一種基于LLM的應用開發(fā)范式，即Agent。目前，微軟CopilotStudio已經(jīng)支持自定義ChatGPT助手無縫集成在CRM、ERP、OA等日常辦公系統(tǒng)中。這是一個新的且富有創(chuàng)造性的Agent框架。在AutoGen發(fā)布的兩個星期內(nèi)，星標量從390狂增到10K，并在Discord上吸引了5000多名成員。

　　可以發(fā)現(xiàn)微軟的AI Agent能力主要是從其本身業(yè)務衍生出來的，AutoGen更像是一種自身基于業(yè)務所打造的能力的外放，這與OpenAI并不相同。

　　OpenAI開發(fā)的GPTs，以及推出的GPT-4Turbo和可定制AI Agent，使得每個人都可以打造自己的大模型應用。諸多業(yè)內(nèi)人士認為，超低的創(chuàng)建門檻和APP Store一樣的商業(yè)模型，會讓OpenAI快速構(gòu)建GPTs生態(tài)。

　　值得注意的是，目前海外已經(jīng)在零售、房地產(chǎn)、旅游、客戶服務、人力資源、金融、制造業(yè)等多個領域出現(xiàn)AI Agent架構(gòu)與產(chǎn)品。OpenAI提供的是基礎Agent的構(gòu)建能力，如工具調(diào)用、基于知識庫文件記憶能力等。這項產(chǎn)品的發(fā)布，使得AI Agent進入了另外一個新階段，即為人人都可以打造自己的Agent提供了一種可能性。

　　例如零售領域的亞馬遜Alexa、Aktify、Regie.ai等;房地產(chǎn)領域的Epique、propertypen、Listingcopy等;客戶服務領域的Agent4、Ebi.Ai、JasonAI、Aide等;人力資源領域的AutonomousHRChatbot、AIInterviewCoach、CareersAI等。

　　總體來看，在AI Agent在底層技術(shù)、架構(gòu)以及具體產(chǎn)品應用等方面都較為完善。像OpenAI、微軟、谷歌這類科技巨頭，有著先發(fā)優(yōu)勢。另一個可以看到的現(xiàn)象是，國內(nèi)AI Agent的深度與廣度仍有所差距。

　　一個值得思考的問題是，Agent落地的關鍵是什么?

　　二、Agent落地的關鍵：

　　模型?行業(yè)經(jīng)驗?還是載體?

　　當前市場上的大多數(shù)Agent，包括OpenAI推出的GPTs，其實只是構(gòu)建了一個基于特定知識庫或?qū)I(yè)數(shù)據(jù)的Chatbot。這些智能體主要用于進行問答交互，如獲取行業(yè)資訊、報告等。

　　然而，在程序聯(lián)動和操作方面還有很大的提升空間。目前，我們還無法直接使用GPTs來操作SAP或金蝶等ERP系統(tǒng)，因為這涉及到API的應用、授權(quán)、維護以及無API管理軟件的連接問題。

　　對于企業(yè)而言，如果GPTs等AI智能體僅用于知識問答，那么其作用將非常有限，就像一個玩具一樣，因為它目前還無法深入到企業(yè)的業(yè)務流程中。

　　這背后的原因有很多，包括模型能力、行業(yè)經(jīng)驗、場景貼合度等，都會影響Agent的能力體現(xiàn)。

　　AI Agent需要具備感知環(huán)境、做出決策并執(zhí)行適當行動的能力。在這些關鍵步驟中，最重要的是理解輸入給Agent的內(nèi)容、進行推理、規(guī)劃、做出準確決策，并將其轉(zhuǎn)化為可執(zhí)行的原子動作序列，以實現(xiàn)最終目標。

　　目前，許多研究利用LLM作為AI Agent的認知核心，這些模型的發(fā)展為完成這一步驟提供了質(zhì)量保證。因此，基于GPT-4的Agent表現(xiàn)得更加智能。

　　但就目前而言，包括GPT-4在內(nèi)的所有大模型，能力仍需提升。

　　不過針對模型能力不足這一問題，智譜AI&清華KEG提出了一種對齊Agent能力的微調(diào)方法AgentTuning，該方法使用少量數(shù)據(jù)微調(diào)已有模型，顯著激發(fā)了模型的Agent能力，同時可以保持模型原有的通用能力。“底座模型問題都還很大，AI Agent真正落地還要等更優(yōu)秀的模型。”某位身處大模型技術(shù)一線的業(yè)內(nèi)人士對產(chǎn)業(yè)家說。

　　“如果一篇論文提出了某種不同的訓練方法，OpenAI內(nèi)部的Slack上會嗤之以鼻,因為這些都是我們玩剩下的。但是當新的AI Agents論文出來的時候,我們才會認真興奮的討論。”這是OpenAI聯(lián)合創(chuàng)始人AndrejKarpathy最近發(fā)表的一段講話。AI Agent的行業(yè)經(jīng)驗對于其落地也至關重要。

　　簡而言之，我們基于大模型能做出什么樣的東西，說到底還是要靠行業(yè)經(jīng)驗，而這恰是OpenAI等一眾大模型巨頭們所欠缺的。

　　要知道，企業(yè)要引入AI Agent進行流程優(yōu)化，必須經(jīng)過成本控制、投入預算、實現(xiàn)效率、安全管控等多方面嚴格及縝密的評估。這就要求技術(shù)供應商提供的必須是平臺級解決方案，而不是只針對單一、個別場景需求來提供的AI Agent自動化解決方案。

　　大型企業(yè)引入新的AI技術(shù)不允許任何試錯成本，因此技術(shù)供應商給出的解決方案必須是開箱即用、具備行業(yè)Know-How術(shù)語和業(yè)務規(guī)則的真實智能體數(shù)字員工。也只有這樣的標準化AI Agent，才能被納入企業(yè)的內(nèi)部編制中去統(tǒng)一管理和調(diào)度。

　　例如，一個醫(yī)療行業(yè)的AI Agent需要具備醫(yī)學知識，并能夠理解和處理醫(yī)療數(shù)據(jù)。一個金融行業(yè)的AI Agent需要具備金融知識，并能夠理解和處理金融數(shù)據(jù)。

　　AI Agent的落地效果也受限于應用場景。在如出行預訂中，得益于豐富的API等問題，AI Agent表現(xiàn)出色。而在如法律助手場景中，由于新知識的頻繁出現(xiàn)和API的不完善，實際應用面臨更多挑戰(zhàn)。

　　這一點，從國內(nèi)AI Agent紛紛生長于協(xié)同辦公平臺就可見一斑。

　　事實上，協(xié)同辦公平臺本身具備良好的API接口和插件體系，這使得將大模型集成到現(xiàn)有工具中變得更加容易。

　　此外，許多企業(yè)和組織都在使用協(xié)同辦公軟件，這意味著大模型可以迅速覆蓋大量的潛在用戶。廣泛的用戶基礎可以加速大模型的迭代和優(yōu)化過程，使其更好地滿足用戶需求。

　　還有大量的數(shù)據(jù)資源助于提高模型的性能，豐富的場景也可以推動大模型技術(shù)持續(xù)改進。

　　釘釘、飛書和企業(yè)微信在作為Agent載體時，也各自具有不同的優(yōu)勢。釘釘提供了完善的組織架構(gòu)管理功能，可以方便地創(chuàng)建、管理和調(diào)整團隊架構(gòu)，使得企業(yè)能夠快速搭建適應其需求的組織結(jié)構(gòu)。

　　企業(yè)微信與微信互通，這使得其AI Agent有可能借助微信龐大的用戶數(shù)據(jù)和應用場景，提供更加個性化和場景化的服務。飛書強調(diào)實時協(xié)作和溝通，支持多人在線編輯文檔、共同討論等功能，有助于團隊高效地完成協(xié)作任務。其特有的一體化，使得整個辦公流程更加標準化。

　　站在這個角度來看，國內(nèi)AI Agent扎堆協(xié)同辦公領域，則變得理所當然。而找到一個適合AI Agent落地的場景或者說載體更為重要。

　　不過，除了協(xié)同辦公，還有許多其他載體可能更適合AI Agent的落地應用。

　　例如智能客服、智能助手、RPA、CRM等。具體來看，在智能客服方面，AI Agent可以自動回答用戶的問題，處理投訴和建議，提高客戶滿意度和效率。在智能助手方面，蘋果公司的Siri、谷歌公司的GoogleAssistant和亞馬遜公司的Alexa都是智能助手的代表。

　　在智能流程自動化方面，許多企業(yè)采用智能流程自動化工具，如UiPath、BluePrism等，來自動完成某些特定的業(yè)務流程。

　　在智能營銷方面，許多營銷平臺都集成了AI Agent，如HubSpot、Salesforce等。這些平臺的AI Agent可以通過數(shù)據(jù)分析和機器學習技術(shù)，提供精準的營銷建議和預測，幫助企業(yè)更好地了解客戶需求，提高銷售業(yè)績。

　　總而言之，模型能力是核心，行業(yè)經(jīng)驗是關鍵，載體是保障。無論是模型能力還是行業(yè)經(jīng)驗抑或是載體都是AI Agent落地的關鍵。值得注意的是，國內(nèi)的軟件業(yè)態(tài)，倒逼國內(nèi)廠商造就了一身定制化、個性化能力，這種能力側(cè)面驗證了國內(nèi)企業(yè)在技術(shù)落地上的潛力，這將會進一步推動Agent的落地。

　　三、AI Agent的終局是什么?

　　在文章開篇的“西部世界小鎮(zhèn)(Westworldsimulation)”里，這些智能體可以與別人和環(huán)境交流(互相注意到彼此舉動、發(fā)起對話或者問候)、反思這些觀察結(jié)果(形成獨特的個人觀點)、制定每天的計劃。他們擁有自己記憶和目標，會產(chǎn)生可信的個人和涌現(xiàn)的社交行為，而不是通過預先設計實現(xiàn)。

　　例如從用戶指定的單一任務開始，即一個AI Agent想要舉辦情人節(jié)聚會，AI Agent們在接下來的時間里會自發(fā)的傳播邀請、認識新朋友、互相約出參加聚會的日期，并協(xié)調(diào)在正確的時間一起出現(xiàn)在聚會上。

　　這是Agent項目里具有代表性的應用。人們之所以為這個項目感到驚訝，是因為Agent的交互出現(xiàn)了人類意料之外的現(xiàn)象。AI Agent爆發(fā)的一段時間，人們普遍認為補齊了大模型短板的AI Agent更具備實用性，將是大模型重要落地方向。

　　隨著Agent的構(gòu)建越發(fā)簡單，Agent生態(tài)的成熟會讓C端Agent出現(xiàn)百花齊放的局面，面對用戶，Agent將會更加接地氣，引起新一輪的爆發(fā)。

　　但就目前而言，這一路徑的商業(yè)化存在諸多問題。拿游戲場景而言，目前收費主要來源于出售游戲裝備、皮膚等方式。而AI Agent的價值無法體現(xiàn)在這些固有的變現(xiàn)途徑上。并且就目前Agent落地效果來看，未出現(xiàn)顛覆性的能力，C端用戶是否會為其買單無法得知。

　　更值得注意的是，隨著讓C端Agent百花齊放，其應用價值方面也隨邊際效應而無限趨向于更小量級。換言之，AI Agent能否成為AI大模型從C端商業(yè)化爆發(fā)一個最核心應用方向，還需時間驗證。且即使未來會成為C端商業(yè)化爆發(fā)一個最核心應用方向，但其“壽命”并不長。

　　一個事實是，AI Agent最終的落腳點或?qū)⒃贐端。

　　比爾蓋茨認為，智能體作為下一個平臺，將會影響人們使用軟件的方式以及軟件的編寫方式。它更擅長查找信息并為用戶總結(jié)信息，能夠會為用戶找到最優(yōu)惠的價格，將取代搜索網(wǎng)站及電商網(wǎng)站，也將取代文字處理器、電子表格和其它生產(chǎn)力應用程序。并且，現(xiàn)在各自獨立的搜索廣告、廣告社交網(wǎng)絡、購物、生產(chǎn)力軟件等，都將變成智能體這一項業(yè)務。Agent會徹底改變應用軟件的打開方式。

　　這些變革來臨之前，相對于 Agent本身帶來的影響，如何構(gòu)建一個Agent，是一個更值得關注的問題。

　　Agent構(gòu)建平臺上，企業(yè)或?qū)⒖梢宰约簶?gòu)建自己RPA、CRM、辦公OA等一系列管理軟件;軟件廠商也可以基于此平臺構(gòu)建軟件為企業(yè)提供服務。

　　對于身處或準備進入AI Agent領域的玩家而言，找到切入點以及好的商業(yè)模式至關重要。

　　未來AI Agent的發(fā)展將不僅僅局限于單體智能，而是會擴展到物的智能和機器人的聯(lián)動。

　　從群體智能的角度來看，ToC可能會形成更大的社區(qū)化虛擬組織，每個人的Agent都能通過虛擬數(shù)據(jù)連接在一起;而ToB則可能形成虛擬的組織和企業(yè)，不同的企業(yè)和員工都能通過智能體納入到網(wǎng)絡當中。

　　最終，整個社會將變成一個巨大的虛實結(jié)合的網(wǎng)絡，形成“智聯(lián)網(wǎng)”。在這個網(wǎng)絡中，不同的智能體將提供更強的生產(chǎn)力，重新塑造整個生產(chǎn)關系，從而提升整個社會的產(chǎn)能。

　　因此，AI Agent的發(fā)展前景非常廣闊，它們將不斷擴展其應用范圍和影響力，為未來的社會發(fā)展帶來巨大的變革和機遇。

　　時至今日，AI Agent雖然帶來了諸多想象力，卻仍舊存在諸多質(zhì)疑。技術(shù)發(fā)展之路本就充滿質(zhì)疑與批判，科技變革對于任何一個企業(yè)與個體都是一場機遇，關鍵在于如何把握它。

　　文章內(nèi)容僅供閱讀，不構(gòu)成投資建議，請謹慎對待。投資者據(jù)此操作，風險自擔。

[No. ]
分享到微信