百川智能發(fā)布全鏈路領域增強金融大模型 Baichuan4-Finance年末家電消費觀察:品質(zhì)生活類產(chǎn)品熱賣,將持續(xù)迎來剛需式普及?GPT-5研發(fā)受阻:OpenAI 新一代模型難見突破性進展新一代語言模型ModernBERT發(fā)布,RAG等任務處理速度快四倍、成本低新研究顯示:Anthropic 的 Claude AI 在合作能力上領先于 OpenAI 和谷歌模型谷歌向投資者保證人工智能本月將迎來“驚人”表現(xiàn)多模態(tài)大模型引爆應用場景 階躍星辰完成數(shù)億美元融資星動紀元發(fā)布端到端原生機器人大模型ERA-42 實現(xiàn)機器人復雜場景操作免費模式強攻下,快手、抖音用“短劇VIP”反擊?低碳存儲助力算力產(chǎn)業(yè) 富士膠片首次亮相IDC大會行業(yè)唯一!海爾熱聲熱泵技術(shù)獲全國顛覆性技術(shù)創(chuàng)新大賽最高獎OPPO A5 Pro首創(chuàng)獵手天線架構(gòu):信號能穿十堵墻一加 Ace 5 Pro首發(fā)電競Wi-Fi芯片G1 帶來「穿墻王」和「搶網(wǎng)王」般的網(wǎng)絡體驗電視市場又出黑馬!TCL同檔Mini LED音畫王P12K,萬象分區(qū)打造超強控光!零下25℃如何取暖?海爾水暖通溫暖驛站亮相冰雪大世界馬太效應,強者恒強?——《中國企業(yè)科創(chuàng)力研究報告(2024)》美團年度報告竟然用上了AI和短。窟@下是真出圈了消息稱上汽大眾正開發(fā)三款新車,技術(shù)分別來自小鵬、智己和榮威鴻蒙智行泊車代駕VPD正式開啟全量推送!升級自動泊車/接駕等多項功能華為官方翻新手機最高降價4000元
  • 首頁 > 企業(yè)IT頻道 > 人工智能

    審視AI Agent:追捧、落地,和2024年的To B破局點

    2023年12月27日 09:39:50   來源:產(chǎn)業(yè)家

      “十個AI應用里面,五個辦公Agent,三個AIGC,還有兩成是回春的數(shù)字人。”那么,Agent到底是不是大模型的AGI終局產(chǎn)品?

      作者|斗斗

      編輯|皮爺

      出品|產(chǎn)業(yè)家

      今年4月份,斯坦福和谷歌的研究者共同創(chuàng)建了一個“西部世界小鎮(zhèn)(Westworldsimulation)”,在這個小鎮(zhèn)里,25個智能體可執(zhí)行類似人類的日常行為,比如起床后做早餐然后去上班,藝術(shù)家作畫,作家寫作。

      一組數(shù)據(jù)顯示,截止11月中旬,AI Agent賽道發(fā)生融資事件13起,總?cè)谫Y金額約735億人民幣,公司融資均值為56.54億人民幣。這些就是如今人們共同談論的“AI Agent實驗”。而在國內(nèi)的今年下半年,大模型市場的玩家們,似乎正齊刷刷地轉(zhuǎn)向AI Agent——這個清晰可見的AGI終局產(chǎn)品。

      而在國外,這一領域亦是火爆。“至少有100個項目正致力于將AI代理商業(yè)化,近10萬名開發(fā)人員正在構(gòu)建自主Agent。”外媒MattSchlicht曾表示。

      AI Agent為何如此火爆?

      關于AI Agent的想象力,一個高贊回答是:“大語言模型只能編個貪吃蛇,而AI Agent可以整出一個王者榮耀。”

      成熟的AI Agent可以使軟件生產(chǎn)大幅降低成本。未來Coding工作流中會很多Agent臨時寫成的軟件和測試方案,不追求長期的可復用性,可以隨用隨拋。目前一家軟件行業(yè)巨頭動輒上萬甚至十萬人,有了AI Agent之后研發(fā)、交付需要耗費的人力和資金將大幅降低。而且使得軟件可以靈活地解決更多長尾需求。

      此外,AI Agent或?qū)長LM搭建一套框架來進行深度思考和分析,從而做出更復雜和可靠的決策。

      總之,就像微軟創(chuàng)始人比爾·蓋茨所說的那樣:“誰能主宰個人助理Agent,那才是大事。因為你將永遠不去搜索網(wǎng)站,不去生產(chǎn)力網(wǎng)站,不去亞馬遜。”

      值得注意的是,在這種巨大的技術(shù)變革下,目前我們?nèi)詻]有切身體會到AI Agent所帶來的紅利和變化。很明顯,AI Agent的發(fā)展仍面臨一些難題。

      一些值得探討的問題是,國內(nèi)外AI Agent的發(fā)展現(xiàn)狀如何?AI Agent落地的關鍵點是什么?以及AI Agent未來是怎樣的?

      一、AI Agent現(xiàn)狀,海外VS本土

      目前,國內(nèi)一些科技公司已經(jīng)產(chǎn)出了數(shù)個知名大模型,因此孕育而生的Agent智能體應用也開始逐漸進入大眾視野。

      例如百度將文心大模型應用到智能搜索、自動駕駛;阿里將通義千問模型應用到高德地圖、優(yōu)酷,盒馬等產(chǎn)品。華為將其盤古模型應用到智能氣象、語音識別等。

      一家叫面壁智能的創(chuàng)業(yè)也公司推出了他們的AI Agent產(chǎn)品ChatDev,可以在短時間內(nèi)完成一個軟件或者一個小游戲的開發(fā),用戶所需要做的,只是提供給它一個要求。

      例如釘釘魔法棒套件中,從聊天AI、文檔AI、會議AI、宜搭AI、TeambitionAI等都匯集了釘釘AI產(chǎn)品能力;騰訊會議中的“會議助理”功能提供了一些智能化的支持,如自動總結(jié)會議紀要、轉(zhuǎn)錄和翻譯;百度推出的智能工作平臺如流搭載了文心大模型,可以實現(xiàn)智能創(chuàng)作、智能推薦等功能;字節(jié)跳動旗下的辦公軟件飛書宣布推出智能AI助手“MyAI”,旨在提升團隊協(xié)作效率。值得注意的是,協(xié)同辦公領域似乎是巨頭們做AI Agent的“必經(jīng)之地”。

      曾有投資人對媒體調(diào)侃:“十個AI應用里面,五個辦公Agent,三個AIGC,還有兩成是回春的數(shù)字人。”這不僅是國內(nèi)AI Agent發(fā)展的現(xiàn)狀,其實從國外一些諸如谷歌、微軟等企業(yè)也在將AI Agent落于協(xié)同辦公場景。

      其實在海外,AI Agent概念從出現(xiàn)到爆發(fā),已經(jīng)邁過多個階段。

      在單一Agent階段,主要是針對不同領域和場景的特定任務,開發(fā)和部署專門的智能體。以GPTengineer為例,給它一個需求,其就可以把代碼寫個大概。

      而多Agent合作階段,是由不同角色的Agent自動合作完成復雜的任務。例如在MetaGPT上,如果讓其做一個股票分析的工具,它會把這個任務分別翻譯給產(chǎn)品經(jīng)理、架構(gòu)師、項目經(jīng)理等5個角色,模擬整個的軟件開發(fā)中所有決策工作流。

      不過,隨著微軟全新工具AutoGen的發(fā)布,AI Agent很快翻開了新的篇章。

      AutoGen允許多個LLM智能體通過聊天來解決任務。LLM智能體可以扮演各種角色,如程序員、設計師,或者是各種角色的組合,對話過程就把任務解決了。這與MetaGPT不同,MetaGPT的角色模型是被定義好的,而AutoGen可以讓開發(fā)者自己定義Agent,還可以讓他們相互對話。

      微軟在AI Agent的布局較早。2023年3月Microsoft365Copilot發(fā)布,在當時便提示了一種基于LLM的應用開發(fā)范式,即Agent。目前,微軟CopilotStudio已經(jīng)支持自定義ChatGPT助手無縫集成在CRM、ERP、OA等日常辦公系統(tǒng)中。這是一個新的且富有創(chuàng)造性的Agent框架。在AutoGen發(fā)布的兩個星期內(nèi),星標量從390狂增到10K,并在Discord上吸引了5000多名成員。

      可以發(fā)現(xiàn)微軟的AI Agent能力主要是從其本身業(yè)務衍生出來的,AutoGen更像是一種自身基于業(yè)務所打造的能力的外放,這與OpenAI并不相同。

      OpenAI開發(fā)的GPTs,以及推出的GPT-4Turbo和可定制AI Agent,使得每個人都可以打造自己的大模型應用。諸多業(yè)內(nèi)人士認為,超低的創(chuàng)建門檻和APP Store一樣的商業(yè)模型,會讓OpenAI快速構(gòu)建GPTs生態(tài)。

      值得注意的是,目前海外已經(jīng)在零售、房地產(chǎn)、旅游、客戶服務、人力資源、金融、制造業(yè)等多個領域出現(xiàn)AI Agent架構(gòu)與產(chǎn)品。OpenAI提供的是基礎Agent的構(gòu)建能力,如工具調(diào)用、基于知識庫文件記憶能力等。這項產(chǎn)品的發(fā)布,使得AI Agent進入了另外一個新階段,即為人人都可以打造自己的Agent提供了一種可能性。

      例如零售領域的亞馬遜Alexa、Aktify、Regie.ai等;房地產(chǎn)領域的Epique、propertypen、Listingcopy等;客戶服務領域的Agent4、Ebi.Ai、JasonAI、Aide等;人力資源領域的AutonomousHRChatbot、AIInterviewCoach、CareersAI等。

      總體來看,在AI Agent在底層技術(shù)、架構(gòu)以及具體產(chǎn)品應用等方面都較為完善。像OpenAI、微軟、谷歌這類科技巨頭,有著先發(fā)優(yōu)勢。另一個可以看到的現(xiàn)象是,國內(nèi)AI Agent的深度與廣度仍有所差距。

      一個值得思考的問題是,Agent落地的關鍵是什么?

      二、Agent落地的關鍵:

      模型?行業(yè)經(jīng)驗?還是載體?

      當前市場上的大多數(shù)Agent,包括OpenAI推出的GPTs,其實只是構(gòu)建了一個基于特定知識庫或?qū)I(yè)數(shù)據(jù)的Chatbot。這些智能體主要用于進行問答交互,如獲取行業(yè)資訊、報告等。

      然而,在程序聯(lián)動和操作方面還有很大的提升空間。目前,我們還無法直接使用GPTs來操作SAP或金蝶等ERP系統(tǒng),因為這涉及到API的應用、授權(quán)、維護以及無API管理軟件的連接問題。

      對于企業(yè)而言,如果GPTs等AI智能體僅用于知識問答,那么其作用將非常有限,就像一個玩具一樣,因為它目前還無法深入到企業(yè)的業(yè)務流程中。

      這背后的原因有很多,包括模型能力、行業(yè)經(jīng)驗、場景貼合度等,都會影響Agent的能力體現(xiàn)。

      AI Agent需要具備感知環(huán)境、做出決策并執(zhí)行適當行動的能力。在這些關鍵步驟中,最重要的是理解輸入給Agent的內(nèi)容、進行推理、規(guī)劃、做出準確決策,并將其轉(zhuǎn)化為可執(zhí)行的原子動作序列,以實現(xiàn)最終目標。

      目前,許多研究利用LLM作為AI Agent的認知核心,這些模型的發(fā)展為完成這一步驟提供了質(zhì)量保證。因此,基于GPT-4的Agent表現(xiàn)得更加智能。

      但就目前而言,包括GPT-4在內(nèi)的所有大模型,能力仍需提升。

      不過針對模型能力不足這一問題,智譜AI&清華KEG提出了一種對齊Agent能力的微調(diào)方法AgentTuning,該方法使用少量數(shù)據(jù)微調(diào)已有模型,顯著激發(fā)了模型的Agent能力,同時可以保持模型原有的通用能力。“底座模型問題都還很大,AI Agent真正落地還要等更優(yōu)秀的模型。”某位身處大模型技術(shù)一線的業(yè)內(nèi)人士對產(chǎn)業(yè)家說。

      “如果一篇論文提出了某種不同的訓練方法,OpenAI內(nèi)部的Slack上會嗤之以鼻,因為這些都是我們玩剩下的。但是當新的AI Agents論文出來的時候,我們才會認真興奮的討論。”這是OpenAI聯(lián)合創(chuàng)始人AndrejKarpathy最近發(fā)表的一段講話。AI Agent的行業(yè)經(jīng)驗對于其落地也至關重要。

      簡而言之,我們基于大模型能做出什么樣的東西,說到底還是要靠行業(yè)經(jīng)驗,而這恰是OpenAI等一眾大模型巨頭們所欠缺的。

      要知道,企業(yè)要引入AI Agent進行流程優(yōu)化,必須經(jīng)過成本控制、投入預算、實現(xiàn)效率、安全管控等多方面嚴格及縝密的評估。這就要求技術(shù)供應商提供的必須是平臺級解決方案,而不是只針對單一、個別場景需求來提供的AI Agent自動化解決方案。

      大型企業(yè)引入新的AI技術(shù)不允許任何試錯成本,因此技術(shù)供應商給出的解決方案必須是開箱即用、具備行業(yè)Know-How術(shù)語和業(yè)務規(guī)則的真實智能體數(shù)字員工。也只有這樣的標準化AI Agent,才能被納入企業(yè)的內(nèi)部編制中去統(tǒng)一管理和調(diào)度。

      例如,一個醫(yī)療行業(yè)的AI Agent需要具備醫(yī)學知識,并能夠理解和處理醫(yī)療數(shù)據(jù)。一個金融行業(yè)的AI Agent需要具備金融知識,并能夠理解和處理金融數(shù)據(jù)。

      AI Agent的落地效果也受限于應用場景。在如出行預訂中,得益于豐富的API等問題,AI Agent表現(xiàn)出色。而在如法律助手場景中,由于新知識的頻繁出現(xiàn)和API的不完善,實際應用面臨更多挑戰(zhàn)。

      這一點,從國內(nèi)AI Agent紛紛生長于協(xié)同辦公平臺就可見一斑。

      事實上,協(xié)同辦公平臺本身具備良好的API接口和插件體系,這使得將大模型集成到現(xiàn)有工具中變得更加容易。

      此外,許多企業(yè)和組織都在使用協(xié)同辦公軟件,這意味著大模型可以迅速覆蓋大量的潛在用戶。廣泛的用戶基礎可以加速大模型的迭代和優(yōu)化過程,使其更好地滿足用戶需求。

      還有大量的數(shù)據(jù)資源助于提高模型的性能,豐富的場景也可以推動大模型技術(shù)持續(xù)改進。

      釘釘、飛書和企業(yè)微信在作為Agent載體時,也各自具有不同的優(yōu)勢。釘釘提供了完善的組織架構(gòu)管理功能,可以方便地創(chuàng)建、管理和調(diào)整團隊架構(gòu),使得企業(yè)能夠快速搭建適應其需求的組織結(jié)構(gòu)。

      企業(yè)微信與微信互通,這使得其AI Agent有可能借助微信龐大的用戶數(shù)據(jù)和應用場景,提供更加個性化和場景化的服務。飛書強調(diào)實時協(xié)作和溝通,支持多人在線編輯文檔、共同討論等功能,有助于團隊高效地完成協(xié)作任務。其特有的一體化,使得整個辦公流程更加標準化。

      站在這個角度來看,國內(nèi)AI Agent扎堆協(xié)同辦公領域,則變得理所當然。而找到一個適合AI Agent落地的場景或者說載體更為重要。

      不過,除了協(xié)同辦公,還有許多其他載體可能更適合AI Agent的落地應用。

      例如智能客服、智能助手、RPA、CRM等。具體來看,在智能客服方面,AI Agent可以自動回答用戶的問題,處理投訴和建議,提高客戶滿意度和效率。在智能助手方面,蘋果公司的Siri、谷歌公司的GoogleAssistant和亞馬遜公司的Alexa都是智能助手的代表。

      在智能流程自動化方面,許多企業(yè)采用智能流程自動化工具,如UiPath、BluePrism等,來自動完成某些特定的業(yè)務流程。

      在智能營銷方面,許多營銷平臺都集成了AI Agent,如HubSpot、Salesforce等。這些平臺的AI Agent可以通過數(shù)據(jù)分析和機器學習技術(shù),提供精準的營銷建議和預測,幫助企業(yè)更好地了解客戶需求,提高銷售業(yè)績。

      總而言之,模型能力是核心,行業(yè)經(jīng)驗是關鍵,載體是保障。無論是模型能力還是行業(yè)經(jīng)驗抑或是載體都是AI Agent落地的關鍵。值得注意的是,國內(nèi)的軟件業(yè)態(tài),倒逼國內(nèi)廠商造就了一身定制化、個性化能力,這種能力側(cè)面驗證了國內(nèi)企業(yè)在技術(shù)落地上的潛力,這將會進一步推動Agent的落地。

      三、AI Agent的終局是什么?

      在文章開篇的“西部世界小鎮(zhèn)(Westworldsimulation)”里,這些智能體可以與別人和環(huán)境交流(互相注意到彼此舉動、發(fā)起對話或者問候)、反思這些觀察結(jié)果(形成獨特的個人觀點)、制定每天的計劃。他們擁有自己記憶和目標,會產(chǎn)生可信的個人和涌現(xiàn)的社交行為,而不是通過預先設計實現(xiàn)。

      例如從用戶指定的單一任務開始,即一個AI Agent想要舉辦情人節(jié)聚會,AI Agent們在接下來的時間里會自發(fā)的傳播邀請、認識新朋友、互相約出參加聚會的日期,并協(xié)調(diào)在正確的時間一起出現(xiàn)在聚會上。

      這是Agent項目里具有代表性的應用。人們之所以為這個項目感到驚訝,是因為Agent的交互出現(xiàn)了人類意料之外的現(xiàn)象。AI Agent爆發(fā)的一段時間,人們普遍認為補齊了大模型短板的AI Agent更具備實用性,將是大模型重要落地方向。

      隨著Agent的構(gòu)建越發(fā)簡單,Agent生態(tài)的成熟會讓C端Agent出現(xiàn)百花齊放的局面,面對用戶,Agent將會更加接地氣,引起新一輪的爆發(fā)。

      但就目前而言,這一路徑的商業(yè)化存在諸多問題。拿游戲場景而言,目前收費主要來源于出售游戲裝備、皮膚等方式。而AI Agent的價值無法體現(xiàn)在這些固有的變現(xiàn)途徑上。并且就目前Agent落地效果來看,未出現(xiàn)顛覆性的能力,C端用戶是否會為其買單無法得知。

      更值得注意的是,隨著讓C端Agent百花齊放,其應用價值方面也隨邊際效應而無限趨向于更小量級。換言之,AI Agent能否成為AI大模型從C端商業(yè)化爆發(fā)一個最核心應用方向,還需時間驗證。且即使未來會成為C端商業(yè)化爆發(fā)一個最核心應用方向,但其“壽命”并不長。

      一個事實是,AI Agent最終的落腳點或?qū)⒃贐端。

      比爾蓋茨認為,智能體作為下一個平臺,將會影響人們使用軟件的方式以及軟件的編寫方式。它更擅長查找信息并為用戶總結(jié)信息,能夠會為用戶找到最優(yōu)惠的價格,將取代搜索網(wǎng)站及電商網(wǎng)站,也將取代文字處理器、電子表格和其它生產(chǎn)力應用程序。并且,現(xiàn)在各自獨立的搜索廣告、廣告社交網(wǎng)絡、購物、生產(chǎn)力軟件等,都將變成智能體這一項業(yè)務。Agent會徹底改變應用軟件的打開方式。

      這些變革來臨之前,相對于 Agent本身帶來的影響,如何構(gòu)建一個Agent,是一個更值得關注的問題。

      Agent構(gòu)建平臺上,企業(yè)或?qū)⒖梢宰约簶?gòu)建自己RPA、CRM、辦公OA等一系列管理軟件;軟件廠商也可以基于此平臺構(gòu)建軟件為企業(yè)提供服務。

      對于身處或準備進入AI Agent領域的玩家而言,找到切入點以及好的商業(yè)模式至關重要。

      未來AI Agent的發(fā)展將不僅僅局限于單體智能,而是會擴展到物的智能和機器人的聯(lián)動。

      從群體智能的角度來看,ToC可能會形成更大的社區(qū)化虛擬組織,每個人的Agent都能通過虛擬數(shù)據(jù)連接在一起;而ToB則可能形成虛擬的組織和企業(yè),不同的企業(yè)和員工都能通過智能體納入到網(wǎng)絡當中。

      最終,整個社會將變成一個巨大的虛實結(jié)合的網(wǎng)絡,形成“智聯(lián)網(wǎng)”。在這個網(wǎng)絡中,不同的智能體將提供更強的生產(chǎn)力,重新塑造整個生產(chǎn)關系,從而提升整個社會的產(chǎn)能。

      因此,AI Agent的發(fā)展前景非常廣闊,它們將不斷擴展其應用范圍和影響力,為未來的社會發(fā)展帶來巨大的變革和機遇。

      時至今日,AI Agent雖然帶來了諸多想象力,卻仍舊存在諸多質(zhì)疑。技術(shù)發(fā)展之路本就充滿質(zhì)疑與批判,科技變革對于任何一個企業(yè)與個體都是一場機遇,關鍵在于如何把握它。

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹慎對待。投資者據(jù)此操作,風險自擔。

    即時

    新聞

    明火炊具市場:三季度健康屬性貫穿全類目

    奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。

    企業(yè)IT

    重慶創(chuàng)新公積金應用,“區(qū)塊鏈+政務服務”顯成效

    “以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關材料,僅幾秒鐘,重慶市民曾某的賬戶就打進了21600元。

    3C消費

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,高能實力,創(chuàng)

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實質(zhì)性的幫助,雙十一期間低至2799元,性價比很高,簡直是創(chuàng)作者們的首選。

    研究

    中國信通院羅松:深度解讀《工業(yè)互聯(lián)網(wǎng)標識解析體系

    9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會——工業(yè)互聯(lián)網(wǎng)標識解析專題論壇在沈陽成功舉辦。