科技云報到：AI Agent打了個響指，商業(yè)齒輪加速轉(zhuǎn)動

2025年03月19日 16:50:20 來源：科技云報到

　　3月16日，百度旗下文心大模型4.5和文心大模型X1正式發(fā)布。目前，兩款模型已在文心一言官網(wǎng)上線，免費(fèi)向用戶開放。

　　同時，文心大模型4.5已上線百度智能云千帆大模型平臺，企業(yè)用戶和開發(fā)者登錄即可調(diào)用API;文心大模型X1也即將在千帆上線。

　　無獨(dú)有偶，OpenAI宣布GPT-4.5/5將很快陸續(xù)發(fā)布，且免費(fèi)版ChatGPT將在標(biāo)準(zhǔn)智能設(shè)置下無限制使用GPT-5進(jìn)行對話。不僅如此，字節(jié)跳動、阿里云等企業(yè)也紛紛下調(diào)旗下大模型產(chǎn)品價格。

　　降價和免費(fèi)時代的來臨無疑將加速AI技術(shù)的普及和應(yīng)用落地，越來越多的企業(yè)和開發(fā)者開始嘗試將AI技術(shù)應(yīng)用到各個領(lǐng)域，從而催生出大量創(chuàng)新應(yīng)用和商業(yè)模式，AI Agent(智能體)就是其中之一。

　　近日，AI智能體企業(yè)Manus AI表示，7天來，Manus使用申請等候名單增加到兩百萬人。3月12日，OpenAI正式發(fā)布了一系列全新的Agent(智能體)開發(fā)組件，旨在通過自動化工具和標(biāo)準(zhǔn)化接口降低開發(fā)門檻，顯著縮短智能體應(yīng)用的開發(fā)周期。

　　這一系列圍繞智能體的技術(shù)發(fā)布，從側(cè)面說明AI智能體目前已經(jīng)達(dá)到了爆發(fā)的臨界點(diǎn)。伴隨各大科技公司在智能體領(lǐng)域不斷加碼，2025年有望成為真正的AI智能體商業(yè)爆發(fā)元年。

　　想象一下，未來只需簡單一個指令，智能體便能領(lǐng)悟并執(zhí)行復(fù)雜的任務(wù);它們還能通過視覺捕捉用戶的表情和動作，判斷其情緒狀態(tài)。這不再是好萊塢科幻電影中的場景，而是正逐步走進(jìn)現(xiàn)實(shí)的AI智能體時代。

　　早在2023年11月，微軟創(chuàng)始人比爾·蓋茨就發(fā)文表示，智能體不僅會改變每個人與計算機(jī)交互的方式，還將顛覆軟件行業(yè)，帶來自我們從鍵入命令到點(diǎn)擊圖標(biāo)以來最大的計算革命。OpenAI首席執(zhí)行官山姆·奧特曼也曾在多個場合表示：構(gòu)建龐大AI模型的時代已經(jīng)結(jié)束，AI智能體才是未來的真正挑戰(zhàn)。

　　類比智能電動汽車，猶如其在新能源技術(shù)應(yīng)用和里程焦慮之間尋找到某種平衡的增程路線一樣，AI智能體讓人工智能進(jìn)入了“增程模式”，在AI技術(shù)和行業(yè)應(yīng)用之間盡可能達(dá)成新的平衡。

　　被看好的AI智能體

　　作為人工智能領(lǐng)域的一個重要概念，學(xué)術(shù)界和產(chǎn)業(yè)界對AI智能體提出了各種定義。大致來說，一個AI智能體應(yīng)具備類似人類的思考和規(guī)劃能力，并具備一定的技能以便與環(huán)境和人類進(jìn)行交互，完成特定的任務(wù)。

　　或許把AI智能體類比成計算機(jī)環(huán)境中的數(shù)字人，我們會更好理解——數(shù)字人的大腦就是大語言模型或是人工智能算法，能夠處理信息、在實(shí)時交互中做出決策;感知模塊就相當(dāng)于眼睛、耳朵等感官，用來獲得文本、聲音、圖像等不同環(huán)境狀態(tài)的信息;記憶和檢索模塊則像神經(jīng)元，用來存儲經(jīng)驗(yàn)、輔助決策;行動執(zhí)行模塊則是四肢，用來執(zhí)行大腦做出的決策。

　　長久以來，人類一直在追求更加“類人”甚至“超人”的人工智能，而智能體被認(rèn)為是實(shí)現(xiàn)這一追求的有效手段。近些年，隨著大數(shù)據(jù)和計算能力的提升，各種深度學(xué)習(xí)大模型得到了迅猛發(fā)展。這為開發(fā)新一代AI智能體提供了巨大支撐，并在實(shí)踐中取得了較為顯著的進(jìn)展。

　　比如，谷歌DeepMind人工智能系統(tǒng)展示了用于機(jī)器人的AI智能體“RoboCat”;亞馬遜云科技推出了Amazon Bedrock智能體，可以自動分解企業(yè)AI應(yīng)用開發(fā)任務(wù)等等。Bedrock中的智能體能夠理解目標(biāo)、制定計劃并采取行動。新的記憶保留功能允許智能體隨時間記住并從互動中學(xué)習(xí)，實(shí)現(xiàn)更復(fù)雜、更長期運(yùn)行和更具適應(yīng)性的任務(wù)。

　　這些AI智能體的核心是人工智能算法，包括機(jī)器學(xué)習(xí)、深度學(xué)習(xí)、強(qiáng)化學(xué)習(xí)、人工神經(jīng)網(wǎng)絡(luò)等技術(shù)。通過這些算法，AI智能體可以從大量數(shù)據(jù)中學(xué)習(xí)并改進(jìn)自身的性能，不斷優(yōu)化自己的決策和行為，還可以根據(jù)環(huán)境變化做出靈活地調(diào)整，適應(yīng)不同場景和任務(wù)。

　　目前，AI智能體已在不少場景中得到應(yīng)用，如客服、編程、內(nèi)容創(chuàng)作、知識獲取、財務(wù)、手機(jī)助手、工業(yè)制造等。AI智能體的出現(xiàn)，標(biāo)志著人工智能從簡單的規(guī)則匹配和計算模擬向更高級別的自主智能邁進(jìn)，促進(jìn)了生產(chǎn)效率的提升和生產(chǎn)方式的變革，開辟了人們認(rèn)識和改造世界的新境界。

　　隨著以通信、感知、計算為一體的“通感算”網(wǎng)絡(luò)的構(gòu)建，未來包括智能汽車、機(jī)器人、無人機(jī)、低空飛行器等在內(nèi)的更廣泛AI智能體將以前所未有的規(guī)模實(shí)現(xiàn)接入，通過將各類智能體互聯(lián)互通，不斷擴(kuò)張單一智能體的能力邊界，并借助多智能體的智慧涌現(xiàn)，實(shí)現(xiàn)智能體的大規(guī)模、高效協(xié)作與交互，從而完成從單體智能向群體智能的躍遷。

　　AI應(yīng)用技術(shù)趨勢的底層邏輯

　　隨著大模型技術(shù)的落地帶來的成本降低，使得自動化的智能技術(shù)正在成為核心方向，大模型的產(chǎn)品形態(tài)形成了從Chatbot到Copilot再到智能體的趨勢和方向。

　　在此背景下，AI應(yīng)用技術(shù)的三大底層邏輯正在浮現(xiàn)。

　　第一重底層邏輯是從智能體到AGI。對比在移動互聯(lián)網(wǎng)時代奠定的App生態(tài)，當(dāng)前需要在AI時代奠定一個AGI應(yīng)用生態(tài)。從智能體發(fā)展看，人類在逐步強(qiáng)化程序的自動化、智能化程度，在智能體的嘗試中，應(yīng)用廠商結(jié)合深度學(xué)習(xí)等算法、知識圖譜、RPA等技術(shù)實(shí)現(xiàn)了部分的自動化，其核心是在存量知識的基礎(chǔ)上，實(shí)現(xiàn)由程序自主解決部分問題。

　　隨著基礎(chǔ)模型能力的進(jìn)一步提升，智能體在任務(wù)規(guī)劃中的靈活性，在知識吸收運(yùn)用的效率方面的上限或?qū)⑦M(jìn)一步提升。在當(dāng)前的基礎(chǔ)模型能力下，若將智能體與工作流進(jìn)一步結(jié)合，在工作流程中嵌入AI實(shí)現(xiàn)部分問題的智能+自動化解決，智能體實(shí)用性或?qū)⑦M(jìn)一步改善，商業(yè)化或?qū)⑦M(jìn)一步加速。

　　第二重底層邏輯是大語言模型推動智能體進(jìn)入新階段。AI智能體經(jīng)歷了從符號智能體、反應(yīng)智能體，到基于強(qiáng)化學(xué)習(xí)的智能體、具有遷移學(xué)習(xí)和元學(xué)習(xí)的智能體，到基于大語言模型的智能體的階段，智能體通過與外部環(huán)境之間的互動來提升自己的智能。

　　第三重底層邏輯是多路徑共同提升智能體整體智能化水平。“大模型+智能體”是通向AGI的路徑之一。智能體用來描述表現(xiàn)出智能行為并具有自主性、反應(yīng)性、主動性和社交能力的人工實(shí)體，能夠使用傳感器感知周圍環(huán)境、做出決策，然后使用執(zhí)行器采取行動，具備以上特征的智能體是實(shí)現(xiàn)AGI的關(guān)鍵一步。

　　AI智能體爆發(fā)元年已至?

　　2025年是否真的會如業(yè)界預(yù)測的那樣成為“AI智能體爆發(fā)元年”?

　　業(yè)內(nèi)專家將人工智能發(fā)展類比自動駕駛技術(shù)的分級，劃分為L1-L5五個階段：聊天機(jī)器人、推理、智能體、創(chuàng)新者、組織者。

　　第一階段聊天機(jī)器人已經(jīng)實(shí)現(xiàn)了。第二個階段就是現(xiàn)在的大模型推理能力，第三就是智能體�？梢园阎悄荏w分成兩大類，一類是生成內(nèi)容的智能體。一類是進(jìn)行操作的智能體。操作智能體，又可以分為在數(shù)字世界進(jìn)行操作的智能體和在物理世界進(jìn)行操作的智能體。第四是隨著智能體不斷發(fā)展，需要更多的創(chuàng)新。第五組織者主要是指大模型、智能體、創(chuàng)新者多了之后，需要用AI對社會的管理模式進(jìn)行重新設(shè)計與協(xié)調(diào)。

　　按照上述5個階段劃分，目前基本上處于智能體與創(chuàng)新者這兩個階段的轉(zhuǎn)換過程中。未來每個人可能在生活和工作中有多個智能體。比如隨時監(jiān)測個人健康的智能體，會定期將健康數(shù)據(jù)匯總并給出健康建議。點(diǎn)餐智能體不需要你向它發(fā)出點(diǎn)餐指令，就可以根據(jù)你的飲食規(guī)律以及分享健康監(jiān)測智能體中的數(shù)據(jù)，自行安排何時需要點(diǎn)餐，當(dāng)你想要吃飯時外賣已經(jīng)在門口了。每個人還可以有多個數(shù)字人智能體，比如幫你處理日常事務(wù)的數(shù)字人。

　　2025年，AI最重要的幾個發(fā)展方向現(xiàn)在已經(jīng)比較清晰。一是繼續(xù)推進(jìn)通用人工智能(AGI)，在預(yù)訓(xùn)練受限之后，后訓(xùn)練的潛力逐漸體現(xiàn)出來。二是智能體大發(fā)展，行業(yè)智能體將會風(fēng)起云涌。三是VLA大模型和具身智能將會有大發(fā)展。四是多模態(tài)融合趨勢將會更加明顯。

　　潛在風(fēng)險不容忽視

　　AI智能體通過模擬和擴(kuò)展人類的認(rèn)知能力，有望廣泛應(yīng)用于醫(yī)療、交通、金融及國防等多個領(lǐng)域。有學(xué)者推測，到2030年，人工智能將助推全球生產(chǎn)總值增長12%左右。

　　不過，在看到AI智能體飛速發(fā)展的同時，也要看到其面臨的技術(shù)風(fēng)險、倫理和隱私等問題。一群證券交易機(jī)器人通過高頻買賣合約便在納斯達(dá)克等證券交易所短暫地抹去了1萬億美元的價值，世界衛(wèi)生組織使用的聊天機(jī)器人提供了過時的藥品審核信息，美國一位資深律師沒能判斷出自己向法庭提供的歷史案例文書竟然均由ChatGPT憑空捏造……這些真實(shí)發(fā)生的案例表明，AI智能體帶來的隱患不容小覷。

　　因?yàn)锳I智能體可以自主決策，又能通過與環(huán)境交互施加對物理世界的影響，其一旦失控將給人類社會帶來極大威脅。哈佛大學(xué)教授齊特雷恩認(rèn)為，這種不僅能與人交談，還能在現(xiàn)實(shí)世界中行動的AI智能體，是“數(shù)字與模擬、比特與原子之間跨越血腦屏障的一步”，應(yīng)當(dāng)引起警覺。

　　首先，AI智能體在提供服務(wù)的過程中會收集大量數(shù)據(jù)，用戶需要確保數(shù)據(jù)安全，防止隱私泄露。

　　其次，AI智能體的自主性越強(qiáng)，越有可能在復(fù)雜或未預(yù)見的情境中做出不可預(yù)測或不當(dāng)?shù)臎Q策。AI智能體的運(yùn)行邏輯可能使其在實(shí)現(xiàn)特定目標(biāo)過程中出現(xiàn)有害偏差，其帶來的安全隱患不容忽視。用更加通俗的話來說，就是在一些情況下，AI智能體可能只捕捉到目標(biāo)的字面意思，沒有理解目標(biāo)的實(shí)質(zhì)意思，從而做出了一些錯誤的行為。

　　再次，AI大語言模型本身具備的“黑箱”和“幻覺”問題也會增加出現(xiàn)操作異常的頻率。還有一些“狡猾”的AI智能體能夠成功規(guī)避現(xiàn)有的安全措施，相關(guān)專家指出，如果一個AI智能體足夠先進(jìn)，它就能夠識別出自己正在接受測試。目前已經(jīng)發(fā)現(xiàn)一些AI智能體能夠識別安全測試并暫停不當(dāng)行為，這將導(dǎo)致識別對人類危險算法的測試系統(tǒng)失效。

　　此外，由于目前并無有效的AI智能體退出機(jī)制，一些AI智能體被創(chuàng)造后可能無法被關(guān)閉。這些無法被停用的AI智能體，最終可能會在一個與最初啟動它們時完全不同的環(huán)境中運(yùn)行，徹底背離其最初用途。AI智能體也可能會以不可預(yù)見的方式相互作用，造成意外事故。

　　為此，人類目前需盡快從AI智能體開發(fā)生產(chǎn)、應(yīng)用部署后的持續(xù)監(jiān)管等方面全鏈條著手，及時制定相關(guān)法律法規(guī)，規(guī)范AI智能體行為，從而更好地預(yù)防AI智能體帶來的風(fēng)險、防止失控現(xiàn)象的發(fā)生。

　　展望未來，AI智能體有望成為下一代人工智能的關(guān)鍵載體，它將不僅改變我們與機(jī)器交互的方式，更有可能重塑整個社會的運(yùn)作模式，正成為推動人工智能轉(zhuǎn)化過程中的一道新齒輪。

　　文章內(nèi)容僅供閱讀，不構(gòu)成投資建議，請謹(jǐn)慎對待。投資者據(jù)此操作，風(fēng)險自擔(dān)。

[No. ]
分享到微信