科技云報(bào)到原創(chuàng)。
2024年,是大模型翻天覆地的一年。
“百模大戰(zhàn)”爆發(fā)不久,大模型價(jià)格戰(zhàn)隨之而來,成本高昂的大模型幾乎進(jìn)入了免費(fèi)時(shí)代。大模型從龐大的實(shí)驗(yàn)室工具,轉(zhuǎn)變?yōu)楦咝ъ`活的應(yīng)用助手,以狂飆猛進(jìn)的速度在眾多行業(yè)落地生根。
不再有人質(zhì)疑大模型是“拿著錘子找釘子”,更急迫的需求來自市場端。行業(yè)對(duì)大模型應(yīng)用的渴望推動(dòng)著AI Agent走向前臺(tái),圍繞AI Agent的混戰(zhàn)已然開啟。
與此同時(shí),大模型的技術(shù)范式飛速演進(jìn),以視頻生成模型Sora為代表的多模態(tài)技術(shù)逐漸成熟,為人們帶來了巨大的想象空間。
這一年,大模型領(lǐng)域充滿著混亂和興奮,技術(shù)和應(yīng)用彼此成就,共同推動(dòng)著市場快速前行。
回顧2024年大模型產(chǎn)業(yè)發(fā)展,我們看到了一條逐漸清晰的演進(jìn)路徑:低成本降低了大模型落地的門檻;AI Agent提供了大模型絕佳的應(yīng)用方式;多模態(tài)直接拓寬了大模型的能力邊界,這一切都為大模型產(chǎn)業(yè)落地按下了加速鍵。
如果說“成本、AI Agent、多模態(tài)”三個(gè)關(guān)鍵詞,代表著2024年大模型的進(jìn)化方向,那么它們也代表著大模型邁向產(chǎn)業(yè)落地的關(guān)鍵節(jié)點(diǎn)。
隨著新一年的到來,這一發(fā)展趨勢(shì)是否會(huì)在2025年延續(xù)下去?大模型產(chǎn)業(yè)落地又將卷向何方?
成本:打通大模型落地的卡點(diǎn)
過去一年,大模型來到了更務(wù)實(shí)的落地階段,但落地始終繞不過一個(gè)卡點(diǎn)——成本。
大模型參數(shù)高達(dá)千億級(jí)別,一次訓(xùn)練所需要的資金,是絕大多數(shù)企業(yè)都“燒不起”的。因此企業(yè)在選擇模型時(shí),除了看重效果,對(duì)成本的考慮,更是決策的重要一環(huán)。
這種變化來自市場對(duì)大模型的真實(shí)需求。2024年,在市場需求和激烈競爭的雙重推動(dòng)下,大模型的價(jià)格戰(zhàn)提前來臨,國內(nèi)最頭部的大模型廠商幾乎都卷入了這場降價(jià)潮,價(jià)格被打到了不可思議的地步。但在某種意義上,價(jià)格戰(zhàn)也最大程度降低了大模型的接入門檻,企業(yè)不會(huì)因?yàn)閮r(jià)格而猶豫了。
與此同時(shí),大模型的落地推進(jìn),讓越來越多企業(yè)意識(shí)到,在具體場景上或許并不需要跑出通用大模型的計(jì)算量。
“大模型不是參數(shù)規(guī)模越大越好”,一位金融科技負(fù)責(zé)人在落地大模型項(xiàng)目后發(fā)現(xiàn),在很多垂類場景中,更輕量的大模型也能達(dá)到通用大模型的效果,而推理成本更低,使用更簡單。
隨之而來的趨勢(shì)是,輕量級(jí)大模型開始流行。
在海外,Google發(fā)布了從20 億到70 億參數(shù)輕量級(jí)模型Gemma;Meta發(fā)布了Llama系列模型,從70億、130億、330億到700億,不同場景選擇不同的模型組合,效果都已被驗(yàn)證。
在國內(nèi),百度發(fā)布了三款輕量級(jí)模型,由大到小是ERNIE Speed、ERNIE Lite、ERNIE Tiny,由百度智能云千帆大模型平臺(tái)對(duì)外提供模型調(diào)用服務(wù),核心理念是幫助客戶降本增效,在特定的場景下通過精調(diào),使小尺寸的模型也能夠達(dá)到千億級(jí)別大模型的效率。
在經(jīng)歷過這一系列大模型需求的變化后,百度智能云千帆產(chǎn)品負(fù)責(zé)同學(xué)有感而發(fā),“在極致關(guān)注成本的狀態(tài)下,大家對(duì)大模型的期待就變成了‘不用給我最大的參數(shù)規(guī)模和最貴的模型’,而是‘在我的場景下效果最好的模型’,不再追求一個(gè)模型去解決所有問題”。
杭州全診醫(yī)學(xué)采用的就是“性價(jià)比”更高的ERNIE Speed。通過使用20萬份精標(biāo)病歷數(shù)據(jù)對(duì)大模型進(jìn)行精調(diào),使AI醫(yī)療助理的醫(yī)學(xué)用語更準(zhǔn)確、更規(guī)范,病歷生成的準(zhǔn)確度提升了45%,醫(yī)生的接診量提高了20%。
在這一過程中,模型蒸餾、混合專家模型(MoE)等創(chuàng)新技術(shù)層出不窮,為的就是在保留大模型性能的同時(shí),減少模型的計(jì)算資源消耗。
但極致的降本不止于此。在實(shí)際業(yè)務(wù)中,企業(yè)往往需要針對(duì)特定場景定制模型,以實(shí)現(xiàn)成本效益最大化。
寧波傳媒就利用大模型定制開發(fā)了一套甬派記者作文AI點(diǎn)評(píng)助手系統(tǒng)。“小記者們投來5萬多篇投稿,寧波晚報(bào)的記者老師眼睛都要看花了,好在現(xiàn)在有了百度智能云的千帆ModelBuilder平臺(tái)開發(fā)的智能作文批改系統(tǒng),可以直接提高作文的篩選和批改效率,還可以對(duì)作文進(jìn)行AI點(diǎn)評(píng),也能提出改進(jìn)意見”,寧波晚報(bào)某技術(shù)負(fù)責(zé)人表示。
這套系統(tǒng)的背后,是基于百度智能云千帆ModelBuilder提供的模型精調(diào)模版——作文點(diǎn)評(píng)樣板間來實(shí)施的,同時(shí)還輔以全流程的模型訓(xùn)練和精調(diào)工具鏈,以提高模型的運(yùn)行效率。
不僅如此,千帆ModelBuilder也提供一站式的數(shù)據(jù)洞察和處理平臺(tái),企業(yè)可以構(gòu)建自身的數(shù)據(jù)飛輪,讓模型越用越聰明;其底層則通過百舸平臺(tái)為千帆平臺(tái)的模型訓(xùn)練及模型推理提供穩(wěn)定高效的算力支撐,確保穩(wěn)定、極速的性能。
這些技術(shù)演進(jìn),都進(jìn)一步為企業(yè)帶來了降本增效,推動(dòng)著大模型的產(chǎn)業(yè)落地。
沙利文聯(lián)合頭豹發(fā)布的《2024年中國行業(yè)大模型市場報(bào)告》顯示,2023年中國行業(yè)大模型市場規(guī)模達(dá)105億元人民幣,2024年市場規(guī)模約為165億元,同比增長達(dá)57%,2028年市場規(guī)模有望達(dá)到624億元人民幣。
總的來看,2024年行業(yè)內(nèi)通過降價(jià)、工具鏈、定制模型等一系列措施,成功打通了大模型落地的卡點(diǎn),用超高的性價(jià)比迎來了產(chǎn)業(yè)落地需求的爆發(fā)。在這一過程中,企業(yè)對(duì)大模型成本極致的追求,也在逐步升級(jí)為提升業(yè)務(wù)的效率和核心收益,大模型技術(shù)正在走入更大的商業(yè)世界。
AI Agent:大模型應(yīng)用的場景化突破
伴隨AI產(chǎn)業(yè)競爭進(jìn)入“落地賽”的下半場,業(yè)界將目光從模型本身投向了AI應(yīng)用。
2024年上半年,國內(nèi)大模型項(xiàng)目中標(biāo)大多還圍繞智算中心、模型中臺(tái)建設(shè),從下半年起,眾多企業(yè)的招標(biāo)內(nèi)容全都轉(zhuǎn)向了應(yīng)用,且越來越細(xì)分。
百度創(chuàng)始人、董事長兼首席執(zhí)行官李彥宏曾公開表示,基礎(chǔ)模型本身是需要靠應(yīng)用才能顯現(xiàn)出來價(jià)值。那么,AI時(shí)代應(yīng)用的核心載體應(yīng)該是什么?這個(gè)問題一度成為業(yè)內(nèi)熱議的焦點(diǎn)。
在百度世界2024大會(huì)上,李彥宏公開表示“智能體是AI應(yīng)用的最主流形態(tài),即將迎來爆發(fā)點(diǎn)”。盡管業(yè)界對(duì)于AI Agent的定義尚未達(dá)成共識(shí),但李彥宏的發(fā)言讓行業(yè)對(duì)AI應(yīng)用的發(fā)展方向更篤定了。過去一年,國內(nèi)外的云廠商、大模型廠商、運(yùn)營商、軟件廠商紛紛涌入賽道,誰也不想錯(cuò)過這個(gè)“香饃饃”。
毫無疑問,AI Agent成為了2024年大模型領(lǐng)域最耀眼的存在,其數(shù)量一度呈爆發(fā)式增長。數(shù)據(jù)顯示,截至2024年11月,千帆大模型平臺(tái)上已經(jīng)幫助客戶精調(diào)了3.3萬個(gè)模型、開發(fā)了77萬個(gè)企業(yè)應(yīng)用。
更讓人興奮的是,AI Agent的爆發(fā)并非虛假的繁榮,而是具備真實(shí)的市場基礎(chǔ)。相比大模型的昂貴,能用得起的企業(yè)并不多,AI Agent更像是一個(gè)輕量化的AI解決方案,具備自主思考、自主編排、記憶、反思等能力,能夠針對(duì)具體場景,解決特定業(yè)務(wù)問題,為企業(yè)帶來最真實(shí)的降本增效。但企業(yè)級(jí)業(yè)務(wù)容不得大的偏差。如何按照設(shè)定好的工作流來執(zhí)行任務(wù),并保證輸出的可靠性和個(gè)性化,是企業(yè)級(jí)Agent全面落地的一個(gè)巨大挑戰(zhàn)。
例如,在保險(xiǎn)行業(yè)的車險(xiǎn)續(xù)保業(yè)務(wù)場景中,讓Agent替代真人銷售就涉及很多業(yè)務(wù)難點(diǎn):面對(duì)客戶最初的拒絕態(tài)度如何化解和引導(dǎo)?如何根據(jù)客戶歷史車險(xiǎn)情況給出優(yōu)惠政策?如何按照工作流成功引導(dǎo)客戶續(xù)保?
為了解決這些問題,百度智能云基于千帆AppBuilder工作流Agent探索,通過工作流編排的形式和大模型的能力,來落地車險(xiǎn)續(xù)保售前數(shù)字員工。
這樣的工作流Agent,可以很好地避免大模型憑空發(fā)揮,同時(shí)輔以人工編排,提升執(zhí)行的穩(wěn)定性和可控性,在規(guī)劃調(diào)度方面的準(zhǔn)確率能達(dá)到95%。同時(shí),工作流Agent還具備隨時(shí)學(xué)習(xí)新知識(shí)和記憶回溯的能力,記憶準(zhǔn)確率可達(dá)96%+,為用戶提供個(gè)性化的服務(wù)。
過去公司要培養(yǎng)一位這樣合格的金牌銷售至少要一兩年,但現(xiàn)在打造這樣一個(gè)“數(shù)字員工”,最快卻只需要一小時(shí)。這樣的工作流Agent還可以快速集成到百度搜索、微信公眾號(hào)、企業(yè)官網(wǎng)等業(yè)務(wù)系統(tǒng)中,便利觸達(dá)用戶。
當(dāng)AI Agent達(dá)到了企業(yè)級(jí)的要求,一些過去AI不太可能實(shí)現(xiàn)的業(yè)務(wù)場景就照進(jìn)了現(xiàn)實(shí)。而更具市場想象力的,是多Agent協(xié)作產(chǎn)品的推出。
2024年11月,百度發(fā)布的無代碼開發(fā)工具“秒噠”就極具代表性,由大模型直接生成代碼,不需要人寫,它門檻很低,人人可上手;通過文心大模型的思考和規(guī)劃能力,實(shí)現(xiàn)對(duì)不同Agent的調(diào)度和編排,這意味著每個(gè)人自己就能指揮多個(gè)Agent來協(xié)同完成任務(wù),不用寫一行代碼,只需要用自然語言就能直接生成代碼、創(chuàng)建應(yīng)用程序。李彥宏更是宣稱“我們將迎來一個(gè)前所未有的只靠想法就能賺錢的時(shí)代”。
“秒噠” 產(chǎn)品的發(fā)布,標(biāo)志著AI Agent走入大眾視野中。當(dāng)越來越多的人意識(shí)到AI Agent有用,應(yīng)用爆發(fā)的速度就會(huì)非常快。據(jù)銀河證券研報(bào)預(yù)計(jì),到2028年,中國AI Agent市場規(guī)模將激增至8520億元,年復(fù)合增長率達(dá)72.7%。
如果將2024年看作是AI Agent爆發(fā)前夜,那么2025年將是AI Agent落地元年。對(duì)于企業(yè)而言,會(huì)更看重AI Agent在業(yè)務(wù)場景中的效果;對(duì)于大模型廠商而言,AI Agent技術(shù)及工具鏈的支撐能力成為基本要求。
多模態(tài):原生融合的AI交互方式
2024年,AI領(lǐng)域迎來了一個(gè)重要的轉(zhuǎn)折點(diǎn)——多模態(tài)大模型的興起。
視頻生成模型Sora的誕生,OpenAI多模態(tài)AI大模型GPT-4o的到來,百度百舸支持國內(nèi)第一個(gè)全自研視頻大模型Vidu的發(fā)布等代表性事件,都讓業(yè)界看到了AI發(fā)展的新方向,多模態(tài)一下躍升為全球大模型廠商競爭的重點(diǎn)。
從技術(shù)上看,多模態(tài)增強(qiáng)了AI系統(tǒng)處理復(fù)雜任務(wù)的能力。比起單模態(tài),融合了文本、圖像、音頻、視頻等多類型數(shù)據(jù)的多模態(tài)大模型,能夠提供更全面、更準(zhǔn)確的理解和響應(yīng)。
不僅如此,多模態(tài)大模型極大拓寬了AI的應(yīng)用領(lǐng)域。過去一年,基于多模態(tài)大模型技術(shù)的創(chuàng)業(yè)公司如雨后春筍般誕生,文生圖片、文生視頻、文生3D、文生音樂、文生代碼等多模態(tài)應(yīng)用層出不窮,智能硬件更是基于多模態(tài)煥發(fā)了新生,為市場帶來了巨大的想象空間。盡管多模態(tài)大模型勾勒的未來非常美好,但也必須承認(rèn),多模態(tài)離產(chǎn)業(yè)落地還有很長的一段距離。
李彥宏在百度世界2024大會(huì)上發(fā)表了類似的觀點(diǎn):“過去24個(gè)月,大模型最大的變化就是基本消除了‘幻覺’,今天文字層面的RAG已經(jīng)做得很好,讓大模型變得可用、可被信賴。但圖像等多模態(tài)技術(shù)要實(shí)用,也需要準(zhǔn)確性和可控性”。
這番發(fā)言印證了業(yè)內(nèi)新的探索方向:消除多模態(tài)生成幻覺,進(jìn)一步提升多模態(tài)生成的可用性。
目前,iRAG是業(yè)內(nèi)公認(rèn)的提升模型能力的技術(shù)方向,是一種通過引入外部知識(shí)的檢索增強(qiáng)生成技術(shù),能夠更好地去掉大模型的幻覺。在全球范圍內(nèi),百度的這項(xiàng)能力是最領(lǐng)先的,基于檢索增強(qiáng)的文生圖技術(shù)iRAG,將百度搜索的億級(jí)圖片資源跟強(qiáng)大的基礎(chǔ)模型能力相結(jié)合,可以生成各種超真實(shí)的圖片。在影視作品、漫畫作品、連續(xù)畫本、海報(bào)制作等應(yīng)用場景中,iRAG可以大幅降低創(chuàng)作成本。
近日,百度智能云千帆大模型平臺(tái)全面上線iRAG功能,用戶可通過千帆ModelBuilder直接調(diào)用使用iRAG接口;與此同時(shí),千帆AppBuilder提供iRAG圖片生成、文生視頻、圖生視頻等豐富的多模態(tài)組件以及數(shù)字人能力,可以在Agent中定制屬于自己的智能體分身;截止目前,千帆AppBuilder已提供90多個(gè)如百度搜索、百度地圖這樣的高質(zhì)量官方組件,讓AI用上更多工具,進(jìn)一步提升AI能力;消除大模型的幻覺,是AI應(yīng)用爆發(fā)的基礎(chǔ)。展望2025年多模態(tài)大模型的發(fā)展趨勢(shì),或許可以用一句話來總結(jié):離幻覺更遠(yuǎn),離落地更近。
AI落地:從產(chǎn)業(yè)到行業(yè)
過去一年的激蕩,讓人們充分感受到,2024年是大模型改變世界的一年。模型能力的持續(xù)迭代與訓(xùn)練成本的持續(xù)降低,智能體的蓬勃發(fā)展,多模態(tài)市場的快速增長,都在宣告一個(gè)新時(shí)代的到來。
來自市場的數(shù)據(jù),直觀呈現(xiàn)出過去一年中國大模型的落地爆發(fā)。百度數(shù)據(jù)顯示,截至11月初,百度文心大模型的日均調(diào)用量超15億,相較5月披露的2億,增長7.5倍,相較一年前首次披露的5000萬次,更是增長約30倍。李彥宏感慨“這個(gè)增速超出預(yù)期”,這條陡峭的增長曲線,說明AI是真需求。
根據(jù)公開招投標(biāo)數(shù)據(jù),2024年國內(nèi)大模型中標(biāo)項(xiàng)目數(shù)量和金額都呈現(xiàn)大幅度增長。2024年1至11月,大模型中標(biāo)項(xiàng)目共728個(gè),是2023年全年的3.6倍;中標(biāo)金額17.1億元,是2023年全年的2.6倍。
數(shù)據(jù)激增的背后,是AI的價(jià)值開始被看見。尤其作為領(lǐng)頭羊的央國企,已開始進(jìn)入到更深層次的產(chǎn)業(yè)落地。
國家電網(wǎng)聯(lián)合百度打造國內(nèi)首個(gè)千億級(jí)多模態(tài)電力行業(yè)大模型,為電網(wǎng)安全穩(wěn)定運(yùn)行、促進(jìn)新能源消納、做好供電服務(wù)提供“超級(jí)大腦”。山東港口聯(lián)合百度打造全球首個(gè)落地應(yīng)用的港口大模型,將智能化服務(wù)深入到港口管理的各個(gè)環(huán)節(jié),打造車船貨全鏈條智能服務(wù)網(wǎng)絡(luò),提升了物流供應(yīng)鏈客戶服務(wù)效率。數(shù)據(jù)顯示,超過六成的央企在聯(lián)合百度智能云進(jìn)行AI創(chuàng)新。
不僅如此,各個(gè)行業(yè)的頭部企業(yè)都在陸續(xù)跟進(jìn),許多上半年在觀望的企業(yè),下半年開始主動(dòng)尋求已成功落地的解決方案,希望在自己的業(yè)務(wù)中復(fù)制。
蔚來汽車攜手百度智能云千帆平臺(tái)共同打造了端云多模態(tài)大模型,研發(fā)了人工智能助手NOMI的問答功能,讓NOMI成為一個(gè)更懂用戶、更聰明的座艙AI伙伴。“我們沒有把它當(dāng)語音助手,而是人工智能的伙伴”,蔚來汽車座艙人工智能研發(fā)負(fù)責(zé)人高杰表示,隨著大模型技術(shù)的出現(xiàn),NOMI的能力得到了進(jìn)一步提升。
2024年,大模型已經(jīng)在多個(gè)行業(yè)中實(shí)現(xiàn)了廣泛而深入的落地,為各行各業(yè)帶來了顯著的價(jià)值。正如百度集團(tuán)執(zhí)行副總裁、百度智能云事業(yè)群總裁沈抖所說,過去的一年,是大模型從技術(shù)變革走向產(chǎn)業(yè)變革的關(guān)鍵一年。大模型重構(gòu)一切,為每個(gè)企業(yè)提供平等的增長機(jī)會(huì)。
在這輪產(chǎn)業(yè)變革中,大模型廠商們也迅速構(gòu)建了自己的技術(shù)能力、打法體系,以百度智能云為代表的頭部廠商都構(gòu)建了端到端、全鏈路的體系,從大模型底座,到企業(yè)級(jí)大模型開發(fā)平臺(tái)及全鏈條工具,再到多樣化的AI應(yīng)用,充分應(yīng)對(duì)用戶對(duì)大模型整體解決方案的需求。
公開數(shù)據(jù)顯示,2024年,百度智能云大模型在中標(biāo)項(xiàng)目數(shù)、行業(yè)覆蓋數(shù)、央國企中標(biāo)項(xiàng)目數(shù)這三個(gè)維度里均為第一,在能源、政務(wù)、金融這三個(gè)行業(yè)的中標(biāo)項(xiàng)目數(shù)位于所有廠商第一,成為企業(yè)級(jí)應(yīng)用大模型落地的主力軍。
如今,大模型仍然在快速滲透進(jìn)各個(gè)行業(yè)。IDC預(yù)計(jì),到2025年,中國的生成式AI軟件市場規(guī)模將達(dá)到35.4億美元。隨著大模型產(chǎn)業(yè)以驚人的速度繼續(xù)向前演進(jìn),2025年大模型市場格局必將發(fā)生新的變化,或許會(huì)帶來人類歷史上的又一次生產(chǎn)力躍遷。
文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請(qǐng)謹(jǐn)慎對(duì)待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。
2024年的Adobe MAX 2024發(fā)布會(huì)上,Adobe推出了最新版本的Adobe Creative Cloud。
奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。
“以前都要去窗口辦,一套流程下來都要半個(gè)月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。
華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準(zhǔn)的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實(shí)質(zhì)性的幫助,雙十一期間低至2799元,性價(jià)比很高,簡直是創(chuàng)作者們的首選。
9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會(huì)——工業(yè)互聯(lián)網(wǎng)標(biāo)識(shí)解析專題論壇在沈陽成功舉辦。