過去幾個(gè)月,行業(yè)用戶對(duì)大模型的關(guān)注經(jīng)歷了從天馬行空的想象,到組建團(tuán)隊(duì)尋找場(chǎng)景。大模型企業(yè)也從百模大戰(zhàn),到競(jìng)相落地布局。
文|周路平 徐鑫
編|石兆
國(guó)內(nèi)大模型戰(zhàn)場(chǎng)的比拼正在進(jìn)入新的階段。
過去2個(gè)月,大模型市場(chǎng)上異常熱鬧,不同參數(shù)級(jí)別和能力類型的大模型紛紛內(nèi)測(cè)。如何降低大模型使用門檻,讓大模型真正在行業(yè)里用起來,是企業(yè)用戶和大模型提供商關(guān)注的焦點(diǎn)。
5月9日,國(guó)內(nèi)最早開始大模型產(chǎn)品內(nèi)測(cè)的百度,公布了企業(yè)級(jí)大模型平臺(tái)“文心千帆”內(nèi)測(cè)的消息。在推動(dòng)大模型落地行業(yè)上,百度邁出了關(guān)鍵一步。
01
大模型競(jìng)爭(zhēng)進(jìn)入新階段
最近兩個(gè)月,百度集團(tuán)副總裁侯震宇感受到了大模型賽道的有趣變化。之前過來接觸的人,級(jí)別都非常高,大多是CEO,交流的內(nèi)容也以科普為主。大家都覺得大模型很重要,害怕掉隊(duì)。但現(xiàn)在,來的大部分是企業(yè)內(nèi)部具體做事的人,他們希望盡快將大模型在業(yè)務(wù)中落地,以獲取競(jìng)爭(zhēng)優(yōu)勢(shì)。
“這是個(gè)好事,說明大模型已經(jīng)逐步邁向?qū)嶋H落地階段。”侯震宇說,外界對(duì)大模型的關(guān)注經(jīng)歷了從天馬行空的想象到探討如何落地的階段。
從國(guó)外廠商的動(dòng)作來看,這一趨勢(shì)的轉(zhuǎn)變已經(jīng)越來越明顯。阿里云此前內(nèi)測(cè)通義千問大模型時(shí),就同步推出了企業(yè)和行業(yè)大模型,并聯(lián)合7家行業(yè)伙伴探索大模型在油氣、電力、交通、金融等多個(gè)行業(yè)的應(yīng)用。商湯、第四范式等人工智能廠商也在智能汽車領(lǐng)域、醫(yī)療、企服軟件開發(fā)摸索大模型的場(chǎng)景。
海外最受關(guān)注的是微軟的路徑。由于與OpenAI在資金、技術(shù)和應(yīng)用落地場(chǎng)景有深度合作,微軟步子邁得大。在C端產(chǎn)品如搜索引擎Bing上,大模型讓應(yīng)用從工具向智能助手轉(zhuǎn)變,目前Bing的活躍用戶增加到了1億水平。在微軟能力強(qiáng)項(xiàng)ToB領(lǐng)域,“智能副駕”Copilot已經(jīng)與微軟已有的低代碼開發(fā)工具、Office辦公軟件、CRM、ERP軟件以及網(wǎng)絡(luò)安全等多款產(chǎn)品結(jié)合,完成產(chǎn)品的智能化升級(jí)。
其中代碼生成平臺(tái)Github和office產(chǎn)品的智能智能助手推出在行業(yè)里引起了不小的轟動(dòng)。
國(guó)內(nèi)企業(yè)服務(wù)市場(chǎng)幾位行業(yè)人士不同程度向數(shù)智前線表達(dá)過焦慮情緒。隨著大模型能力引入相關(guān)賽道,企服產(chǎn)品服務(wù)客戶的方式和競(jìng)爭(zhēng)點(diǎn)可能也會(huì)發(fā)生變化,他們需要密切關(guān)注。
國(guó)內(nèi)最早推出大模型產(chǎn)品內(nèi)測(cè)的百度此前也一直與大量企業(yè)探索應(yīng)用場(chǎng)景。百度公布的數(shù)據(jù),有超過300家生態(tài)伙伴參與內(nèi)測(cè),在400多個(gè)企業(yè)內(nèi)部場(chǎng)景取得測(cè)試成效。大模型內(nèi)測(cè)后,百度開了3場(chǎng)面向企業(yè)客戶的大模型技術(shù)交流會(huì),每場(chǎng)都人員爆滿。這也反映了當(dāng)下企業(yè)們迫切想了解大模型在細(xì)分場(chǎng)景里的方案。但也有用戶反映,希望看到更有確定性的機(jī)會(huì)。
最新的消息是,文心大模型技術(shù)交流日上,百度披露了正在聯(lián)合企業(yè)客戶、生態(tài)合作伙伴內(nèi)測(cè)的“文心千帆大模型平臺(tái)”,以未來滿足企業(yè)客戶研發(fā)和使用大模型的需求。
文心千帆大模型平臺(tái)不但提供包括文心一言在內(nèi)的大模型服務(wù),還提供大模型開發(fā)和應(yīng)用的整套可視化工具鏈,包括數(shù)據(jù)生成、標(biāo)注、回流的數(shù)據(jù)閉環(huán)管理功能。客戶以少量數(shù)據(jù)即可發(fā)起模型微調(diào),最快幾分鐘就可獲得自己的專屬大模型。
目前,百度自身已有的相關(guān)產(chǎn)品已率先開始基于文心千帆大模型平臺(tái)進(jìn)行智能化升級(jí)。同時(shí),基于大量用戶交流與反饋,百度將大模型應(yīng)用的場(chǎng)景提煉成了通用應(yīng)用和行業(yè)應(yīng)用兩類。
通用類包含了智能創(chuàng)作平臺(tái)、數(shù)字人技術(shù)和生成、知識(shí)管理和檢索、對(duì)話系統(tǒng)以及智能客服等適用于所有行業(yè)的場(chǎng)景。在此之上,金融、政務(wù)、工業(yè)、媒體、電商零售等多個(gè)行業(yè),是百度智能云所覆蓋的重要戰(zhàn)略場(chǎng)景。
為了能更好的在行業(yè)落地,百度也在積極打造合作伙伴生態(tài)。5月9日的交流會(huì)上,百度與聯(lián)想集團(tuán)、用友、寶蘭德等14家文心千帆生態(tài)伙伴簽約,繼續(xù)推進(jìn)大模型的行業(yè)場(chǎng)景落地。
業(yè)界觀察,這些生態(tài)伙伴在企業(yè)服務(wù)的細(xì)分市場(chǎng),有大量數(shù)據(jù)積累和行業(yè)實(shí)踐沉淀,對(duì)百度在細(xì)分行業(yè)場(chǎng)景里形成能力補(bǔ)充。
例如,老牌企業(yè)服務(wù)提供商用友,在企業(yè)數(shù)智化轉(zhuǎn)型領(lǐng)域積累了數(shù)百萬企業(yè)客戶的人財(cái)物項(xiàng)、產(chǎn)供銷研等10大領(lǐng)域和眾多行業(yè)的應(yīng)用實(shí)踐;寶蘭德是國(guó)內(nèi)電信行業(yè)國(guó)產(chǎn)中間件市場(chǎng)的頭部廠商,在中間件、智能運(yùn)維等行業(yè)通用軟件及數(shù)智化產(chǎn)品解決方案有豐富經(jīng)驗(yàn)。
業(yè)內(nèi)認(rèn)為,豐富的實(shí)踐和碰撞,能幫助大模型實(shí)現(xiàn)產(chǎn)品、技術(shù)和應(yīng)用場(chǎng)景間的良性互動(dòng)。
“真正能夠把大模型在垂直行業(yè)做好,是目前各個(gè)企業(yè)都要考慮的問題。”智能運(yùn)維企業(yè)寶蘭德董事長(zhǎng)說,讓大模型的能力落地是接下來大模型發(fā)展的一個(gè)非常關(guān)鍵的步驟。
02
大模型ToB的兩條腿
作為企業(yè)級(jí)大模型生產(chǎn)平臺(tái),百度給文心千帆的定位是大模型生產(chǎn)和分發(fā)的集散地。文心千帆平臺(tái)上,不但提供包括文心一言在內(nèi)的大模型服務(wù)及第三方大模型服務(wù),還提供大模型開發(fā)和應(yīng)用的整套工具鏈。
企業(yè)既可以直接用百度預(yù)訓(xùn)練的文心大模型,還可以基于平臺(tái)訓(xùn)練自己專屬的大模型,百度文心千帆大模型平臺(tái)提供的兩種不同商業(yè)模式,也契合了當(dāng)前企業(yè)對(duì)大模型的不同需求。
百度內(nèi)部形象地將兩者比作為“操作系統(tǒng)模式”和“臺(tái)積電模式”。所謂操作系統(tǒng),是指文心一言大模型扮演了AI時(shí)代操作系統(tǒng)的角色,企業(yè)只需要在文心一言大模型的基礎(chǔ)上,注入少量行業(yè)知識(shí)數(shù)據(jù)進(jìn)行微調(diào),用很小成本就能得到自己的專屬大模型,就像開發(fā)者在安卓開發(fā)App一樣。
臺(tái)積電模式指的是百度提供高效穩(wěn)定的全套基礎(chǔ)設(shè)施和豐富的工具鏈,讓客戶到文心千帆大模型平臺(tái)來訓(xùn)練他們自己的大模型,訓(xùn)練出來之后再交付給客戶,就好比芯片設(shè)計(jì)企業(yè),拿著設(shè)計(jì)好的圖紙,交給臺(tái)積電流片制造。
但這兩種模式,都非常考驗(yàn)平臺(tái)能否提供一套簡(jiǎn)單易用的工具鏈。
“中國(guó)企業(yè)關(guān)注大模型的落地能力。”用友副總裁、研究院院長(zhǎng)呂建偉說,外界雖然演示了很多大模型的應(yīng)用場(chǎng)景,但背后的加工過程非常復(fù)雜,比如需要做提示詞,需要做模板,有很多的工作需要去做,“如何能把這些很復(fù)雜的,像微調(diào)、提示調(diào)優(yōu)、指令調(diào)優(yōu)、強(qiáng)化學(xué)習(xí)的功能,從工具層面再降低一個(gè)層級(jí)(非常重要)”。
以大模型訓(xùn)練和應(yīng)用最常見的微調(diào)為例,它能低成本地對(duì)模型進(jìn)行修正,用于改進(jìn)預(yù)訓(xùn)練模型的性能,以適應(yīng)新的任務(wù)。
呂建偉直言,當(dāng)下訓(xùn)練大模型經(jīng)常遇到兩個(gè)極端:要么是不能進(jìn)行很好地微調(diào)和性能調(diào)優(yōu),大模型跑起來就沒法停下來;要么需要花費(fèi)上千萬元,去重新訓(xùn)練。
技術(shù)交流日當(dāng)天,百度智能云AI與大數(shù)據(jù)平臺(tái)總經(jīng)理昕舟在百度智能云BI產(chǎn)品sugar上,現(xiàn)場(chǎng)演示了文心大模型的微調(diào)全過程。sugar主要提供數(shù)據(jù)可視化,幫助客戶做商業(yè)分析和決策,已接入了文心一言的能力。
“展示一下各個(gè)地區(qū)的銷售額”,第一個(gè)指令通過輸入框下達(dá),全程不需要任何專業(yè)的技能,很快系統(tǒng)就反饋出一個(gè)餅狀圖,有對(duì)應(yīng)的百分比和銷售額。
“統(tǒng)計(jì)華北地區(qū)2019年3月到5月的銷售額,用折線圖來表示。”需求開始變得復(fù)雜,而系統(tǒng)也沒有返回結(jié)果。
這也是很多通用大模型會(huì)遇到的問題:如何通過小樣本數(shù)據(jù)的投喂,讓大模型變得更加聰明和強(qiáng)大。很快,昕舟將準(zhǔn)備好的100條高質(zhì)量精標(biāo)數(shù)據(jù),投喂給大模型。在小樣本的微調(diào)下,系統(tǒng)很快掌握了技能,準(zhǔn)確返回了結(jié)果。
微調(diào)教會(huì)了大模型在特定的應(yīng)用中學(xué)會(huì)特定的指令和要求,并且還能具備一定的泛化能力。這也是業(yè)內(nèi)訓(xùn)練大模型的常見做法。
除了微調(diào),目前,文心千帆大模型平臺(tái)包含了大模型生產(chǎn)和應(yīng)用的完整生命周期要具備的功能和工具,從底層的AI異構(gòu)算力、高性能文件系統(tǒng)、高速網(wǎng)絡(luò)和AI調(diào)度增強(qiáng),到海量的數(shù)據(jù)處理、高質(zhì)量的數(shù)據(jù)標(biāo)注、強(qiáng)化學(xué)習(xí),再到大模型的評(píng)估、高效的壓縮、自動(dòng)化的Prompt工程和快速的應(yīng)用編排。千帆大模型平臺(tái)考慮到了大模型從開發(fā)、應(yīng)用到調(diào)優(yōu)的每一個(gè)環(huán)節(jié)。
另外,文心千帆大平臺(tái)也支持插件。ChatGPT在推出Plugins(插件)功能時(shí),外界一片驚呼,它能將ChatGPT連接到第三方應(yīng)用程序。
除了訓(xùn)練和應(yīng)用大模型,不同的業(yè)務(wù)需求對(duì)大模型的部署方式也提出了要求。當(dāng)下,外界普遍認(rèn)為公有云是一個(gè)非常高效的應(yīng)用方式,但不少企業(yè)尤其是政企客戶,出于數(shù)據(jù)安全和合規(guī)考慮,都會(huì)要求私有化部署。
“中國(guó)ToB市場(chǎng),很多大企業(yè)要求私有化部署,但大模型的私有化部署其實(shí)很復(fù)雜,有很多局限性。”呂建偉說,如果要把大模型分發(fā)給中國(guó)上萬家的大型企業(yè),如何很容易地分發(fā)部署,部署的工具在哪里都是業(yè)內(nèi)所關(guān)注的問題。
目前,包括百度、華為和阿里在內(nèi)的廠商都在提供公有云服務(wù)和私有化部署兩種交付模式。
以百度文心千帆為例,它的部署方式則更加靈活,對(duì)外將提供了“3+3”的交付方式。公有云服務(wù)上提供推理(直接調(diào)用大模型的推理能力)、微調(diào)(通過高質(zhì)量精標(biāo)業(yè)務(wù)數(shù)據(jù),高效訓(xùn)練出特定行業(yè)的大模型)、托管(將模型發(fā)布在百度智能云,以實(shí)現(xiàn)更加穩(wěn)定高效的運(yùn)行)三種服務(wù)。
私有化部署上,文心千帆大模型平臺(tái)也提供了三種部署方式:包括支持軟件授權(quán)(提供在企業(yè)環(huán)境中運(yùn)行的大模型服務(wù))、軟硬一體(提供整套大模型服務(wù)及對(duì)應(yīng)的硬件基礎(chǔ)設(shè)施)、租賃服務(wù)(提供機(jī)器和平臺(tái)的租賃滿足客戶低頻需求)。
據(jù)數(shù)智前線獲悉,租賃服務(wù)是百度智能云最新增加的部署方式,目的是滿足部分客戶對(duì)模型訓(xùn)練的低頻需求,相比于去采購(gòu)大量的資源和機(jī)器,租賃會(huì)更劃算。
公有云和私有化結(jié)合的靈活多樣的部署方式,將加快大模型在企業(yè)業(yè)務(wù)中的應(yīng)用。
03
成本壓力下,全棧底座的優(yōu)勢(shì)
隨著業(yè)界普遍將通用人工智能視為歷史性的機(jī)遇。不少企業(yè)紛紛開始訓(xùn)練自己的大模型,被業(yè)內(nèi)稱為“百模大戰(zhàn)”。但并不是每一家企業(yè)都要從零到一去訓(xùn)練大模型,一般企業(yè)既沒有這個(gè)能力,也沒這個(gè)必要,“我想開車,不需要自己去造車”。
“我們不應(yīng)該自己去做大模型,我們把自己定位在大模型的最佳應(yīng)用方。”金山辦公助理總裁田然直言,文心一言發(fā)布后的第一時(shí)間,金山辦公就聯(lián)系了百度,開啟了內(nèi)測(cè)。
這是一個(gè)非常現(xiàn)實(shí)的考量。金山辦公CEO章慶元此前在接受采訪時(shí)也提到,“我的核心競(jìng)爭(zhēng)力還在Office本身。所以我一定要跟進(jìn)最好的大模型,誰好我就用誰。我就做大模型的應(yīng)用者。”
其實(shí),無論是自己去訓(xùn)練大模型,還是接入大廠提供的大模型服務(wù),成本都是其中非常重要的考量。
華為此前透露,大模型開發(fā)和訓(xùn)練一次的成本高達(dá)1200萬美元,背后是大量資源和算力的消耗。而即便是調(diào)用類似ChatGPT的方式,GPT-3.5模型的API價(jià)格為0.002美元/千token,GPT-4在請(qǐng)求方面的API價(jià)格為0.06美元/千token。對(duì)于很多企業(yè)而言,這也是一筆難以承受的成本。
田然提到,金山辦公有數(shù)億用戶,如果這些用戶都用上大模型的能力,將會(huì)帶來巨大的成本壓力。所以,成本也是金山辦公在使用大模型時(shí)非常關(guān)注的地方。“百度大模型的推理性能和推理的成本是有一些優(yōu)勢(shì)的。”田然說。
侯震宇表示:”最終能夠讓大模型服務(wù)推廣開的只有兩個(gè)原因:第一個(gè)是模型效果,第二個(gè)是成本。”
事實(shí)上,百度大模型的調(diào)用和訓(xùn)練成本一直在下降。文心一言開啟內(nèi)測(cè)后,一個(gè)月就迭代了四次。根據(jù)百度之前披露的數(shù)據(jù),文心一言的推理成本如今只有發(fā)布之初的十分之一,而3個(gè)月內(nèi)的推理效率提升10倍,模型推理性能提升50%,模型算力利用率提升1倍。
侯震宇透露,除了推理成本下降,在接下來幾個(gè)月,不管是在模型使用,還是在模型微調(diào)甚至在模型再訓(xùn)練方面,“價(jià)格應(yīng)該不會(huì)成為大家使用或者擁抱大模型的瓶頸”。
這得益于百度打造的國(guó)內(nèi)首個(gè)全棧自研的AI基礎(chǔ)設(shè)施“百度AI大底座”,它面向企業(yè)AI開發(fā)提供端到端的解決方案,從芯片、框架、模型和應(yīng)用進(jìn)行了全棧布局。
正如侯震宇所言,大模型時(shí)代下,企業(yè)不但需要智能的算力、靈活的框架平臺(tái)、豐富的大模型體系以及優(yōu)質(zhì)的應(yīng)用方案,還需要這四層技術(shù)架構(gòu)之間的適配與優(yōu)化,這是一個(gè)“既要、又要、還要”的端到端創(chuàng)新工程。
這是百度AI大底座在大模型訓(xùn)練上的優(yōu)勢(shì)所在:芯片層的昆侖芯、框架層的飛槳和模型層的文心大模型家族。每一層均有行業(yè)領(lǐng)先的產(chǎn)品,可以形成一個(gè)高效的反饋閉環(huán),幫助大模型不斷去調(diào)優(yōu)迭代。尤其在框架層和模型層之間,AI大底座有很強(qiáng)的協(xié)同作用,可以幫助企業(yè)構(gòu)建更高效的模型,持續(xù)調(diào)優(yōu)性能,并顯著降低成本。
“大家可能會(huì)覺得堆積算力、寫好代碼、然后進(jìn)行模型訓(xùn)練,把它跑起來就行了。實(shí)際上在訓(xùn)練過程中會(huì)遇到各種各樣的挑戰(zhàn),很少有人能夠使得一個(gè)大模型訓(xùn)練過程能夠在連續(xù)一兩天內(nèi)不出問題。”百度智能云云計(jì)算產(chǎn)品解決方案和運(yùn)營(yíng)部總經(jīng)理宋飛說,“百度AI大底座可以為大模型提供高效、穩(wěn)定的訓(xùn)練和有效的收斂。”
根據(jù)百度披露的數(shù)據(jù),百度AI大底座的千卡加速比達(dá)到90%,資源利用率達(dá)到70%,開發(fā)效率提升100%。如果不是全棧布局,很難獲得這樣的效果。
除了效率和成本,安全合規(guī)也是企業(yè)選擇大模型的一大前提。田然提到,金山辦公與百度大模型團(tuán)隊(duì)對(duì)接后,討論的第一個(gè)問題就是安全合規(guī)。
而國(guó)內(nèi)企業(yè)對(duì)國(guó)產(chǎn)化自主可控也有很高的要求。“雖然中國(guó)有很多個(gè)機(jī)器學(xué)習(xí)的框架,他們也都是支持國(guó)產(chǎn)化的系統(tǒng),軟硬件,也都是開源,但飛槳的開源知識(shí)社區(qū),是我們?cè)u(píng)估來做得最好的一個(gè)。”呂建偉坦言。
大模型被認(rèn)為是AI發(fā)展的分水嶺,已經(jīng)在等政務(wù)、工業(yè)、金融、傳媒等領(lǐng)域的辦公協(xié)同、智能客服、文案生成、工業(yè)質(zhì)檢等場(chǎng)景下展現(xiàn)出了威力,無論是對(duì)現(xiàn)有產(chǎn)品的改造,還是創(chuàng)新場(chǎng)景的探索,大模型都在打開全新的想象空間。需求已經(jīng)涌現(xiàn),只不過,市場(chǎng)的需求注定是碎片化的,企業(yè)的大規(guī)模應(yīng)用還有待時(shí)日。
文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請(qǐng)謹(jǐn)慎對(duì)待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。
2024年的Adobe MAX 2024發(fā)布會(huì)上,Adobe推出了最新版本的Adobe Creative Cloud。
奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。
“以前都要去窗口辦,一套流程下來都要半個(gè)月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。
華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準(zhǔn)的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實(shí)質(zhì)性的幫助,雙十一期間低至2799元,性價(jià)比很高,簡(jiǎn)直是創(chuàng)作者們的首選。
9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會(huì)——工業(yè)互聯(lián)網(wǎng)標(biāo)識(shí)解析專題論壇在沈陽成功舉辦。