大模型熱兩年后,將大模型融入業(yè)務(wù)場(chǎng)景、組織流程,提高產(chǎn)品和服務(wù)質(zhì)量,已經(jīng)成為越來(lái)越多企業(yè)的共識(shí)。
不僅如此,員工們也希望能用AI提升工作效率,甚至打破職業(yè)發(fā)展的天花板。
然而,許多企業(yè)在落地的具體過(guò)程中,卻面臨著眾多痛點(diǎn),困難重重。
AI正以意想不到的規(guī)模融入工作場(chǎng)所:幫助節(jié)省時(shí)間(90%),專注于最重要的工作(85%),變得更有創(chuàng)造力(84%),并且更享受工作(83%)
AI商業(yè)落地困難重重,何解?
首先,成本就是一大難關(guān)。
現(xiàn)實(shí)問(wèn)題是,該給大模型買多少算力?投多少人做數(shù)據(jù)治理、訓(xùn)練模型?需要多少人做運(yùn)維?
第二,數(shù)據(jù)隱私與安全,也是讓不少企業(yè)望而卻步的重要原因。
B端企業(yè)往往對(duì)數(shù)據(jù)隱私要求較高,但大模型通常是由第三方提供,這個(gè)過(guò)程中就存在數(shù)據(jù)泄露的風(fēng)險(xiǎn)。
比如,一家醫(yī)療公司計(jì)劃將大模型用于患者診斷,但擔(dān)心數(shù)據(jù)傳輸?shù)降谌侥P吞峁┥痰姆⻊?wù)器,會(huì)泄露患者隱私。雖然可以進(jìn)行數(shù)據(jù)脫敏,但脫敏后的數(shù)據(jù)精度降低,也會(huì)降低模型效果。
第三,模型的集成與部署復(fù)雜,需要專業(yè)技術(shù)團(tuán)隊(duì)的支持。
B端用戶的技術(shù)棧各不相同,現(xiàn)有的大模型可能需要大量調(diào)整,才能與企業(yè)現(xiàn)有系統(tǒng)集成。
比如某零售公司想要將大模型嵌入到內(nèi)部CRM系統(tǒng)中,但由于API接口與現(xiàn)有系統(tǒng)不兼容,他們就需要開發(fā)大量中間接口,在內(nèi)部數(shù)據(jù)安全防護(hù)上花費(fèi)額外資源。結(jié)果就是項(xiàng)目推進(jìn)極慢,還需要大量技術(shù)支持。
還有一種情況是,通用模型雖然有全領(lǐng)域能力,但是很多具有獨(dú)特專業(yè)知識(shí)的行業(yè)和場(chǎng)景卻無(wú)法直接應(yīng)用。
比如在大模型落地工業(yè)場(chǎng)景上,施耐德電器數(shù)字化就提出了這樣的「兩難問(wèn)題」——制造業(yè)企業(yè)的數(shù)據(jù)、知識(shí)、經(jīng)驗(yàn)無(wú)法分享,導(dǎo)致數(shù)據(jù)流動(dòng)差,難以出現(xiàn)垂直行業(yè)大模型;單個(gè)企業(yè)出面做私有化垂直的微調(diào)大模型,則會(huì)成本過(guò)高、維護(hù)難度過(guò)大。
此時(shí),就需要結(jié)合客戶領(lǐng)域和場(chǎng)景對(duì)通用大模型進(jìn)行定向調(diào)優(yōu)和增強(qiáng)。
然而,這個(gè)過(guò)程更是存在諸多痛點(diǎn):缺少全鏈路增強(qiáng)的訓(xùn)練工具和框架;缺少與原模型匹配的通用訓(xùn)練預(yù)料;缺少模型訓(xùn)練的超參數(shù)、數(shù)據(jù)標(biāo)注、數(shù)據(jù)清洗、配比等訓(xùn)練經(jīng)驗(yàn)……
顯然,今天的AI仍處于鉆木取火的階段,誰(shuí)能攻破以上難題,讓企業(yè)可靠、經(jīng)濟(jì)、易用地使用大模型,誰(shuí)就能率先拿下一城。
這時(shí),我們需要的是一套完整的工業(yè)級(jí)解決方案。
而就在昨天,百川智能正式面向企業(yè)用戶,發(fā)布了「1+3」一站式大模型商業(yè)化解決方案,包括全鏈路優(yōu)質(zhì)通用訓(xùn)練數(shù)據(jù)、Baichuan4-Turbo、Baichuan4-Air兩款模型,以及全鏈路領(lǐng)域增強(qiáng)工具鏈。
「1+3」的組合,覆蓋了從數(shù)據(jù)構(gòu)建、模型訓(xùn)練到強(qiáng)化調(diào)優(yōu)、部署運(yùn)營(yíng)的全流程。
通過(guò)這個(gè)產(chǎn)品矩陣,企業(yè)既能保障自身數(shù)據(jù)和隱私安全,還能以較低成本高效實(shí)現(xiàn)效果最佳的大模型私有化部署,用大模型賦能多種業(yè)務(wù)場(chǎng)景。
一言以蔽之,工具多、部署快、效果好、成本低。
搭配自用通用優(yōu)質(zhì)訓(xùn)練數(shù)據(jù),多場(chǎng)景可用率高達(dá)96%
當(dāng)前,AI社區(qū)已經(jīng)有很多高質(zhì)量的LLM可以免費(fèi)獲取,諸如Llama、Gemma等等。
它們具備了強(qiáng)大的通用泛化能力,然而,由于每個(gè)企業(yè)都擁有自身獨(dú)特的專業(yè)知識(shí)和應(yīng)用場(chǎng)景,直接應(yīng)用通用模型難以達(dá)到理想效果,因此必須對(duì)模型進(jìn)行定制化優(yōu)化從而適應(yīng)特定領(lǐng)域和場(chǎng)景的需求。而優(yōu)化后模型在多場(chǎng)景下的可用率是評(píng)估其價(jià)值的關(guān)鍵標(biāo)準(zhǔn)。
目前,行業(yè)主流的定制化優(yōu)化方式有兩種:用場(chǎng)景數(shù)據(jù)微調(diào);場(chǎng)景數(shù)據(jù)混合開源通用數(shù)據(jù)微調(diào)。
數(shù)據(jù)顯示,僅用專業(yè)數(shù)據(jù)微調(diào)模型,多場(chǎng)景可用率是84%。
若是利用行業(yè)公開的通用數(shù)據(jù),或者自建通用數(shù)據(jù)集,外加專有數(shù)據(jù)進(jìn)行領(lǐng)域增強(qiáng)訓(xùn)練,可用率會(huì)有所提升,但也只能提升2%。
以上這些還不是最優(yōu)解,因?yàn)閷?duì)于很多企業(yè)來(lái)說(shuō),多場(chǎng)景可用率低于90%基本上就是不可用的狀態(tài)。
導(dǎo)致這種情況的主要原因是,受限于諸多因素,企業(yè)在混合微調(diào)時(shí)只能自建或者使用開源的通用數(shù)據(jù),很難獲得與原模型高度匹配的通用訓(xùn)練數(shù)據(jù),因此即便經(jīng)過(guò)調(diào)優(yōu),模型也有很大概率會(huì)失去通用性,變成無(wú)法應(yīng)對(duì)多個(gè)場(chǎng)景的專用模型。
這次,百川智能直接給出了其自用的預(yù)訓(xùn)練通用數(shù)據(jù)、SFT微調(diào)通用數(shù)據(jù)以及強(qiáng)化學(xué)習(xí)過(guò)程中的通用數(shù)據(jù)。
同時(shí),自研的超參自動(dòng)化搜索和調(diào)優(yōu)技術(shù)、數(shù)據(jù)動(dòng)態(tài)自適應(yīng)配比技術(shù)等訓(xùn)練經(jīng)驗(yàn)和技術(shù),也都一并封裝成工具,給到企業(yè)使用。
用白話說(shuō)就是,Baichuan4-Turbo、Baichuan4-Air用到的高質(zhì)量通用訓(xùn)練數(shù)據(jù)和訓(xùn)練技巧,都在里面!
評(píng)測(cè)結(jié)果顯示,在使用百川智能優(yōu)質(zhì)通用訓(xùn)練數(shù)據(jù)與企業(yè)專有數(shù)據(jù)混合微調(diào)后,模型在金融、教育、醫(yī)療等場(chǎng)景下的專業(yè)細(xì)分任務(wù)的平均可用率高達(dá)96%。
相比不混合通用數(shù)據(jù)提升12%,混合開源通用數(shù)據(jù)提升10%。
相較于其他行業(yè)解決方案,百川智能取得了最新的SOTA,這也從側(cè)面證明了模型想要在企業(yè)場(chǎng)景下取得優(yōu)秀表現(xiàn),需要的是專有數(shù)據(jù)與和原模型高度匹配的通用數(shù)據(jù)的「混合增強(qiáng)」。
模型升級(jí):Baichuan4-Turbo兩張4090即可部署,Baichuan4-Air推理成本下降99%
接下來(lái),如何將Baichuan4-Turbo、Baichuan4-Air應(yīng)用在實(shí)際場(chǎng)景中?
從名字中不難看出,它們都是Baichuan4系列基礎(chǔ)模型的升級(jí)。
對(duì)于企業(yè)來(lái)說(shuō),在不同場(chǎng)景階段,對(duì)模型性能和成本要求各不相同。
在復(fù)雜場(chǎng)景探索階段,他們更加關(guān)注模型性能、部署成本。
而在已驗(yàn)證過(guò)的大規(guī)模落地階段,他們更側(cè)重模型推理成本、響應(yīng)速度。
這次新發(fā)布的兩款模型,分別應(yīng)對(duì)不同階段的客戶落地場(chǎng)景,效果更好,成本更低。
復(fù)雜場(chǎng)景探索:Baichuan4-Turbo
其中,Baichuan4-Turbo屬于旗艦?zāi)P蜕?jí)版。
它適合復(fù)雜場(chǎng)景的初期探索階段,尤其適用于對(duì)于初始部署成本(比如顯存)較為敏感的場(chǎng)景。
對(duì)于B端企業(yè)用戶,大模型時(shí)常會(huì)遇到極為復(fù)雜的場(chǎng)景,這時(shí)就對(duì)模型能力提出了很高的要求。
比如在一個(gè)金融機(jī)構(gòu)中,需要實(shí)時(shí)分析海量交易和市場(chǎng)數(shù)據(jù),還要檢測(cè)異常交易、反欺詐,預(yù)測(cè)信用風(fēng)險(xiǎn)等等。
此時(shí)就需要大模型能夠整合動(dòng)態(tài)數(shù)據(jù)與多模態(tài)處理、具有強(qiáng)大的模型識(shí)別與實(shí)時(shí)預(yù)測(cè)能力。
這樣它才能快速集成結(jié)構(gòu)化(交易記錄)和非結(jié)構(gòu)化數(shù)據(jù)(文本),并進(jìn)行跨模態(tài)的信息分析。并且,它還能對(duì)數(shù)據(jù)中的微小變化做出快速響應(yīng),識(shí)別風(fēng)險(xiǎn)信號(hào)。
針對(duì)以上場(chǎng)景,Baichuan4-Turbo就是一個(gè)極具性價(jià)比的選擇。
相比Baichuan4,Baichuan4-Turbo在B端客戶高頻應(yīng)用場(chǎng)景上,效果均有顯著提升。具體來(lái)說(shuō),分聚類提升了9.09%、多語(yǔ)言提升了31.43%、信息摘要提升了50%、生成提升了12.77%。
而在成本上,通過(guò)w4kv4等infra量化,Baichuan4-Turbo僅需2張4090,即可達(dá)到GPT-4o效果。
可以說(shuō)達(dá)到了旗艦?zāi)P偷男袠I(yè)最低,僅為Baichuan4的15%。
在響應(yīng)速度上也更快,其中首token速度提升了51%、token流速提升了73%。
廣泛應(yīng)用:首個(gè)MoE模型Baichuan4-Air
Baichuan4-Air則是Baichuan4系列中的低成本極速版,同時(shí)也是百川智能發(fā)布的首款MoE模型。
它適合中等復(fù)雜及簡(jiǎn)單場(chǎng)景的廣泛應(yīng)用階段,尤其是請(qǐng)求量大、推理成本敏感型的場(chǎng)景。
比如電商搜索和推薦、智能客服與對(duì)話機(jī)器人,都屬于這一類。
電商平臺(tái)的用戶訪問(wèn)量大,產(chǎn)品瀏覽和搜索請(qǐng)求頻繁發(fā)生,此時(shí)模型無(wú)需深層理解用戶的全部行為,只需提供較高相關(guān)性的推薦即可。
而在智能客服場(chǎng)景,銀行、零售、物流等企業(yè)的在線客服系統(tǒng)往往有高并發(fā)的用戶咨詢,用戶問(wèn)題相對(duì)簡(jiǎn)單、重復(fù)性高,不涉及復(fù)雜情感理解和多輪對(duì)話。
此時(shí),相比復(fù)雜大模型,輕量化的模型就能實(shí)時(shí)響應(yīng)海量請(qǐng)求,在不犧牲速度的情況下回答大量簡(jiǎn)單的用戶咨詢,企業(yè)也不必承受復(fù)雜模型帶來(lái)的高計(jì)算成本。
Baichuan4-Air,正是為這類用戶量身打造。
它的效果和Baichuan4基本持平,但價(jià)格只有后者的1%——0.98厘/千tokens,目前行業(yè)最低。
同時(shí),它的響應(yīng)也更快,首token速度提升了77%、token流速提升了93%。
值得一提的是,作為百川智能的首個(gè)MoE模型,Baichuan4-Air 行業(yè)首創(chuàng)了PRI架構(gòu),巧妙融合了Pyramid(金字塔架構(gòu))、Residual(殘差結(jié)構(gòu))、Interval(區(qū)間結(jié)構(gòu))三種配置方式。
與標(biāo)準(zhǔn)的MoE架構(gòu)相比,Baichuan4-Air的MoE架構(gòu)保持了MLP(多層感知機(jī))和Attention(注意力機(jī)制)的內(nèi)部結(jié)構(gòu)不變,僅對(duì)混合專家MLP層的配置方式進(jìn)行優(yōu)化,通過(guò)合理配置專家數(shù)量和激活策略,能夠更好地平衡計(jì)算負(fù)載,減少計(jì)算量,提高推理速度。
正是由于這種MoE架構(gòu)上的創(chuàng)新,Baichuan4-Air在時(shí)效率和模型性能上均表現(xiàn)優(yōu)異。
在相同訓(xùn)練數(shù)據(jù)下,Baichuan4-Air不僅時(shí)效率更高,性能也大幅領(lǐng)先于GPT4-style、Mixtral-style結(jié)構(gòu)的MoE模型。
至此,所謂停止預(yù)訓(xùn)練模型的謠言,也就不攻自破了。
全鏈路領(lǐng)域增強(qiáng)工具鏈,覆蓋模型部署全流程
作為「1+3」產(chǎn)品矩陣中的「1」,從數(shù)據(jù)處理、增量預(yù)訓(xùn)練、模型微調(diào)、強(qiáng)化學(xué)習(xí)、提示詞優(yōu)化,到評(píng)測(cè)、量化、部署,「全鏈路領(lǐng)域增強(qiáng)工具鏈」全面覆蓋了私有化部署的所有關(guān)鍵環(huán)節(jié)。
模型訓(xùn)練經(jīng)驗(yàn)+高效訓(xùn)練框架
值得一提的是,百川團(tuán)隊(duì)基于數(shù)萬(wàn)億token的訓(xùn)練實(shí)戰(zhàn)經(jīng)驗(yàn),全部開放。
這其中,微調(diào)數(shù)據(jù)自動(dòng)化增強(qiáng)、標(biāo)注工具、數(shù)據(jù)配比搜索策略等,全部被封裝到全生命周期工具包中,企業(yè)直接可用。
在整套工具鏈中,還包含了百川開放的高效訓(xùn)練框架。
相較于開源方案,基于百川成熟的訓(xùn)練框架,能在相同收斂結(jié)果下,將訓(xùn)練速度提升數(shù)倍。
與此同時(shí),它還支持RAG、Agent能力定制化,以及超長(zhǎng)窗口訓(xùn)練等高級(jí)功能。
這些能力,能夠幫助企業(yè)在更短時(shí)間內(nèi),完成復(fù)雜模型訓(xùn)練任務(wù)。
得到微調(diào)模型后,在部署前還需進(jìn)行全面的模型評(píng)測(cè)。
「全鏈路領(lǐng)域增強(qiáng)工具鏈」中提供了一站式模型評(píng)測(cè)方案,不僅包含了行業(yè)標(biāo)準(zhǔn)的基準(zhǔn)測(cè)試,還包含了全面自動(dòng)評(píng)測(cè)功能。
一方面,能夠幫企業(yè)了解模型相對(duì)表現(xiàn);另一方面,還能為其模型優(yōu)化提供精確指導(dǎo)。
不僅如此,通過(guò)大量的適配工作,百川智能還實(shí)現(xiàn)了多平臺(tái)適配的私有化部署方案,和英偉達(dá)、華為、寒武紀(jì)、高通、MTK、天數(shù)等主流芯片都能適配。
多、快、好、省,深受合作伙伴好評(píng)
那些拿到內(nèi)測(cè)資格的客戶,紛紛對(duì)百川智能兩款新模型、全鏈路領(lǐng)域增強(qiáng)工具鏈,給出了好評(píng)。
新致軟件稱,百川的工具包為L(zhǎng)LM開發(fā)帶來(lái)了革命性的提升。
這套工具不僅能夠有效處理私有數(shù)據(jù)資產(chǎn),還可以與百川優(yōu)質(zhì)通用數(shù)據(jù)融合訓(xùn)練,從而顯著提升了最終模型的表現(xiàn)效果。
另一個(gè)案例來(lái)自信雅達(dá)。
他們的實(shí)踐表明,Baichuan4-Turbo在硬件需求方面實(shí)現(xiàn)了重大突破——僅需2張4090顯卡即可流暢運(yùn)行,大幅降低了基礎(chǔ)設(shè)施投入成本。
更令人矚目的是,自部署該模型以來(lái),他們?cè)跇I(yè)務(wù)層面取得了顯著成效:客戶滿意度提升15%,運(yùn)營(yíng)效率更是實(shí)現(xiàn)了近30%的增長(zhǎng)。
以上,這些數(shù)據(jù)充分證明了百川智能的一站式解決方案,在實(shí)際應(yīng)用場(chǎng)景中的卓越表現(xiàn)。
截至目前,百川智能已經(jīng)服務(wù)了數(shù)千家客戶,不僅有北電數(shù)智、完美世界游戲等行業(yè)領(lǐng)軍企業(yè),還與多家行業(yè)生態(tài)伙伴,以及運(yùn)營(yíng)商達(dá)成合作,攜手構(gòu)建百川大模型生態(tài)。
隨著生態(tài)朋友圈不斷壯大,百川的實(shí)踐證明,LLM的落地不是遙不可及的未來(lái),而是觸手可及的現(xiàn)實(shí)。
最終實(shí)現(xiàn),讓更多企業(yè)以更低門檻、更高效率擁抱AI時(shí)代,推動(dòng)各行各業(yè)的升級(jí)。
文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請(qǐng)謹(jǐn)慎對(duì)待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。
11月11日,據(jù)網(wǎng)經(jīng)社數(shù)字零售臺(tái)(DR.100EC.CN)數(shù)據(jù)顯示,秋冬服飾仍是雙11的C位,女士針織衫、女士外套、女士羽絨服等位居服飾消費(fèi)前列,女士夾克銷量同比增長(zhǎng)72%,女士棉衣、女士羊毛衫銷量同比增長(zhǎng)50%以上。男士外套銷量同比增長(zhǎng)30%以上。
奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。
“以前都要去窗口辦,一套流程下來(lái)都要半個(gè)月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。
華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準(zhǔn)的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來(lái)實(shí)質(zhì)性的幫助,雙十一期間低至2799元,性價(jià)比很高,簡(jiǎn)直是創(chuàng)作者們的首選。
9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會(huì)——工業(yè)互聯(lián)網(wǎng)標(biāo)識(shí)解析專題論壇在沈陽(yáng)成功舉辦。