首頁(yè) > 云計(jì)算頻道 > 大模型

推理成本直降99%！百川智能「1+3」矩陣揭秘，兩張4090玩轉(zhuǎn)旗艦新模型

2024年11月01日 14:58:37 來源：新智元公眾號(hào)

　　大模型熱兩年后，將大模型融入業(yè)務(wù)場(chǎng)景、組織流程，提高產(chǎn)品和服務(wù)質(zhì)量，已經(jīng)成為越來越多企業(yè)的共識(shí)。

　　不僅如此，員工們也希望能用AI提升工作效率，甚至打破職業(yè)發(fā)展的天花板。

　　然而，許多企業(yè)在落地的具體過程中，卻面臨著眾多痛點(diǎn)，困難重重。

　　AI正以意想不到的規(guī)模融入工作場(chǎng)所:幫助節(jié)省時(shí)間(90%)，專注于最重要的工作(85%)，變得更有創(chuàng)造力(84%)，并且更享受工作(83%)

　　AI商業(yè)落地困難重重，何解?

　　首先，成本就是一大難關(guān)。

　　現(xiàn)實(shí)問題是，該給大模型買多少算力?投多少人做數(shù)據(jù)治理、訓(xùn)練模型?需要多少人做運(yùn)維?

　　第二，數(shù)據(jù)隱私與安全，也是讓不少企業(yè)望而卻步的重要原因。

　　B端企業(yè)往往對(duì)數(shù)據(jù)隱私要求較高，但大模型通常是由第三方提供，這個(gè)過程中就存在數(shù)據(jù)泄露的風(fēng)險(xiǎn)。

　　比如，一家醫(yī)療公司計(jì)劃將大模型用于患者診斷，但擔(dān)心數(shù)據(jù)傳輸?shù)降谌侥Ｐ吞峁┥痰姆⻊?wù)器，會(huì)泄露患者隱私。雖然可以進(jìn)行數(shù)據(jù)脫敏，但脫敏后的數(shù)據(jù)精度降低，也會(huì)降低模型效果。

　　第三，模型的集成與部署復(fù)雜，需要專業(yè)技術(shù)團(tuán)隊(duì)的支持。

　　B端用戶的技術(shù)棧各不相同，現(xiàn)有的大模型可能需要大量調(diào)整，才能與企業(yè)現(xiàn)有系統(tǒng)集成。

　　比如某零售公司想要將大模型嵌入到內(nèi)部CRM系統(tǒng)中，但由于API接口與現(xiàn)有系統(tǒng)不兼容，他們就需要開發(fā)大量中間接口，在內(nèi)部數(shù)據(jù)安全防護(hù)上花費(fèi)額外資源。結(jié)果就是項(xiàng)目推進(jìn)極慢，還需要大量技術(shù)支持。

　　還有一種情況是，通用模型雖然有全領(lǐng)域能力，但是很多具有獨(dú)特專業(yè)知識(shí)的行業(yè)和場(chǎng)景卻無法直接應(yīng)用。

　　比如在大模型落地工業(yè)場(chǎng)景上，施耐德電器數(shù)字化就提出了這樣的「兩難問題」——制造業(yè)企業(yè)的數(shù)據(jù)、知識(shí)、經(jīng)驗(yàn)無法分享，導(dǎo)致數(shù)據(jù)流動(dòng)差，難以出現(xiàn)垂直行業(yè)大模型;單個(gè)企業(yè)出面做私有化垂直的微調(diào)大模型，則會(huì)成本過高、維護(hù)難度過大。

　　此時(shí)，就需要結(jié)合客戶領(lǐng)域和場(chǎng)景對(duì)通用大模型進(jìn)行定向調(diào)優(yōu)和增強(qiáng)。

　　然而，這個(gè)過程更是存在諸多痛點(diǎn):缺少全鏈路增強(qiáng)的訓(xùn)練工具和框架;缺少與原模型匹配的通用訓(xùn)練預(yù)料;缺少模型訓(xùn)練的超參數(shù)、數(shù)據(jù)標(biāo)注、數(shù)據(jù)清洗、配比等訓(xùn)練經(jīng)驗(yàn)……

　　顯然，今天的AI仍處于鉆木取火的階段，誰(shuí)能攻破以上難題，讓企業(yè)可靠、經(jīng)濟(jì)、易用地使用大模型，誰(shuí)就能率先拿下一城。

　　這時(shí)，我們需要的是一套完整的工業(yè)級(jí)解決方案。

　　而就在昨天，百川智能正式面向企業(yè)用戶，發(fā)布了「1+3」一站式大模型商業(yè)化解決方案，包括全鏈路優(yōu)質(zhì)通用訓(xùn)練數(shù)據(jù)、Baichuan4-Turbo、Baichuan4-Air兩款模型，以及全鏈路領(lǐng)域增強(qiáng)工具鏈。

　　「1+3」的組合，覆蓋了從數(shù)據(jù)構(gòu)建、模型訓(xùn)練到強(qiáng)化調(diào)優(yōu)、部署運(yùn)營(yíng)的全流程。

　　通過這個(gè)產(chǎn)品矩陣，企業(yè)既能保障自身數(shù)據(jù)和隱私安全，還能以較低成本高效實(shí)現(xiàn)效果最佳的大模型私有化部署，用大模型賦能多種業(yè)務(wù)場(chǎng)景。

　　一言以蔽之，工具多、部署快、效果好、成本低。

　　搭配自用通用優(yōu)質(zhì)訓(xùn)練數(shù)據(jù)，多場(chǎng)景可用率高達(dá)96%

　　當(dāng)前，AI社區(qū)已經(jīng)有很多高質(zhì)量的LLM可以免費(fèi)獲取，諸如Llama、Gemma等等。

　　它們具備了強(qiáng)大的通用泛化能力，然而，由于每個(gè)企業(yè)都擁有自身獨(dú)特的專業(yè)知識(shí)和應(yīng)用場(chǎng)景，直接應(yīng)用通用模型難以達(dá)到理想效果，因此必須對(duì)模型進(jìn)行定制化優(yōu)化從而適應(yīng)特定領(lǐng)域和場(chǎng)景的需求。而優(yōu)化后模型在多場(chǎng)景下的可用率是評(píng)估其價(jià)值的關(guān)鍵標(biāo)準(zhǔn)。

　　目前，行業(yè)主流的定制化優(yōu)化方式有兩種:用場(chǎng)景數(shù)據(jù)微調(diào);場(chǎng)景數(shù)據(jù)混合開源通用數(shù)據(jù)微調(diào)。

　　數(shù)據(jù)顯示，僅用專業(yè)數(shù)據(jù)微調(diào)模型，多場(chǎng)景可用率是84%。

　　若是利用行業(yè)公開的通用數(shù)據(jù)，或者自建通用數(shù)據(jù)集，外加專有數(shù)據(jù)進(jìn)行領(lǐng)域增強(qiáng)訓(xùn)練，可用率會(huì)有所提升，但也只能提升2%。

　　以上這些還不是最優(yōu)解，因?yàn)閷?duì)于很多企業(yè)來說，多場(chǎng)景可用率低于90%基本上就是不可用的狀態(tài)。

　　導(dǎo)致這種情況的主要原因是，受限于諸多因素，企業(yè)在混合微調(diào)時(shí)只能自建或者使用開源的通用數(shù)據(jù)，很難獲得與原模型高度匹配的通用訓(xùn)練數(shù)據(jù)，因此即便經(jīng)過調(diào)優(yōu)，模型也有很大概率會(huì)失去通用性，變成無法應(yīng)對(duì)多個(gè)場(chǎng)景的專用模型。

　　這次，百川智能直接給出了其自用的預(yù)訓(xùn)練通用數(shù)據(jù)、SFT微調(diào)通用數(shù)據(jù)以及強(qiáng)化學(xué)習(xí)過程中的通用數(shù)據(jù)。

　　同時(shí)，自研的超參自動(dòng)化搜索和調(diào)優(yōu)技術(shù)、數(shù)據(jù)動(dòng)態(tài)自適應(yīng)配比技術(shù)等訓(xùn)練經(jīng)驗(yàn)和技術(shù)，也都一并封裝成工具，給到企業(yè)使用。

　　用白話說就是，Baichuan4-Turbo、Baichuan4-Air用到的高質(zhì)量通用訓(xùn)練數(shù)據(jù)和訓(xùn)練技巧，都在里面!

　　評(píng)測(cè)結(jié)果顯示，在使用百川智能優(yōu)質(zhì)通用訓(xùn)練數(shù)據(jù)與企業(yè)專有數(shù)據(jù)混合微調(diào)后，模型在金融、教育、醫(yī)療等場(chǎng)景下的專業(yè)細(xì)分任務(wù)的平均可用率高達(dá)96%。

　　相比不混合通用數(shù)據(jù)提升12%，混合開源通用數(shù)據(jù)提升10%。

　　相較于其他行業(yè)解決方案，百川智能取得了最新的SOTA，這也從側(cè)面證明了模型想要在企業(yè)場(chǎng)景下取得優(yōu)秀表現(xiàn)，需要的是專有數(shù)據(jù)與和原模型高度匹配的通用數(shù)據(jù)的「混合增強(qiáng)」。

　　模型升級(jí):Baichuan4-Turbo兩張4090即可部署，Baichuan4-Air推理成本下降99%

　　接下來，如何將Baichuan4-Turbo、Baichuan4-Air應(yīng)用在實(shí)際場(chǎng)景中?

　　從名字中不難看出，它們都是Baichuan4系列基礎(chǔ)模型的升級(jí)。

　　對(duì)于企業(yè)來說，在不同場(chǎng)景階段，對(duì)模型性能和成本要求各不相同。

　　在復(fù)雜場(chǎng)景探索階段，他們更加關(guān)注模型性能、部署成本。

　　而在已驗(yàn)證過的大規(guī)模落地階段，他們更側(cè)重模型推理成本、響應(yīng)速度。

　　這次新發(fā)布的兩款模型，分別應(yīng)對(duì)不同階段的客戶落地場(chǎng)景，效果更好，成本更低。

　　復(fù)雜場(chǎng)景探索:Baichuan4-Turbo

　　其中，Baichuan4-Turbo屬于旗艦?zāi)Ｐ蜕?jí)版。

　　它適合復(fù)雜場(chǎng)景的初期探索階段，尤其適用于對(duì)于初始部署成本(比如顯存)較為敏感的場(chǎng)景。

　　對(duì)于B端企業(yè)用戶，大模型時(shí)常會(huì)遇到極為復(fù)雜的場(chǎng)景，這時(shí)就對(duì)模型能力提出了很高的要求。

　　比如在一個(gè)金融機(jī)構(gòu)中，需要實(shí)時(shí)分析海量交易和市場(chǎng)數(shù)據(jù)，還要檢測(cè)異常交易、反欺詐，預(yù)測(cè)信用風(fēng)險(xiǎn)等等。

　　此時(shí)就需要大模型能夠整合動(dòng)態(tài)數(shù)據(jù)與多模態(tài)處理、具有強(qiáng)大的模型識(shí)別與實(shí)時(shí)預(yù)測(cè)能力。

　　這樣它才能快速集成結(jié)構(gòu)化(交易記錄)和非結(jié)構(gòu)化數(shù)據(jù)(文本)，并進(jìn)行跨模態(tài)的信息分析。并且，它還能對(duì)數(shù)據(jù)中的微小變化做出快速響應(yīng)，識(shí)別風(fēng)險(xiǎn)信號(hào)。

　　針對(duì)以上場(chǎng)景，Baichuan4-Turbo就是一個(gè)極具性價(jià)比的選擇。

　　相比Baichuan4，Baichuan4-Turbo在B端客戶高頻應(yīng)用場(chǎng)景上，效果均有顯著提升。具體來說，分聚類提升了9.09%、多語(yǔ)言提升了31.43%、信息摘要提升了50%、生成提升了12.77%。

　　而在成本上，通過w4kv4等infra量化，Baichuan4-Turbo僅需2張4090，即可達(dá)到GPT-4o效果。

　　可以說達(dá)到了旗艦?zāi)Ｐ偷男袠I(yè)最低，僅為Baichuan4的15%。

　　在響應(yīng)速度上也更快，其中首token速度提升了51%、token流速提升了73%。

　　廣泛應(yīng)用:首個(gè)MoE模型Baichuan4-Air

　　Baichuan4-Air則是Baichuan4系列中的低成本極速版，同時(shí)也是百川智能發(fā)布的首款MoE模型。

　　它適合中等復(fù)雜及簡(jiǎn)單場(chǎng)景的廣泛應(yīng)用階段，尤其是請(qǐng)求量大、推理成本敏感型的場(chǎng)景。

　　比如電商搜索和推薦、智能客服與對(duì)話機(jī)器人，都屬于這一類。

　　電商平臺(tái)的用戶訪問量大，產(chǎn)品瀏覽和搜索請(qǐng)求頻繁發(fā)生，此時(shí)模型無需深層理解用戶的全部行為，只需提供較高相關(guān)性的推薦即可。

　　而在智能客服場(chǎng)景，銀行、零售、物流等企業(yè)的在線客服系統(tǒng)往往有高并發(fā)的用戶咨詢，用戶問題相對(duì)簡(jiǎn)單、重復(fù)性高，不涉及復(fù)雜情感理解和多輪對(duì)話。

　　此時(shí)，相比復(fù)雜大模型，輕量化的模型就能實(shí)時(shí)響應(yīng)海量請(qǐng)求，在不犧牲速度的情況下回答大量簡(jiǎn)單的用戶咨詢，企業(yè)也不必承受復(fù)雜模型帶來的高計(jì)算成本。

　　Baichuan4-Air，正是為這類用戶量身打造。

　　它的效果和Baichuan4基本持平，但價(jià)格只有后者的1%——0.98厘/千tokens，目前行業(yè)最低。

　　同時(shí)，它的響應(yīng)也更快，首token速度提升了77%、token流速提升了93%。

　　值得一提的是，作為百川智能的首個(gè)MoE模型，Baichuan4-Air 行業(yè)首創(chuàng)了PRI架構(gòu)，巧妙融合了Pyramid(金字塔架構(gòu))、Residual(殘差結(jié)構(gòu))、Interval(區(qū)間結(jié)構(gòu))三種配置方式。

　　與標(biāo)準(zhǔn)的MoE架構(gòu)相比，Baichuan4-Air的MoE架構(gòu)保持了MLP(多層感知機(jī))和Attention(注意力機(jī)制)的內(nèi)部結(jié)構(gòu)不變，僅對(duì)混合專家MLP層的配置方式進(jìn)行優(yōu)化，通過合理配置專家數(shù)量和激活策略，能夠更好地平衡計(jì)算負(fù)載，減少計(jì)算量，提高推理速度。

　　正是由于這種MoE架構(gòu)上的創(chuàng)新，Baichuan4-Air在時(shí)效率和模型性能上均表現(xiàn)優(yōu)異。

　　在相同訓(xùn)練數(shù)據(jù)下，Baichuan4-Air不僅時(shí)效率更高，性能也大幅領(lǐng)先于GPT4-style、Mixtral-style結(jié)構(gòu)的MoE模型。

　　至此，所謂停止預(yù)訓(xùn)練模型的謠言，也就不攻自破了。

　　全鏈路領(lǐng)域增強(qiáng)工具鏈，覆蓋模型部署全流程

　　作為「1+3」產(chǎn)品矩陣中的「1」，從數(shù)據(jù)處理、增量預(yù)訓(xùn)練、模型微調(diào)、強(qiáng)化學(xué)習(xí)、提示詞優(yōu)化，到評(píng)測(cè)、量化、部署，「全鏈路領(lǐng)域增強(qiáng)工具鏈」全面覆蓋了私有化部署的所有關(guān)鍵環(huán)節(jié)。

　　模型訓(xùn)練經(jīng)驗(yàn)+高效訓(xùn)練框架

　　值得一提的是，百川團(tuán)隊(duì)基于數(shù)萬(wàn)億token的訓(xùn)練實(shí)戰(zhàn)經(jīng)驗(yàn)，全部開放。

　　這其中，微調(diào)數(shù)據(jù)自動(dòng)化增強(qiáng)、標(biāo)注工具、數(shù)據(jù)配比搜索策略等，全部被封裝到全生命周期工具包中，企業(yè)直接可用。

　　在整套工具鏈中，還包含了百川開放的高效訓(xùn)練框架。

　　相較于開源方案，基于百川成熟的訓(xùn)練框架，能在相同收斂結(jié)果下，將訓(xùn)練速度提升數(shù)倍。

　　與此同時(shí)，它還支持RAG、Agent能力定制化，以及超長(zhǎng)窗口訓(xùn)練等高級(jí)功能。

　　這些能力，能夠幫助企業(yè)在更短時(shí)間內(nèi)，完成復(fù)雜模型訓(xùn)練任務(wù)。

　　得到微調(diào)模型后，在部署前還需進(jìn)行全面的模型評(píng)測(cè)。

　　「全鏈路領(lǐng)域增強(qiáng)工具鏈」中提供了一站式模型評(píng)測(cè)方案，不僅包含了行業(yè)標(biāo)準(zhǔn)的基準(zhǔn)測(cè)試，還包含了全面自動(dòng)評(píng)測(cè)功能。

　　一方面，能夠幫企業(yè)了解模型相對(duì)表現(xiàn);另一方面，還能為其模型優(yōu)化提供精確指導(dǎo)。

　　不僅如此，通過大量的適配工作，百川智能還實(shí)現(xiàn)了多平臺(tái)適配的私有化部署方案，和英偉達(dá)、華為、寒武紀(jì)、高通、MTK、天數(shù)等主流芯片都能適配。

　　多、快、好、省，深受合作伙伴好評(píng)

　　那些拿到內(nèi)測(cè)資格的客戶，紛紛對(duì)百川智能兩款新模型、全鏈路領(lǐng)域增強(qiáng)工具鏈，給出了好評(píng)。

　　新致軟件稱，百川的工具包為L(zhǎng)LM開發(fā)帶來了革命性的提升。

　　這套工具不僅能夠有效處理私有數(shù)據(jù)資產(chǎn)，還可以與百川優(yōu)質(zhì)通用數(shù)據(jù)融合訓(xùn)練，從而顯著提升了最終模型的表現(xiàn)效果。

　　另一個(gè)案例來自信雅達(dá)。

　　他們的實(shí)踐表明，Baichuan4-Turbo在硬件需求方面實(shí)現(xiàn)了重大突破——僅需2張4090顯卡即可流暢運(yùn)行，大幅降低了基礎(chǔ)設(shè)施投入成本。

　　更令人矚目的是，自部署該模型以來，他們?cè)跇I(yè)務(wù)層面取得了顯著成效:客戶滿意度提升15%，運(yùn)營(yíng)效率更是實(shí)現(xiàn)了近30%的增長(zhǎng)。

　　以上，這些數(shù)據(jù)充分證明了百川智能的一站式解決方案，在實(shí)際應(yīng)用場(chǎng)景中的卓越表現(xiàn)。

　　截至目前，百川智能已經(jīng)服務(wù)了數(shù)千家客戶，不僅有北電數(shù)智、完美世界游戲等行業(yè)領(lǐng)軍企業(yè)，還與多家行業(yè)生態(tài)伙伴，以及運(yùn)營(yíng)商達(dá)成合作，攜手構(gòu)建百川大模型生態(tài)。

　　隨著生態(tài)朋友圈不斷壯大，百川的實(shí)踐證明，LLM的落地不是遙不可及的未來，而是觸手可及的現(xiàn)實(shí)。

　　最終實(shí)現(xiàn)，讓更多企業(yè)以更低門檻、更高效率擁抱AI時(shí)代，推動(dòng)各行各業(yè)的升級(jí)。

　　文章內(nèi)容僅供閱讀，不構(gòu)成投資建議，請(qǐng)謹(jǐn)慎對(duì)待。投資者據(jù)此操作，風(fēng)險(xiǎn)自擔(dān)。

[No. ]
分享到微信

即時(shí)

具身智能，正在批量復(fù)制創(chuàng)業(yè)公司

2024年以前，具身智能還是以學(xué)術(shù)界為主，是需要長(zhǎng)期研發(fā)創(chuàng)新的試驗(yàn)田。

真我Neo7 SE正式發(fā)布，天璣8400游戲神機(jī)國(guó)補(bǔ)價(jià)1530元起

罕見病AI大模型正式進(jìn)入臨床應(yīng)用

感谢您访问我们的网站，您可能还对以下资源感兴趣：
台湾中文娱乐网

推理成本直降99%！百川智能「1+3」矩陣揭秘，兩張4090玩轉(zhuǎn)旗艦新模型

即時(shí)

具身智能，正在批量復(fù)制創(chuàng)業(yè)公司

新聞

明火炊具市場(chǎng)：三季度健康屬性貫穿全類目

企業(yè)IT

重慶創(chuàng)新公積金應(yīng)用，“區(qū)塊鏈+政務(wù)服務(wù)”顯成效

3C消費(fèi)

華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器，高能實(shí)力，創(chuàng)

研究

中國(guó)信通院羅松：深度解讀《工業(yè)互聯(lián)網(wǎng)標(biāo)識(shí)解析體系

專題

推理成本直降99%！百川智能「1+3」矩陣揭秘，兩張4090玩轉(zhuǎn)旗艦新模型

擴(kuò)展閱讀

推理成本直降99%！百川智能「1+3」矩陣揭秘，兩張4090玩轉(zhuǎn)旗艦新模型