百川智能發(fā)布全鏈路領(lǐng)域增強(qiáng)金融大模型 Baichuan4-Finance年末家電消費(fèi)觀察:品質(zhì)生活類產(chǎn)品熱賣,將持續(xù)迎來剛需式普及?GPT-5研發(fā)受阻:OpenAI 新一代模型難見突破性進(jìn)展新一代語言模型ModernBERT發(fā)布,RAG等任務(wù)處理速度快四倍、成本低新研究顯示:Anthropic 的 Claude AI 在合作能力上領(lǐng)先于 OpenAI 和谷歌模型谷歌向投資者保證人工智能本月將迎來“驚人”表現(xiàn)多模態(tài)大模型引爆應(yīng)用場景 階躍星辰完成數(shù)億美元融資星動紀(jì)元發(fā)布端到端原生機(jī)器人大模型ERA-42 實(shí)現(xiàn)機(jī)器人復(fù)雜場景操作免費(fèi)模式強(qiáng)攻下,快手、抖音用“短劇VIP”反擊?低碳存儲助力算力產(chǎn)業(yè) 富士膠片首次亮相IDC大會行業(yè)唯一!海爾熱聲熱泵技術(shù)獲全國顛覆性技術(shù)創(chuàng)新大賽最高獎OPPO A5 Pro首創(chuàng)獵手天線架構(gòu):信號能穿十堵墻一加 Ace 5 Pro首發(fā)電競Wi-Fi芯片G1 帶來「穿墻王」和「搶網(wǎng)王」般的網(wǎng)絡(luò)體驗(yàn)電視市場又出黑馬!TCL同檔Mini LED音畫王P12K,萬象分區(qū)打造超強(qiáng)控光!零下25℃如何取暖?海爾水暖通溫暖驛站亮相冰雪大世界馬太效應(yīng),強(qiáng)者恒強(qiáng)?——《中國企業(yè)科創(chuàng)力研究報告(2024)》美團(tuán)年度報告竟然用上了AI和短?這下是真出圈了消息稱上汽大眾正開發(fā)三款新車,技術(shù)分別來自小鵬、智己和榮威鴻蒙智行泊車代駕VPD正式開啟全量推送!升級自動泊車/接駕等多項(xiàng)功能華為官方翻新手機(jī)最高降價4000元
  • 首頁 > 云計算頻道 > 大模型

    推理成本直降99%!百川智能「1+3」矩陣揭秘,兩張4090玩轉(zhuǎn)旗艦新模型

    2024年11月01日 14:58:37   來源:新智元公眾號

      大模型熱兩年后,將大模型融入業(yè)務(wù)場景、組織流程,提高產(chǎn)品和服務(wù)質(zhì)量,已經(jīng)成為越來越多企業(yè)的共識。

      不僅如此,員工們也希望能用AI提升工作效率,甚至打破職業(yè)發(fā)展的天花板。

      然而,許多企業(yè)在落地的具體過程中,卻面臨著眾多痛點(diǎn),困難重重。

      AI正以意想不到的規(guī)模融入工作場所:幫助節(jié)省時間(90%),專注于最重要的工作(85%),變得更有創(chuàng)造力(84%),并且更享受工作(83%)

      AI商業(yè)落地困難重重,何解?

      首先,成本就是一大難關(guān)。

      現(xiàn)實(shí)問題是,該給大模型買多少算力?投多少人做數(shù)據(jù)治理、訓(xùn)練模型?需要多少人做運(yùn)維?

      第二,數(shù)據(jù)隱私與安全,也是讓不少企業(yè)望而卻步的重要原因。

      B端企業(yè)往往對數(shù)據(jù)隱私要求較高,但大模型通常是由第三方提供,這個過程中就存在數(shù)據(jù)泄露的風(fēng)險。

      比如,一家醫(yī)療公司計劃將大模型用于患者診斷,但擔(dān)心數(shù)據(jù)傳輸?shù)降谌侥P吞峁┥痰姆⻊?wù)器,會泄露患者隱私。雖然可以進(jìn)行數(shù)據(jù)脫敏,但脫敏后的數(shù)據(jù)精度降低,也會降低模型效果。

      第三,模型的集成與部署復(fù)雜,需要專業(yè)技術(shù)團(tuán)隊(duì)的支持。

      B端用戶的技術(shù)棧各不相同,現(xiàn)有的大模型可能需要大量調(diào)整,才能與企業(yè)現(xiàn)有系統(tǒng)集成。

      比如某零售公司想要將大模型嵌入到內(nèi)部CRM系統(tǒng)中,但由于API接口與現(xiàn)有系統(tǒng)不兼容,他們就需要開發(fā)大量中間接口,在內(nèi)部數(shù)據(jù)安全防護(hù)上花費(fèi)額外資源。結(jié)果就是項(xiàng)目推進(jìn)極慢,還需要大量技術(shù)支持。

      還有一種情況是,通用模型雖然有全領(lǐng)域能力,但是很多具有獨(dú)特專業(yè)知識的行業(yè)和場景卻無法直接應(yīng)用。

      比如在大模型落地工業(yè)場景上,施耐德電器數(shù)字化就提出了這樣的「兩難問題」——制造業(yè)企業(yè)的數(shù)據(jù)、知識、經(jīng)驗(yàn)無法分享,導(dǎo)致數(shù)據(jù)流動差,難以出現(xiàn)垂直行業(yè)大模型;單個企業(yè)出面做私有化垂直的微調(diào)大模型,則會成本過高、維護(hù)難度過大。

      此時,就需要結(jié)合客戶領(lǐng)域和場景對通用大模型進(jìn)行定向調(diào)優(yōu)和增強(qiáng)。

      然而,這個過程更是存在諸多痛點(diǎn):缺少全鏈路增強(qiáng)的訓(xùn)練工具和框架;缺少與原模型匹配的通用訓(xùn)練預(yù)料;缺少模型訓(xùn)練的超參數(shù)、數(shù)據(jù)標(biāo)注、數(shù)據(jù)清洗、配比等訓(xùn)練經(jīng)驗(yàn)……

      顯然,今天的AI仍處于鉆木取火的階段,誰能攻破以上難題,讓企業(yè)可靠、經(jīng)濟(jì)、易用地使用大模型,誰就能率先拿下一城。

      這時,我們需要的是一套完整的工業(yè)級解決方案。

      而就在昨天,百川智能正式面向企業(yè)用戶,發(fā)布了「1+3」一站式大模型商業(yè)化解決方案,包括全鏈路優(yōu)質(zhì)通用訓(xùn)練數(shù)據(jù)、Baichuan4-Turbo、Baichuan4-Air兩款模型,以及全鏈路領(lǐng)域增強(qiáng)工具鏈。

      「1+3」的組合,覆蓋了從數(shù)據(jù)構(gòu)建、模型訓(xùn)練到強(qiáng)化調(diào)優(yōu)、部署運(yùn)營的全流程。

      通過這個產(chǎn)品矩陣,企業(yè)既能保障自身數(shù)據(jù)和隱私安全,還能以較低成本高效實(shí)現(xiàn)效果最佳的大模型私有化部署,用大模型賦能多種業(yè)務(wù)場景。

      一言以蔽之,工具多、部署快、效果好、成本低。

      搭配自用通用優(yōu)質(zhì)訓(xùn)練數(shù)據(jù),多場景可用率高達(dá)96%

      當(dāng)前,AI社區(qū)已經(jīng)有很多高質(zhì)量的LLM可以免費(fèi)獲取,諸如Llama、Gemma等等。

      它們具備了強(qiáng)大的通用泛化能力,然而,由于每個企業(yè)都擁有自身獨(dú)特的專業(yè)知識和應(yīng)用場景,直接應(yīng)用通用模型難以達(dá)到理想效果,因此必須對模型進(jìn)行定制化優(yōu)化從而適應(yīng)特定領(lǐng)域和場景的需求。而優(yōu)化后模型在多場景下的可用率是評估其價值的關(guān)鍵標(biāo)準(zhǔn)。

      目前,行業(yè)主流的定制化優(yōu)化方式有兩種:用場景數(shù)據(jù)微調(diào);場景數(shù)據(jù)混合開源通用數(shù)據(jù)微調(diào)。

      數(shù)據(jù)顯示,僅用專業(yè)數(shù)據(jù)微調(diào)模型,多場景可用率是84%。

      若是利用行業(yè)公開的通用數(shù)據(jù),或者自建通用數(shù)據(jù)集,外加專有數(shù)據(jù)進(jìn)行領(lǐng)域增強(qiáng)訓(xùn)練,可用率會有所提升,但也只能提升2%。

      以上這些還不是最優(yōu)解,因?yàn)閷τ诤芏嗥髽I(yè)來說,多場景可用率低于90%基本上就是不可用的狀態(tài)。

      導(dǎo)致這種情況的主要原因是,受限于諸多因素,企業(yè)在混合微調(diào)時只能自建或者使用開源的通用數(shù)據(jù),很難獲得與原模型高度匹配的通用訓(xùn)練數(shù)據(jù),因此即便經(jīng)過調(diào)優(yōu),模型也有很大概率會失去通用性,變成無法應(yīng)對多個場景的專用模型。

      這次,百川智能直接給出了其自用的預(yù)訓(xùn)練通用數(shù)據(jù)、SFT微調(diào)通用數(shù)據(jù)以及強(qiáng)化學(xué)習(xí)過程中的通用數(shù)據(jù)。

      同時,自研的超參自動化搜索和調(diào)優(yōu)技術(shù)、數(shù)據(jù)動態(tài)自適應(yīng)配比技術(shù)等訓(xùn)練經(jīng)驗(yàn)和技術(shù),也都一并封裝成工具,給到企業(yè)使用。

      用白話說就是,Baichuan4-Turbo、Baichuan4-Air用到的高質(zhì)量通用訓(xùn)練數(shù)據(jù)和訓(xùn)練技巧,都在里面!

      評測結(jié)果顯示,在使用百川智能優(yōu)質(zhì)通用訓(xùn)練數(shù)據(jù)與企業(yè)專有數(shù)據(jù)混合微調(diào)后,模型在金融、教育、醫(yī)療等場景下的專業(yè)細(xì)分任務(wù)的平均可用率高達(dá)96%。

      相比不混合通用數(shù)據(jù)提升12%,混合開源通用數(shù)據(jù)提升10%。

      相較于其他行業(yè)解決方案,百川智能取得了最新的SOTA,這也從側(cè)面證明了模型想要在企業(yè)場景下取得優(yōu)秀表現(xiàn),需要的是專有數(shù)據(jù)與和原模型高度匹配的通用數(shù)據(jù)的「混合增強(qiáng)」。

      模型升級:Baichuan4-Turbo兩張4090即可部署,Baichuan4-Air推理成本下降99%

      接下來,如何將Baichuan4-Turbo、Baichuan4-Air應(yīng)用在實(shí)際場景中?

      從名字中不難看出,它們都是Baichuan4系列基礎(chǔ)模型的升級。

      對于企業(yè)來說,在不同場景階段,對模型性能和成本要求各不相同。

      在復(fù)雜場景探索階段,他們更加關(guān)注模型性能、部署成本。

      而在已驗(yàn)證過的大規(guī)模落地階段,他們更側(cè)重模型推理成本、響應(yīng)速度。

      這次新發(fā)布的兩款模型,分別應(yīng)對不同階段的客戶落地場景,效果更好,成本更低。

      復(fù)雜場景探索:Baichuan4-Turbo

      其中,Baichuan4-Turbo屬于旗艦?zāi)P蜕壈妗?/p>

      它適合復(fù)雜場景的初期探索階段,尤其適用于對于初始部署成本(比如顯存)較為敏感的場景。

      對于B端企業(yè)用戶,大模型時常會遇到極為復(fù)雜的場景,這時就對模型能力提出了很高的要求。

      比如在一個金融機(jī)構(gòu)中,需要實(shí)時分析海量交易和市場數(shù)據(jù),還要檢測異常交易、反欺詐,預(yù)測信用風(fēng)險等等。

      此時就需要大模型能夠整合動態(tài)數(shù)據(jù)與多模態(tài)處理、具有強(qiáng)大的模型識別與實(shí)時預(yù)測能力。

      這樣它才能快速集成結(jié)構(gòu)化(交易記錄)和非結(jié)構(gòu)化數(shù)據(jù)(文本),并進(jìn)行跨模態(tài)的信息分析。并且,它還能對數(shù)據(jù)中的微小變化做出快速響應(yīng),識別風(fēng)險信號。

      針對以上場景,Baichuan4-Turbo就是一個極具性價比的選擇。

      相比Baichuan4,Baichuan4-Turbo在B端客戶高頻應(yīng)用場景上,效果均有顯著提升。具體來說,分聚類提升了9.09%、多語言提升了31.43%、信息摘要提升了50%、生成提升了12.77%。

      而在成本上,通過w4kv4等infra量化,Baichuan4-Turbo僅需2張4090,即可達(dá)到GPT-4o效果。

      可以說達(dá)到了旗艦?zāi)P偷男袠I(yè)最低,僅為Baichuan4的15%。

      在響應(yīng)速度上也更快,其中首token速度提升了51%、token流速提升了73%。

      廣泛應(yīng)用:首個MoE模型Baichuan4-Air

      Baichuan4-Air則是Baichuan4系列中的低成本極速版,同時也是百川智能發(fā)布的首款MoE模型。

      它適合中等復(fù)雜及簡單場景的廣泛應(yīng)用階段,尤其是請求量大、推理成本敏感型的場景。

      比如電商搜索和推薦、智能客服與對話機(jī)器人,都屬于這一類。

      電商平臺的用戶訪問量大,產(chǎn)品瀏覽和搜索請求頻繁發(fā)生,此時模型無需深層理解用戶的全部行為,只需提供較高相關(guān)性的推薦即可。

      而在智能客服場景,銀行、零售、物流等企業(yè)的在線客服系統(tǒng)往往有高并發(fā)的用戶咨詢,用戶問題相對簡單、重復(fù)性高,不涉及復(fù)雜情感理解和多輪對話。

      此時,相比復(fù)雜大模型,輕量化的模型就能實(shí)時響應(yīng)海量請求,在不犧牲速度的情況下回答大量簡單的用戶咨詢,企業(yè)也不必承受復(fù)雜模型帶來的高計算成本。

      Baichuan4-Air,正是為這類用戶量身打造。

      它的效果和Baichuan4基本持平,但價格只有后者的1%——0.98厘/千tokens,目前行業(yè)最低。

      同時,它的響應(yīng)也更快,首token速度提升了77%、token流速提升了93%。

      值得一提的是,作為百川智能的首個MoE模型,Baichuan4-Air 行業(yè)首創(chuàng)了PRI架構(gòu),巧妙融合了Pyramid(金字塔架構(gòu))、Residual(殘差結(jié)構(gòu))、Interval(區(qū)間結(jié)構(gòu))三種配置方式。

      與標(biāo)準(zhǔn)的MoE架構(gòu)相比,Baichuan4-Air的MoE架構(gòu)保持了MLP(多層感知機(jī))和Attention(注意力機(jī)制)的內(nèi)部結(jié)構(gòu)不變,僅對混合專家MLP層的配置方式進(jìn)行優(yōu)化,通過合理配置專家數(shù)量和激活策略,能夠更好地平衡計算負(fù)載,減少計算量,提高推理速度。

      正是由于這種MoE架構(gòu)上的創(chuàng)新,Baichuan4-Air在時效率和模型性能上均表現(xiàn)優(yōu)異。

      在相同訓(xùn)練數(shù)據(jù)下,Baichuan4-Air不僅時效率更高,性能也大幅領(lǐng)先于GPT4-style、Mixtral-style結(jié)構(gòu)的MoE模型。

      至此,所謂停止預(yù)訓(xùn)練模型的謠言,也就不攻自破了。

      全鏈路領(lǐng)域增強(qiáng)工具鏈,覆蓋模型部署全流程

      作為「1+3」產(chǎn)品矩陣中的「1」,從數(shù)據(jù)處理、增量預(yù)訓(xùn)練、模型微調(diào)、強(qiáng)化學(xué)習(xí)、提示詞優(yōu)化,到評測、量化、部署,「全鏈路領(lǐng)域增強(qiáng)工具鏈」全面覆蓋了私有化部署的所有關(guān)鍵環(huán)節(jié)。

      模型訓(xùn)練經(jīng)驗(yàn)+高效訓(xùn)練框架

      值得一提的是,百川團(tuán)隊(duì)基于數(shù)萬億token的訓(xùn)練實(shí)戰(zhàn)經(jīng)驗(yàn),全部開放。

      這其中,微調(diào)數(shù)據(jù)自動化增強(qiáng)、標(biāo)注工具、數(shù)據(jù)配比搜索策略等,全部被封裝到全生命周期工具包中,企業(yè)直接可用。

      在整套工具鏈中,還包含了百川開放的高效訓(xùn)練框架。

      相較于開源方案,基于百川成熟的訓(xùn)練框架,能在相同收斂結(jié)果下,將訓(xùn)練速度提升數(shù)倍。

      與此同時,它還支持RAG、Agent能力定制化,以及超長窗口訓(xùn)練等高級功能。

      這些能力,能夠幫助企業(yè)在更短時間內(nèi),完成復(fù)雜模型訓(xùn)練任務(wù)。

      得到微調(diào)模型后,在部署前還需進(jìn)行全面的模型評測。

      「全鏈路領(lǐng)域增強(qiáng)工具鏈」中提供了一站式模型評測方案,不僅包含了行業(yè)標(biāo)準(zhǔn)的基準(zhǔn)測試,還包含了全面自動評測功能。

      一方面,能夠幫企業(yè)了解模型相對表現(xiàn);另一方面,還能為其模型優(yōu)化提供精確指導(dǎo)。

      不僅如此,通過大量的適配工作,百川智能還實(shí)現(xiàn)了多平臺適配的私有化部署方案,和英偉達(dá)、華為、寒武紀(jì)、高通、MTK、天數(shù)等主流芯片都能適配。

      多、快、好、省,深受合作伙伴好評

      那些拿到內(nèi)測資格的客戶,紛紛對百川智能兩款新模型、全鏈路領(lǐng)域增強(qiáng)工具鏈,給出了好評。

      新致軟件稱,百川的工具包為LLM開發(fā)帶來了革命性的提升。

      這套工具不僅能夠有效處理私有數(shù)據(jù)資產(chǎn),還可以與百川優(yōu)質(zhì)通用數(shù)據(jù)融合訓(xùn)練,從而顯著提升了最終模型的表現(xiàn)效果。

      另一個案例來自信雅達(dá)。

      他們的實(shí)踐表明,Baichuan4-Turbo在硬件需求方面實(shí)現(xiàn)了重大突破——僅需2張4090顯卡即可流暢運(yùn)行,大幅降低了基礎(chǔ)設(shè)施投入成本。

      更令人矚目的是,自部署該模型以來,他們在業(yè)務(wù)層面取得了顯著成效:客戶滿意度提升15%,運(yùn)營效率更是實(shí)現(xiàn)了近30%的增長。

      以上,這些數(shù)據(jù)充分證明了百川智能的一站式解決方案,在實(shí)際應(yīng)用場景中的卓越表現(xiàn)。

      截至目前,百川智能已經(jīng)服務(wù)了數(shù)千家客戶,不僅有北電數(shù)智、完美世界游戲等行業(yè)領(lǐng)軍企業(yè),還與多家行業(yè)生態(tài)伙伴,以及運(yùn)營商達(dá)成合作,攜手構(gòu)建百川大模型生態(tài)。

      隨著生態(tài)朋友圈不斷壯大,百川的實(shí)踐證明,LLM的落地不是遙不可及的未來,而是觸手可及的現(xiàn)實(shí)。

      最終實(shí)現(xiàn),讓更多企業(yè)以更低門檻、更高效率擁抱AI時代,推動各行各業(yè)的升級。

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹(jǐn)慎對待。投資者據(jù)此操作,風(fēng)險自擔(dān)。

    即時

    新聞

    明火炊具市場:三季度健康屬性貫穿全類目

    奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。

    企業(yè)IT

    重慶創(chuàng)新公積金應(yīng)用,“區(qū)塊鏈+政務(wù)服務(wù)”顯成效

    “以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。

    3C消費(fèi)

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,高能實(shí)力,創(chuàng)

    華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準(zhǔn)的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實(shí)質(zhì)性的幫助,雙十一期間低至2799元,性價比很高,簡直是創(chuàng)作者們的首選。

    研究

    中國信通院羅松:深度解讀《工業(yè)互聯(lián)網(wǎng)標(biāo)識解析體系

    9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會——工業(yè)互聯(lián)網(wǎng)標(biāo)識解析專題論壇在沈陽成功舉辦。