如果說2023年是通用大模型的元年,2024年將是行業(yè)大模型落地元年。
從去年底到今年初,各行各業(yè)正迎來大模型落地潮。“大家都馬不停蹄的。”
就在這樣的熱潮之中,政企市場的資深玩家浪潮云,在青島發(fā)布海若大模型業(yè)務戰(zhàn)略,定位行業(yè)大模型市場,首批面向政府、交通、應急、制造、醫(yī)療、農業(yè)六大行業(yè),通過培育“三位一體”的數字生態(tài)創(chuàng)新共同體,加速行業(yè)大模型在百城落地。
01
大模型落地熱開始了
“大模型的行業(yè)落地需求來的又快又猛。”一位趕到青島參加浪潮云數字創(chuàng)新生態(tài)大會的大模型落地服務商說。“從去年底到今年初,這樣的氛圍特別濃,大家都馬不停蹄的,這個潮流來的太快了。”另一位現(xiàn)場人士說。
一位正在與醫(yī)院合作大模型落地的浪潮云人士說,原來每家醫(yī)院都有自己的一個小生態(tài),其他人想進入都有壁壘。“但我們現(xiàn)在用大模型去聊,醫(yī)院都很開放。雙方在一起碰撞的思路特別多,大家都愿意做出一些創(chuàng)新的東西。”
在醫(yī)院,一位科室主任告訴浪潮云人士,自己手下那么多博士,80%的時間都花在文書上了。“一點都不夸張。”另一位參觀的服務商說,現(xiàn)在實習生就是在辦公室寫病歷,根本接觸不到患者。“所以他們就想解決這個問題。”目前,浪潮云與一家三甲醫(yī)院合作,采用大模型的即時病例生成,準確率已達90%。
在經歷了近一年的市場培育和摸索后,各行各業(yè)正迎來大模型落地潮。背后根本的原因是,傳統(tǒng)技術已不能解決企業(yè)當下面臨的問題,而大模型在降本增效上確實效果明顯。正是在這樣的形勢下,浪潮云正式發(fā)布海若大模型業(yè)務戰(zhàn)略。
“如果說2023年是通用大模型的元年,2024年從浪潮云的角度來看,是行業(yè)大模型落地的元年。”浪潮云首席技術官孫思清說,浪潮云正在與生態(tài)伙伴,跑通行業(yè)大模型商業(yè)閉環(huán)。
02
行業(yè)大模型必須下場
去年,全國掀起了百模大戰(zhàn)。“前期的同質化比較嚴重,大家尤其關注通用大模型的基礎能力。”顏亮說,“但在后續(xù)的裂變中,我們意識到,大模型要能快速展現(xiàn)場景價值、快速落地,行業(yè)大模型必須下場。”
現(xiàn)在各個城市已意識到這個趨勢,都在加大行業(yè)大模型投入力度。
那么,一個行業(yè)大模型是怎么煉成的?孫思清告訴數智前線,在每個行業(yè),浪潮云都有“燈塔客戶”,合作去訓練行業(yè)模型。
在數據方面,大模型的訓練使用了公開數據、授權數據和私有數據。其中,公開數據集完全能對外,是浪潮云經過治理形成的;如果用到了行業(yè)授權數據,要保障不出域;而針對私有數據則是本地化的。“每個行業(yè)的數據安全分級不同,要根據不同的法規(guī)解決這件事。”孫思清說。
“有些數據不容易確權怎么辦?就在域內做模型訓練,訓練后模型能不能出域,就涉及到安全審查或安全評估。”顏亮進一步分析,“因為模型可以加噪,如果技術能證明原始數據是不可復原的,模型就可以出域,這是下一個課題,業(yè)內還在探討。”
在訓練行業(yè)大模型時,浪潮云會沉淀每個行業(yè)的通用智能體,這是一些共性應用,發(fā)布在智能體商店。每個行業(yè)智能體商店將覆蓋200多個典型應用場景,加快復制推廣。行業(yè)大模型在進入企業(yè)或政府內部,可以再結合專有數據、專有場景調優(yōu)。
“行業(yè)大模型落地的一個特點,是必須有一個對專有數據的精調過程。”顏亮說。
“從浪潮云來講,我們必須跟別人不一樣,會考慮標準化、規(guī)模化,同時一定會考慮定制化。”孫思清說。
有趣的是,通用大模型參數已經從上千億走到萬億級,但在浪潮云在行業(yè)落地中發(fā)現(xiàn),參數不是越多越好。“在行業(yè)中,我們認為7B-70B性價比最佳。”孫思清說,因為國民經濟共有97個行業(yè),每個行業(yè)采用的數據集通常是2T、3T,不會很大。這一實踐得到不少服務商的認同。
對于大模型落地路徑,業(yè)界有不同觀點。“大家現(xiàn)在有一個很大的概念,叫做大模型的原生,但我不這么認為。”顏亮告訴數智前線,“我們的想法是針對原有的生產系統(tǒng)或管理系統(tǒng),植入大模型能力,這既能快速體現(xiàn)行業(yè)價值,也能對原有架構挑戰(zhàn)最小。”
現(xiàn)場一位資深服務商表示贊同。他們從去年開始與一些地市合作,將行業(yè)大模型植入到原有的投訴舉報系統(tǒng),實現(xiàn)了效果提升,目前已在幾個地市推廣復制。
當下大模型處于場景點的挖掘,顏亮認為,要真正讓行業(yè)產生質變,大模型需要全流程植入。這可能需要1-2年,其中關鍵是大模型要經過周期性迭代,才能達到可用。“最多兩年時間。競爭會促成大家的互相學習和投入,我們感知到,2024年用戶在大模型上的投入,是2023年水平的3-4倍以上。”
03
行業(yè)落地關卡和三個解法
在這一年的實踐中,浪潮云觀察,政企用戶在接納、落地行業(yè)大模型上,要過四大關卡:
首先是數據隱私的保護和合規(guī),這是客戶的底線,這個問題不解決,很多行業(yè)客戶就不會進場;其次是復雜的定制化需求,這是政企行業(yè)的基本要求;再次是人工與智能的協(xié)作,這是當下每個人都面臨的新變化;最后是持續(xù)的學習和優(yōu)化,大模型落地不是一個項目,而是服務與運營。
浪潮云也摸索出三個解法,將其提煉為可信賴、易落地和可持續(xù)。
首先是可信賴,核心要解決的問題是本地化部署。政府有明確的“數據不出域”的邊界,行業(yè)和企業(yè)也有“模糊的”數據不出域的邊界。本地部署是行業(yè)大模型的必備條件,滿足用戶的底線要求。
其次是易落地。大模型企業(yè)要提供完整的產品矩陣。“算力一定是大模型廠商帶著入場的。”顏亮說。數據治理能力是必不可少的。而大模型引擎是最基本的要求。要在行業(yè)里實現(xiàn)價值,要靠智能體工廠,這是一個面向行業(yè)的人工智能低代碼開發(fā)平臺。最終,做出的智能體要發(fā)布到商店里。
最后是可持續(xù)。“如果不可持續(xù),得不償失,因為我們去做一個大模型驗證的試驗環(huán)境,投入量級都是幾百萬元。”顏亮在大會上介紹說,我們建議“平臺+服務”模式,購買MaaS服務。從持續(xù)性上看,核心問題是數據的持續(xù)供給,現(xiàn)在95%的政企客戶,數據質量不高,要做數據治理。
浪潮云在這三方面已有明確布局。浪潮云已在120個城市部署了云中心。預計今年6月,基于浪潮政務云,會在90個城市部署大模型引擎和智能體平臺,提供從底層分布式算力,到上層治理好的數據集,再到上面的海若大模型、智能體工廠和智能體商店,以及安全衛(wèi)士的整個體系。
在這樣的體系下,云上的政務客戶,在一天內可以接入大模型,開箱即用。在云中心覆蓋的城市,不能直接用政務云的非政務客戶,浪潮云一周可以在云中心內為企業(yè)和行業(yè)做部署;如果是基于客戶自有云中心或第三方云中心,部署周期為一個月。
04
大模型的“三位一體”創(chuàng)新生態(tài)
大模型帶來了新的生態(tài)結構。顏亮告訴數智前線,這是一個“三位一體”的創(chuàng)新共同體,分別是算力層生態(tài)伙伴、行業(yè)數據層生態(tài)伙伴,以及智能體運用生態(tài)伙伴。
從算力角度講,浪潮云自身有一定算力,但因為大模型下場會帶來很大的算力消耗,所以各地建設的算力中心,包括政府平臺公司建設的算力平臺,都在浪潮云的生態(tài)伙伴范疇。
在智能體開發(fā)商伙伴方面,大模型也改變了傳統(tǒng)的開發(fā)形態(tài)。軟硬件廠商、端廠商會融合起來一同創(chuàng)新。比如在醫(yī)院病歷生成應用中,醫(yī)生會掛采集端。“我們甚至有個想法,是把模型小型化之后,植入到采集端,突破效率、環(huán)境的局限性。這在發(fā)展之中。”顏亮說。
文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。
2024年的Adobe MAX 2024發(fā)布會上,Adobe推出了最新版本的Adobe Creative Cloud。
奧維云網(AVC)推總數據顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。
“以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關材料,僅幾秒鐘,重慶市民曾某的賬戶就打進了21600元。
華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實質性的幫助,雙十一期間低至2799元,性價比很高,簡直是創(chuàng)作者們的首選。