“技術(shù)是不會(huì)以任何商業(yè)行為或者人們的意愿所改變它的上限和下限的,它需要的時(shí)間是恒定的。 ”
如果說中國大模型市場(chǎng)最核心的話題是什么?降價(jià)則必然是其中之一。
從目前的參賽玩家來看,不論是字節(jié)豆包,還是阿里、百度、騰訊、科大訊飛,國內(nèi)的一眾to b大模型廠商都被卷入這股降價(jià)潮中,它們或是全量降價(jià),或是小參數(shù)模型降價(jià)。
“很多云廠其實(shí)本來沒想降,但大家都降了,也沒辦法,只能跟。”一位相關(guān)人士告訴產(chǎn)業(yè)家。
具體來看,目前業(yè)內(nèi)降價(jià)的主要版本更多的是基于公有云版本的接口成本降低,以及輕量化模型的調(diào)用成本調(diào)優(yōu)。而從目前大模型的調(diào)用來看,這些也是當(dāng)下開發(fā)者小范圍使用最優(yōu)先使用的版本。根據(jù)不完全統(tǒng)計(jì),如今有超過40%的企業(yè)都在嘗試使用大模型相關(guān)產(chǎn)品,或是基于辦公,或是基于生產(chǎn)等等。
但這種意愿的蓬勃生長和這次降價(jià)潮并不成正相關(guān)。“其實(shí)降價(jià)對(duì)我們影響不大,本來我們的調(diào)用成本就很低,現(xiàn)在重點(diǎn)是能不能內(nèi)部使用起來。”一位金融企業(yè)的CIO告訴我們。
這是很多人向產(chǎn)業(yè)家傳遞的信號(hào)。因此,在這背后,對(duì)應(yīng)的一個(gè)核心問題是:降價(jià),是不是會(huì)推動(dòng)和加速大模型在產(chǎn)業(yè)和行業(yè)側(cè)的落地?或者說,降價(jià)是不是大模型從技術(shù)向工程邁步的核心因素?
如果說一年前,市場(chǎng)對(duì)于這個(gè)問題的回答是肯定的,那么如今,這個(gè)問題則更多見仁見智。在產(chǎn)業(yè)家和不同企業(yè)的溝通交流中,得出的一致結(jié)論是,如今企業(yè)更多的卡點(diǎn)并非在大模型本身,而在于企業(yè)自己。
這些工程側(cè)的卡點(diǎn)涵蓋向量數(shù)據(jù)庫、數(shù)據(jù)清理/標(biāo)注、知識(shí)庫的梳理建立以及內(nèi)部業(yè)務(wù)邏輯和流程的清理,“我們現(xiàn)在想在copilot基礎(chǔ)上加一層,到Agent的階段,但整體的業(yè)務(wù)流程梳理需要時(shí)間。”上述人士告訴我們。
在降價(jià)潮把大模型拉回C位的如今,我們更應(yīng)該審視的是在大模型進(jìn)入中國一年后的當(dāng)下,在技術(shù)、參數(shù)不再是唯一標(biāo)準(zhǔn)的如今,中國產(chǎn)業(yè)大模型的卡點(diǎn)如今到底在哪?
一、大模型時(shí)代,
低價(jià)究竟意味著什么?
“我們不希望發(fā)布半成品。之所以今天發(fā)布,是因?yàn)楝F(xiàn)在我們的模型能力已經(jīng)準(zhǔn)備好了。”火山引擎總裁譚待表示。上周三,火山引擎正式發(fā)布字節(jié)旗下的豆包大模型。
而與此同時(shí),更為重磅的消息是,豆包大模型宣布降價(jià),每千tokens價(jià)格0.0008,直接給出了“全網(wǎng)最低價(jià)”。
這也意味著,大模型價(jià)格戰(zhàn)就此打響。先是阿里宣布其主力模型全面降價(jià),在豆包大模型的基礎(chǔ)上,再降三個(gè)點(diǎn),每千tokens價(jià)格0.0005;當(dāng)天下午百度宣布“免費(fèi),立即生效”,緊接著,阿里云再加碼,宣布通義旗下的12款模型已開源,全部免費(fèi)下載。等到了周三,參與者又多了科大訊飛和騰訊。
對(duì)此,海外媒體給出的評(píng)價(jià)是,國內(nèi)互聯(lián)網(wǎng)廠商的價(jià)格戰(zhàn),向來都遵循一個(gè)公式:“一旦降價(jià),就直接擊穿底價(jià),‘不留活口’。”在過往的SaaS和云計(jì)算階段,也恰都是這種節(jié)奏。
原因?yàn)楹?或者說,大模型成熟到可以以如此低的成本進(jìn)行大規(guī)模商業(yè)化了嗎?
在談及大模型價(jià)格之前,先來看云計(jì)算的價(jià)格戰(zhàn),在過去的幾年時(shí)間里,包括阿里云、騰訊云、華為云等在云側(cè)的價(jià)格也更都處于不斷調(diào)低的模式,但就云計(jì)算技術(shù)本身而言,伴隨著流批一體、分布式存儲(chǔ)等技術(shù)的優(yōu)化,服務(wù)器CPU的成本在加速降低。客觀來看,這種降價(jià)邏輯完全合理。
但這里面忽略了一個(gè)問題,即時(shí)間緯度。從時(shí)間來看,國內(nèi)云計(jì)算的發(fā)展早在2006年,甚至更早就已經(jīng)開始了,等到了2014年左右才進(jìn)入到快速發(fā)展期。而直到2016年,國內(nèi)各大云廠商才開始靈活調(diào)整價(jià)格,真正的價(jià)格戰(zhàn),或者說競(jìng)相放低價(jià)格則要更晚。
從這個(gè)緯度來看,大模型在國內(nèi)卻僅發(fā)展了不到兩年的時(shí)間,中間不論是如今整體算力上的短缺,還是對(duì)于GPU納管的存儲(chǔ)計(jì)算能力,以及其算法框架的優(yōu)化, 盡管其是基于云計(jì)算的底層架構(gòu)進(jìn)行成本側(cè)的優(yōu)化,但目前都尚未成熟。
據(jù)了解,以目前國內(nèi)的主流芯片而言,如果是軟硬一體的交付,其算力利用率能到80%,但如果分別進(jìn)行軟件和硬件的交付,整體由于異構(gòu)以及不兼容的問題,其利用率甚至可以低到60%以及更低。此外,就國內(nèi)的主流芯片而言,其相較于英偉達(dá)的H100等性能,同等價(jià)格下其性能更是只有其60%左右。
這些都代表著對(duì)大模型而言,真正良性的價(jià)格下浮并沒有實(shí)現(xiàn)。那么,從這個(gè)節(jié)點(diǎn)來看,大模型廠商廠商降價(jià)的本質(zhì)是什么?
在前段時(shí)間,王小川曾聊到這樣一句話,“百川智能不參與價(jià)格戰(zhàn),因?yàn)槲覀冎饕嫦虻氖莄端業(yè)務(wù),降價(jià)的主要是B端的需求。”
誠然如此,從本質(zhì)來看,在大模型降價(jià)背后,對(duì)一眾云廠商而言,其可以通過更低的價(jià)格更快、更好地構(gòu)建自身的AI開發(fā)生態(tài),通過讓自身的大模型產(chǎn)品被更多B端企業(yè)使用,進(jìn)而建立數(shù)據(jù)飛輪和強(qiáng)化用戶粘性。
從當(dāng)下來看,一旦企業(yè)選擇使用一家大模型,一般要經(jīng)歷搭建知識(shí)庫、數(shù)據(jù)庫、數(shù)據(jù)清理/標(biāo)注,以及訓(xùn)練、微調(diào)等環(huán)節(jié),這也意味著其替換成本極其高,對(duì)模型廠商而言則對(duì)應(yīng)的是極高的用戶粘性以及提前卡位。
實(shí)際上,從各家面向生態(tài)的動(dòng)作能窺得一二。比如百度面向開發(fā)者推出的一眾包括飛槳在內(nèi)的開發(fā)社區(qū),再比如阿里自身的魔搭社區(qū),以及騰訊、華為面向開發(fā)者的一眾工具,在降價(jià)的動(dòng)作背后,也更是對(duì)自身AI生態(tài)的底層加速。
二、低價(jià),
真的會(huì)「催熟」大模型落地?
而在生態(tài)和客戶粘性之外,更應(yīng)該思考的一個(gè)問題是:低價(jià)真的會(huì)催熟中國產(chǎn)業(yè)大模型的落地嗎?
客觀來看,如果說大模型是一個(gè)簡(jiǎn)單的C端應(yīng)用,或者對(duì)于企業(yè)來講是一個(gè)“拿來即用”的程序,那么降價(jià)或免費(fèi)策略一定會(huì)更大程度地催熟市場(chǎng)。但如果站在企業(yè)搭建大模型的角度,這個(gè)問題則要更復(fù)雜得多。
總體來說,企業(yè)自身搭建一個(gè)大模型,不僅僅需要從大模型企業(yè)那里獲取相關(guān)服務(wù),對(duì)于企業(yè)自身也有更高要求,比如企業(yè)內(nèi)部的數(shù)據(jù)訓(xùn)練、知識(shí)庫搭建等等。
以一個(gè)在金融企業(yè)內(nèi)部的大模型實(shí)際案例為例,即銀行需要構(gòu)建大模型,其第一步是數(shù)據(jù)收集。首先,各部門需要把風(fēng)險(xiǎn)評(píng)估、客戶信用評(píng)分、欺詐檢測(cè)等數(shù)據(jù)匯總起來,同時(shí)在此基礎(chǔ)上,收集各部門對(duì)大模型業(yè)務(wù)的需求。
其次,將這些結(jié)構(gòu)化和非結(jié)構(gòu)化的數(shù)據(jù)進(jìn)行具體整理,并確定數(shù)據(jù)來源。這里包括數(shù)據(jù)清洗、轉(zhuǎn)換數(shù)據(jù)格式等等。
而這些工作都是企業(yè)在業(yè)務(wù)部門內(nèi)需要完成的。
在完成了整個(gè)數(shù)據(jù)層面的處理,還需要進(jìn)行模型層面的訓(xùn)練。這里則需要用到大模型廠商提供的服務(wù),比如基于大模型廠商提供的SFT組件,以及對(duì)應(yīng)的prompt模塊進(jìn)行模型訓(xùn)練調(diào)整。
另外,為了行業(yè)模型能夠更精準(zhǔn)地匹配業(yè)務(wù),大模型廠商還需要配合企業(yè)完成知識(shí)庫的搭建。
可以看到,大模型落地更等同于一個(gè)系統(tǒng)工程。即使大模型企業(yè)通過低價(jià)或免費(fèi)策略吸引了大量客戶,企業(yè)客戶在實(shí)際應(yīng)用中仍需要投入大量的資源和時(shí)間來整合和優(yōu)化這些服務(wù)。目前從國內(nèi)的實(shí)踐落地來看,盡管已經(jīng)有一些央國企在帶頭完成各自行業(yè)里的垂直模型搭建,但其中在數(shù)據(jù)收集以及訓(xùn)練層面也仍是困難重重。
此外,問題也更在模型側(cè)。“包括我們不知道在不同的場(chǎng)景我們到底該用多大的模型進(jìn)行訓(xùn)練,這點(diǎn)我們技術(shù)團(tuán)隊(duì)只能根據(jù)廠商給出來的幾個(gè)模型一個(gè)個(gè)試,但究竟是多大的能夠做什么事情,這個(gè)事情沒有明確的說明。”一位相關(guān)技術(shù)負(fù)責(zé)人告訴產(chǎn)業(yè)家。
從某種程度來說,降價(jià)解決的僅僅是大模型工程最前端的入口問題,但對(duì)于整個(gè)過程中的全部鏈路節(jié)點(diǎn)的打通,這中間的各種問題仍然足夠繁瑣,關(guān)卡難度也更足夠大。
三、大模型,
「行業(yè)壁壘」之戰(zhàn)
“用虧損換收入是不可持續(xù)的,所以我們從來不走這條路子。”火山引擎譚待這樣告訴媒體。
站在商業(yè)化的角度去思考,既然目前大模型廠商離盈利還較遠(yuǎn),那么如今字節(jié)、阿里、百度、科大訊飛和騰訊都紛紛宣布降價(jià),甚至免費(fèi),在這波操作背后,這些大模型廠商有沒有更深層的意圖?
首先,一個(gè)在過去互聯(lián)網(wǎng)時(shí)代和云計(jì)算時(shí)代的邏輯是,大廠推出的系統(tǒng)和應(yīng)用要想在行業(yè)里站穩(wěn)腳跟,就必須要有一定的行業(yè)know-how積累和服務(wù)經(jīng)驗(yàn)的沉淀。
同樣地,這套思路也適用于大模型時(shí)代。只是與之不同的是,大模型時(shí)代是站在互聯(lián)網(wǎng)時(shí)代和云計(jì)算時(shí)代之上的,一方面,過去的問題不會(huì)重復(fù)出現(xiàn),比如數(shù)據(jù)孤島和系統(tǒng)之間打通的問題,在大模型時(shí)代基于scaling law的模式,則會(huì)有更好的解決方式;
另一方面,過去的互聯(lián)網(wǎng)廠商和如今的大模型廠商是同一批參與者,這也意味著,一些包括數(shù)據(jù)庫、中間件以及數(shù)據(jù)層面的行業(yè)積累可以復(fù)用。
實(shí)際上,這也是為什么去年華為盤古大模型一經(jīng)發(fā)布,就打著“不作詩,只做事”的口號(hào),直接選擇行業(yè)大模型的原因。此外,包括百度、阿里、騰訊、火山引擎等更是在行業(yè)大模型側(cè)不斷加碼,比如在5月28日的智能經(jīng)濟(jì)論壇峰會(huì)上,百度副總裁沈抖就表示,百度的行業(yè)大模型方案是在通用大模型的基礎(chǔ)上,催生出N個(gè)行業(yè)小模型,基于“大模型+小模型”的方案幫助企業(yè)落地。
相較之下,騰訊的混元大模型的行業(yè)積累則聚焦在社交、辦公和汽車領(lǐng)域。在不久前剛結(jié)束的北京車展前后,騰訊也發(fā)布了汽車行業(yè)大模型,這也是基于騰訊的混元大模型之上的,比如在汽車研發(fā)、生產(chǎn)、營銷、服務(wù)和企業(yè)協(xié)同辦公等場(chǎng)景,汽車大模型都可以發(fā)揮作用。
然而,上述提到的行業(yè)案例也只是目前大模型生態(tài)里的冰山一角。
可以感知到的是,目前各家大模型廠商的一致路徑都是,通過與行業(yè)企業(yè)的合作,基于更精準(zhǔn)的數(shù)據(jù)進(jìn)而構(gòu)建出各自的大模型行業(yè)壁壘。
寫在最后:
實(shí)際上,從降價(jià)到大模型大規(guī)模實(shí)際落地,中間還有很長的一段路要走。這條路是大模型廠商如何做好模型搭建相關(guān)的云服務(wù),企業(yè)如何梳理數(shù)據(jù)、訓(xùn)練數(shù)據(jù)、如何基于業(yè)務(wù)邏輯搭建模型,以及工具和接口是否一致等等問題。
但降價(jià)潮本身也并非毫無意義。
從目前的落地情況來看,大模型在B端的落地還遠(yuǎn)未到成熟的地步。在大模型廠商之外,SaaS企業(yè)也更在進(jìn)行軟件層面的AI重構(gòu),能看到的是,包括用友、金蝶、微盟、銷售易等企業(yè),它們有的選擇與大模型企業(yè)合作搭建自己的大模型;有些則選擇以API的方式接入大廠的大模型底座,在上面建自己的AI Agent;再或者,有些則是更進(jìn)一步,構(gòu)建“AI+SaaS”原生應(yīng)用。
這些新的基于軟件層面的嘗試,都將建立在算力足夠普惠的基礎(chǔ)上。“未來整個(gè)行業(yè)的推理成本每年降低10倍是可以期待的,而且這個(gè)趨勢(shì)是必然的。對(duì)于行業(yè)來說,現(xiàn)在模型的API調(diào)用還是非常非常低的比例,如果推理成本一年降低10倍那就有更多的人可以用上大模型,這是非常利好的消息。”李開復(fù)表示。
算力普惠,是大模型落地的充分條件,但從如今的進(jìn)度條來看,它盡管需要被正視價(jià)值,但遠(yuǎn)遠(yuǎn)不能成為改變整個(gè)大模型落地的最強(qiáng)催化劑。
“技術(shù)是不會(huì)以任何商業(yè)行為或者人們的意愿所改變它的上限和下限的,它需要的時(shí)間是恒定的。”上述金融企業(yè)的CIO說道。
文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請(qǐng)謹(jǐn)慎對(duì)待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。
2024年的Adobe MAX 2024發(fā)布會(huì)上,Adobe推出了最新版本的Adobe Creative Cloud。
奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。
“以前都要去窗口辦,一套流程下來都要半個(gè)月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。
華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準(zhǔn)的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實(shí)質(zhì)性的幫助,雙十一期間低至2799元,性價(jià)比很高,簡(jiǎn)直是創(chuàng)作者們的首選。
9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會(huì)——工業(yè)互聯(lián)網(wǎng)標(biāo)識(shí)解析專題論壇在沈陽成功舉辦。