iPhone16系列新品正式發(fā)售 新品爆發(fā)就在抖音電商廣告燒錢過億,70%用戶靠投流,大模型算不過成本賬?PS1經(jīng)典配色!索尼發(fā)布30周年紀(jì)念版PS5、PS5 Pro:限量賣泰順:聚智聚力數(shù)字創(chuàng)客激發(fā)鄉(xiāng)村振興新動能電商12年 ,ALL IN 小紅書,開店3月賣出1100萬Mate 70最受期待!華為三款重磅機(jī)型蓄勢待發(fā)云天勵(lì)飛“算力積木”架構(gòu):引領(lǐng)邊緣AI芯片新變革徹底告別3999元!小米15入網(wǎng) 支持90W快充FF發(fā)布第二品牌Faraday X:對標(biāo)豐田 專注增程式混動車型黑神話悟空總收入超67億:銷量已超2000萬份通快成立激光業(yè)務(wù)區(qū)域中心(中國),強(qiáng)勢布局中國市場Sandalwood Advisors受邀參加第31屆中信里昂投資者論壇淘寶倒逼新風(fēng)向:一場電商減負(fù)運(yùn)動博浪AI時(shí)代,阿里、華為“硬碰硬”Youtube將推出人工智能工具 可生成創(chuàng)意、標(biāo)題甚至完整視頻申通、圓通、韻達(dá)發(fā)布 8 月簡報(bào):快遞業(yè)務(wù)量、收入均同比增長,單票收入均下降蘋果iPhone 16系列開啟發(fā)售,Max最高加2500元TECNO 全球發(fā)布二代折疊屏旗艦—PHANTOM V Fold2 5G及PHANTOM V Flip2 5G科大訊飛還是AI“小甜甜”嗎?消息稱美團(tuán)外賣調(diào)整經(jīng)營目標(biāo),從追求 GMV 變?yōu)樽非笥唵瘟?/a>
  • 首頁 > 云計(jì)算頻道 > 大模型

    降價(jià)潮背后:中國產(chǎn)業(yè)大模型落地的卡點(diǎn)到底在哪?

    2024年05月30日 17:08:56   來源:產(chǎn)業(yè)家

      “技術(shù)是不會以任何商業(yè)行為或者人們的意愿所改變它的上限和下限的,它需要的時(shí)間是恒定的。 ”

      如果說中國大模型市場最核心的話題是什么?降價(jià)則必然是其中之一。

      從目前的參賽玩家來看,不論是字節(jié)豆包,還是阿里、百度、騰訊、科大訊飛,國內(nèi)的一眾to b大模型廠商都被卷入這股降價(jià)潮中,它們或是全量降價(jià),或是小參數(shù)模型降價(jià)。

      “很多云廠其實(shí)本來沒想降,但大家都降了,也沒辦法,只能跟。”一位相關(guān)人士告訴產(chǎn)業(yè)家。

      具體來看,目前業(yè)內(nèi)降價(jià)的主要版本更多的是基于公有云版本的接口成本降低,以及輕量化模型的調(diào)用成本調(diào)優(yōu)。而從目前大模型的調(diào)用來看,這些也是當(dāng)下開發(fā)者小范圍使用最優(yōu)先使用的版本。根據(jù)不完全統(tǒng)計(jì),如今有超過40%的企業(yè)都在嘗試使用大模型相關(guān)產(chǎn)品,或是基于辦公,或是基于生產(chǎn)等等。

      但這種意愿的蓬勃生長和這次降價(jià)潮并不成正相關(guān)。“其實(shí)降價(jià)對我們影響不大,本來我們的調(diào)用成本就很低,現(xiàn)在重點(diǎn)是能不能內(nèi)部使用起來。”一位金融企業(yè)的CIO告訴我們。

      這是很多人向產(chǎn)業(yè)家傳遞的信號。因此,在這背后,對應(yīng)的一個(gè)核心問題是:降價(jià),是不是會推動和加速大模型在產(chǎn)業(yè)和行業(yè)側(cè)的落地?或者說,降價(jià)是不是大模型從技術(shù)向工程邁步的核心因素?

      如果說一年前,市場對于這個(gè)問題的回答是肯定的,那么如今,這個(gè)問題則更多見仁見智。在產(chǎn)業(yè)家和不同企業(yè)的溝通交流中,得出的一致結(jié)論是,如今企業(yè)更多的卡點(diǎn)并非在大模型本身,而在于企業(yè)自己。

      這些工程側(cè)的卡點(diǎn)涵蓋向量數(shù)據(jù)庫、數(shù)據(jù)清理/標(biāo)注、知識庫的梳理建立以及內(nèi)部業(yè)務(wù)邏輯和流程的清理,“我們現(xiàn)在想在copilot基礎(chǔ)上加一層,到Agent的階段,但整體的業(yè)務(wù)流程梳理需要時(shí)間。”上述人士告訴我們。

      在降價(jià)潮把大模型拉回C位的如今,我們更應(yīng)該審視的是在大模型進(jìn)入中國一年后的當(dāng)下,在技術(shù)、參數(shù)不再是唯一標(biāo)準(zhǔn)的如今,中國產(chǎn)業(yè)大模型的卡點(diǎn)如今到底在哪?

      一、大模型時(shí)代,

      低價(jià)究竟意味著什么?

      “我們不希望發(fā)布半成品。之所以今天發(fā)布,是因?yàn)楝F(xiàn)在我們的模型能力已經(jīng)準(zhǔn)備好了。”火山引擎總裁譚待表示。上周三,火山引擎正式發(fā)布字節(jié)旗下的豆包大模型。

      而與此同時(shí),更為重磅的消息是,豆包大模型宣布降價(jià),每千tokens價(jià)格0.0008,直接給出了“全網(wǎng)最低價(jià)”。

      這也意味著,大模型價(jià)格戰(zhàn)就此打響。先是阿里宣布其主力模型全面降價(jià),在豆包大模型的基礎(chǔ)上,再降三個(gè)點(diǎn),每千tokens價(jià)格0.0005;當(dāng)天下午百度宣布“免費(fèi),立即生效”,緊接著,阿里云再加碼,宣布通義旗下的12款模型已開源,全部免費(fèi)下載。等到了周三,參與者又多了科大訊飛和騰訊。

      對此,海外媒體給出的評價(jià)是,國內(nèi)互聯(lián)網(wǎng)廠商的價(jià)格戰(zhàn),向來都遵循一個(gè)公式:“一旦降價(jià),就直接擊穿底價(jià),‘不留活口’。”在過往的SaaS和云計(jì)算階段,也恰都是這種節(jié)奏。

      原因?yàn)楹?或者說,大模型成熟到可以以如此低的成本進(jìn)行大規(guī)模商業(yè)化了嗎?

      在談及大模型價(jià)格之前,先來看云計(jì)算的價(jià)格戰(zhàn),在過去的幾年時(shí)間里,包括阿里云、騰訊云、華為云等在云側(cè)的價(jià)格也更都處于不斷調(diào)低的模式,但就云計(jì)算技術(shù)本身而言,伴隨著流批一體、分布式存儲等技術(shù)的優(yōu)化,服務(wù)器CPU的成本在加速降低?陀^來看,這種降價(jià)邏輯完全合理。

      但這里面忽略了一個(gè)問題,即時(shí)間緯度。從時(shí)間來看,國內(nèi)云計(jì)算的發(fā)展早在2006年,甚至更早就已經(jīng)開始了,等到了2014年左右才進(jìn)入到快速發(fā)展期。而直到2016年,國內(nèi)各大云廠商才開始靈活調(diào)整價(jià)格,真正的價(jià)格戰(zhàn),或者說競相放低價(jià)格則要更晚。

      從這個(gè)緯度來看,大模型在國內(nèi)卻僅發(fā)展了不到兩年的時(shí)間,中間不論是如今整體算力上的短缺,還是對于GPU納管的存儲計(jì)算能力,以及其算法框架的優(yōu)化, 盡管其是基于云計(jì)算的底層架構(gòu)進(jìn)行成本側(cè)的優(yōu)化,但目前都尚未成熟。

      據(jù)了解,以目前國內(nèi)的主流芯片而言,如果是軟硬一體的交付,其算力利用率能到80%,但如果分別進(jìn)行軟件和硬件的交付,整體由于異構(gòu)以及不兼容的問題,其利用率甚至可以低到60%以及更低。此外,就國內(nèi)的主流芯片而言,其相較于英偉達(dá)的H100等性能,同等價(jià)格下其性能更是只有其60%左右。

      這些都代表著對大模型而言,真正良性的價(jià)格下浮并沒有實(shí)現(xiàn)。那么,從這個(gè)節(jié)點(diǎn)來看,大模型廠商廠商降價(jià)的本質(zhì)是什么?

      在前段時(shí)間,王小川曾聊到這樣一句話,“百川智能不參與價(jià)格戰(zhàn),因?yàn)槲覀冎饕嫦虻氖莄端業(yè)務(wù),降價(jià)的主要是B端的需求。”

      誠然如此,從本質(zhì)來看,在大模型降價(jià)背后,對一眾云廠商而言,其可以通過更低的價(jià)格更快、更好地構(gòu)建自身的AI開發(fā)生態(tài),通過讓自身的大模型產(chǎn)品被更多B端企業(yè)使用,進(jìn)而建立數(shù)據(jù)飛輪和強(qiáng)化用戶粘性。

      從當(dāng)下來看,一旦企業(yè)選擇使用一家大模型,一般要經(jīng)歷搭建知識庫、數(shù)據(jù)庫、數(shù)據(jù)清理/標(biāo)注,以及訓(xùn)練、微調(diào)等環(huán)節(jié),這也意味著其替換成本極其高,對模型廠商而言則對應(yīng)的是極高的用戶粘性以及提前卡位。

      實(shí)際上,從各家面向生態(tài)的動作能窺得一二。比如百度面向開發(fā)者推出的一眾包括飛槳在內(nèi)的開發(fā)社區(qū),再比如阿里自身的魔搭社區(qū),以及騰訊、華為面向開發(fā)者的一眾工具,在降價(jià)的動作背后,也更是對自身AI生態(tài)的底層加速。

      二、低價(jià),

      真的會「催熟」大模型落地?

      而在生態(tài)和客戶粘性之外,更應(yīng)該思考的一個(gè)問題是:低價(jià)真的會催熟中國產(chǎn)業(yè)大模型的落地嗎?

      客觀來看,如果說大模型是一個(gè)簡單的C端應(yīng)用,或者對于企業(yè)來講是一個(gè)“拿來即用”的程序,那么降價(jià)或免費(fèi)策略一定會更大程度地催熟市場。但如果站在企業(yè)搭建大模型的角度,這個(gè)問題則要更復(fù)雜得多。

      總體來說,企業(yè)自身搭建一個(gè)大模型,不僅僅需要從大模型企業(yè)那里獲取相關(guān)服務(wù),對于企業(yè)自身也有更高要求,比如企業(yè)內(nèi)部的數(shù)據(jù)訓(xùn)練、知識庫搭建等等。

      以一個(gè)在金融企業(yè)內(nèi)部的大模型實(shí)際案例為例,即銀行需要構(gòu)建大模型,其第一步是數(shù)據(jù)收集。首先,各部門需要把風(fēng)險(xiǎn)評估、客戶信用評分、欺詐檢測等數(shù)據(jù)匯總起來,同時(shí)在此基礎(chǔ)上,收集各部門對大模型業(yè)務(wù)的需求。

      其次,將這些結(jié)構(gòu)化和非結(jié)構(gòu)化的數(shù)據(jù)進(jìn)行具體整理,并確定數(shù)據(jù)來源。這里包括數(shù)據(jù)清洗、轉(zhuǎn)換數(shù)據(jù)格式等等。

      而這些工作都是企業(yè)在業(yè)務(wù)部門內(nèi)需要完成的。

      在完成了整個(gè)數(shù)據(jù)層面的處理,還需要進(jìn)行模型層面的訓(xùn)練。這里則需要用到大模型廠商提供的服務(wù),比如基于大模型廠商提供的SFT組件,以及對應(yīng)的prompt模塊進(jìn)行模型訓(xùn)練調(diào)整。

      另外,為了行業(yè)模型能夠更精準(zhǔn)地匹配業(yè)務(wù),大模型廠商還需要配合企業(yè)完成知識庫的搭建。

      可以看到,大模型落地更等同于一個(gè)系統(tǒng)工程。即使大模型企業(yè)通過低價(jià)或免費(fèi)策略吸引了大量客戶,企業(yè)客戶在實(shí)際應(yīng)用中仍需要投入大量的資源和時(shí)間來整合和優(yōu)化這些服務(wù)。目前從國內(nèi)的實(shí)踐落地來看,盡管已經(jīng)有一些央國企在帶頭完成各自行業(yè)里的垂直模型搭建,但其中在數(shù)據(jù)收集以及訓(xùn)練層面也仍是困難重重。

      此外,問題也更在模型側(cè)。“包括我們不知道在不同的場景我們到底該用多大的模型進(jìn)行訓(xùn)練,這點(diǎn)我們技術(shù)團(tuán)隊(duì)只能根據(jù)廠商給出來的幾個(gè)模型一個(gè)個(gè)試,但究竟是多大的能夠做什么事情,這個(gè)事情沒有明確的說明。”一位相關(guān)技術(shù)負(fù)責(zé)人告訴產(chǎn)業(yè)家。

      從某種程度來說,降價(jià)解決的僅僅是大模型工程最前端的入口問題,但對于整個(gè)過程中的全部鏈路節(jié)點(diǎn)的打通,這中間的各種問題仍然足夠繁瑣,關(guān)卡難度也更足夠大。

      三、大模型,

      「行業(yè)壁壘」之戰(zhàn)

      “用虧損換收入是不可持續(xù)的,所以我們從來不走這條路子。”火山引擎譚待這樣告訴媒體。

      站在商業(yè)化的角度去思考,既然目前大模型廠商離盈利還較遠(yuǎn),那么如今字節(jié)、阿里、百度、科大訊飛和騰訊都紛紛宣布降價(jià),甚至免費(fèi),在這波操作背后,這些大模型廠商有沒有更深層的意圖?

      首先,一個(gè)在過去互聯(lián)網(wǎng)時(shí)代和云計(jì)算時(shí)代的邏輯是,大廠推出的系統(tǒng)和應(yīng)用要想在行業(yè)里站穩(wěn)腳跟,就必須要有一定的行業(yè)know-how積累和服務(wù)經(jīng)驗(yàn)的沉淀。

      同樣地,這套思路也適用于大模型時(shí)代。只是與之不同的是,大模型時(shí)代是站在互聯(lián)網(wǎng)時(shí)代和云計(jì)算時(shí)代之上的,一方面,過去的問題不會重復(fù)出現(xiàn),比如數(shù)據(jù)孤島和系統(tǒng)之間打通的問題,在大模型時(shí)代基于scaling law的模式,則會有更好的解決方式;

      另一方面,過去的互聯(lián)網(wǎng)廠商和如今的大模型廠商是同一批參與者,這也意味著,一些包括數(shù)據(jù)庫、中間件以及數(shù)據(jù)層面的行業(yè)積累可以復(fù)用。

      實(shí)際上,這也是為什么去年華為盤古大模型一經(jīng)發(fā)布,就打著“不作詩,只做事”的口號,直接選擇行業(yè)大模型的原因。此外,包括百度、阿里、騰訊、火山引擎等更是在行業(yè)大模型側(cè)不斷加碼,比如在5月28日的智能經(jīng)濟(jì)論壇峰會上,百度副總裁沈抖就表示,百度的行業(yè)大模型方案是在通用大模型的基礎(chǔ)上,催生出N個(gè)行業(yè)小模型,基于“大模型+小模型”的方案幫助企業(yè)落地。

      相較之下,騰訊的混元大模型的行業(yè)積累則聚焦在社交、辦公和汽車領(lǐng)域。在不久前剛結(jié)束的北京車展前后,騰訊也發(fā)布了汽車行業(yè)大模型,這也是基于騰訊的混元大模型之上的,比如在汽車研發(fā)、生產(chǎn)、營銷、服務(wù)和企業(yè)協(xié)同辦公等場景,汽車大模型都可以發(fā)揮作用。

      然而,上述提到的行業(yè)案例也只是目前大模型生態(tài)里的冰山一角。

      可以感知到的是,目前各家大模型廠商的一致路徑都是,通過與行業(yè)企業(yè)的合作,基于更精準(zhǔn)的數(shù)據(jù)進(jìn)而構(gòu)建出各自的大模型行業(yè)壁壘。

      寫在最后:

      實(shí)際上,從降價(jià)到大模型大規(guī)模實(shí)際落地,中間還有很長的一段路要走。這條路是大模型廠商如何做好模型搭建相關(guān)的云服務(wù),企業(yè)如何梳理數(shù)據(jù)、訓(xùn)練數(shù)據(jù)、如何基于業(yè)務(wù)邏輯搭建模型,以及工具和接口是否一致等等問題。

      但降價(jià)潮本身也并非毫無意義。

      從目前的落地情況來看,大模型在B端的落地還遠(yuǎn)未到成熟的地步。在大模型廠商之外,SaaS企業(yè)也更在進(jìn)行軟件層面的AI重構(gòu),能看到的是,包括用友、金蝶、微盟、銷售易等企業(yè),它們有的選擇與大模型企業(yè)合作搭建自己的大模型;有些則選擇以API的方式接入大廠的大模型底座,在上面建自己的AI Agent;再或者,有些則是更進(jìn)一步,構(gòu)建“AI+SaaS”原生應(yīng)用。

      這些新的基于軟件層面的嘗試,都將建立在算力足夠普惠的基礎(chǔ)上。“未來整個(gè)行業(yè)的推理成本每年降低10倍是可以期待的,而且這個(gè)趨勢是必然的。對于行業(yè)來說,現(xiàn)在模型的API調(diào)用還是非常非常低的比例,如果推理成本一年降低10倍那就有更多的人可以用上大模型,這是非常利好的消息。”李開復(fù)表示。

      算力普惠,是大模型落地的充分條件,但從如今的進(jìn)度條來看,它盡管需要被正視價(jià)值,但遠(yuǎn)遠(yuǎn)不能成為改變整個(gè)大模型落地的最強(qiáng)催化劑。

      “技術(shù)是不會以任何商業(yè)行為或者人們的意愿所改變它的上限和下限的,它需要的時(shí)間是恒定的。”上述金融企業(yè)的CIO說道。

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹(jǐn)慎對待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。

    即時(shí)

    TCL實(shí)業(yè)榮獲IFA2024多項(xiàng)大獎(jiǎng),展示全球科技創(chuàng)新力量

    近日,德國柏林國際電子消費(fèi)品展覽會(IFA2024)隆重舉辦。憑借在核心技術(shù)、產(chǎn)品設(shè)計(jì)及應(yīng)用方面的創(chuàng)新變革,全球領(lǐng)先的智能終端企業(yè)TCL實(shí)業(yè)成功斬獲兩項(xiàng)“IFA全球產(chǎn)品設(shè)計(jì)創(chuàng)新大獎(jiǎng)”金獎(jiǎng),有力證明了其在全球市場的強(qiáng)大影響力。

    新聞

    敢闖技術(shù)無人區(qū) TCL實(shí)業(yè)斬獲多項(xiàng)AWE 2024艾普蘭獎(jiǎng)

    近日,中國家電及消費(fèi)電子博覽會(AWE 2024)隆重開幕。全球領(lǐng)先的智能終端企業(yè)TCL實(shí)業(yè)攜多款創(chuàng)新技術(shù)和新品亮相,以敢為精神勇闖技術(shù)無人區(qū),斬獲四項(xiàng)AWE 2024艾普蘭大獎(jiǎng)。

    企業(yè)IT

    重慶創(chuàng)新公積金應(yīng)用,“區(qū)塊鏈+政務(wù)服務(wù)”顯成效

    “以前都要去窗口辦,一套流程下來都要半個(gè)月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。

    研究

    2024全球開發(fā)者先鋒大會即將開幕

    由世界人工智能大會組委會、上海市經(jīng)信委、徐匯區(qū)政府、臨港新片區(qū)管委會共同指導(dǎo),由上海市人工智能行業(yè)協(xié)會聯(lián)合上海人工智能實(shí)驗(yàn)室、上海臨港經(jīng)濟(jì)發(fā)展(集團(tuán))有限公司、開放原子開源基金會主辦的“2024全球開發(fā)者先鋒大會”,將于2024年3月23日至24日舉辦。