輕松籌:十年深耕大健康領(lǐng)域,打造全方位健康保障生態(tài)面對(duì)承壓的小家電市場(chǎng),小熊、蘇泊爾上半年為何一降一增?研發(fā)投入高增、占營(yíng)收比超5%,科沃斯、石頭科技升高技術(shù)壁壘激光顯示全面“向新”發(fā)展,未來(lái)激光電視主機(jī)僅有iPad大小2024年冷年空調(diào)市場(chǎng)總結(jié):規(guī)模下探,結(jié)構(gòu)降級(jí),空調(diào)行業(yè)邁入新周OpenAI o1全方位SOTA登頂lmsys推薦榜!數(shù)學(xué)能力碾壓Claude和谷歌模型,o1-mini并列第一iPhone16系列新品正式發(fā)售 新品爆發(fā)就在抖音電商廣告燒錢過(guò)億,70%用戶靠投流,大模型算不過(guò)成本賬?PS1經(jīng)典配色!索尼發(fā)布30周年紀(jì)念版PS5、PS5 Pro:限量賣泰順:聚智聚力數(shù)字創(chuàng)客激發(fā)鄉(xiāng)村振興新動(dòng)能電商12年 ,ALL IN 小紅書,開店3月賣出1100萬(wàn)Mate 70最受期待!華為三款重磅機(jī)型蓄勢(shì)待發(fā)云天勵(lì)飛“算力積木”架構(gòu):引領(lǐng)邊緣AI芯片新變革徹底告別3999元!小米15入網(wǎng) 支持90W快充FF發(fā)布第二品牌Faraday X:對(duì)標(biāo)豐田 專注增程式混動(dòng)車型黑神話悟空總收入超67億:銷量已超2000萬(wàn)份通快成立激光業(yè)務(wù)區(qū)域中心(中國(guó)),強(qiáng)勢(shì)布局中國(guó)市場(chǎng)Sandalwood Advisors受邀參加第31屆中信里昂投資者論壇淘寶倒逼新風(fēng)向:一場(chǎng)電商減負(fù)運(yùn)動(dòng)博浪AI時(shí)代,阿里、華為“硬碰硬”
  • 首頁(yè) > 云計(jì)算頻道 > 大模型

    大模型“免費(fèi)”送,廠商們圖什么?

    2024年06月05日 16:34:28   來(lái)源:壹度Pro

      2024年618,傳統(tǒng)電商行業(yè)不再喧囂,但大模型市場(chǎng)卻開啟了慘烈的“價(jià)格戰(zhàn)”,甚至部分企業(yè)直接免費(fèi)送大模型服務(wù)。

      5月15日,字節(jié)跳動(dòng)宣布,豆包主力模型企業(yè)市場(chǎng)定價(jià)為0.0008元/千Tokens,0.8厘可處理1500多個(gè)漢字,比行業(yè)便宜99.3%。

      一周后,阿里云也對(duì)外宣布,通義千問(wèn)GPT-4級(jí)主力模型Qwen-Long的API輸入價(jià)格降至0.0005元/千Tokens,直降97%。

      阿里云卷入“價(jià)格戰(zhàn)”后,百度、騰訊云、科大訊飛等企業(yè)也接連宣布自家的大模型降價(jià)。其中百度甚至宣布,兩款基礎(chǔ)模型可免費(fèi)調(diào)用。

      不可否認(rèn)的是,隨著技術(shù)逐漸成熟,大模型的成本正不斷下探。為了盡快俘獲更多企業(yè)客戶,拓寬市場(chǎng)影響力,上游算力提供商確實(shí)需要盡力降價(jià)。

      然而需要注意的是,盡管大模型成本正逐步下探,但目前大部分企業(yè)的大模型業(yè)務(wù)依然面臨算力、人力成本高企的挑戰(zhàn),沒(méi)能盈利。在此背景下,上游算力提供商不斷降價(jià),甚至免費(fèi)送大模型,顯得十分反常。

      這種非理性的價(jià)格戰(zhàn),其實(shí)凸顯出了上游企業(yè)亟待通過(guò)讓利,打通大模型商業(yè)閉環(huán)的內(nèi)在焦慮。

      01 價(jià)格戰(zhàn)背后,大模型商業(yè)困局難解

      2023年以來(lái),隨著ChatGPT爆火,諸多科技公司都看到了AI大模型蘊(yùn)含著巨大的商業(yè)價(jià)值,因而加碼相關(guān)業(yè)務(wù)。2024年3月,國(guó)家數(shù)據(jù)局局長(zhǎng)劉烈宏透露,中國(guó)10億參數(shù)規(guī)模以上大模型數(shù)量已超100個(gè)。

      然而隨著越來(lái)越多企業(yè)入局相關(guān)產(chǎn)業(yè),大模型商業(yè)模式不健全,成本高、落地難、下游企業(yè)持觀望態(tài)度等問(wèn)題愈發(fā)凸顯。

      由于需要采購(gòu)高性能計(jì)算機(jī),并且需要進(jìn)行模型訓(xùn)練,大模型的成本異常高昂。以O(shè)penAI為例,其訓(xùn)練GPT-4的FLOPS約為2.15e25,一次訓(xùn)練成本為6300萬(wàn)美元。The Information報(bào)道,2022年,OpenAI虧損約為5.4億美元左右,約擴(kuò)大一倍。

      目前,大部分企業(yè)都意識(shí)到了大模型的參數(shù)越多,商業(yè)想象力越大,因而持續(xù)加碼模型訓(xùn)練。不過(guò)問(wèn)題也隨之而來(lái),那就是大模型僅僅問(wèn)世兩年時(shí)間,下游創(chuàng)收手段十分有限。

      整體而言,大模型有兩種創(chuàng)收模式,一是直接向用戶收取訂閱費(fèi),二是向開發(fā)者收取API調(diào)用費(fèi)。比如,2023年初,OpenAI推出了會(huì)員訂閱服務(wù)ChatGPT Plus,費(fèi)用為20美元/月,可使用基于GPT-4的模型,并且提供更快的響應(yīng)時(shí)間、優(yōu)先訪問(wèn)等權(quán)限。

      不過(guò),據(jù)Reddot聯(lián)合創(chuàng)始人Pierre Herubel測(cè)算,即使以每月?lián)碛?00萬(wàn)訂戶估計(jì),ChatGPT Plus每年或只能為OpenAI帶來(lái)2.4億美元左右收入,很難幫助公司扭虧為盈。

      因此,目前以O(shè)penAI為代表企業(yè)的發(fā)力重點(diǎn),是向企業(yè)收取API調(diào)用費(fèi)。參照云計(jì)算的經(jīng)驗(yàn),外部的企業(yè)從零開始訓(xùn)練大語(yǔ)言模型非常困難,傾向于采購(gòu)成熟的AI大模型技術(shù),一旦這些企業(yè)探索出具備想象力的商業(yè)模式,即可反哺上游算力提供商,進(jìn)而實(shí)現(xiàn)多方共贏。

      對(duì)此,2023年11月,百度創(chuàng)始人兼CEO李彥宏曾表示,不斷地重復(fù)開發(fā)基礎(chǔ)大模型是對(duì)社會(huì)資源的極大浪費(fèi),“AI原生時(shí)代,我們需要100萬(wàn)量級(jí)的AI原生應(yīng)用,但是不需要100個(gè)大模型。”

      02 算力提供商作出表率,但B端企業(yè)仍持觀望態(tài)度

      由于大部分大模型算力提供商都是平臺(tái)型企業(yè),推出大模型技術(shù)后,這些企業(yè)紛紛在內(nèi)部試水相關(guān)技術(shù)的商業(yè)化,以圖給下游客戶做出商業(yè)化表率。

      比如,2023年阿里云峰會(huì)上,時(shí)任阿里巴巴集團(tuán)董事會(huì)主席兼CEO、阿里云智能集團(tuán)CEO張勇表示:“阿里巴巴所有產(chǎn)品未來(lái)將接入‘通義千問(wèn)’大模型,進(jìn)行全面改造。”

      以釘釘為例,接入大模型后,其支持AI生成推廣文案、繪圖方式創(chuàng)建應(yīng)用、視頻會(huì)議中生成摘要等功能。釘釘總裁葉軍認(rèn)為,大模型將會(huì)讓釘釘?shù)氖杖朐鲩L(zhǎng)百分之幾十。

      無(wú)獨(dú)有偶,過(guò)去一段時(shí)間,騰訊也積極探索AI技術(shù)的商業(yè)化應(yīng)用。2023年財(cái)報(bào)中,騰訊對(duì)外表示:“廣告AI模型的改進(jìn)顯著提升了精準(zhǔn)投放的效果…… 這些發(fā)展帶動(dòng)了高質(zhì)量的收入來(lái)源,推動(dòng)毛利增長(zhǎng) 23%。”

      自有業(yè)務(wù)挖掘出AI的商業(yè)價(jià)值后,上游算力提供商正致力于針對(duì)垂直行業(yè)的細(xì)分需求,提供定制大模型能力。

      比如,2023年6月,騰訊云宣布開啟“騰訊云行業(yè)大模型生態(tài)計(jì)劃”,致力于推進(jìn)大模型在產(chǎn)業(yè)領(lǐng)域的創(chuàng)新和落地。據(jù)悉,騰訊云已為傳媒、文旅、政務(wù)等10余個(gè)行業(yè)提供了超50個(gè)大模型行業(yè)解決方案。

      然而需要注意的是,平臺(tái)型企業(yè)大多擁有自研大模型技術(shù),無(wú)論是試錯(cuò)還是使用成本都更低,往往只會(huì)對(duì)外宣傳商業(yè)路徑清晰的大模型落地案例。

      反觀外部的企業(yè)需要采購(gòu)上游的大模型技術(shù),探索成本相對(duì)更高,并且商業(yè)模式不清晰,很難擁有足夠的積極性。見(jiàn)實(shí)團(tuán)隊(duì)披露的《AI應(yīng)用需求與付費(fèi)意愿調(diào)研報(bào)告》顯示,46.2%的企業(yè)AI預(yù)算在1萬(wàn)元以下,另有22.2%和24%的企業(yè)預(yù)算分別為1萬(wàn)-5萬(wàn)元以及5萬(wàn)元-10萬(wàn)元,這些中腰部企業(yè)沒(méi)有足夠的預(yù)算探索AI。

      此前,大部分主力模型產(chǎn)品的API輸入價(jià)格不菲,比如,Qwen-Long為0.02元/千tokens,1萬(wàn)元只可以購(gòu)買5億個(gè)tokens。如果一個(gè)產(chǎn)品有500萬(wàn)月活,1萬(wàn)元的預(yù)算,一個(gè)月平均只能供每個(gè)用戶使用100個(gè)tokens,顯然不夠。

      03 成本雖屢屢下探,但算力提供商已急不可耐

      顯而易見(jiàn),當(dāng)下限制大模型B端商業(yè)化落地的主要障礙,就是API成本過(guò)高,限制了B端企業(yè)探索相應(yīng)的商業(yè)閉環(huán)。因此,目前算力提供商的發(fā)力方向,就是致力于通過(guò)技術(shù)手段,壓低大模型的成本,降低B端企業(yè)的使用成本。

      開頭提到,字節(jié)跳動(dòng)旗下豆包主力模型企業(yè)市場(chǎng)定價(jià)為0.0008元/千Tokens,比行業(yè)便宜99.3%。對(duì)此,火山引擎總裁譚待表示:“豆包模型的超低定價(jià),來(lái)源于我們有信心用技術(shù)手段優(yōu)化成本,而不是補(bǔ)貼或是打價(jià)格戰(zhàn)爭(zhēng)奪市場(chǎng)份額。”

      無(wú)獨(dú)有偶,2024年5月6日,深度求索開源了第二代MoE模型DeepSeek-V2,性能更強(qiáng),訓(xùn)練成本更低。據(jù)悉,DeepSeek可節(jié)省42.5%訓(xùn)練成本,減少93.3%的KV緩存,最大吞吐量提高5.76倍。整體而言,DeepSeek-V2消耗的顯存(KV Cache)只有同級(jí)別Dense模型的1/5-1/100。

      不過(guò),這并不意味著當(dāng)下大模型行業(yè)的價(jià)格戰(zhàn)十分正常。2024年5月,談及大模型的發(fā)展趨勢(shì)時(shí),零一萬(wàn)物CEO李開復(fù)接受采訪時(shí)表示:“未來(lái)整個(gè)行業(yè)的推理成本每年降低10倍是可以期待的,而且這個(gè)趨勢(shì)是必然的。”未來(lái),大模型的成本將呈階梯狀下探,但目前大模型的價(jià)格卻斷崖式下探,甚至部分企業(yè)免費(fèi)送,降價(jià)幅度遠(yuǎn)超上游成本降幅。

      上游算力提供商之所以如此內(nèi)卷,很大程度上都是希望俘獲更多的B端企業(yè),一方面實(shí)現(xiàn)規(guī)模效應(yīng),另一方面,讓B端企業(yè)無(wú)負(fù)擔(dān)地探索良性的商業(yè)模式。對(duì)此,譚待表示:“大的使用量,才能打磨出好模型,也能大幅降低模型推理的單位成本……大模型從以分計(jì)價(jià)到以厘計(jì)價(jià),將助力企業(yè)以更低成本加速業(yè)務(wù)創(chuàng)新。”

      盡管激烈的價(jià)格戰(zhàn)之下,大模型已經(jīng)進(jìn)入“免費(fèi)時(shí)代”,但其實(shí)大部分上游算力提供商為了后續(xù)創(chuàng)收,都留有更為隱晦的收費(fèi)手段。

      目前,大部分大模型僅推理用的token降價(jià),而訓(xùn)練和部署成本依然不低。比如,阿里的qwen-turbo 模型百萬(wàn)個(gè)token推理只要2元,若是訓(xùn)練,就需要30元,部署時(shí),每月需要2萬(wàn)元。

      由此來(lái)看,大模型進(jìn)入“免費(fèi)時(shí)代”,很大程度上其實(shí)只是一個(gè)宣傳意義上的噱頭。如果下游企業(yè)想要用上成套大模型服務(wù),那么不能不付出更高的使用成本。

      而之所以上游算力提供商僅僅降低推理用的token成本,主要是因?yàn)橥ㄟ^(guò)內(nèi)部應(yīng)用,其對(duì)于大模型的商業(yè)價(jià)值足夠自信,希望降價(jià)的噱頭起到引流的作用。

      參照云計(jì)算價(jià)格戰(zhàn)的經(jīng)驗(yàn),此番大模型價(jià)格戰(zhàn)或許可以吸引更多下游企業(yè)認(rèn)真審視大模型,有望基于相關(guān)技術(shù)探索出更多良性的商業(yè)模式。

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請(qǐng)謹(jǐn)慎對(duì)待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。

    即時(shí)

    TCL實(shí)業(yè)榮獲IFA2024多項(xiàng)大獎(jiǎng),展示全球科技創(chuàng)新力量

    近日,德國(guó)柏林國(guó)際電子消費(fèi)品展覽會(huì)(IFA2024)隆重舉辦。憑借在核心技術(shù)、產(chǎn)品設(shè)計(jì)及應(yīng)用方面的創(chuàng)新變革,全球領(lǐng)先的智能終端企業(yè)TCL實(shí)業(yè)成功斬獲兩項(xiàng)“IFA全球產(chǎn)品設(shè)計(jì)創(chuàng)新大獎(jiǎng)”金獎(jiǎng),有力證明了其在全球市場(chǎng)的強(qiáng)大影響力。

    新聞

    敢闖技術(shù)無(wú)人區(qū) TCL實(shí)業(yè)斬獲多項(xiàng)AWE 2024艾普蘭獎(jiǎng)

    近日,中國(guó)家電及消費(fèi)電子博覽會(huì)(AWE 2024)隆重開幕。全球領(lǐng)先的智能終端企業(yè)TCL實(shí)業(yè)攜多款創(chuàng)新技術(shù)和新品亮相,以敢為精神勇闖技術(shù)無(wú)人區(qū),斬獲四項(xiàng)AWE 2024艾普蘭大獎(jiǎng)。

    企業(yè)IT

    重慶創(chuàng)新公積金應(yīng)用,“區(qū)塊鏈+政務(wù)服務(wù)”顯成效

    “以前都要去窗口辦,一套流程下來(lái)都要半個(gè)月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。

    研究

    2024全球開發(fā)者先鋒大會(huì)即將開幕

    由世界人工智能大會(huì)組委會(huì)、上海市經(jīng)信委、徐匯區(qū)政府、臨港新片區(qū)管委會(huì)共同指導(dǎo),由上海市人工智能行業(yè)協(xié)會(huì)聯(lián)合上海人工智能實(shí)驗(yàn)室、上海臨港經(jīng)濟(jì)發(fā)展(集團(tuán))有限公司、開放原子開源基金會(huì)主辦的“2024全球開發(fā)者先鋒大會(huì)”,將于2024年3月23日至24日舉辦。