自 5 月 6 日 DeepSeek 提出降價(jià)、實(shí)現(xiàn)百萬 Tokens 輸入 1 元開始,字節(jié)、智譜、阿里、百度、訊飛、騰訊等也先后加入到降價(jià)浪潮中。到 5 月 22 日,ERNIE Speed、ERNIE Lite、訊飛星火 Lite、混元-lite 模型等均已實(shí)現(xiàn)限定條件下免費(fèi)。
國(guó)內(nèi)大模型廠商,尤其是以云廠商為代表的模型公司,掀起的降價(jià)潮,已經(jīng)超越了在行業(yè)內(nèi)產(chǎn)生影響,更引發(fā)了大眾層面的關(guān)注。百度指數(shù)上「大模型」關(guān)鍵詞在近兩周也有大幅提升。
激進(jìn)的云廠商的意圖路人皆知:通過降低試用成本,吸引大量試用型開發(fā)者;通過模型成本降低,加強(qiáng)云及其他產(chǎn)品的售賣。這背后的一個(gè)重要原因則是:大模型層面的競(jìng)爭(zhēng)激烈,但目前各家差距并不明顯,沒有誰能一騎絕塵、遙遙*,降低成本很可能是一個(gè)*的業(yè)務(wù)策略及競(jìng)爭(zhēng)策略。
與市場(chǎng)主流預(yù)期不同,模型層創(chuàng)業(yè)公司現(xiàn)階段還暫未恐慌:
大廠的「降價(jià)」當(dāng)前還有很多的限定條件,真要用起來成本或許并沒有宣傳的那么低;在開發(fā)者依然會(huì)考慮性能的當(dāng)下,給創(chuàng)業(yè)公司依然留下了生存空間;
大廠的「降價(jià)」宣傳加強(qiáng)了市場(chǎng)教育,利好全行業(yè),有廠商告訴 Founder Park 研究中心,近期常規(guī)的(非刻意因?yàn)榻祪r(jià)預(yù)付)充值、續(xù)費(fèi)率還略有增長(zhǎng));
有模型廠商的公司高管認(rèn)為,大廠開源的都是小模型,當(dāng)用戶量增加時(shí),可能要花費(fèi)更多精力優(yōu)化小模型,反而創(chuàng)業(yè)公司有可能能有機(jī)會(huì)優(yōu)化大參數(shù)模型,同時(shí)大廠的降價(jià)或有可能吸引一部分灰產(chǎn),很可能需要花精力應(yīng)對(duì)灰產(chǎn)。
但不管對(duì)于大廠還是模型層創(chuàng)業(yè)公司而言,降低 Token 成本都是未來大勢(shì)所趨。便宜的模型、繁榮的開發(fā)者生態(tài)、*方應(yīng)用都是這場(chǎng)「百模大戰(zhàn)」接下來競(jìng)爭(zhēng)關(guān)鍵。
01
大廠沒有講明的點(diǎn):
降價(jià)后成本可能依然很貴
Founder Park 研究中心與行業(yè)交流,獲知的信息,得出的結(jié)論更偏向于:對(duì)開發(fā)者來說當(dāng)前的降價(jià)更像是「試用裝」,適合要試用大模型的客群,對(duì)行業(yè)的直接影響并不大。
這主要是因?yàn)椋?/p>
*,當(dāng)前部分廠商的「降價(jià)」中沒有提 TPM(每分鐘處理內(nèi)容量)、RPM(每分鐘請(qǐng)求數(shù))兩個(gè)限定條件。隨著這兩個(gè)重要數(shù)值的增加,其成本也會(huì)提升。
第二,部分模型「降價(jià)」重點(diǎn)降低了輸入端的 Token 價(jià)格,輸出端降價(jià)低于輸入。
第三,此前很多國(guó)內(nèi)大模型都會(huì)在注冊(cè)時(shí)贈(zèng)送部分 Token,或者在中小開發(fā)者的應(yīng)用快速起量時(shí)給與 Token 支持,基本接近「免費(fèi)」或者「低價(jià)」。
在「降價(jià)潮」的兩周內(nèi),整個(gè)市場(chǎng)的輿論也經(jīng)歷了幾個(gè)階段:
Token 成本因?yàn)樗惴ǖ蠓鶋旱秃蟮男袠I(yè)關(guān)注;
Token 成本因?yàn)樯虡I(yè)策略大幅降低后的大眾關(guān)注;
大規(guī)模降價(jià)引發(fā)了行業(yè)就大廠是否真降價(jià)的反思與討論,如高 TPM、RPM 下的實(shí)際成本討論;
大廠模型大規(guī)模降價(jià)后引發(fā)的投資圈反思,如獨(dú)立模型層創(chuàng)業(yè)者是否還有機(jī)會(huì),大廠逼迫模型層公司不得不做應(yīng)用成為自己*的客戶;
降價(jià)能不能解決大模型商業(yè)模式的反思。
整體來看,這次降價(jià)潮中,大眾層面吃瓜降價(jià)熱點(diǎn),但很多開發(fā)者反應(yīng)相對(duì)平淡。這主要是因?yàn)椋?/p>
*,實(shí)際部分應(yīng)用場(chǎng)景中,開發(fā)者調(diào)用的仍主要是 OpenAI 的接口。其他模型則根據(jù)場(chǎng)景不同各有優(yōu)劣。
第二,在早期量不大的情況下,開發(fā)者更在意的是切換模型是否會(huì)影響產(chǎn)品效果,是否會(huì)存在業(yè)務(wù)風(fēng)險(xiǎn)。
第三,很多潛在開發(fā)者或者潛在客戶還處于找 TPM、PMF 的階段,面臨「找不到使用場(chǎng)景」、「不知道怎么用」等現(xiàn)實(shí)難題。
02
大廠談「免費(fèi)」,
創(chuàng)業(yè)者怎么辦?
從 Founder Park 近期與行業(yè)交流的信息來看,當(dāng)前模型層創(chuàng)業(yè)公司暫未產(chǎn)生媒體宣傳中的恐慌。
多家創(chuàng)業(yè)公司的從業(yè)者告訴 Founder Park,大廠的「降價(jià)」、「免費(fèi)」宣傳加強(qiáng)了市場(chǎng)教育,利好全行業(yè)。
更為重要的意義是,這也給了應(yīng)用側(cè)行業(yè)信心,未來的 Token 成本一定是「便宜到可以忽略不計(jì)」的,會(huì)變成行業(yè)的基礎(chǔ)設(shè)施,可以在這樣的前提背景下解決真實(shí)問題、關(guān)鍵問題。
但對(duì)于獨(dú)立的模型廠商來說,市場(chǎng)競(jìng)爭(zhēng)會(huì)牽引行業(yè)在這個(gè)點(diǎn)上飽和攻擊,最終讓 Token 成本趨近于免費(fèi)。接下來的競(jìng)爭(zhēng)策略都是不得不思考的問題。這其中既包括業(yè)務(wù)模式的思考,也包括通過技術(shù)手段降低成本。
首先,如果模型本身可能很難收到錢,獨(dú)立的模型廠商就不得不自研應(yīng)用,考慮靠應(yīng)用收回部分成本。大廠的模型降價(jià)潮奠定了未來模型本身可能不一定能賺錢的基調(diào),模型廠商就不得不思考這一轉(zhuǎn)變。Founder Park 近期與一些關(guān)注 AGI 的投資人交流,對(duì)方也表達(dá)了類似的觀點(diǎn)。
從資本的視角來看,模型層公司自己研發(fā)應(yīng)用一直很重要。但以往,主要是因?yàn)橐獙?duì)外傳達(dá)自己是自己模型的*客戶,既可以平攤一部分成本,又可以不斷優(yōu)化模型,才能打造自身模型的重要特色,并對(duì)類似客戶形成吸引力。這與云廠商的發(fā)展策略類似。
這樣的思考主要來自上一階段的產(chǎn)業(yè)實(shí)踐。比如,在大模型公司內(nèi)部,他們往往有一套更有針對(duì)性的評(píng)測(cè)基準(zhǔn)。一位知名大模型公司的產(chǎn)品負(fù)責(zé)人表示,這套內(nèi)部的評(píng)測(cè)基準(zhǔn),需要非常漫長(zhǎng)的調(diào)試才能成型,它實(shí)際上是一家大模型公司最核心的資產(chǎn),為自己模型的訓(xùn)練和迭代提供方向。而這樣的「資產(chǎn)」建立,也往往需要自有應(yīng)用的支持和配合。
但當(dāng)下,考慮到未來的降價(jià)潮、免費(fèi)可能性,自研應(yīng)用的戰(zhàn)略意義也會(huì)進(jìn)一步加強(qiáng)。
當(dāng)前,大模型還是技術(shù)驅(qū)動(dòng),比拼性能,還處于「智能能力決定下限,決定是否可以普及」的階段。隨著開發(fā)者發(fā)現(xiàn)免費(fèi)的模型只能解決「試用」場(chǎng)景時(shí),最終還是會(huì)回歸到性能的比拼,選擇更有利于業(yè)務(wù)的模型。只有不斷提升模型智能能力,才有機(jī)會(huì)活在牌桌上。
對(duì)于創(chuàng)業(yè)公司來說,專注在用技術(shù)的方式,去不斷優(yōu)化成本,不斷從 infra 到模型訓(xùn)練和調(diào)優(yōu),再到交互的每個(gè)環(huán)節(jié)里,優(yōu)化效率,才有可能在競(jìng)爭(zhēng)中取得優(yōu)勢(shì)。這一點(diǎn),字節(jié)旗下的豆包、火山云也提到了,火山引擎總裁譚待認(rèn)為,「豆包模型的超低定價(jià),來源于我們有信心用技術(shù)手段優(yōu)化成本,而不是補(bǔ)貼或是打價(jià)格戰(zhàn)爭(zhēng)奪市場(chǎng)份額。」
其次,宣傳層面,F(xiàn)ounder Park 了解到,一些創(chuàng)業(yè)公司也在思考「免費(fèi)」以外的宣傳亮點(diǎn),以獲得更多用戶。
成本不是當(dāng)前客戶*關(guān)注的重點(diǎn)。比如,傅盛提出「降價(jià)對(duì)企業(yè)用戶影響有限。企業(yè)用戶需要 AI 應(yīng)用,更關(guān)心數(shù)據(jù)安全,F(xiàn)在開源小參數(shù)大模型加應(yīng)用套件,可以滿足絕大多數(shù)的企業(yè)需求了」。
03
降價(jià)是大勢(shì)所趨,
未來 token 會(huì)便宜到忽略不計(jì)
雖然此次對(duì)云廠商真實(shí)降價(jià)力度存在爭(zhēng)議,但可以預(yù)見,模型降價(jià)是大勢(shì)所趨。放到更長(zhǎng)線的產(chǎn)業(yè)周期里,未來 Token 的價(jià)格可能便宜到忽略不計(jì)。
首先,現(xiàn)實(shí)主義的原因是模型廠商「競(jìng)爭(zhēng)策略」的需要。
短期來看,大模型廠商之間的差距并不明顯。在沒有殺手锏、護(hù)城河的情況下,低價(jià)就有可能是吸引客戶的重要策略。
此前我們?cè)凇丁芬晃闹幸呀?jīng)提到,大模型今天可以在模型的「能力范圍內(nèi)」做很多業(yè)務(wù),但是成本非常高。比如,當(dāng)前大模型的智商其實(shí)可以達(dá)到高中生水平,就可以做很多服務(wù)于幼兒、兒童的場(chǎng)景;比如大模型的幻覺能力,可以在一定場(chǎng)景中演變?yōu)閯?chuàng)意能力,可以在創(chuàng)意行業(yè)應(yīng)用。但是這些場(chǎng)景還很難在用戶端收到足夠多的錢,因此,過去一年中,很多做出有一定影響力產(chǎn)品的開發(fā)者都表達(dá)了「燒不起 Token」。
其次,基于摩爾定律,大模型屬于 IT 技術(shù),理論上成本也會(huì)不斷降低。今天,大廠則是通過商業(yè)行為,加速了降價(jià)。
投資機(jī)構(gòu)拾象在 2024 年初曾做過一個(gè)總結(jié),「模型訓(xùn)練的成本在過去 18 個(gè)月已經(jīng)降了 4- 5 倍,模型推理的成本在過去 18 個(gè)月降了 10 倍左右」。基于此,他們提出了「新時(shí)代摩爾定律」:每 1-2 年模型水平就能提升一到兩代,模型訓(xùn)練成本每 18 個(gè)月就會(huì)降低至原來的 1/4、推理成本每 18 個(gè)月降低至是原來的 1/10,未來模型推理成本做到今天 1% 這件事是非?深A(yù)期的。
事實(shí)上,自去年市場(chǎng)上出現(xiàn)開源模型以來,整個(gè)市場(chǎng)的模型訓(xùn)練及模型調(diào)用成本也在大幅下滑,私有部署從最早的幾千萬元降到了幾十萬元量級(jí),同樣性能的模型成本至少低了不止一個(gè)數(shù)量級(jí)。
再次,只有 Token 成本足夠低,才有可能促進(jìn)大模型生態(tài)的繁榮,進(jìn)而使得產(chǎn)業(yè)鏈上的公司都是賺錢的。
雖然每一代技術(shù)出現(xiàn)時(shí),大家都會(huì)研究「先有雞還是先有蛋」的問題,但歷史多次證明,「只有看見才能相信」。摩爾定律之下,每個(gè)人都會(huì)保有成本降低的預(yù)期,但實(shí)際上只有看到性能的上限和可以做的事情開發(fā)者才有可能入場(chǎng)。
在上篇文章《》的《要「便宜的可以忽略不計(jì)」》的章節(jié)里,我們也提到:在 AGI 領(lǐng)域,如果有一種「智能聚合網(wǎng)絡(luò)效應(yīng)」,那么這種加強(qiáng)版網(wǎng)絡(luò)效應(yīng)就意味著,用戶數(shù)量的增長(zhǎng)能夠帶來系統(tǒng)整體價(jià)值的提升。在這樣的背景下,免費(fèi)模式理論上有可能成為一種有效的市場(chǎng)策略。在 AGI 領(lǐng)域中,如果免費(fèi)模式有助于企業(yè)快速做大規(guī)模,進(jìn)而有可能做大營(yíng)收和利潤(rùn),那么這種模式的可行性在很大程度上依賴于大模型推理的成本降低。大模型推理所需的 Token 是 AI 系統(tǒng)運(yùn)作的基礎(chǔ),其成本直接影響到企業(yè)的運(yùn)營(yíng)費(fèi)用和盈利能力。
為了確保免費(fèi)模式或者低價(jià)模式的可行性,我們需要一個(gè)前提條件:未來大模型推理時(shí)的 Token 要便宜到忽略不計(jì)。為了生態(tài)的繁榮,最終也會(huì)倒逼上游降低成本。
當(dāng)下,開發(fā)者毫無疑問的會(huì)成為稀缺資源,成為模型廠商爭(zhēng)相搶奪的對(duì)象。有網(wǎng)友調(diào)侃,可能很快模型廠商就要給開發(fā)者發(fā)補(bǔ)貼了。
Founder Park 近期的訪談中,也有創(chuàng)業(yè)者表達(dá)出了對(duì)于大廠的顧慮,集中體現(xiàn)在對(duì)于大廠盜用創(chuàng)意與數(shù)據(jù)的擔(dān)憂。考慮到今天的應(yīng)用普遍都還「太輕」,這一顧慮或并不成立。
但當(dāng) Token 有可能便宜到忽略不計(jì),未來的商業(yè)模式的規(guī)劃或許更值得思考。很可能依據(jù)公司自身實(shí)力,未來的商業(yè)策略演變?yōu)閮煞N完全不同的路徑:一是服務(wù)于客戶,向用戶免費(fèi),依然走「大事業(yè)」路線,靠免費(fèi)做大規(guī)模并謀求大 GMV 或者大流量;一是服務(wù)于用戶,直接面向用戶收費(fèi),實(shí)現(xiàn)更高的利潤(rùn)率。
而對(duì)于行業(yè)來說,更重要的因素或許還是,大模型的商業(yè)模式該如何走通。
與其他軟件行業(yè)相比,大模型的 ROI 在當(dāng)下還很難算回來。一名有美國(guó)資本背景的投資人表示,在他看來,當(dāng)前大模型公司的收入其實(shí)不能看做「ARR」,反而更應(yīng)該看作實(shí)驗(yàn)性質(zhì)的一次性收入,這筆收入很可能在 6 個(gè)月后因?yàn)樾碌哪P统霈F(xiàn)而重新進(jìn)行開發(fā)。
賈揚(yáng)清在高山書院硅谷站「高山夜話」活動(dòng)中也提到過類似的觀點(diǎn),「大模型對(duì)比傳統(tǒng)軟件,可以創(chuàng)造營(yíng)收的時(shí)間太短」。開發(fā)完 Windows,可能在接下來的 5-10 年當(dāng)中持續(xù)迭代、收回成本。但大模型每次訓(xùn)練過一個(gè)模型之后,下一次還是要從零開始重新訓(xùn)練,需要持續(xù)追加投入,但模型的迭代速度又很快,中間能夠賺錢的時(shí)間窗口很可能是一年左右,甚至更短。
文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請(qǐng)謹(jǐn)慎對(duì)待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。
2024年的Adobe MAX 2024發(fā)布會(huì)上,Adobe推出了最新版本的Adobe Creative Cloud。
奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。
“以前都要去窗口辦,一套流程下來都要半個(gè)月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。
華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準(zhǔn)的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實(shí)質(zhì)性的幫助,雙十一期間低至2799元,性價(jià)比很高,簡(jiǎn)直是創(chuàng)作者們的首選。
9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會(huì)——工業(yè)互聯(lián)網(wǎng)標(biāo)識(shí)解析專題論壇在沈陽成功舉辦。