作者|陶然 編輯|魏曉
to C業(yè)務(wù)狂飆大半年的Kimi,開(kāi)始在B端發(fā)力了。
八月尚未過(guò)半,兩則直接關(guān)聯(lián)其商業(yè)化進(jìn)程的消息,在市場(chǎng)中傳開(kāi):
二日,Kimi母公司月之暗面官宣Kimi企業(yè)級(jí)API正式發(fā)布。相較于覆蓋to C需求的通用模型,企業(yè)級(jí)模型推理API有著更高等級(jí)的數(shù)據(jù)安全保障和并發(fā)速率,用以支持企業(yè)內(nèi)部的復(fù)雜工作流和大規(guī)模的數(shù)據(jù)處理需求。
五天后,公司再次放出商業(yè)化動(dòng)作,宣布Kimi開(kāi)放平臺(tái)的上下文緩存Cache存儲(chǔ)費(fèi)用降低50%,由10元/1M tokens/min降低至5元/1M tokens/min,價(jià)格生效時(shí)間為2024年8月7日。
這項(xiàng)技術(shù)實(shí)際上早在在7月1日就已通過(guò)開(kāi)放平臺(tái)啟動(dòng)公測(cè),通過(guò)預(yù)存那些可能會(huì)被反復(fù)引用、頻繁請(qǐng)求的文本或數(shù)據(jù)等信息來(lái)給模型推理過(guò)程“降本增效”。
Kimi現(xiàn)今在B端謀求AI變現(xiàn)的動(dòng)作,絕非此前應(yīng)用內(nèi)上線“打賞功能灰度測(cè)試”那般仍有試探意味:
從企業(yè)級(jí)解決方案,到具體場(chǎng)景優(yōu)化,再到價(jià)格調(diào)整,月之暗面顯然是有備而來(lái)。
大模型應(yīng)用,向錢看
圈內(nèi)關(guān)于大模型應(yīng)用的立場(chǎng),在技術(shù)落地日漸密集的2024年清晰分成了兩派。
七月初在上海舉行的世界人工智能大會(huì)(WAIC)上,手握目前國(guó)內(nèi)最大規(guī)模AI應(yīng)用訪問(wèn)量的百度CEO李彥宏在演講中談及了他對(duì)大模型應(yīng)用的看法:C端當(dāng)然要做,但大模型更有成果的應(yīng)用場(chǎng)景仍在B端。
李彥宏認(rèn)為,在AI時(shí)代,“超級(jí)能干”的應(yīng)用,即那些能夠深刻影響產(chǎn)業(yè)、顯著提升應(yīng)用場(chǎng)景效率的應(yīng)用,其價(jià)值或許更為重大,它們所創(chuàng)造的整體價(jià)值遠(yuǎn)超移動(dòng)互聯(lián)網(wǎng)時(shí)代的某些“超級(jí)應(yīng)用”。
未來(lái)在醫(yī)療、金融、教育、制造、交通、農(nóng)業(yè)等領(lǐng)域,都會(huì)依據(jù)自己的場(chǎng)景的特點(diǎn)、獨(dú)特經(jīng)驗(yàn)、行業(yè)規(guī)則及數(shù)據(jù)資源等,定制化地開(kāi)發(fā)出做出各種各樣的智能體。將來(lái)會(huì)有數(shù)以百萬(wàn)量級(jí)的智能體出現(xiàn),形成龐大的智能體生態(tài)。
這種打法,可以算作現(xiàn)階段BAT等科技大廠的代表。
從硅星人統(tǒng)計(jì)的大模型相關(guān)項(xiàng)目中標(biāo)情況來(lái)看,百度今年中標(biāo)了包括醫(yī)療、金融、能源、環(huán)保和交通等多個(gè)領(lǐng)域的共計(jì)17個(gè)項(xiàng)目,其中不乏大型國(guó)企以及各行各業(yè)的頭部公司,金額也基本在百萬(wàn)甚至千萬(wàn)級(jí)別。
而初創(chuàng)公司代表,像百川智能王小川、月之暗面楊植麟,過(guò)去給外界的印象一直是堅(jiān)定的to C支持者。
AI助手百小應(yīng)的發(fā)布會(huì)上王小川就曾表示,to B業(yè)務(wù)并非百川主要仰賴的商業(yè)模式,在美國(guó)做to B是好生意,但國(guó)內(nèi)市場(chǎng)C端比B端“大十倍”。
月之暗面創(chuàng)始人楊植麟雖然沒(méi)有在公開(kāi)場(chǎng)合過(guò)多談及公司的變現(xiàn),但也在幾個(gè)月前上海創(chuàng)新創(chuàng)業(yè)青年 50 人論壇的演講中表示,得益于Transformer架構(gòu)的提出、半導(dǎo)體產(chǎn)業(yè)發(fā)展,以及互聯(lián)網(wǎng)為AI積累下來(lái)的大量數(shù)據(jù),在世界上可能“第一次出現(xiàn)了這種 AI to C 的機(jī)會(huì)。”
對(duì)于是把Kimi做成to C的AI超級(jí)應(yīng)用,還是把名號(hào)打響后多點(diǎn)布局,楊植麟留過(guò)活扣:我們to B倒也不是說(shuō)完全不做,但是我們可能最主要的肯定還是會(huì)去聚焦和發(fā)力這個(gè)C端。
大概是研判時(shí)機(jī)已到,堅(jiān)持to C許久的月之暗面,終于對(duì)to B“真香”了。
Kimi to B:技術(shù)和市場(chǎng)都已成熟
從最淺表的層面來(lái)說(shuō),做to B解決方案和之前在C端的Kimi相比,需要解決的首先一個(gè)問(wèn)題就是:
對(duì)于付費(fèi)玩家,你的服務(wù)器不能有事沒(méi)事就宕機(jī)。
算力規(guī)模是個(gè)繞不開(kāi)的話題:月之暗面用一年時(shí)間,把Kimi干到了大模型賽道內(nèi)流量和使用量的頂流(部分統(tǒng)計(jì)顯示,七月份Kimi和文心一言是國(guó)內(nèi)唯二月活超過(guò)千萬(wàn)的主流大模型),但畢竟仍是初創(chuàng)公司,資源比起大廠不會(huì)特別富裕是顯而易見(jiàn)的。
很少聽(tīng)說(shuō)文心一言、通義千問(wèn)出現(xiàn)用戶高峰導(dǎo)致算力不足的情況,但經(jīng)常用Kimi的用戶想必或多或少都被算力墻擋住過(guò)幾個(gè)回合的問(wèn)答(最近似乎好些了)。
而企業(yè)客戶如果將Kimi作為常用的生產(chǎn)力工具,那么企業(yè)級(jí)API的服務(wù)器就必須保證的穩(wěn)定性和可靠性,確保在高負(fù)載情況下可以正常運(yùn)行。
結(jié)合此番降價(jià)的上下文緩存技術(shù)來(lái)看,除了隨著業(yè)務(wù)體量按需擴(kuò)大服務(wù)器規(guī)模之外,Kimi將另一項(xiàng)中心放在了對(duì)現(xiàn)有模型推理的“降本增效”上。
這項(xiàng)技術(shù)的費(fèi)用,通常是因平臺(tái)或服務(wù)提供商維護(hù)和提供緩存服務(wù)而對(duì)客戶收取。以網(wǎng)購(gòu)類比,如果用戶經(jīng)常使用同一個(gè)購(gòu)物網(wǎng)站、App,那么這個(gè)網(wǎng)站/App很可能就會(huì)在系統(tǒng)中單獨(dú)創(chuàng)建一個(gè)數(shù)據(jù)集,將用戶ID、購(gòu)物車內(nèi)容、偏好設(shè)置信息存儲(chǔ)其中。
而在大模型的使用場(chǎng)景中,如果用戶向系統(tǒng)提交了一個(gè)請(qǐng)求,比如詢問(wèn)一系列問(wèn)題,或者給Kimi甩過(guò)去一篇萬(wàn)字長(zhǎng)文本要求生成報(bào)告,大模型在處理請(qǐng)求時(shí)就需要理解用戶的查詢上下文,包括之前的問(wèn)題、相關(guān)話題或者某些領(lǐng)域的特定信息。
這部分推理出的中間結(jié)果和計(jì)算出的關(guān)鍵信息往往在用戶后續(xù)的問(wèn)答中會(huì)被反復(fù)提及(調(diào)用),將他們緩存起來(lái)以便后續(xù)請(qǐng)求時(shí)可以快速訪問(wèn),是一個(gè)相對(duì)節(jié)省算力資源的選擇。
并非是瀏覽器那種為了方便用戶登錄而記錄用戶名和密碼,這種緩存首先降低的是模型反復(fù)閱讀、推理所消耗的資源量,對(duì)結(jié)果生成效率也會(huì)有一定程度提升。利用緩存的上下文信息,大模型可以快速生成響應(yīng)或推薦內(nèi)容,而不需要從頭開(kāi)始重新計(jì)算。從而對(duì)用戶提出相關(guān)問(wèn)題或需要相關(guān)信息加速響應(yīng),減少浪費(fèi)時(shí)間的等待。
這種有助于提高系統(tǒng)的響應(yīng)速度和處理效率,同時(shí)保持對(duì)話或文本生成的連貫性和準(zhǔn)確性的緩存機(jī)制,對(duì)于提供流暢的用戶體驗(yàn)和優(yōu)化資源使用來(lái)說(shuō)會(huì)相當(dāng)關(guān)鍵。
尤其在未來(lái)可能面對(duì)來(lái)自B端、更多的用戶和更集中的數(shù)據(jù)處理請(qǐng)求時(shí),快速響應(yīng)并高效處理的價(jià)值可能進(jìn)一步突出。
One More Thing
to B動(dòng)作頻頻的月之暗面,近期還喜提一筆來(lái)自鵝廠的大額融資。
市場(chǎng)消息顯示,騰訊參與了月之暗面最新一輪3億美元融資,完成后將使得公司市值升至33億美元,成為國(guó)內(nèi)大模型初創(chuàng)企業(yè)中估值最高的一家。
月之暗面并未對(duì)此事做出回應(yīng),但據(jù)稱有接近騰訊方面的消息源表示參投屬實(shí)。
至此,被譽(yù)為“新AI四小龍”的智譜AI、MiniMax、百川智能和月之暗面,四家公司背后的投資陣營(yíng)都已有了騰訊及阿里巴巴的參與。
BAT中百度更多選擇做好自己,AT則繼續(xù)通過(guò)創(chuàng)投多點(diǎn)下注。
初創(chuàng)公司忙于卷技術(shù)做應(yīng)用,而大廠們似乎已經(jīng)將注意力的一部分,放在了投資回報(bào)率,亦或是未來(lái)行業(yè)格局的話語(yǔ)權(quán)上。
來(lái)源|AI藍(lán)媒匯 作者|陶然
文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請(qǐng)謹(jǐn)慎對(duì)待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。
2024年的Adobe MAX 2024發(fā)布會(huì)上,Adobe推出了最新版本的Adobe Creative Cloud。
奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。
“以前都要去窗口辦,一套流程下來(lái)都要半個(gè)月了,現(xiàn)在方便多了!”打開(kāi)“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。
華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準(zhǔn)的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來(lái)實(shí)質(zhì)性的幫助,雙十一期間低至2799元,性價(jià)比很高,簡(jiǎn)直是創(chuàng)作者們的首選。
9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會(huì)——工業(yè)互聯(lián)網(wǎng)標(biāo)識(shí)解析專題論壇在沈陽(yáng)成功舉辦。