Kimi 開(kāi)始回本了

2024年08月13日 14:25:10 作者|陶然編輯|魏曉 來(lái)源：AI藍(lán)媒匯

　　作者|陶然編輯|魏曉

　　to C業(yè)務(wù)狂飆大半年的Kimi，開(kāi)始在B端發(fā)力了。

　　八月尚未過(guò)半，兩則直接關(guān)聯(lián)其商業(yè)化進(jìn)程的消息，在市場(chǎng)中傳開(kāi)：

　　二日，Kimi母公司月之暗面官宣Kimi企業(yè)級(jí)API正式發(fā)布。相較于覆蓋to C需求的通用模型，企業(yè)級(jí)模型推理API有著更高等級(jí)的數(shù)據(jù)安全保障和并發(fā)速率，用以支持企業(yè)內(nèi)部的復(fù)雜工作流和大規(guī)模的數(shù)據(jù)處理需求。

　　五天后，公司再次放出商業(yè)化動(dòng)作，宣布Kimi開(kāi)放平臺(tái)的上下文緩存Cache存儲(chǔ)費(fèi)用降低50%，由10元/1M tokens/min降低至5元/1M tokens/min，價(jià)格生效時(shí)間為2024年8月7日。

　　這項(xiàng)技術(shù)實(shí)際上早在在7月1日就已通過(guò)開(kāi)放平臺(tái)啟動(dòng)公測(cè)，通過(guò)預(yù)存那些可能會(huì)被反復(fù)引用、頻繁請(qǐng)求的文本或數(shù)據(jù)等信息來(lái)給模型推理過(guò)程“降本增效”。

　　Kimi現(xiàn)今在B端謀求AI變現(xiàn)的動(dòng)作，絕非此前應(yīng)用內(nèi)上線“打賞功能灰度測(cè)試”那般仍有試探意味：

　　從企業(yè)級(jí)解決方案，到具體場(chǎng)景優(yōu)化，再到價(jià)格調(diào)整，月之暗面顯然是有備而來(lái)。

　　大模型應(yīng)用，向錢看

　　圈內(nèi)關(guān)于大模型應(yīng)用的立場(chǎng)，在技術(shù)落地日漸密集的2024年清晰分成了兩派。

　　七月初在上海舉行的世界人工智能大會(huì)(WAIC)上，手握目前國(guó)內(nèi)最大規(guī)模AI應(yīng)用訪問(wèn)量的百度CEO李彥宏在演講中談及了他對(duì)大模型應(yīng)用的看法：C端當(dāng)然要做，但大模型更有成果的應(yīng)用場(chǎng)景仍在B端。

　　李彥宏認(rèn)為，在AI時(shí)代，“超級(jí)能干”的應(yīng)用，即那些能夠深刻影響產(chǎn)業(yè)、顯著提升應(yīng)用場(chǎng)景效率的應(yīng)用，其價(jià)值或許更為重大，它們所創(chuàng)造的整體價(jià)值遠(yuǎn)超移動(dòng)互聯(lián)網(wǎng)時(shí)代的某些“超級(jí)應(yīng)用”。

　　未來(lái)在醫(yī)療、金融、教育、制造、交通、農(nóng)業(yè)等領(lǐng)域，都會(huì)依據(jù)自己的場(chǎng)景的特點(diǎn)、獨(dú)特經(jīng)驗(yàn)、行業(yè)規(guī)則及數(shù)據(jù)資源等，定制化地開(kāi)發(fā)出做出各種各樣的智能體。將來(lái)會(huì)有數(shù)以百萬(wàn)量級(jí)的智能體出現(xiàn)，形成龐大的智能體生態(tài)。

　　這種打法，可以算作現(xiàn)階段BAT等科技大廠的代表。

　　從硅星人統(tǒng)計(jì)的大模型相關(guān)項(xiàng)目中標(biāo)情況來(lái)看，百度今年中標(biāo)了包括醫(yī)療、金融、能源、環(huán)保和交通等多個(gè)領(lǐng)域的共計(jì)17個(gè)項(xiàng)目，其中不乏大型國(guó)企以及各行各業(yè)的頭部公司，金額也基本在百萬(wàn)甚至千萬(wàn)級(jí)別。

　　而初創(chuàng)公司代表，像百川智能王小川、月之暗面楊植麟，過(guò)去給外界的印象一直是堅(jiān)定的to C支持者。

　　AI助手百小應(yīng)的發(fā)布會(huì)上王小川就曾表示，to B業(yè)務(wù)并非百川主要仰賴的商業(yè)模式，在美國(guó)做to B是好生意，但國(guó)內(nèi)市場(chǎng)C端比B端“大十倍”。

　　月之暗面創(chuàng)始人楊植麟雖然沒(méi)有在公開(kāi)場(chǎng)合過(guò)多談及公司的變現(xiàn)，但也在幾個(gè)月前上海創(chuàng)新創(chuàng)業(yè)青年 50 人論壇的演講中表示，得益于Transformer架構(gòu)的提出、半導(dǎo)體產(chǎn)業(yè)發(fā)展，以及互聯(lián)網(wǎng)為AI積累下來(lái)的大量數(shù)據(jù)，在世界上可能“第一次出現(xiàn)了這種 AI to C 的機(jī)會(huì)。”

　　對(duì)于是把Kimi做成to C的AI超級(jí)應(yīng)用，還是把名號(hào)打響后多點(diǎn)布局，楊植麟留過(guò)活扣：我們to B倒也不是說(shuō)完全不做，但是我們可能最主要的肯定還是會(huì)去聚焦和發(fā)力這個(gè)C端。

　　大概是研判時(shí)機(jī)已到，堅(jiān)持to C許久的月之暗面，終于對(duì)to B“真香”了。

　　Kimi to B：技術(shù)和市場(chǎng)都已成熟

　　從最淺表的層面來(lái)說(shuō)，做to B解決方案和之前在C端的Kimi相比，需要解決的首先一個(gè)問(wèn)題就是：

　　對(duì)于付費(fèi)玩家，你的服務(wù)器不能有事沒(méi)事就宕機(jī)。

　　算力規(guī)模是個(gè)繞不開(kāi)的話題：月之暗面用一年時(shí)間，把Kimi干到了大模型賽道內(nèi)流量和使用量的頂流(部分統(tǒng)計(jì)顯示，七月份Kimi和文心一言是國(guó)內(nèi)唯二月活超過(guò)千萬(wàn)的主流大模型)，但畢竟仍是初創(chuàng)公司，資源比起大廠不會(huì)特別富裕是顯而易見(jiàn)的。

　　很少聽(tīng)說(shuō)文心一言、通義千問(wèn)出現(xiàn)用戶高峰導(dǎo)致算力不足的情況，但經(jīng)常用Kimi的用戶想必或多或少都被算力墻擋住過(guò)幾個(gè)回合的問(wèn)答(最近似乎好些了)。

　　而企業(yè)客戶如果將Kimi作為常用的生產(chǎn)力工具，那么企業(yè)級(jí)API的服務(wù)器就必須保證的穩(wěn)定性和可靠性，確保在高負(fù)載情況下可以正常運(yùn)行。

　　結(jié)合此番降價(jià)的上下文緩存技術(shù)來(lái)看，除了隨著業(yè)務(wù)體量按需擴(kuò)大服務(wù)器規(guī)模之外，Kimi將另一項(xiàng)中心放在了對(duì)現(xiàn)有模型推理的“降本增效”上。

　　這項(xiàng)技術(shù)的費(fèi)用，通常是因平臺(tái)或服務(wù)提供商維護(hù)和提供緩存服務(wù)而對(duì)客戶收取。以網(wǎng)購(gòu)類比，如果用戶經(jīng)常使用同一個(gè)購(gòu)物網(wǎng)站、App，那么這個(gè)網(wǎng)站/App很可能就會(huì)在系統(tǒng)中單獨(dú)創(chuàng)建一個(gè)數(shù)據(jù)集，將用戶ID、購(gòu)物車內(nèi)容、偏好設(shè)置信息存儲(chǔ)其中。

　　而在大模型的使用場(chǎng)景中，如果用戶向系統(tǒng)提交了一個(gè)請(qǐng)求，比如詢問(wèn)一系列問(wèn)題，或者給Kimi甩過(guò)去一篇萬(wàn)字長(zhǎng)文本要求生成報(bào)告，大模型在處理請(qǐng)求時(shí)就需要理解用戶的查詢上下文，包括之前的問(wèn)題、相關(guān)話題或者某些領(lǐng)域的特定信息。

　　這部分推理出的中間結(jié)果和計(jì)算出的關(guān)鍵信息往往在用戶后續(xù)的問(wèn)答中會(huì)被反復(fù)提及(調(diào)用)，將他們緩存起來(lái)以便后續(xù)請(qǐng)求時(shí)可以快速訪問(wèn)，是一個(gè)相對(duì)節(jié)省算力資源的選擇。

　　并非是瀏覽器那種為了方便用戶登錄而記錄用戶名和密碼，這種緩存首先降低的是模型反復(fù)閱讀、推理所消耗的資源量，對(duì)結(jié)果生成效率也會(huì)有一定程度提升。利用緩存的上下文信息，大模型可以快速生成響應(yīng)或推薦內(nèi)容，而不需要從頭開(kāi)始重新計(jì)算。從而對(duì)用戶提出相關(guān)問(wèn)題或需要相關(guān)信息加速響應(yīng)，減少浪費(fèi)時(shí)間的等待。

　　這種有助于提高系統(tǒng)的響應(yīng)速度和處理效率，同時(shí)保持對(duì)話或文本生成的連貫性和準(zhǔn)確性的緩存機(jī)制，對(duì)于提供流暢的用戶體驗(yàn)和優(yōu)化資源使用來(lái)說(shuō)會(huì)相當(dāng)關(guān)鍵。

　　尤其在未來(lái)可能面對(duì)來(lái)自B端、更多的用戶和更集中的數(shù)據(jù)處理請(qǐng)求時(shí)，快速響應(yīng)并高效處理的價(jià)值可能進(jìn)一步突出。

　　One More Thing

　　to B動(dòng)作頻頻的月之暗面，近期還喜提一筆來(lái)自鵝廠的大額融資。

　　市場(chǎng)消息顯示，騰訊參與了月之暗面最新一輪3億美元融資，完成后將使得公司市值升至33億美元，成為國(guó)內(nèi)大模型初創(chuàng)企業(yè)中估值最高的一家。

　　月之暗面并未對(duì)此事做出回應(yīng)，但據(jù)稱有接近騰訊方面的消息源表示參投屬實(shí)。

　　至此，被譽(yù)為“新AI四小龍”的智譜AI、MiniMax、百川智能和月之暗面，四家公司背后的投資陣營(yíng)都已有了騰訊及阿里巴巴的參與。

　　BAT中百度更多選擇做好自己，AT則繼續(xù)通過(guò)創(chuàng)投多點(diǎn)下注。

　　初創(chuàng)公司忙于卷技術(shù)做應(yīng)用，而大廠們似乎已經(jīng)將注意力的一部分，放在了投資回報(bào)率，亦或是未來(lái)行業(yè)格局的話語(yǔ)權(quán)上。

　　來(lái)源|AI藍(lán)媒匯作者|陶然

　　文章內(nèi)容僅供閱讀，不構(gòu)成投資建議，請(qǐng)謹(jǐn)慎對(duì)待。投資者據(jù)此操作，風(fēng)險(xiǎn)自擔(dān)。

[No. ]
分享到微信