大模型不需要眼前的共識

2024年05月07日 09:02:06 來源：窄播公眾號

　　確定性的機會指向的往往是需求場景，需要實干家，不斷優(yōu)化體驗;而不確定的機會往往依托于技術(shù)創(chuàng)新，需要冒險家，探索出一條通向應(yīng)用的路徑。這也是為什么人們不會驚訝于雷軍下場造車的決心，卻很難完全相信楊植麟在月之暗面創(chuàng)業(yè)過程中表現(xiàn)出來的技術(shù)理想主義。

　　在大模型領(lǐng)域，并沒有形成像新能源車一樣的市場共識。企業(yè)在確定性和不確定性之間進行的權(quán)衡，是引發(fā)行業(yè)分歧的主要原因。選擇確定性還是擁抱不確定性，決定了企業(yè)是優(yōu)先賺到錢，還是優(yōu)先做好技術(shù);是堅持做閉源大模型，還是賭開源大模型一定會迎頭趕上;是要依靠通用模型催生引爆行業(yè)的超級應(yīng)用，還是要通過小模型先占領(lǐng)細分市場。

　　當前的環(huán)境下，企業(yè)和投資人都會從更現(xiàn)實的角度去做考量，活下去、掙到錢，比一個不確定的理想愿景更能說服人。但人們對大模型的期待是給行業(yè)帶來更徹底地改變。從長遠來看，現(xiàn)在很多企業(yè)的大模型應(yīng)用，還是在對原有工具進行小修小補，很難產(chǎn)生引爆技術(shù)的應(yīng)用，也很難抵御未來大模型技術(shù)迭代帶來的洗牌。

　　泛濫的「智能體」是最明顯的一個例子。國產(chǎn)大模型的落地催生出各種被冠以智能體名號的聊天機器人和「XX助手」。百度文心一言中充斥著大量伏地魔、繁花-爺叔這樣的模擬對話機器人;kimi+上也出現(xiàn)了公文筆桿子、i人嘴替等個人助理;字節(jié)豆包在抖音上的推廣也都依靠批改作業(yè)、練習英語口語等簡單的功能點來吸引用戶。

　　很難想象這樣的聊天機器人能有多強大的生命力。如果我們對于大模型的期待僅停留在追求確定性的階段——利用其提升智能客服的對話體驗，提高資料搜集整理的效率以及擴充某些圖像或生成某些代碼，那么大模型能夠產(chǎn)生的實際價值或?qū)⑦h不及我們現(xiàn)在的預期。

　　大模型殺手級應(yīng)用的出現(xiàn)一定是要革掉某個現(xiàn)有體驗的命。現(xiàn)在來看，沒有共識就是最好的消息，至少說明這個市場上，不是所有人都只滿足于眼前的利益，還有人在沿著另一條邏輯路線前行，在不確定中尋找更大的可能，去打一場持久戰(zhàn)。

　　大模型的兩種邏輯

　　中局和終局是大模型領(lǐng)域目前比較有代表性的兩種發(fā)展邏輯。

　　中局的邏輯以朱嘯虎(金沙江創(chuàng)投主管合伙人)為代表，包括一部分聚焦應(yīng)用層的創(chuàng)業(yè)者在內(nèi)，致力于利用開源大模型快速構(gòu)建服務(wù)于細分需求的小模型，然后通過數(shù)據(jù)積累和模型迭代，建立競爭門檻;終局的邏輯以月之暗面為代表，傾向繼續(xù)投入于大模型能力的提升，等待技術(shù)迭代引爆超級應(yīng)用。

　　在中局的邏輯里，大模型的理解、決策能力被融合到既有的場景中，讓這些場景能夠應(yīng)用大模型的生成能力，提升解決方案的性能，從而產(chǎn)生新的商業(yè)化可能性。這種邏輯受到青睞的原因是，有確定性需求，可以迅速見到成效，用戶付費意愿更強。

　　在朱嘯虎的介紹中，一家利用開源大模型做AI視頻面試的企業(yè)2023年的收入比2022年翻了一倍;利用開源大模型做AIGC視頻廣告的公司2023年收入做到了5000多萬元，比2022年漲了四五倍。

　　朱嘯虎追求的機會是，利用LLaMA這種快速提升的開源大模型，結(jié)合垂直場景的數(shù)據(jù)積累和人工微調(diào)，在幾個月內(nèi)提升某一垂直場景的效率，在大模型發(fā)展過程中先賺到第一桶金。

　　朱嘯虎對大模型的發(fā)展持悲觀預期，對應(yīng)用場景的開發(fā)保持樂觀，主張從實際出發(fā)，把能賺的錢先賺到。

　　月之暗面的創(chuàng)始人楊植麟的理念則更具技術(shù)理想主義色彩，他相信大模型會逐步完成對世界的建模，并在這個過程中自然涌現(xiàn)出殺手級應(yīng)用。

　　楊植麟的終局邏輯下，大模型是一種解釋世界的工具，就像人會用語言描述世界、理解世界一樣，大模型用數(shù)學為語言建模，讓AI也能夠理解世界，描述世界。AI依靠這種學習能力，逐步實現(xiàn)像人一樣使用工具，讓AGI成為幫助人鏈接和管理細分場景的「助理」。

　　AI能夠使用工具，也就意味著很多場景的運作方式將會迎來巨大改變�？赡芷髽I(yè)未來并不需要有一個專門的視頻面試工具，也不需要有獨立的AI客服，而是統(tǒng)合到一個大模型主導的企業(yè)級智能體中，依靠智能體打通和掌控企業(yè)的不同環(huán)節(jié)。

　　在即將被OpenAI帶火的AI搜索中，真正的難點不是搜索結(jié)果到底要以網(wǎng)頁列表的形式顯示，還是以經(jīng)過AI整合的一段話來顯示，而是如何利用AI的理解能力，把被APP分解的信息重新鏈接成為一個整體。在Kimi+中，可以看到什么值得買、小紅書的相關(guān)內(nèi)容可以借助個人助理「什么值得買」和「美好生活指南」來進行喚醒。

　　但隨著楊植麟2個月套現(xiàn)4000萬美元的消息傳出，市場對他的這種終局邏輯產(chǎn)生了質(zhì)疑。月之暗面直接面向C端用戶的思路，獲客成本高且營收前景低。在沒有新的變化出現(xiàn)前，月之暗面商業(yè)化前景的不明朗被認為是楊植麟信心不足，急于套現(xiàn)的原因。

　　聊天機器人發(fā)揚不了大模型

　　從目前來看，國內(nèi)的大模型應(yīng)用給到嘗鮮者的總體感覺還處于大而無當階段，提出問題之后獲得的答案很難讓人滿意。這一方面受限于大模型自身的技術(shù)能力不足，另一方面則受限于用戶對大模型應(yīng)用使用經(jīng)驗的不足。

　　很多大模型應(yīng)用推出之初，都僅有一個對話框，用戶可以在對話框中提出任何問題并獲得答案。而利用精準的Prompt充分開發(fā)大模型的現(xiàn)有能力，成為大部分用戶難以在短時間內(nèi)逾越的門檻。

　　目前充斥在文心一言、豆包等大模型應(yīng)用中的智能體，很多都是為了降低大模型的使用門檻而打包的Prompt，也就是將一些用戶的使用經(jīng)驗沉淀為可以被分享的智能體，讓用戶可以按照需求找到不同的智能體，獲得更具針對性、更有效的回答。

　　Prompt門檻的出現(xiàn)本質(zhì)上還是大模型在語言理解能力上存在欠缺。用戶即便利用現(xiàn)成的Prompt獲得了有效信息，也依然要面對不成熟的體驗。Prompt或者所謂的智能體，可以解決初次溝通的效率問題，但解決不了復雜對話的效果問題，大模型應(yīng)用往往都不止一輪對話。

　　這也是為什么智能體面向B端的商業(yè)化運作依然停留在客服、營銷領(lǐng)域，并沒有能推進到其他生產(chǎn)生活領(lǐng)域中。因為客服、營銷領(lǐng)域在大模型應(yīng)用之前就已經(jīng)實現(xiàn)了基礎(chǔ)的智能對話體驗，大模型的理解能力可以讓互動變得更加靈活、自然。

　　從李彥宏(百度創(chuàng)始人)演講中提到的案例可以看到，百度在企業(yè)智能體方面的實踐是提供了一套結(jié)合大模型的無代碼客服機器人生成工具。企業(yè)可以上傳私域知識，自動形成對話語料，也可以過濾不在自己經(jīng)營范圍內(nèi)的內(nèi)容，還能關(guān)聯(lián)第三方的工具。

　　被包裝為智能體的客服機器人，會服務(wù)于百度的搜索生態(tài)。當用戶在百度APP搜索「什么時候去新加坡人最少」時，會在最前面顯示新加坡旅游局AI分身給到的答案，點擊可以進行更多對話。這種智能體本質(zhì)上和之前的百家號、小程序一樣，是百度為售賣搜索營銷、云服務(wù)等產(chǎn)品的新切入點。

　　但無論是to B的客服機器人，還是to C的各種Prompt，都不具備獨特性，很難成為大模型的引爆應(yīng)用�，F(xiàn)在呈現(xiàn)在用戶面前的智能體、大模型應(yīng)用，都還是只停留在優(yōu)化工具的階段，只不過是讓搜索變得智能了一點。就像王小川（百川智能創(chuàng)始人兼首席執(zhí)行官）所說，是在聚焦于搜索如何使用大模型，而不是大模型如何學會用好搜索。

　　理想狀態(tài)下，智能體應(yīng)該能夠調(diào)用工具，完成更為復雜的任務(wù)，而不僅僅是聊天。這里需要提到，無論Rabbit R1是否只是一個安卓App的套殼產(chǎn)品，但其結(jié)合大語言模型和所謂大動作模型對APP使用體驗的創(chuàng)造性升級，似乎更接近于一個智能體理想中的狀態(tài)——通過不斷學習理解人的復雜意圖，模仿人的動作執(zhí)行復雜操作。

　　我會比較贊同楊植麟所說的，技術(shù)是這個時代唯一新變量。無論是在to B還是to C場景中，在其他變量都沒有變的情況下，技術(shù)對語言的理解越來越精準，對人類意圖、行為的理解越來越精準，其能夠處理的任務(wù)就會越來越復雜，智能體的能力才會越來越強大。

　　Kimi的走紅，已經(jīng)證明大模型應(yīng)用具備了被引爆的市場基礎(chǔ)。Kimi于2023年10月上線，2024年2月日活訪問量已經(jīng)在國內(nèi)排到前三，在3月將無損上下文長度從最初的20多萬字增加到200萬字后，Kimi關(guān)注度繼續(xù)走高，連續(xù)五次擴容，訪問量環(huán)比增長321.58%。

　　沒有共識就是最好的共識

　　當下還未解決的是，何時會出現(xiàn)一款讓大眾用戶保持高頻使用的超級應(yīng)用。就大模型的應(yīng)用現(xiàn)狀來看，國內(nèi)和國外都還處于工具優(yōu)化階段，只是取決于大模型不同的性能，效果上會有所不同。比如，Adobe對AI的最新應(yīng)用仍聚焦于AI圖像編輯功能的創(chuàng)新和改進，文生圖功能的推出，以及視頻內(nèi)容的換頭、延長和輔助鏡頭的生成。

　　面向未來，讓大模型學會使用工具，而不依賴人工微調(diào)，是技術(shù)發(fā)展的又一個節(jié)點。扎克伯格說，「對于Llama-3，當我們開始進入更多這些類似于智能體的行為時，我認為其中一些將是更多手工設(shè)計的。我們對Llama-4的目標將是將更多這樣的東西納入模型�！�

　　最終能力的大幅提升，依然有賴于大模型本身的進步。但是，大模型的每一次進步，都需要耗費一筆相當龐大的資金。根據(jù)THE DECODER披露，GPT-4一次訓練成本為6300萬美元。而根據(jù)AI Index的估算，OpenAI的GPT-4估計使用了價值7800萬美元的計算資源進行訓練，谷歌的Gemini Ultra 的計算成本則高達1.91億美元。

　　高昂的訓練成本也是國內(nèi)在大模型方面沒有形成共識的原因之一。國內(nèi)大模型的融資額度要低于國外。月之暗面在2月獲得了10億美元A輪投資，Minimax3月被傳獲得6億美元戰(zhàn)略投資。相較于亞馬遜向Anthropic追加的27.5億美元投資，都不算多。而且國內(nèi)的環(huán)境并不利于大模型的進一步融資。

　　對大模型技術(shù)未來發(fā)展的差異化預期是另外一個原因。一部分開源大模型的支持者會認為，開源大模型與閉源大模型的發(fā)展會受到大模型技術(shù)發(fā)展坡度的影響，坡度越陡，閉源的優(yōu)勢越大，一旦坡度變緩，開源會很快追趕上來。

　　等待開源大模型追趕上來的人，都預期大模型技術(shù)發(fā)展的坡度會在短時間內(nèi)變緩。這樣閉源大模型與開源大模型的差距就會相對縮小。而提前深耕場景，積累了一定數(shù)據(jù)的企業(yè)則能夠利用開源大模型構(gòu)筑不低于閉源大模型企業(yè)的場景壁壘。

　　對于小企業(yè)而言，以應(yīng)用場景為目標訓練小技能，然后不斷根據(jù)技術(shù)進步重新「練號」，可以在這個大技術(shù)趨勢下不斷抓到小風口，甚至在大風口到來時，以插件的形式參與其中。對于巨頭企業(yè)來說，其優(yōu)勢是多場景的融合，是對核心入口的爭搶，「重開新號」的代價太高，技術(shù)的迭代往往意味著一場淘汰賽的開啟。

　　基于融資能力的不同、對技術(shù)應(yīng)用前景預期的不同、自身體量的不同，企業(yè)之間的共識并沒有形成。

　　這是一個好消息，說明大模型領(lǐng)域還遠未像新能源車一樣進入到市場成熟階段。雖然不確定性會增加失敗的風險，但其中也蘊藏著的機會也更大，足以說服一部分企業(yè)冒險前行，追求技術(shù)的高峰。

　　可以理解中局的無奈，卻不應(yīng)放棄對終局的堅持。

　　文章內(nèi)容僅供閱讀，不構(gòu)成投資建議，請謹慎對待。投資者據(jù)此操作，風險自擔。

[No. ]
分享到微信