確定性的機會指向的往往是需求場景,需要實干家,不斷優(yōu)化體驗;而不確定的機會往往依托于技術(shù)創(chuàng)新,需要冒險家,探索出一條通向應(yīng)用的路徑。這也是為什么人們不會驚訝于雷軍下場造車的決心,卻很難完全相信楊植麟在月之暗面創(chuàng)業(yè)過程中表現(xiàn)出來的技術(shù)理想主義。
在大模型領(lǐng)域,并沒有形成像新能源車一樣的市場共識。企業(yè)在確定性和不確定性之間進行的權(quán)衡,是引發(fā)行業(yè)分歧的主要原因。選擇確定性還是擁抱不確定性,決定了企業(yè)是優(yōu)先賺到錢,還是優(yōu)先做好技術(shù);是堅持做閉源大模型,還是賭開源大模型一定會迎頭趕上;是要依靠通用模型催生引爆行業(yè)的超級應(yīng)用,還是要通過小模型先占領(lǐng)細分市場。
當前的環(huán)境下,企業(yè)和投資人都會從更現(xiàn)實的角度去做考量,活下去、掙到錢,比一個不確定的理想愿景更能說服人。但人們對大模型的期待是給行業(yè)帶來更徹底地改變。從長遠來看,現(xiàn)在很多企業(yè)的大模型應(yīng)用,還是在對原有工具進行小修小補,很難產(chǎn)生引爆技術(shù)的應(yīng)用,也很難抵御未來大模型技術(shù)迭代帶來的洗牌。
泛濫的「智能體」是最明顯的一個例子。國產(chǎn)大模型的落地催生出各種被冠以智能體名號的聊天機器人和「XX助手」。百度文心一言中充斥著大量伏地魔、繁花-爺叔這樣的模擬對話機器人;kimi+上也出現(xiàn)了公文筆桿子、i人嘴替等個人助理;字節(jié)豆包在抖音上的推廣也都依靠批改作業(yè)、練習英語口語等簡單的功能點來吸引用戶。
很難想象這樣的聊天機器人能有多強大的生命力。如果我們對于大模型的期待僅停留在追求確定性的階段——利用其提升智能客服的對話體驗,提高資料搜集整理的效率以及擴充某些圖像或生成某些代碼,那么大模型能夠產(chǎn)生的實際價值或?qū)⑦h不及我們現(xiàn)在的預期。
大模型殺手級應(yīng)用的出現(xiàn)一定是要革掉某個現(xiàn)有體驗的命。現(xiàn)在來看,沒有共識就是最好的消息,至少說明這個市場上,不是所有人都只滿足于眼前的利益,還有人在沿著另一條邏輯路線前行,在不確定中尋找更大的可能,去打一場持久戰(zhàn)。
大模型的兩種邏輯
中局和終局是大模型領(lǐng)域目前比較有代表性的兩種發(fā)展邏輯。
中局的邏輯以朱嘯虎(金沙江創(chuàng)投主管合伙人)為代表,包括一部分聚焦應(yīng)用層的創(chuàng)業(yè)者在內(nèi),致力于利用開源大模型快速構(gòu)建服務(wù)于細分需求的小模型,然后通過數(shù)據(jù)積累和模型迭代,建立競爭門檻;終局的邏輯以月之暗面為代表,傾向繼續(xù)投入于大模型能力的提升,等待技術(shù)迭代引爆超級應(yīng)用。
在中局的邏輯里,大模型的理解、決策能力被融合到既有的場景中,讓這些場景能夠應(yīng)用大模型的生成能力,提升解決方案的性能,從而產(chǎn)生新的商業(yè)化可能性。這種邏輯受到青睞的原因是,有確定性需求,可以迅速見到成效,用戶付費意愿更強。
在朱嘯虎的介紹中,一家利用開源大模型做AI視頻面試的企業(yè)2023年的收入比2022年翻了一倍;利用開源大模型做AIGC視頻廣告的公司2023年收入做到了5000多萬元,比2022年漲了四五倍。
朱嘯虎追求的機會是,利用LLaMA這種快速提升的開源大模型,結(jié)合垂直場景的數(shù)據(jù)積累和人工微調(diào),在幾個月內(nèi)提升某一垂直場景的效率,在大模型發(fā)展過程中先賺到第一桶金。
朱嘯虎對大模型的發(fā)展持悲觀預期,對應(yīng)用場景的開發(fā)保持樂觀,主張從實際出發(fā),把能賺的錢先賺到。
月之暗面的創(chuàng)始人楊植麟的理念則更具技術(shù)理想主義色彩,他相信大模型會逐步完成對世界的建模,并在這個過程中自然涌現(xiàn)出殺手級應(yīng)用。
楊植麟的終局邏輯下,大模型是一種解釋世界的工具,就像人會用語言描述世界、理解世界一樣,大模型用數(shù)學為語言建模,讓AI也能夠理解世界,描述世界。AI依靠這種學習能力,逐步實現(xiàn)像人一樣使用工具,讓AGI成為幫助人鏈接和管理細分場景的「助理」。
AI能夠使用工具,也就意味著很多場景的運作方式將會迎來巨大改變?赡芷髽I(yè)未來并不需要有一個專門的視頻面試工具,也不需要有獨立的AI客服,而是統(tǒng)合到一個大模型主導的企業(yè)級智能體中,依靠智能體打通和掌控企業(yè)的不同環(huán)節(jié)。
在即將被OpenAI帶火的AI搜索中,真正的難點不是搜索結(jié)果到底要以網(wǎng)頁列表的形式顯示,還是以經(jīng)過AI整合的一段話來顯示,而是如何利用AI的理解能力,把被APP分解的信息重新鏈接成為一個整體。在Kimi+中,可以看到什么值得買、小紅書的相關(guān)內(nèi)容可以借助個人助理「什么值得買」和「美好生活指南」來進行喚醒。
但隨著楊植麟2個月套現(xiàn)4000萬美元的消息傳出,市場對他的這種終局邏輯產(chǎn)生了質(zhì)疑。月之暗面直接面向C端用戶的思路,獲客成本高且營收前景低。在沒有新的變化出現(xiàn)前,月之暗面商業(yè)化前景的不明朗被認為是楊植麟信心不足,急于套現(xiàn)的原因。
聊天機器人發(fā)揚不了大模型
從目前來看,國內(nèi)的大模型應(yīng)用給到嘗鮮者的總體感覺還處于大而無當階段,提出問題之后獲得的答案很難讓人滿意。這一方面受限于大模型自身的技術(shù)能力不足,另一方面則受限于用戶對大模型應(yīng)用使用經(jīng)驗的不足。
很多大模型應(yīng)用推出之初,都僅有一個對話框,用戶可以在對話框中提出任何問題并獲得答案。而利用精準的Prompt充分開發(fā)大模型的現(xiàn)有能力,成為大部分用戶難以在短時間內(nèi)逾越的門檻。
目前充斥在文心一言、豆包等大模型應(yīng)用中的智能體,很多都是為了降低大模型的使用門檻而打包的Prompt,也就是將一些用戶的使用經(jīng)驗沉淀為可以被分享的智能體,讓用戶可以按照需求找到不同的智能體,獲得更具針對性、更有效的回答。
Prompt門檻的出現(xiàn)本質(zhì)上還是大模型在語言理解能力上存在欠缺。用戶即便利用現(xiàn)成的Prompt獲得了有效信息,也依然要面對不成熟的體驗。Prompt或者所謂的智能體,可以解決初次溝通的效率問題,但解決不了復雜對話的效果問題,大模型應(yīng)用往往都不止一輪對話。
這也是為什么智能體面向B端的商業(yè)化運作依然停留在客服、營銷領(lǐng)域,并沒有能推進到其他生產(chǎn)生活領(lǐng)域中。因為客服、營銷領(lǐng)域在大模型應(yīng)用之前就已經(jīng)實現(xiàn)了基礎(chǔ)的智能對話體驗,大模型的理解能力可以讓互動變得更加靈活、自然。
從李彥宏(百度創(chuàng)始人)演講中提到的案例可以看到,百度在企業(yè)智能體方面的實踐是提供了一套結(jié)合大模型的無代碼客服機器人生成工具。企業(yè)可以上傳私域知識,自動形成對話語料,也可以過濾不在自己經(jīng)營范圍內(nèi)的內(nèi)容,還能關(guān)聯(lián)第三方的工具。
被包裝為智能體的客服機器人,會服務(wù)于百度的搜索生態(tài)。當用戶在百度APP搜索「什么時候去新加坡人最少」時,會在最前面顯示新加坡旅游局AI分身給到的答案,點擊可以進行更多對話。這種智能體本質(zhì)上和之前的百家號、小程序一樣,是百度為售賣搜索營銷、云服務(wù)等產(chǎn)品的新切入點。
但無論是to B的客服機器人,還是to C的各種Prompt,都不具備獨特性,很難成為大模型的引爆應(yīng)用,F(xiàn)在呈現(xiàn)在用戶面前的智能體、大模型應(yīng)用,都還是只停留在優(yōu)化工具的階段,只不過是讓搜索變得智能了一點。就像王小川(百川智能創(chuàng)始人兼首席執(zhí)行官)所說,是在聚焦于搜索如何使用大模型,而不是大模型如何學會用好搜索。
理想狀態(tài)下,智能體應(yīng)該能夠調(diào)用工具,完成更為復雜的任務(wù),而不僅僅是聊天。這里需要提到,無論Rabbit R1是否只是一個安卓App的套殼產(chǎn)品,但其結(jié)合大語言模型和所謂大動作模型對APP使用體驗的創(chuàng)造性升級,似乎更接近于一個智能體理想中的狀態(tài)——通過不斷學習理解人的復雜意圖,模仿人的動作執(zhí)行復雜操作。
我會比較贊同楊植麟所說的,技術(shù)是這個時代唯一新變量。無論是在to B還是to C場景中,在其他變量都沒有變的情況下,技術(shù)對語言的理解越來越精準,對人類意圖、行為的理解越來越精準,其能夠處理的任務(wù)就會越來越復雜,智能體的能力才會越來越強大。
Kimi的走紅,已經(jīng)證明大模型應(yīng)用具備了被引爆的市場基礎(chǔ)。Kimi于2023年10月上線,2024年2月日活訪問量已經(jīng)在國內(nèi)排到前三,在3月將無損上下文長度從最初的20多萬字增加到200萬字后,Kimi關(guān)注度繼續(xù)走高,連續(xù)五次擴容,訪問量環(huán)比增長321.58%。
沒有共識就是最好的共識
當下還未解決的是,何時會出現(xiàn)一款讓大眾用戶保持高頻使用的超級應(yīng)用。就大模型的應(yīng)用現(xiàn)狀來看,國內(nèi)和國外都還處于工具優(yōu)化階段,只是取決于大模型不同的性能,效果上會有所不同。比如,Adobe對AI的最新應(yīng)用仍聚焦于AI圖像編輯功能的創(chuàng)新和改進,文生圖功能的推出,以及視頻內(nèi)容的換頭、延長和輔助鏡頭的生成。
面向未來,讓大模型學會使用工具,而不依賴人工微調(diào),是技術(shù)發(fā)展的又一個節(jié)點。扎克伯格說,「對于Llama-3,當我們開始進入更多這些類似于智能體的行為時,我認為其中一些將是更多手工設(shè)計的。我們對Llama-4的目標將是將更多這樣的東西納入模型!
最終能力的大幅提升,依然有賴于大模型本身的進步。但是,大模型的每一次進步,都需要耗費一筆相當龐大的資金。根據(jù)THE DECODER披露,GPT-4一次訓練成本為6300萬美元。而根據(jù)AI Index的估算,OpenAI的GPT-4估計使用了價值7800萬美元的計算資源進行訓練,谷歌的Gemini Ultra 的計算成本則高達1.91億美元。
高昂的訓練成本也是國內(nèi)在大模型方面沒有形成共識的原因之一。國內(nèi)大模型的融資額度要低于國外。月之暗面在2月獲得了10億美元A輪投資,Minimax3月被傳獲得6億美元戰(zhàn)略投資。相較于亞馬遜向Anthropic追加的27.5億美元投資,都不算多。而且國內(nèi)的環(huán)境并不利于大模型的進一步融資。
對大模型技術(shù)未來發(fā)展的差異化預期是另外一個原因。一部分開源大模型的支持者會認為,開源大模型與閉源大模型的發(fā)展會受到大模型技術(shù)發(fā)展坡度的影響,坡度越陡,閉源的優(yōu)勢越大,一旦坡度變緩,開源會很快追趕上來。
等待開源大模型追趕上來的人,都預期大模型技術(shù)發(fā)展的坡度會在短時間內(nèi)變緩。這樣閉源大模型與開源大模型的差距就會相對縮小。而提前深耕場景,積累了一定數(shù)據(jù)的企業(yè)則能夠利用開源大模型構(gòu)筑不低于閉源大模型企業(yè)的場景壁壘。
對于小企業(yè)而言,以應(yīng)用場景為目標訓練小技能,然后不斷根據(jù)技術(shù)進步重新「練號」,可以在這個大技術(shù)趨勢下不斷抓到小風口,甚至在大風口到來時,以插件的形式參與其中。對于巨頭企業(yè)來說,其優(yōu)勢是多場景的融合,是對核心入口的爭搶,「重開新號」的代價太高,技術(shù)的迭代往往意味著一場淘汰賽的開啟。
基于融資能力的不同、對技術(shù)應(yīng)用前景預期的不同、自身體量的不同,企業(yè)之間的共識并沒有形成。
這是一個好消息,說明大模型領(lǐng)域還遠未像新能源車一樣進入到市場成熟階段。雖然不確定性會增加失敗的風險,但其中也蘊藏著的機會也更大,足以說服一部分企業(yè)冒險前行,追求技術(shù)的高峰。
可以理解中局的無奈,卻不應(yīng)放棄對終局的堅持。
文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹慎對待。投資者據(jù)此操作,風險自擔。
2024年的Adobe MAX 2024發(fā)布會上,Adobe推出了最新版本的Adobe Creative Cloud。
奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。
“以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進了21600元。
華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實質(zhì)性的幫助,雙十一期間低至2799元,性價比很高,簡直是創(chuàng)作者們的首選。
9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會——工業(yè)互聯(lián)網(wǎng)標識解析專題論壇在沈陽成功舉辦。