國產(chǎn)大模型落地，等一個(gè)“Sora時(shí)刻”

2024年03月12日 10:08:41 來源：刺猬公社公眾號(hào)

　　僅憑幾十個(gè)提示詞，就能生成一段流暢完整、視角多元的視頻，其內(nèi)容質(zhì)量幾乎能以假亂真，甚至不亞于專業(yè)拍攝團(tuán)隊(duì)，這就是OpenAI首款文生視頻產(chǎn)品Sora，一經(jīng)發(fā)布便激起千層浪，讓全球感受到新的AI震撼。

　　2024年的AI故事，伴隨著這款殺手級(jí)應(yīng)用的橫空出世拉開帷幕，Sora再度讓所有人注意到了AI的無限可能性，為略顯疲軟的市場(chǎng)再打了一針雞血。

　　回看2023年，AI產(chǎn)業(yè)迎來了空前發(fā)展，海內(nèi)外AI企業(yè)如雨后春筍，國內(nèi)更是迎來了聲勢(shì)浩大的“百模大戰(zhàn)”，通義千問、文心一言、智譜AI、盤古大模型.....卷多模態(tài)、卷算力、卷token，一時(shí)間百家爭鳴。

　　但一個(gè)核心的問題仍舊盤桓在所有人頭上:大模型產(chǎn)品到底如何實(shí)現(xiàn)商業(yè)落地?商業(yè)是技術(shù)發(fā)展的內(nèi)生動(dòng)力之一，唯有業(yè)務(wù)飛輪轉(zhuǎn)動(dòng)起來，才能讓企業(yè)們真正走向未來。

　　垂直大模型，走向落地

　　2023年的“百模大戰(zhàn)”到底為行業(yè)帶來了什么?

　　或許是一個(gè)清晰的商業(yè)認(rèn)知:垂直化，才是大模型走向落地的實(shí)際路徑。

　　“事實(shí)上AI大模型產(chǎn)業(yè)還處在一個(gè)很初級(jí)的階段，創(chuàng)造的內(nèi)容、解決的問題還相對(duì)比較初級(jí)。”初心資本合伙人李可佳向刺猬公社表示。

　　初心資本是國內(nèi)一家專注于人工智能、智能硬件、前沿科技及探索性投資的早期股權(quán)投資機(jī)構(gòu)，對(duì)于AI產(chǎn)業(yè)有著較深的洞察。

　　李可佳用丹尼爾·卡尼曼《思考，快與慢》一書中的系統(tǒng)概念為我們解釋了目前大模型產(chǎn)業(yè)的發(fā)展階段:

　　丹尼爾·卡尼曼認(rèn)為，在人的大腦中有兩套系統(tǒng)，系統(tǒng)1指的是快系統(tǒng)，是一種涉及直覺的思維方式，用于快速?zèng)Q策。它做出決策的依據(jù)主要依賴于偏差、偏見和錯(cuò)誤的啟發(fā)法，它是無意識(shí)且快速的;系統(tǒng)2則是一種慢系統(tǒng)，它更為慢速和理性，負(fù)責(zé)對(duì)系統(tǒng)1進(jìn)行有意識(shí)的控制，特別是在涉及復(fù)雜問題的情形中，是否形成系統(tǒng)2也是區(qū)分人與動(dòng)物的重要指標(biāo)。

　　“現(xiàn)在整個(gè)產(chǎn)業(yè)的發(fā)展仍處于系統(tǒng)1階段，在對(duì)創(chuàng)造力要求比較高的文科、藝術(shù)等領(lǐng)域，AI已經(jīng)有很好的表現(xiàn)，它的泛化能力也非常強(qiáng)，但如果希望它能解決一些很實(shí)際復(fù)雜的技術(shù)問題、商業(yè)問題，我們?nèi)匀恍枰却?lsquo;系統(tǒng)2’的到來。”

　　AI目前正處于互聯(lián)網(wǎng)的“雅虎時(shí)刻”，甚至還沒有發(fā)展到“谷歌崛起”。OpenAI Sora這樣的明星產(chǎn)品固然能讓人提振信心，但商業(yè)落地問題是全行業(yè)都要面對(duì)的問題:

　　目前人們已經(jīng)能與AI展開對(duì)話、通過AI生成文本、圖像、甚至高質(zhì)量的視頻，但問題在于，這些生成能力目前還處在較低水平，Sora還不夠多，當(dāng)幻覺與新鮮感散去，在C端難做突破的大模型們，該去哪里實(shí)現(xiàn)自己的價(jià)值?

　　B端是較為實(shí)際的出路。

　　這也是李可佳口中的“系統(tǒng)2”發(fā)展方向，通過理性、高效的AI為商務(wù)、工業(yè)提供助力，從而深刻改變整個(gè)產(chǎn)業(yè)，這也是大模型商業(yè)落地最實(shí)際的方向。但另一個(gè)事實(shí)是，通用大模型往往不能很高效快速地適配于企業(yè)的需要。

　　于是，大模型產(chǎn)業(yè)走向垂直化、細(xì)分化、專業(yè)化，已經(jīng)成為了未來最重要的趨勢(shì)之一。

　　無論是GPT還是其他基于Transformer架構(gòu)下的大模型產(chǎn)品，其生成反饋的原則都并非線性的邏輯思考，而是根據(jù)“學(xué)到的知識(shí)和規(guī)律”來進(jìn)行概率組合，這也是為何大模型學(xué)的越多越強(qiáng)悍的原因。

　　通用大模型的問題就是，它學(xué)習(xí)的主要是通用的、可公開的知識(shí)數(shù)據(jù)，針對(duì)擁有信息壁壘的產(chǎn)業(yè)領(lǐng)域，通用大模型很難發(fā)揮作用。

　　這也是目前國內(nèi)外許多廠商在做的。在教育、政企服務(wù)、醫(yī)療等領(lǐng)域，許多大模型都開始了走向垂直化，包括網(wǎng)易的子曰教育大模型、專注政企客戶的雅意大模型、在金融、醫(yī)療等領(lǐng)域深耕的百川大模型等。

　　通過小而精的訓(xùn)練方法，不僅能夠突破大模型無法解決專業(yè)問題的阻礙，還能進(jìn)一步降低成本，讓大規(guī)模推廣成為可能。

　　“以前很多人都認(rèn)為，只要模型的規(guī)模夠大，過了多少億參數(shù)，模型就能達(dá)到很強(qiáng)的能力，但其實(shí)其對(duì)于任務(wù)的理解能力還是比較淺顯的。”

　　在2023年底，雅意2.0大模型發(fā)布時(shí)，中科聞歌董事長王磊曾向刺猬公社表示，在他看來，垂直專業(yè)才是大模型發(fā)展的未來方向，雅意2.0大模型也同樣遵循了這樣一個(gè)方向，不再一味的追求規(guī)模與C端反饋，而是選擇摒棄娛樂向的內(nèi)容，將更多專業(yè)知識(shí)數(shù)據(jù)融入訓(xùn)練中，從而實(shí)現(xiàn)更好的政企服務(wù)。

　　那么有哪些產(chǎn)業(yè)能夠更快的實(shí)現(xiàn)“大模型化”呢?

　　李可佳認(rèn)為這主要看行業(yè)的容錯(cuò)率與專業(yè)度。在智慧教育領(lǐng)域的多年深耕讓他認(rèn)識(shí)到，在容錯(cuò)率相對(duì)較高、對(duì)專業(yè)精準(zhǔn)要求相對(duì)較低的領(lǐng)域，AI帶來的變革將更容易發(fā)生。“在拍搜、語言學(xué)習(xí)這些領(lǐng)域，大模型帶來的效率提升是非常顯著的。”

　　他認(rèn)為，醫(yī)療、金融等領(lǐng)域也正在產(chǎn)生變革，伴隨著大模型能力的不斷進(jìn)化，更多工業(yè)、科技領(lǐng)域的生產(chǎn)制造都會(huì)迎來一場(chǎng)AI改造。

　　AI Agent:突破AI需求困境

　　那么如何將大模型的能力更直接的運(yùn)用到我們的生產(chǎn)過程中?AI Agent或許是一種更現(xiàn)實(shí)的路徑。

　　“可以這樣構(gòu)想一下，我還在做別的工作或是休息，在一個(gè)類似元宇宙的空間里，我的AI Agent(代理)與另外一位創(chuàng)業(yè)者的AI Agent相遇，它們聊的很開心，或許等我醒過來，我的AI Agent就拿著對(duì)方的商業(yè)計(jì)劃書來給我看了。”

　　AI Agent在未來將成為人與AI大模型連接的工具，成為AI領(lǐng)域繼GPT、文心一言等大模型產(chǎn)品的下一個(gè)熱點(diǎn)，正在被越來越多人所認(rèn)同。

　　一位AI從業(yè)者向刺猬公社表示，AI Agent不僅僅會(huì)成為便利工作生活的工具，還能真正推動(dòng)大模型從B端到C端的實(shí)際落地，推動(dòng)AI產(chǎn)業(yè)的商業(yè)化成熟。

　　換言之，AI Agent是AI產(chǎn)品更成熟的形態(tài)，它真正的使命就在于將AI能力封裝化，讓C端、B端用戶都能更便捷更直觀的運(yùn)用，從而助力生產(chǎn)力的解放。如果說大模型產(chǎn)品只能被動(dòng)的接收-生成，那么Agent的使命要復(fù)雜的多，它更類似智能助手，需要借助自身的AI能力幫助使用者解決切實(shí)問題。

　　“其實(shí)這是一種AI native的認(rèn)知。”李可佳表示，不同于很多企業(yè)+AI的思維，Agent事實(shí)上是一種AI+的邏輯。

　　“面對(duì)AI浪潮，我們不能只去想如何利用AI能力加持我們已有的業(yè)務(wù)形式。我就認(rèn)識(shí)很多創(chuàng)業(yè)者，希望通過大模型提升自己的Saas服務(wù)能力，比如做一個(gè)郵件營銷的生成式AI產(chǎn)品等等，但他們卻忽略了一點(diǎn)，以后有些SaaS類產(chǎn)品可能都直接autopilot了，這個(gè)產(chǎn)品對(duì)應(yīng)的環(huán)節(jié)可能都沒了。”

　　Agent的意義就在于，它正在改變著人機(jī)協(xié)作的邏輯:

　　不僅僅是協(xié)助工作，AI就可以獨(dú)自幫助使用者完成任務(wù)，它不需要事實(shí)的提示詞輸入，也不需要使用者一步步的繁雜操作，只需要一個(gè)指令，Agent就能幫你完成很多在過去時(shí)代無比復(fù)雜的工作，比如數(shù)據(jù)分析、廣告營銷投放、甚至是社交、銷售這樣主觀性很強(qiáng)的工作。

　　這幾乎是革命性的，在Agent日漸成熟的情況下，很多行業(yè)的許多環(huán)節(jié)都能夠被改寫，甚至取代。

　　GPTs就是OpenAI針對(duì)Agent概念推出的產(chǎn)品之一，定制化的GPT機(jī)器人、能夠滿足不同的使用需要、專注于不同的領(lǐng)域，GPTs的推出一度讓全球Agent企業(yè)大感危機(jī)。

　　目前來看，GPTs似乎還沒有達(dá)到Agent的程度，對(duì)于國內(nèi)外的許多AI 企業(yè)來說，機(jī)會(huì)仍然存在。

　　但Agent不是更智能的AI聊天機(jī)器人，其最主要的能力是主動(dòng)調(diào)用AI工具，為使用者解決問題，想要實(shí)現(xiàn)這樣的能力，除了技術(shù)能力外，與Agent背后的大模型基底息息相關(guān)，比如多模態(tài)的輸入輸出能力、幻覺問題、多輪交互的高效靠譜，都將影響Agent的表現(xiàn)。

　　更重要的是，Agent的應(yīng)用往往要與不同的產(chǎn)業(yè)領(lǐng)域、應(yīng)用場(chǎng)景相結(jié)合，這就與前面提到的垂直化趨勢(shì)深度相關(guān)。

　　現(xiàn)如今國內(nèi)也已經(jīng)出現(xiàn)了很多垂直領(lǐng)域的Agent產(chǎn)品，百度研發(fā)的營銷Agent輕舸、釘釘、飛書的AI辦公助理，這些企業(yè)從自身已有的產(chǎn)品和業(yè)務(wù)優(yōu)勢(shì)出發(fā)，希望借助Agent創(chuàng)造新的產(chǎn)品邏輯，從而實(shí)現(xiàn)產(chǎn)品的二次成長。

　　以釘釘?shù)腁I Agent為例，其AI 助理可以與釘釘本身“融為一體”，根據(jù)用戶的指令，與平臺(tái)上的應(yīng)用和第三方插件、企業(yè)自建應(yīng)用等結(jié)合，對(duì)這些功能進(jìn)行調(diào)用。這樣一來，也讓釘釘龐大的插件和應(yīng)用庫變得簡單易用，用戶不再需要一個(gè)個(gè)找應(yīng)用，AI 助理就可以做到更符合用戶使用場(chǎng)景的匹配。

　　類似釘釘AI助理這樣的產(chǎn)品，正在解決大模型的“偽需求”困境，帶有強(qiáng)烈的“AI native”思維。當(dāng)更好用、更有效的Agent產(chǎn)品被用戶看見、使用，甚至解決工作生活中的種種痛點(diǎn)，大模型的商業(yè)落地難題也終將得到解決。

　　從娛樂需求，到更廣闊的世界

　　現(xiàn)如今整個(gè)產(chǎn)業(yè)到底還面臨著哪些問題?

　　最重要的仍是技術(shù)能力問題。“如果從創(chuàng)業(yè)的角度出發(fā)來看，或許你在進(jìn)行邏輯推演時(shí)，能夠獲得一個(gè)不錯(cuò)的推算結(jié)果，但真正重要的還是能否讓用戶感受到‘神奇時(shí)刻’。”李可佳表示。

　　對(duì)于大模型產(chǎn)品來說，最重要的仍舊是通過技術(shù)解決用戶需求的能力，自ChatGPT橫空出世以來，無數(shù)人都認(rèn)為大模型產(chǎn)品將改變整個(gè)互聯(lián)網(wǎng)的生產(chǎn)邏輯，但未來的進(jìn)程似乎要遠(yuǎn)慢于我們的期望。

　　歸根結(jié)底，是大多數(shù)大模型產(chǎn)品的能力遠(yuǎn)沒有達(dá)到“神奇時(shí)刻”，簡單的多輪對(duì)話或許能為用戶帶來一刻的驚艷，但缺乏實(shí)際解決問題的能力。

　　“質(zhì)量信號(hào)沒有達(dá)到效果，還要看數(shù)量信號(hào)，也就是用戶的留存情況。”這也與產(chǎn)品的實(shí)用性相關(guān)，GPT能夠在全球席卷上億用戶，除了出類拔萃的能力外，優(yōu)質(zhì)的交互體驗(yàn)，不斷推出的多模態(tài)生成產(chǎn)品，都是關(guān)鍵因素。

　　有Sora這樣的殺手級(jí)應(yīng)用，OpenAI自然不會(huì)為用戶、商業(yè)化發(fā)愁，但對(duì)于其他玩家來說，除了在研發(fā)上下苦功外，垂直專業(yè)化、加強(qiáng)體驗(yàn)、創(chuàng)建多元應(yīng)用場(chǎng)景就成為了重要的路徑。

　　除此之外，拋開大模型產(chǎn)品、Agent等固有思路，大模型還有許多新的機(jī)會(huì)。

　　作為早期投資市場(chǎng)的布局者，李可佳和所在的初心資本的投資邏輯可以概括為“兩橫三縱”，在這樣一個(gè)坐標(biāo)圖譜中，蘊(yùn)含著初心觀察到的產(chǎn)業(yè)機(jī)會(huì)。

　　“兩橫分別是人才紅利和供應(yīng)鏈紅利，在過去十幾年中國移動(dòng)互聯(lián)網(wǎng)的飛速發(fā)展之下，整個(gè)行業(yè)培養(yǎng)了大量的工程師、科研人員，在全球都有著不少的優(yōu)勢(shì)，另一方面，中國在制造業(yè)上擁有很強(qiáng)的優(yōu)勢(shì)，尤其是在3C硬件等領(lǐng)域，我們的制造業(yè)供應(yīng)鏈相當(dāng)完備。”

　　以這樣兩個(gè)紅利為基礎(chǔ)，三縱則代表了幾個(gè)重要的技術(shù)變量，第一就是生成式AI，其余兩縱則為算力的性能躍遷和電動(dòng)化到智能化的變遷。三縱與兩橫之間的許多交叉點(diǎn)則蘊(yùn)含著新的機(jī)會(huì)，例如AI+硬件、AI+元宇宙、AI+XR等可能，都正被深切關(guān)注著。

　　在海外，Rabbit R1等AI Pin硬件令人關(guān)注，而在國內(nèi)，榮耀、OPPO等廠商相繼推出AI產(chǎn)品、AI手機(jī)等，希望實(shí)現(xiàn)彎道超車;在XR領(lǐng)域，萬眾矚目的Vision Pro同樣與AI有著千絲萬縷的聯(lián)系，在AI大模型的支持下，新的世界圖景正在逐漸展開。

　　但最重要的仍舊是AI native思維。

　　“最讓我感覺興奮的是，在硅谷這些地方，我們接觸到了很多非常年輕的創(chuàng)業(yè)者，他們從不懷疑AI能否改變世界，他們的創(chuàng)業(yè)項(xiàng)目，都是基于AI時(shí)代已經(jīng)到來的前提下開展的。”李可佳向我們回憶，而這些AI native思維加持下的創(chuàng)業(yè)者，也讓他真正看到了未來的圖景。

　　“新的技術(shù)正在改變世界的每個(gè)角落，如果沉溺在舊世界里，很可能會(huì)被時(shí)代拋棄。”

　　文章內(nèi)容僅供閱讀，不構(gòu)成投資建議，請(qǐng)謹(jǐn)慎對(duì)待。投資者據(jù)此操作，風(fēng)險(xiǎn)自擔(dān)。

[No. ]
分享到微信