僅憑幾十個(gè)提示詞,就能生成一段流暢完整、視角多元的視頻,其內(nèi)容質(zhì)量幾乎能以假亂真,甚至不亞于專業(yè)拍攝團(tuán)隊(duì),這就是OpenAI首款文生視頻產(chǎn)品Sora,一經(jīng)發(fā)布便激起千層浪,讓全球感受到新的AI震撼。
2024年的AI故事,伴隨著這款殺手級(jí)應(yīng)用的橫空出世拉開帷幕,Sora再度讓所有人注意到了AI的無限可能性,為略顯疲軟的市場(chǎng)再打了一針雞血。
回看2023年,AI產(chǎn)業(yè)迎來了空前發(fā)展,海內(nèi)外AI企業(yè)如雨后春筍,國內(nèi)更是迎來了聲勢(shì)浩大的“百模大戰(zhàn)”,通義千問、文心一言、智譜AI、盤古大模型.....卷多模態(tài)、卷算力、卷token,一時(shí)間百家爭鳴。
但一個(gè)核心的問題仍舊盤桓在所有人頭上:大模型產(chǎn)品到底如何實(shí)現(xiàn)商業(yè)落地?商業(yè)是技術(shù)發(fā)展的內(nèi)生動(dòng)力之一,唯有業(yè)務(wù)飛輪轉(zhuǎn)動(dòng)起來,才能讓企業(yè)們真正走向未來。
垂直大模型,走向落地
2023年的“百模大戰(zhàn)”到底為行業(yè)帶來了什么?
或許是一個(gè)清晰的商業(yè)認(rèn)知:垂直化,才是大模型走向落地的實(shí)際路徑。
“事實(shí)上AI大模型產(chǎn)業(yè)還處在一個(gè)很初級(jí)的階段,創(chuàng)造的內(nèi)容、解決的問題還相對(duì)比較初級(jí)。”初心資本合伙人李可佳向刺猬公社表示。
初心資本是國內(nèi)一家專注于人工智能、智能硬件、前沿科技及探索性投資的早期股權(quán)投資機(jī)構(gòu),對(duì)于AI產(chǎn)業(yè)有著較深的洞察。
李可佳用丹尼爾·卡尼曼《思考,快與慢》一書中的系統(tǒng)概念為我們解釋了目前大模型產(chǎn)業(yè)的發(fā)展階段:
丹尼爾·卡尼曼認(rèn)為,在人的大腦中有兩套系統(tǒng),系統(tǒng)1指的是快系統(tǒng),是一種涉及直覺的思維方式,用于快速?zèng)Q策。它做出決策的依據(jù)主要依賴于偏差、偏見和錯(cuò)誤的啟發(fā)法,它是無意識(shí)且快速的;系統(tǒng)2則是一種慢系統(tǒng),它更為慢速和理性,負(fù)責(zé)對(duì)系統(tǒng)1進(jìn)行有意識(shí)的控制,特別是在涉及復(fù)雜問題的情形中,是否形成系統(tǒng)2也是區(qū)分人與動(dòng)物的重要指標(biāo)。
“現(xiàn)在整個(gè)產(chǎn)業(yè)的發(fā)展仍處于系統(tǒng)1階段,在對(duì)創(chuàng)造力要求比較高的文科、藝術(shù)等領(lǐng)域,AI已經(jīng)有很好的表現(xiàn),它的泛化能力也非常強(qiáng),但如果希望它能解決一些很實(shí)際復(fù)雜的技術(shù)問題、商業(yè)問題,我們?nèi)匀恍枰却?lsquo;系統(tǒng)2’的到來。”
AI目前正處于互聯(lián)網(wǎng)的“雅虎時(shí)刻”,甚至還沒有發(fā)展到“谷歌崛起”。OpenAI Sora這樣的明星產(chǎn)品固然能讓人提振信心,但商業(yè)落地問題是全行業(yè)都要面對(duì)的問題:
目前人們已經(jīng)能與AI展開對(duì)話、通過AI生成文本、圖像、甚至高質(zhì)量的視頻,但問題在于,這些生成能力目前還處在較低水平,Sora還不夠多,當(dāng)幻覺與新鮮感散去,在C端難做突破的大模型們,該去哪里實(shí)現(xiàn)自己的價(jià)值?
B端是較為實(shí)際的出路。
這也是李可佳口中的“系統(tǒng)2”發(fā)展方向,通過理性、高效的AI為商務(wù)、工業(yè)提供助力,從而深刻改變整個(gè)產(chǎn)業(yè),這也是大模型商業(yè)落地最實(shí)際的方向。但另一個(gè)事實(shí)是,通用大模型往往不能很高效快速地適配于企業(yè)的需要。
于是,大模型產(chǎn)業(yè)走向垂直化、細(xì)分化、專業(yè)化,已經(jīng)成為了未來最重要的趨勢(shì)之一。
無論是GPT還是其他基于Transformer架構(gòu)下的大模型產(chǎn)品,其生成反饋的原則都并非線性的邏輯思考,而是根據(jù)“學(xué)到的知識(shí)和規(guī)律”來進(jìn)行概率組合,這也是為何大模型學(xué)的越多越強(qiáng)悍的原因。
通用大模型的問題就是,它學(xué)習(xí)的主要是通用的、可公開的知識(shí)數(shù)據(jù),針對(duì)擁有信息壁壘的產(chǎn)業(yè)領(lǐng)域,通用大模型很難發(fā)揮作用。
這也是目前國內(nèi)外許多廠商在做的。在教育、政企服務(wù)、醫(yī)療等領(lǐng)域,許多大模型都開始了走向垂直化,包括網(wǎng)易的子曰教育大模型、專注政企客戶的雅意大模型、在金融、醫(yī)療等領(lǐng)域深耕的百川大模型等。
通過小而精的訓(xùn)練方法,不僅能夠突破大模型無法解決專業(yè)問題的阻礙,還能進(jìn)一步降低成本,讓大規(guī)模推廣成為可能。
“以前很多人都認(rèn)為,只要模型的規(guī)模夠大,過了多少億參數(shù),模型就能達(dá)到很強(qiáng)的能力,但其實(shí)其對(duì)于任務(wù)的理解能力還是比較淺顯的。”
在2023年底,雅意2.0大模型發(fā)布時(shí),中科聞歌董事長王磊曾向刺猬公社表示,在他看來,垂直專業(yè)才是大模型發(fā)展的未來方向,雅意2.0大模型也同樣遵循了這樣一個(gè)方向,不再一味的追求規(guī)模與C端反饋,而是選擇摒棄娛樂向的內(nèi)容,將更多專業(yè)知識(shí)數(shù)據(jù)融入訓(xùn)練中,從而實(shí)現(xiàn)更好的政企服務(wù)。
那么有哪些產(chǎn)業(yè)能夠更快的實(shí)現(xiàn)“大模型化”呢?
李可佳認(rèn)為這主要看行業(yè)的容錯(cuò)率與專業(yè)度。在智慧教育領(lǐng)域的多年深耕讓他認(rèn)識(shí)到,在容錯(cuò)率相對(duì)較高、對(duì)專業(yè)精準(zhǔn)要求相對(duì)較低的領(lǐng)域,AI帶來的變革將更容易發(fā)生。“在拍搜、語言學(xué)習(xí)這些領(lǐng)域,大模型帶來的效率提升是非常顯著的。”
他認(rèn)為,醫(yī)療、金融等領(lǐng)域也正在產(chǎn)生變革,伴隨著大模型能力的不斷進(jìn)化,更多工業(yè)、科技領(lǐng)域的生產(chǎn)制造都會(huì)迎來一場(chǎng)AI改造。
AI Agent:突破AI需求困境
那么如何將大模型的能力更直接的運(yùn)用到我們的生產(chǎn)過程中?AI Agent或許是一種更現(xiàn)實(shí)的路徑。
“可以這樣構(gòu)想一下,我還在做別的工作或是休息,在一個(gè)類似元宇宙的空間里,我的AI Agent(代理)與另外一位創(chuàng)業(yè)者的AI Agent相遇,它們聊的很開心,或許等我醒過來,我的AI Agent就拿著對(duì)方的商業(yè)計(jì)劃書來給我看了。”
AI Agent在未來將成為人與AI大模型連接的工具,成為AI領(lǐng)域繼GPT、文心一言等大模型產(chǎn)品的下一個(gè)熱點(diǎn),正在被越來越多人所認(rèn)同。
一位AI從業(yè)者向刺猬公社表示,AI Agent不僅僅會(huì)成為便利工作生活的工具,還能真正推動(dòng)大模型從B端到C端的實(shí)際落地,推動(dòng)AI產(chǎn)業(yè)的商業(yè)化成熟。
換言之,AI Agent是AI產(chǎn)品更成熟的形態(tài),它真正的使命就在于將AI能力封裝化,讓C端、B端用戶都能更便捷更直觀的運(yùn)用,從而助力生產(chǎn)力的解放。如果說大模型產(chǎn)品只能被動(dòng)的接收-生成,那么Agent的使命要復(fù)雜的多,它更類似智能助手,需要借助自身的AI能力幫助使用者解決切實(shí)問題。
“其實(shí)這是一種AI native的認(rèn)知。”李可佳表示,不同于很多企業(yè)+AI的思維,Agent事實(shí)上是一種AI+的邏輯。
“面對(duì)AI浪潮,我們不能只去想如何利用AI能力加持我們已有的業(yè)務(wù)形式。我就認(rèn)識(shí)很多創(chuàng)業(yè)者,希望通過大模型提升自己的Saas服務(wù)能力,比如做一個(gè)郵件營銷的生成式AI產(chǎn)品等等,但他們卻忽略了一點(diǎn),以后有些SaaS類產(chǎn)品可能都直接autopilot了,這個(gè)產(chǎn)品對(duì)應(yīng)的環(huán)節(jié)可能都沒了。”
Agent的意義就在于,它正在改變著人機(jī)協(xié)作的邏輯:
不僅僅是協(xié)助工作,AI就可以獨(dú)自幫助使用者完成任務(wù),它不需要事實(shí)的提示詞輸入,也不需要使用者一步步的繁雜操作,只需要一個(gè)指令,Agent就能幫你完成很多在過去時(shí)代無比復(fù)雜的工作,比如數(shù)據(jù)分析、廣告營銷投放、甚至是社交、銷售這樣主觀性很強(qiáng)的工作。
這幾乎是革命性的,在Agent日漸成熟的情況下,很多行業(yè)的許多環(huán)節(jié)都能夠被改寫,甚至取代。
GPTs就是OpenAI針對(duì)Agent概念推出的產(chǎn)品之一,定制化的GPT機(jī)器人、能夠滿足不同的使用需要、專注于不同的領(lǐng)域,GPTs的推出一度讓全球Agent企業(yè)大感危機(jī)。
目前來看,GPTs似乎還沒有達(dá)到Agent的程度,對(duì)于國內(nèi)外的許多AI 企業(yè)來說,機(jī)會(huì)仍然存在。
但Agent不是更智能的AI聊天機(jī)器人,其最主要的能力是主動(dòng)調(diào)用AI工具,為使用者解決問題,想要實(shí)現(xiàn)這樣的能力,除了技術(shù)能力外,與Agent背后的大模型基底息息相關(guān),比如多模態(tài)的輸入輸出能力、幻覺問題、多輪交互的高效靠譜,都將影響Agent的表現(xiàn)。
更重要的是,Agent的應(yīng)用往往要與不同的產(chǎn)業(yè)領(lǐng)域、應(yīng)用場(chǎng)景相結(jié)合,這就與前面提到的垂直化趨勢(shì)深度相關(guān)。
現(xiàn)如今國內(nèi)也已經(jīng)出現(xiàn)了很多垂直領(lǐng)域的Agent產(chǎn)品,百度研發(fā)的營銷Agent輕舸、釘釘、飛書的AI辦公助理,這些企業(yè)從自身已有的產(chǎn)品和業(yè)務(wù)優(yōu)勢(shì)出發(fā),希望借助Agent創(chuàng)造新的產(chǎn)品邏輯,從而實(shí)現(xiàn)產(chǎn)品的二次成長。
以釘釘?shù)腁I Agent為例,其AI 助理可以與釘釘本身“融為一體”,根據(jù)用戶的指令,與平臺(tái)上的應(yīng)用和第三方插件、企業(yè)自建應(yīng)用等結(jié)合,對(duì)這些功能進(jìn)行調(diào)用。這樣一來,也讓釘釘龐大的插件和應(yīng)用庫變得簡單易用,用戶不再需要一個(gè)個(gè)找應(yīng)用,AI 助理就可以做到更符合用戶使用場(chǎng)景的匹配。
類似釘釘AI助理這樣的產(chǎn)品,正在解決大模型的“偽需求”困境,帶有強(qiáng)烈的“AI native”思維。當(dāng)更好用、更有效的Agent產(chǎn)品被用戶看見、使用,甚至解決工作生活中的種種痛點(diǎn),大模型的商業(yè)落地難題也終將得到解決。
從娛樂需求,到更廣闊的世界
現(xiàn)如今整個(gè)產(chǎn)業(yè)到底還面臨著哪些問題?
最重要的仍是技術(shù)能力問題。“如果從創(chuàng)業(yè)的角度出發(fā)來看,或許你在進(jìn)行邏輯推演時(shí),能夠獲得一個(gè)不錯(cuò)的推算結(jié)果,但真正重要的還是能否讓用戶感受到‘神奇時(shí)刻’。”李可佳表示。
對(duì)于大模型產(chǎn)品來說,最重要的仍舊是通過技術(shù)解決用戶需求的能力,自ChatGPT橫空出世以來,無數(shù)人都認(rèn)為大模型產(chǎn)品將改變整個(gè)互聯(lián)網(wǎng)的生產(chǎn)邏輯,但未來的進(jìn)程似乎要遠(yuǎn)慢于我們的期望。
歸根結(jié)底,是大多數(shù)大模型產(chǎn)品的能力遠(yuǎn)沒有達(dá)到“神奇時(shí)刻”,簡單的多輪對(duì)話或許能為用戶帶來一刻的驚艷,但缺乏實(shí)際解決問題的能力。
“質(zhì)量信號(hào)沒有達(dá)到效果,還要看數(shù)量信號(hào),也就是用戶的留存情況。”這也與產(chǎn)品的實(shí)用性相關(guān),GPT能夠在全球席卷上億用戶,除了出類拔萃的能力外,優(yōu)質(zhì)的交互體驗(yàn),不斷推出的多模態(tài)生成產(chǎn)品,都是關(guān)鍵因素。
有Sora這樣的殺手級(jí)應(yīng)用,OpenAI自然不會(huì)為用戶、商業(yè)化發(fā)愁,但對(duì)于其他玩家來說,除了在研發(fā)上下苦功外,垂直專業(yè)化、加強(qiáng)體驗(yàn)、創(chuàng)建多元應(yīng)用場(chǎng)景就成為了重要的路徑。
除此之外,拋開大模型產(chǎn)品、Agent等固有思路,大模型還有許多新的機(jī)會(huì)。
作為早期投資市場(chǎng)的布局者,李可佳和所在的初心資本的投資邏輯可以概括為“兩橫三縱”,在這樣一個(gè)坐標(biāo)圖譜中,蘊(yùn)含著初心觀察到的產(chǎn)業(yè)機(jī)會(huì)。
“兩橫分別是人才紅利和供應(yīng)鏈紅利,在過去十幾年中國移動(dòng)互聯(lián)網(wǎng)的飛速發(fā)展之下,整個(gè)行業(yè)培養(yǎng)了大量的工程師、科研人員,在全球都有著不少的優(yōu)勢(shì),另一方面,中國在制造業(yè)上擁有很強(qiáng)的優(yōu)勢(shì),尤其是在3C硬件等領(lǐng)域,我們的制造業(yè)供應(yīng)鏈相當(dāng)完備。”
以這樣兩個(gè)紅利為基礎(chǔ),三縱則代表了幾個(gè)重要的技術(shù)變量,第一就是生成式AI,其余兩縱則為算力的性能躍遷和電動(dòng)化到智能化的變遷。三縱與兩橫之間的許多交叉點(diǎn)則蘊(yùn)含著新的機(jī)會(huì),例如AI+硬件、AI+元宇宙、AI+XR等可能,都正被深切關(guān)注著。
在海外,Rabbit R1等AI Pin硬件令人關(guān)注,而在國內(nèi),榮耀、OPPO等廠商相繼推出AI產(chǎn)品、AI手機(jī)等,希望實(shí)現(xiàn)彎道超車;在XR領(lǐng)域,萬眾矚目的Vision Pro同樣與AI有著千絲萬縷的聯(lián)系,在AI大模型的支持下,新的世界圖景正在逐漸展開。
但最重要的仍舊是AI native思維。
“最讓我感覺興奮的是,在硅谷這些地方,我們接觸到了很多非常年輕的創(chuàng)業(yè)者,他們從不懷疑AI能否改變世界,他們的創(chuàng)業(yè)項(xiàng)目,都是基于AI時(shí)代已經(jīng)到來的前提下開展的。”李可佳向我們回憶,而這些AI native思維加持下的創(chuàng)業(yè)者,也讓他真正看到了未來的圖景。
“新的技術(shù)正在改變世界的每個(gè)角落,如果沉溺在舊世界里,很可能會(huì)被時(shí)代拋棄。”
文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請(qǐng)謹(jǐn)慎對(duì)待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。
2024年的Adobe MAX 2024發(fā)布會(huì)上,Adobe推出了最新版本的Adobe Creative Cloud。
奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。
“以前都要去窗口辦,一套流程下來都要半個(gè)月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。
華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準(zhǔn)的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實(shí)質(zhì)性的幫助,雙十一期間低至2799元,性價(jià)比很高,簡直是創(chuàng)作者們的首選。
9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會(huì)——工業(yè)互聯(lián)網(wǎng)標(biāo)識(shí)解析專題論壇在沈陽成功舉辦。