AI原生時代，大模型創(chuàng)業(yè)有“捷徑”

2023年11月16日 13:21:29 來源：深渡Cross

　　一年前ChatGPT橫空出世的時候，它之所以能引發(fā)圍觀人群的驚嘆，乃至把這輪已經(jīng)跌入情緒和現(xiàn)實雙重深淵的人工智能行業(yè)搶救過來，是因為它相比此前的人工智能產(chǎn)品跨越式地產(chǎn)生了智能的“涌現(xiàn)”。

　　所謂“涌現(xiàn)”是指構(gòu)成復(fù)雜系統(tǒng)的多個個體組件，在相互作用的過程中，于系統(tǒng)層面產(chǎn)生了這些個體所不具有的新特性。例如像螞蟻這樣的生物，單個的個體表現(xiàn)不出任何高等的意識，但蟻群這個系統(tǒng)卻可以建造巨大的巢穴，在巢穴里塞滿食物，并通過明確的分工合作完成復(fù)雜的任務(wù)。有研究人員認(rèn)為，由神經(jīng)元構(gòu)成的大腦也是這樣通過這類局部作用，在個體層面“涌現(xiàn)”出意識的。

　　ChatGPT所涌現(xiàn)出的能力令OpenAI自身的開發(fā)者都感到意外，冥冥中似乎人類已經(jīng)隱約觸摸到了通向AGI的終極道路。這樣的前景很難不令從業(yè)者感到心潮澎湃，對于中國的互聯(lián)網(wǎng)企業(yè)尤其如此。一個保守的估計是，目前國內(nèi)研發(fā)的大模型總數(shù)已經(jīng)超過了200個。這個現(xiàn)象當(dāng)然首先反映出在人工智能領(lǐng)域，以及更廣泛的計算機(jī)科學(xué)和IT產(chǎn)業(yè)方面，我們已經(jīng)處于或者起碼非常接近世界領(lǐng)先水平。

　　然而，與制造大模型的狂熱相比，國內(nèi)對于在大模型之上構(gòu)建AI原生應(yīng)用的熱情似乎要冷淡得多。百度創(chuàng)始人李彥宏10月15日在西麗湖論壇上提到，中國目前的AI原生應(yīng)用很難說出個一二來，而國外除了幾十個基礎(chǔ)大模型之外，已經(jīng)有上千個AI原生應(yīng)用，這是現(xiàn)在中國市場上所沒有的。

　　在《深渡》看來，基于大模型本身的特征和可能的發(fā)展路徑來說，上述這種“爭模型輕應(yīng)用”的現(xiàn)象其實并不合理。更恰當(dāng)?shù)男袠I(yè)模式應(yīng)該轉(zhuǎn)過來：制造大模型需要理性慎重，而業(yè)界參與大模型浪潮的激情和狂熱，應(yīng)該導(dǎo)向?qū)ふ覒?yīng)用大模型這個出口上來。

　　制造大模型需“冷靜”

　　國內(nèi)的大模型從數(shù)量上講，應(yīng)該已經(jīng)確定性地超過了美國。

　　促成這個現(xiàn)實的最重要原因，是很多企業(yè)選擇建造專有大模型，這些專有大模型通常宣稱基于各自所在的行業(yè)，因而在特定場景下有著更好的表現(xiàn)。

　　然而實際情況是，這些專有大模型在智能“涌現(xiàn)”上往往跟頭部產(chǎn)品相差甚遠(yuǎn)，它們基本談不上創(chuàng)造多少真實價值，更多的作用體現(xiàn)在企業(yè)對自身技術(shù)實力的PR宣傳上面。

　　這些專有模型面臨的障礙主要就在大模型的“大”上面。

　　OpenAI在ChatGPT上取得成功的根本原因，并非理論上有重大突破，比如作為大模型關(guān)鍵支撐的Transformer架構(gòu)，早在2017年就由谷歌的科研團(tuán)隊提出了。ChatGPT的成功歸根結(jié)底是“暴力美學(xué)”的勝利，是量變引發(fā)的質(zhì)變。

　　這也意味著只有當(dāng)參數(shù)規(guī)模足夠大，訓(xùn)練的語料足夠多，模型才會在超過某個門檻后涌現(xiàn)出智能。但是對于今天國內(nèi)很多自制大模型的科技企業(yè)來說，他們的技術(shù)實力和所能支配的資源，其實并不足以幫助他們邁過這個門檻。

　　比如，我們可以從最直觀的參數(shù)規(guī)模來考慮問題。在今年五月底的中關(guān)村論壇上，有業(yè)內(nèi)機(jī)構(gòu)發(fā)布了《中國人工智能大模型地圖研究報告》。這份報告提到中國當(dāng)時有超過79個大模型，但使用的標(biāo)準(zhǔn)是“參數(shù)規(guī)模在10億以上”。一個自然的疑問是，“10億參數(shù)”能達(dá)到智能涌現(xiàn)的門檻嗎?

　　合理的猜測，大概是不能的。

　　因為早在2019年OpenAI開源的GPT-2就使用了15億個參數(shù)，但當(dāng)時這個模型的最大用途是用來生成fake news。作為對比，去年底首次亮相的GPT-3.5，參數(shù)規(guī)模達(dá)到了1750億。也就是說，在超過100倍的量變過后，GPT-3.5才真正產(chǎn)生了令人驚艷的“智能涌現(xiàn)”。

　　而從GPT-3.5到GPT-4，模型的參數(shù)規(guī)模甚至進(jìn)一步擴(kuò)張。七月份的一篇論文提到，GPT-4包含了1.8萬億參數(shù)，相比GPT-3.5又增長了一個數(shù)量級。對應(yīng)的，GPT-4的單次訓(xùn)練成本也從GPT-3的460萬美元大幅增加到6300萬美元。

　　即便是阿爾特曼，也曾在接受采訪時表示：“我們要成功完成任務(wù)所需的資金比我最初想象的要多得多”。根據(jù)《財富》的報道，去年OpenAI收入為3000萬美元，但凈虧損總額超過5億美元。

　　在ChatGPT發(fā)布后，與大部分普通人的驚訝和雀躍相反，很多高校實驗室里搞自然語言處理(NLP)的研究人員發(fā)出了“NLP已死”的感嘆。一方面，ChatGPT的問世代表著NLP領(lǐng)域的突破性成果。但另一方面，大模型訓(xùn)練所需要的龐大開銷，也意味著大部分實驗室今后不再有能力跟進(jìn)這個前沿領(lǐng)域的很多最新進(jìn)展。

　　毫無疑問，對于絕大部分企業(yè)來說，這個邏輯同樣成立，既沒有能力也沒有必要去“重復(fù)造大模型的輪子”。

　　從PC時代到移動互聯(lián)網(wǎng)時代，再到如今由生成式大模型引領(lǐng)的AI時代，每個時代都有作為支撐的基礎(chǔ)技術(shù)底座。而一個越來越顯著的趨勢是，大模型正在取代Windows和后來的iOS/Android，成為AI時代的操作系統(tǒng)。

　　從商業(yè)模式上講，這的確又是一個締造世界上最偉大科技公司的絕妙機(jī)會。只是這一次的勝利者，絕對不會像當(dāng)初Apple起步一樣，從喬布斯的車庫里冒出來。

　　對于那些希望抓住大模型浪潮的絕大部分公司而言，登上這列火車的最好機(jī)會一定不是“買卡、囤芯片、建智算中心，從頭訓(xùn)練自己的專用大模型”。而是應(yīng)該像李彥宏說的，將基礎(chǔ)大模型的通用能力和行業(yè)領(lǐng)域的專有能力相結(jié)合。這種“大模型套小模型”的產(chǎn)業(yè)化模式，能夠很好結(jié)合兩方面的優(yōu)點(diǎn)：專用的小模型反應(yīng)快，成本低;大模型更智能，可以用來兜底。

　　從行業(yè)發(fā)展態(tài)勢看，目前其實已經(jīng)有大批嗅覺靈敏的公司在這么做了。李彥宏在15日的演講中就提到，8月31號開放以來，文心大模型的API調(diào)用量，呈現(xiàn)指數(shù)級的增長趨勢：“國內(nèi)有200多個大模型，很多上了這個榜單、那個排名，其實都沒有什么使用量。文心大模型一家的調(diào)用量恐怕比所有那200家加起來的調(diào)用量還大”。

　　AI原生應(yīng)用大模型要“狂熱”

　　在大模型出現(xiàn)之前的十年里，科技行業(yè)其實已經(jīng)經(jīng)歷過好幾輪的技術(shù)熱潮。盡管沒有像黃仁勛把大模型出現(xiàn)稱為人工智能行業(yè)的“iPhone時刻”這么夸張，但在每一輪這樣的技術(shù)浪潮中，總會有大批的投資人和創(chuàng)業(yè)者因為某一個新奇的概念，蜂擁而入賭上自己的金錢和時間。

　　當(dāng)然，這些浪潮來得快退得更快，最后留下一地雞毛，區(qū)塊鏈、元宇宙、云計算和各種花樣的O2O都是些典型的例子。某種程度上說，無論投資人還是從業(yè)者在這次大模型到來后，明顯吸取了過去的經(jīng)驗教訓(xùn)，從一開始就對大模型的落地給予了更多的關(guān)注。

　　但需要注意的是，如我們在上面一章闡述過的，在追求大模型落地的過程中，我們不應(yīng)該走制造一堆行業(yè)專用大模型的路子，因為這些不夠大因而不夠智能的“專用大模型”，并不能實現(xiàn)名實相符的價值創(chuàng)造。更優(yōu)的落地路徑是在一個強(qiáng)大的基礎(chǔ)大模型上面，去調(diào)用它的各項能力，開發(fā)出豐富的AI原生應(yīng)用。

　　不過相較于制造大模型的熱情，國內(nèi)從業(yè)者對于應(yīng)用大模型的氛圍似乎要低一些，后面這項事業(yè)是需要加一把火的。這跟國外的情況恰恰相反，因為即便是微軟這個量級的公司也沒有自己另起爐灶蓋大模型，而是在努力把OpenAI的大模型吸納進(jìn)Office這一套生產(chǎn)力工具里。

　　其實，我們國內(nèi)是有領(lǐng)先的基礎(chǔ)大模型的，而且如李彥宏所說，強(qiáng)大的基礎(chǔ)大模型，一定能驅(qū)動AI原生應(yīng)用爆發(fā)。

　　今年3 月16日，百度率先發(fā)布了基于文心大模型3.0的文心一言產(chǎn)品。而在一個月前的2023百度世界大會上，文心大模型4.0也正式問世。當(dāng)時，李彥宏以《手把手教你做AI原生應(yīng)用》為主題發(fā)表演講，現(xiàn)場開啟邀請測試，實地展現(xiàn)百度在AI領(lǐng)域?qū)崿F(xiàn)多維度的持續(xù)突破。憑借參數(shù)規(guī)模全球第一，文心大模型4.0的綜合能力“與GPT-4相比毫不遜色”，全面領(lǐng)跑全球AI行業(yè)。

　　基于迄今為止最強(qiáng)大的文心大模型，在理解、生成、邏輯和記憶四大能力上，文心4.0都有明顯提升。比如，在生成能力上，文心一言除了生成文字內(nèi)容，更包括了圖片、視頻、數(shù)字人等多模態(tài)內(nèi)容，可實現(xiàn)的創(chuàng)作體裁超過200種，涵蓋了幾乎所有寫作需求。在邏輯和記憶能力上，相比之前的版本也有了成倍提升。

　　大模型在智能涌現(xiàn)后出現(xiàn)的理解、生成、邏輯和記憶四大能力，是AI時代到來后最本質(zhì)的生產(chǎn)力革新。而與制造大模型本身的高門檻不同，今天的創(chuàng)業(yè)者同樣可以極其容易地通過接入文心一言這樣的大模型，通過應(yīng)用這四大能力徹底重構(gòu)自身產(chǎn)品的用戶體驗。

　　事實上，為了幫助各行各業(yè)的客戶盡早用上大模型，百度在文心一言正式亮相的同一個月，就推出了文心千帆。文心千帆是全球首款一站式企業(yè)級大模型平臺，既提供像文心一言這樣領(lǐng)先的基礎(chǔ)大模型，也包含了開發(fā)大模型需要的工具鏈和配套環(huán)境。在隨后不到半年的時間里，千帆大模型平臺上月活企業(yè)數(shù)已近萬家，覆蓋金融、制造、能源、政務(wù)、交通等行業(yè)的400多個場景。

　　大模型和生成式人工智能作為堪比工業(yè)革命的巨大機(jī)遇，已經(jīng)成為公眾共識。但目前來說，無論國內(nèi)國外都還沒有出現(xiàn)跨時代的AI原生應(yīng)用，這是一塊急需填補(bǔ)的“權(quán)力真空”。李彥宏在今天的演講中表達(dá)了同樣的遺憾和期待：

　　就像移動時代誕生了像微信、抖音、Uber這樣的“mobile-native”的應(yīng)用一樣，AI原生時代一定會有優(yōu)秀的AI原生應(yīng)用是基于這些大模型開發(fā)出來的。

　　記住，是基于最好的基礎(chǔ)大模型去開發(fā)應(yīng)用，這是比制造大模型更容易成功的“捷徑”。

　　結(jié)語

　　在《深渡》看來，大模型掀起的這輪AI革命來得再恰當(dāng)不過。因為相較于過去那些科技變革，以文心一言為代表的國內(nèi)基礎(chǔ)大模型，表明國內(nèi)的技術(shù)水平已經(jīng)站到了跟國外頂尖同行并駕齊驅(qū)的位置。對于那些腦袋靈光夢想遠(yuǎn)大的龐大創(chuàng)業(yè)者群體而言，這在某種程度上是從未有過的“幸運(yùn)”。

　　當(dāng)然，前提是他們要選對切入這條賽道的方向，在制造大模型上多一點(diǎn)冷靜，而在應(yīng)用大模型上不妨狂熱一些。

　　文章內(nèi)容僅供閱讀，不構(gòu)成投資建議，請謹(jǐn)慎對待。投資者據(jù)此操作，風(fēng)險自擔(dān)。

[No. ]
分享到微信