一年前ChatGPT橫空出世的時候,它之所以能引發(fā)圍觀人群的驚嘆,乃至把這輪已經(jīng)跌入情緒和現(xiàn)實雙重深淵的人工智能行業(yè)搶救過來,是因為它相比此前的人工智能產(chǎn)品跨越式地產(chǎn)生了智能的“涌現(xiàn)”。
所謂“涌現(xiàn)”是指構(gòu)成復(fù)雜系統(tǒng)的多個個體組件,在相互作用的過程中,于系統(tǒng)層面產(chǎn)生了這些個體所不具有的新特性。例如像螞蟻這樣的生物,單個的個體表現(xiàn)不出任何高等的意識,但蟻群這個系統(tǒng)卻可以建造巨大的巢穴,在巢穴里塞滿食物,并通過明確的分工合作完成復(fù)雜的任務(wù)。有研究人員認(rèn)為,由神經(jīng)元構(gòu)成的大腦也是這樣通過這類局部作用,在個體層面“涌現(xiàn)”出意識的。
ChatGPT所涌現(xiàn)出的能力令OpenAI自身的開發(fā)者都感到意外,冥冥中似乎人類已經(jīng)隱約觸摸到了通向AGI的終極道路。這樣的前景很難不令從業(yè)者感到心潮澎湃,對于中國的互聯(lián)網(wǎng)企業(yè)尤其如此。一個保守的估計是,目前國內(nèi)研發(fā)的大模型總數(shù)已經(jīng)超過了200個。這個現(xiàn)象當(dāng)然首先反映出在人工智能領(lǐng)域,以及更廣泛的計算機(jī)科學(xué)和IT產(chǎn)業(yè)方面,我們已經(jīng)處于或者起碼非常接近世界領(lǐng)先水平。
然而,與制造大模型的狂熱相比,國內(nèi)對于在大模型之上構(gòu)建AI原生應(yīng)用的熱情似乎要冷淡得多。百度創(chuàng)始人李彥宏10月15日在西麗湖論壇上提到,中國目前的AI原生應(yīng)用很難說出個一二來,而國外除了幾十個基礎(chǔ)大模型之外,已經(jīng)有上千個AI原生應(yīng)用,這是現(xiàn)在中國市場上所沒有的。
在《深渡》看來,基于大模型本身的特征和可能的發(fā)展路徑來說,上述這種“爭模型輕應(yīng)用”的現(xiàn)象其實并不合理。更恰當(dāng)?shù)男袠I(yè)模式應(yīng)該轉(zhuǎn)過來:制造大模型需要理性慎重,而業(yè)界參與大模型浪潮的激情和狂熱,應(yīng)該導(dǎo)向?qū)ふ覒?yīng)用大模型這個出口上來。
制造大模型需“冷靜”
國內(nèi)的大模型從數(shù)量上講,應(yīng)該已經(jīng)確定性地超過了美國。
促成這個現(xiàn)實的最重要原因,是很多企業(yè)選擇建造專有大模型,這些專有大模型通常宣稱基于各自所在的行業(yè),因而在特定場景下有著更好的表現(xiàn)。
然而實際情況是,這些專有大模型在智能“涌現(xiàn)”上往往跟頭部產(chǎn)品相差甚遠(yuǎn),它們基本談不上創(chuàng)造多少真實價值,更多的作用體現(xiàn)在企業(yè)對自身技術(shù)實力的PR宣傳上面。
這些專有模型面臨的障礙主要就在大模型的“大”上面。
OpenAI在ChatGPT上取得成功的根本原因,并非理論上有重大突破,比如作為大模型關(guān)鍵支撐的Transformer架構(gòu),早在2017年就由谷歌的科研團(tuán)隊提出了。ChatGPT的成功歸根結(jié)底是“暴力美學(xué)”的勝利,是量變引發(fā)的質(zhì)變。
這也意味著只有當(dāng)參數(shù)規(guī)模足夠大,訓(xùn)練的語料足夠多,模型才會在超過某個門檻后涌現(xiàn)出智能。但是對于今天國內(nèi)很多自制大模型的科技企業(yè)來說,他們的技術(shù)實力和所能支配的資源,其實并不足以幫助他們邁過這個門檻。
比如,我們可以從最直觀的參數(shù)規(guī)模來考慮問題。在今年五月底的中關(guān)村論壇上,有業(yè)內(nèi)機(jī)構(gòu)發(fā)布了《中國人工智能大模型地圖研究報告》。這份報告提到中國當(dāng)時有超過79個大模型,但使用的標(biāo)準(zhǔn)是“參數(shù)規(guī)模在10億以上”。一個自然的疑問是,“10億參數(shù)”能達(dá)到智能涌現(xiàn)的門檻嗎?
合理的猜測,大概是不能的。
因為早在2019年OpenAI開源的GPT-2就使用了15億個參數(shù),但當(dāng)時這個模型的最大用途是用來生成fake news。作為對比,去年底首次亮相的GPT-3.5,參數(shù)規(guī)模達(dá)到了1750億。也就是說,在超過100倍的量變過后,GPT-3.5才真正產(chǎn)生了令人驚艷的“智能涌現(xiàn)”。
而從GPT-3.5到GPT-4,模型的參數(shù)規(guī)模甚至進(jìn)一步擴(kuò)張。七月份的一篇論文提到,GPT-4包含了1.8萬億參數(shù),相比GPT-3.5又增長了一個數(shù)量級。對應(yīng)的,GPT-4的單次訓(xùn)練成本也從GPT-3的460萬美元大幅增加到6300萬美元。
即便是阿爾特曼,也曾在接受采訪時表示:“我們要成功完成任務(wù)所需的資金比我最初想象的要多得多”。根據(jù)《財富》的報道,去年OpenAI收入為3000萬美元,但凈虧損總額超過5億美元。
在ChatGPT發(fā)布后,與大部分普通人的驚訝和雀躍相反,很多高校實驗室里搞自然語言處理(NLP)的研究人員發(fā)出了“NLP已死”的感嘆。一方面,ChatGPT的問世代表著NLP領(lǐng)域的突破性成果。但另一方面,大模型訓(xùn)練所需要的龐大開銷,也意味著大部分實驗室今后不再有能力跟進(jìn)這個前沿領(lǐng)域的很多最新進(jìn)展。
毫無疑問,對于絕大部分企業(yè)來說,這個邏輯同樣成立,既沒有能力也沒有必要去“重復(fù)造大模型的輪子”。
從PC時代到移動互聯(lián)網(wǎng)時代,再到如今由生成式大模型引領(lǐng)的AI時代,每個時代都有作為支撐的基礎(chǔ)技術(shù)底座。而一個越來越顯著的趨勢是,大模型正在取代Windows和后來的iOS/Android,成為AI時代的操作系統(tǒng)。
從商業(yè)模式上講,這的確又是一個締造世界上最偉大科技公司的絕妙機(jī)會。只是這一次的勝利者,絕對不會像當(dāng)初Apple起步一樣,從喬布斯的車庫里冒出來。
對于那些希望抓住大模型浪潮的絕大部分公司而言,登上這列火車的最好機(jī)會一定不是“買卡、囤芯片、建智算中心,從頭訓(xùn)練自己的專用大模型”。而是應(yīng)該像李彥宏說的,將基礎(chǔ)大模型的通用能力和行業(yè)領(lǐng)域的專有能力相結(jié)合。這種“大模型套小模型”的產(chǎn)業(yè)化模式,能夠很好結(jié)合兩方面的優(yōu)點(diǎn):專用的小模型反應(yīng)快,成本低;大模型更智能,可以用來兜底。
從行業(yè)發(fā)展態(tài)勢看,目前其實已經(jīng)有大批嗅覺靈敏的公司在這么做了。李彥宏在15日的演講中就提到,8月31號開放以來,文心大模型的API調(diào)用量,呈現(xiàn)指數(shù)級的增長趨勢:“國內(nèi)有200多個大模型,很多上了這個榜單、那個排名,其實都沒有什么使用量。文心大模型一家的調(diào)用量恐怕比所有那200家加起來的調(diào)用量還大”。
AI原生應(yīng)用大模型要“狂熱”
在大模型出現(xiàn)之前的十年里,科技行業(yè)其實已經(jīng)經(jīng)歷過好幾輪的技術(shù)熱潮。盡管沒有像黃仁勛把大模型出現(xiàn)稱為人工智能行業(yè)的“iPhone時刻”這么夸張,但在每一輪這樣的技術(shù)浪潮中,總會有大批的投資人和創(chuàng)業(yè)者因為某一個新奇的概念,蜂擁而入賭上自己的金錢和時間。
當(dāng)然,這些浪潮來得快退得更快,最后留下一地雞毛,區(qū)塊鏈、元宇宙、云計算和各種花樣的O2O都是些典型的例子。某種程度上說,無論投資人還是從業(yè)者在這次大模型到來后,明顯吸取了過去的經(jīng)驗教訓(xùn),從一開始就對大模型的落地給予了更多的關(guān)注。
但需要注意的是,如我們在上面一章闡述過的,在追求大模型落地的過程中,我們不應(yīng)該走制造一堆行業(yè)專用大模型的路子,因為這些不夠大因而不夠智能的“專用大模型”,并不能實現(xiàn)名實相符的價值創(chuàng)造。更優(yōu)的落地路徑是在一個強(qiáng)大的基礎(chǔ)大模型上面,去調(diào)用它的各項能力,開發(fā)出豐富的AI原生應(yīng)用。
不過相較于制造大模型的熱情,國內(nèi)從業(yè)者對于應(yīng)用大模型的氛圍似乎要低一些,后面這項事業(yè)是需要加一把火的。這跟國外的情況恰恰相反,因為即便是微軟這個量級的公司也沒有自己另起爐灶蓋大模型,而是在努力把OpenAI的大模型吸納進(jìn)Office這一套生產(chǎn)力工具里。
其實,我們國內(nèi)是有領(lǐng)先的基礎(chǔ)大模型的,而且如李彥宏所說,強(qiáng)大的基礎(chǔ)大模型,一定能驅(qū)動AI原生應(yīng)用爆發(fā)。
今年3 月16日,百度率先發(fā)布了基于文心大模型3.0的文心一言產(chǎn)品。而在一個月前的2023百度世界大會上,文心大模型4.0也正式問世。當(dāng)時,李彥宏以《手把手教你做AI原生應(yīng)用》為主題發(fā)表演講,現(xiàn)場開啟邀請測試,實地展現(xiàn)百度在AI領(lǐng)域?qū)崿F(xiàn)多維度的持續(xù)突破。憑借參數(shù)規(guī)模全球第一,文心大模型4.0的綜合能力“與GPT-4相比毫不遜色”,全面領(lǐng)跑全球AI行業(yè)。
基于迄今為止最強(qiáng)大的文心大模型,在理解、生成、邏輯和記憶四大能力上,文心4.0都有明顯提升。比如,在生成能力上,文心一言除了生成文字內(nèi)容,更包括了圖片、視頻、數(shù)字人等多模態(tài)內(nèi)容,可實現(xiàn)的創(chuàng)作體裁超過200種,涵蓋了幾乎所有寫作需求。在邏輯和記憶能力上,相比之前的版本也有了成倍提升。
大模型在智能涌現(xiàn)后出現(xiàn)的理解、生成、邏輯和記憶四大能力,是AI時代到來后最本質(zhì)的生產(chǎn)力革新。而與制造大模型本身的高門檻不同,今天的創(chuàng)業(yè)者同樣可以極其容易地通過接入文心一言這樣的大模型,通過應(yīng)用這四大能力徹底重構(gòu)自身產(chǎn)品的用戶體驗。
事實上,為了幫助各行各業(yè)的客戶盡早用上大模型,百度在文心一言正式亮相的同一個月,就推出了文心千帆。文心千帆是全球首款一站式企業(yè)級大模型平臺,既提供像文心一言這樣領(lǐng)先的基礎(chǔ)大模型,也包含了開發(fā)大模型需要的工具鏈和配套環(huán)境。在隨后不到半年的時間里,千帆大模型平臺上月活企業(yè)數(shù)已近萬家,覆蓋金融、制造、能源、政務(wù)、交通等行業(yè)的400多個場景。
大模型和生成式人工智能作為堪比工業(yè)革命的巨大機(jī)遇,已經(jīng)成為公眾共識。但目前來說,無論國內(nèi)國外都還沒有出現(xiàn)跨時代的AI原生應(yīng)用,這是一塊急需填補(bǔ)的“權(quán)力真空”。李彥宏在今天的演講中表達(dá)了同樣的遺憾和期待:
就像移動時代誕生了像微信、抖音、Uber這樣的“mobile-native”的應(yīng)用一樣,AI原生時代一定會有優(yōu)秀的AI原生應(yīng)用是基于這些大模型開發(fā)出來的。
記住,是基于最好的基礎(chǔ)大模型去開發(fā)應(yīng)用,這是比制造大模型更容易成功的“捷徑”。
結(jié)語
在《深渡》看來,大模型掀起的這輪AI革命來得再恰當(dāng)不過。因為相較于過去那些科技變革,以文心一言為代表的國內(nèi)基礎(chǔ)大模型,表明國內(nèi)的技術(shù)水平已經(jīng)站到了跟國外頂尖同行并駕齊驅(qū)的位置。對于那些腦袋靈光夢想遠(yuǎn)大的龐大創(chuàng)業(yè)者群體而言,這在某種程度上是從未有過的“幸運(yùn)”。
當(dāng)然,前提是他們要選對切入這條賽道的方向,在制造大模型上多一點(diǎn)冷靜,而在應(yīng)用大模型上不妨狂熱一些。
文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹(jǐn)慎對待。投資者據(jù)此操作,風(fēng)險自擔(dān)。
京東11.11采銷直播探廠為消費(fèi)者揭開答案。近日,京東3C數(shù)碼采銷走進(jìn)武漢攀升工廠、合肥聯(lián)想工廠和科大訊飛展廳,通過直播帶貨廠商爆款產(chǎn)品,并為消費(fèi)者帶來超值低價與福利。
奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。
“以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。
華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準(zhǔn)的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實質(zhì)性的幫助,雙十一期間低至2799元,性價比很高,簡直是創(chuàng)作者們的首選。
9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會——工業(yè)互聯(lián)網(wǎng)標(biāo)識解析專題論壇在沈陽成功舉辦。