大模型現(xiàn)狀：一邊速成，一邊參數(shù)內(nèi)卷

2023年08月01日 09:46:36 來源：互聯(lián)網(wǎng)那些事

　　當(dāng)下大模型賽道的現(xiàn)狀：一邊是創(chuàng)業(yè)公司基于開源大模型速成，一邊是大廠在各種內(nèi)卷大模型參數(shù)。

　　據(jù)機(jī)構(gòu)不完全統(tǒng)計(jì)，目前中國10億參數(shù)規(guī)模以上的大模型已發(fā)布79個。在大參數(shù)內(nèi)卷的過程中，市場開始出現(xiàn)另一種聲音“不具備發(fā)展方向的參數(shù)提升是沒有意義的”。

　　為此，在發(fā)展方向上，當(dāng)下一部分大模型已經(jīng)聚焦到垂類領(lǐng)域應(yīng)用�；诔汕先f的模型發(fā)展，底座或許會發(fā)生改變，但仔細(xì)一想，也總需要有人能夠在垂類行業(yè)中跑出來。

　　同時，在發(fā)展初期，雖然閉源大模型在質(zhì)量上更優(yōu)，也相對安全，但大模型生態(tài)終究需要一定程度的內(nèi)卷，開源實(shí)際上可以助長大模型的繁榮。另一個角度，基于開源眾多企業(yè)有了賽道參賽的資格，但也總有人輕易就倒在了第一關(guān)匣——算力短缺。

　　說到底，大模型數(shù)量是在以倍數(shù)的數(shù)量在增長，但如果片面的看待大模型日益增長的數(shù)量，那么某種程度上也會忽略掉背后部分公司對大模型的抉擇、掙扎，甚至是選擇后放棄的可能性。

　　眾所周知，人工智能三要素是：算力、算法和數(shù)據(jù)。開源只是處于算法階段，之后企業(yè)還需要對其進(jìn)行大量的算力支持和數(shù)據(jù)訓(xùn)練，這背后的成本是高昂的。

　　一、垂直大模型，創(chuàng)業(yè)公司還有盼頭嗎?

　　在開源大模型選擇上，基于成本和定制開發(fā)的原因，選擇小參數(shù)模型的創(chuàng)業(yè)型企業(yè)不在少數(shù)，甚至是該類企業(yè)的首選。

　　一個是預(yù)訓(xùn)練成本問題。

　　國盛證券曾經(jīng)估算，GPT-3訓(xùn)練一次的成本約為140萬美元，對于一些更大的LLM模型，訓(xùn)練成本介于200萬美元至1200萬美元之間。

　　包括在今年1月，平均每天約有1300萬獨(dú)立訪客使用ChatGPT，對應(yīng)芯片需求為3萬多片英偉達(dá)A100GPU，初始投入成本約為8億美元，每日電費(fèi)在5萬美元左右。

　　更何況，在大量資金投入之前，還需要大量的數(shù)據(jù)資源來支撐模型訓(xùn)練。為此，另一個原因是預(yù)訓(xùn)練需求問題。

　　有業(yè)內(nèi)也曾表達(dá)過對此的看法：“大模型本身的泛化能力仍受限于數(shù)據(jù)。”

　　因?yàn)槿绻坏⿲Υ竽Ｐ偷母哔|(zhì)量數(shù)據(jù)篩選和訓(xùn)練得過少，大模型的輸出質(zhì)量問題是很明顯的，在體驗(yàn)上，用戶的體驗(yàn)感也會大大降低。

　　可以說，在預(yù)訓(xùn)練的過程中，僅僅是在數(shù)據(jù)的積累上就已經(jīng)花費(fèi)了大量的資金與時間。

　　更何況，在大模型賽道中，大多數(shù)的創(chuàng)業(yè)公司都是圍繞在行業(yè)垂直領(lǐng)域進(jìn)行發(fā)展，付出雖然相對少，但一定不輕松。

　　具體一點(diǎn)來說就是，如果大模型要改變行業(yè)的商業(yè)模式的話，那么對此最簡單的判定標(biāo)準(zhǔn)就是，該類大模型是否具備的行業(yè)數(shù)據(jù)足夠多，例如要對藏在暗處的黑產(chǎn)要有足夠的了解，才能不被黑產(chǎn)所用，處于安全被動的狀態(tài)。

　　另一個判定的標(biāo)準(zhǔn)就是，大模型在運(yùn)行之時所處理的數(shù)據(jù)，最終輸出的質(zhì)量如何。

　　說到底，想要基于開源模型去打破模型壟斷，還需要對大量的數(shù)據(jù)進(jìn)行足夠的優(yōu)化提升，并且對基礎(chǔ)設(shè)施的投入足夠完善。

　　如今的開源大模型實(shí)際上更像是網(wǎng)絡(luò)時代的Android，沒有大廠的落地場景、數(shù)據(jù)積累等優(yōu)勢的創(chuàng)業(yè)公司，發(fā)展起來很不容易，但仍然存在機(jī)會。

　　事實(shí)上，達(dá)摩院也曾將“大小模型協(xié)作發(fā)展”視為未來趨勢之一。

　　就連創(chuàng)業(yè)公司追一科技相信“垂直大模型是堅(jiān)實(shí)的機(jī)會，就像發(fā)現(xiàn)美洲大陸這件事遠(yuǎn)不只成就了一人而已”。

　　于是如今我們可以看到眾多創(chuàng)業(yè)公司開始選擇入局大模型賽道，其中包括毫末智行、創(chuàng)新奇智、元語智能等AI創(chuàng)業(yè)公司所推出的DriveGPT雪湖·海若、奇智孔明、ChatYuan元語等大模型。

　　不過，國內(nèi)雖然尚未有產(chǎn)品面向C端，但基于B端，大廠已經(jīng)開始實(shí)現(xiàn)初步落地的過程中。

　　據(jù)悉，目前大廠都在計(jì)劃通過云的方式對外輸出大模型的能力，云計(jì)算成為A大模型落地的最佳方式，模型即服務(wù)(MaaS)越發(fā)受到關(guān)注，而這也將帶來大模型成本的降低。

　　那么，創(chuàng)業(yè)公司還存在盼頭嗎?

　　二、勝負(fù)在于產(chǎn)品體驗(yàn)與市場需求相匹配?

　　根據(jù)權(quán)威雜志《Fast Company》預(yù)測，OpenAI 2023年的收入將達(dá)到2億美元，包括提供API數(shù)據(jù)接口服務(wù)、聊天機(jī)器人訂閱服務(wù)費(fèi)等。

　　很顯然，各行業(yè)對大模型的需求是存在的，但基于安全性的考慮，加之to B對大模型亦步亦趨的態(tài)度，大模型當(dāng)下安全系數(shù)有限。于是，在相對基礎(chǔ)，需求量高的對話、文檔內(nèi)容生成、問答，包括協(xié)同辦公中對話、文檔生成等眾多場景，互聯(lián)網(wǎng)大廠也在優(yōu)先做。

　　例如，現(xiàn)在人類只需要把商品的信息告訴AI，讓AI自動生成多種風(fēng)格的商品帶貨腳本和風(fēng)格，再配個數(shù)字人主播，就可以幫企業(yè)把貨給賣出去。據(jù)百度介紹，相比真人直播，數(shù)字直播可實(shí)現(xiàn)7*24小時不間斷直播，轉(zhuǎn)化率為無人直播間的2倍。

　　在云上基礎(chǔ)設(shè)施作為大模型創(chuàng)業(yè)的必要底座下，擁有云計(jì)算的互聯(lián)網(wǎng)大廠具有一定的優(yōu)勢。

　　根據(jù)IDC發(fā)布的2022年全球云計(jì)算IaaS市場追蹤數(shù)據(jù)來看，市場份額TOP10玩家都是中美的大公司，包括美國的亞馬遜、谷歌、微軟、IBM，中國的阿里、華為、騰訊、百度等。

　　雖然大模型的開閉源之爭，終究不會是靠某一個或幾個產(chǎn)品的出現(xiàn)而終結(jié)，還要更多頂尖人才參與、技術(shù)迭代和資金支持。

　　但橫做對比，眾多AI創(chuàng)業(yè)公司也缺少了一份如同創(chuàng)業(yè)獨(dú)角獸公司MiniMax的運(yùn)氣。(不同的是MiniMax注重的是通用大模型)

　　7月20日，騰訊云對外披露助力MiniMax研發(fā)大模型的最新進(jìn)展。目前，騰訊云長期支持MiniMax的千卡級任務(wù)穩(wěn)定運(yùn)行在騰訊云上，可用性達(dá)99.9%。

　　據(jù)悉，自2022年6月起，基于算力集群、云原生、大數(shù)據(jù)、安全等產(chǎn)品能力，騰訊云為MiniMax搭建了從資源層、數(shù)據(jù)層到業(yè)務(wù)層的云架構(gòu)。

　　現(xiàn)實(shí)似乎再度證明了，拿到入場券是第一步，接下來考驗(yàn)的是市場玩家們探索商業(yè)化和技術(shù)升級的能力。直白一點(diǎn)來說，AI創(chuàng)業(yè)公司想要在賽道中跑到最后，每一步都不能落下。

　　某種程度上來說，在大模型研發(fā)上創(chuàng)業(yè)公司也并非全無優(yōu)勢。

　　雖然部分互聯(lián)網(wǎng)大廠已經(jīng)實(shí)現(xiàn)初步場景落地，亦或是開始售賣服務(wù)獲得收入，但大廠以及MiniMax的目光更多是聚焦在通用大模型上。

　　而垂直大模型仍然是真空地帶。特別是對于傳統(tǒng)企業(yè)群體來說，考慮到自身業(yè)務(wù)的IT屬性低、投出產(chǎn)比低等問題，選擇自研大模型的概率較低。

　　例如創(chuàng)新奇智聚焦在工業(yè)大模型產(chǎn)品“奇智孔明”;擁有一定數(shù)據(jù)優(yōu)勢，往語言上發(fā)展的ChatYuan元語大模型;主打自動駕駛生成式大模型DriveGPT雪湖·海若。

　　不過有一說一，訓(xùn)練的數(shù)據(jù)和方向不同，成本差別很大。

　　先是元語大模型從零開始做一次訓(xùn)練的成本能做到千萬人民幣量級。而在自動駕駛生成式領(lǐng)域上，比ChatGPT 多設(shè)計(jì)一套新的語言，緊接著再把所有的真實(shí)道路駕駛數(shù)據(jù)，并“翻譯”成統(tǒng)一的語言的DriveGPT雪湖·海若，也存在著一定的成本投入。

　　某種程度上，AI創(chuàng)業(yè)公司能夠?qū)崿F(xiàn)對大模型的大量投入，更多的是得益于ChatGPT商業(yè)和營銷方面的成功，能夠瞬間讓人們目睹了大模型的可落地性，而不是繼續(xù)隱匿在漫長的技術(shù)迭代中。

　　為此，當(dāng)下實(shí)現(xiàn)落地的第一步，就是大模型的訓(xùn)練成本、推理成本一定能做到比搜索還要低，而且還能保證即時性。

　　三、從概念到落地，到底有多難?

　　有觀點(diǎn)認(rèn)為，能跑出來的中國大模型創(chuàng)業(yè)公司，很可能是垂直整合型。

　　簡單來說就是，一邊在做底層大模型的同時，找準(zhǔn)一個模型最終的主應(yīng)用場景，一邊收集用戶數(shù)據(jù)并做出快速的迭代。

　　目測，元語智能更偏向于這一類�？偨Y(jié)起來看，在很長的一段時間內(nèi)元語智能都聚焦在自然語言大模型業(yè)務(wù)上。

　　元語COO朱雷并表示，“不會為了跟風(fēng)盲目拓展圖片、視頻業(yè)務(wù)，元語的目標(biāo)是實(shí)現(xiàn)‘ChatGPT’等前沿語言大模型的全面國產(chǎn)化。語言大模型的生態(tài)已經(jīng)足夠大了，做好業(yè)務(wù)聚焦很重要。”

　　但對于其他往自動駕駛、工業(yè)生產(chǎn)等垂直大模型發(fā)展的創(chuàng)業(yè)公司來說，或許缺乏對一些特殊的行業(yè)數(shù)據(jù)掌握。

　　畢竟，在垂直大模型賽道，未來企業(yè)競爭的一個核心因素，就是私有數(shù)據(jù)和私有經(jīng)驗(yàn)，個體公司的流程并不被大模型者知曉時，可能就會有獨(dú)特的競爭力。

　　另外，業(yè)務(wù)聚焦的過程中，還需要到數(shù)據(jù)從源頭到預(yù)訓(xùn)練、輸出的準(zhǔn)確性。

　　目前，生成式人工智能在監(jiān)管上也正在受到更多關(guān)注。近日國內(nèi)發(fā)布了《生成式人工智能服務(wù)管理辦法(征求意見稿)》，明確要求不得出現(xiàn)歧視，生成內(nèi)容應(yīng)當(dāng)真實(shí)準(zhǔn)確、防止生成虛假信息等，如果出現(xiàn)，除內(nèi)容過濾外，還要通過模型優(yōu)化等進(jìn)行優(yōu)化。

　　但如果是作為生成式人工智能的固有缺陷，這在從技術(shù)上難以保證和徹底解決。

　　此外，在更好的開源模型的出現(xiàn)，保不齊會伴隨著更多躍躍欲試的公司會涌進(jìn)來，這對于創(chuàng)業(yè)公司來說，有何嘗不是競爭?

　　例如當(dāng)下的Llama 2，7月18日，Meta公司發(fā)布了首個開源人工智能模型Llama的商業(yè)版本 Llama 2。有企業(yè)認(rèn)為，根據(jù)現(xiàn)在的各種評測文檔，除了代碼能力差一些，其實(shí)很多地方已經(jīng)開始接近ChatGPT。

　　或許未來開源社區(qū)的狂熱浪潮會讓具備基礎(chǔ)能力的大模型普及化，以后私有化大模型就是白菜價。直白一點(diǎn)來說就是，企業(yè)可能會非常便宜地使用私有化大模型。

　　更重要的一個點(diǎn)是，湯道生曾表示：“通用大模型有很強(qiáng)的能力，但并不能解決很多企業(yè)的具體問題，在100個場景中可以解決70%—80%的問題，但未必能100%滿足企業(yè)某個場景的需求。但企業(yè)如果基于行業(yè)大模型，再加上自身數(shù)據(jù)進(jìn)行精調(diào)，可以建構(gòu)專屬模型，打造出高可用的智能服務(wù)。”

　　當(dāng)然，這種私有化大模型還未到來，但賽道中的創(chuàng)業(yè)公司，一定是機(jī)遇和困境齊具。

　　參考：

　　獵云網(wǎng)：爭搶垂直大模型機(jī)遇，創(chuàng)業(yè)公司們拼了

　　中國經(jīng)濟(jì)新聞網(wǎng)：騰訊云助力MiniMax打造大模型：規(guī)模超千卡，可用性達(dá)99.9%

　　搜狐AI報(bào)道：超30個國產(chǎn)大模型混戰(zhàn)：華為百度阿里騰訊，誰能成為“中國的OpenAI”?

　　連線Insight：大模型競速賽，已經(jīng)開始拼場景、搶客戶了

　　科技新知：大模型打響開閉源之戰(zhàn)

　　文章內(nèi)容僅供閱讀，不構(gòu)成投資建議，請謹(jǐn)慎對待。投資者據(jù)此操作，風(fēng)險(xiǎn)自擔(dān)。

[No. ]
分享到微信