當下大模型賽道的現(xiàn)狀:一邊是創(chuàng)業(yè)公司基于開源大模型速成,一邊是大廠在各種內(nèi)卷大模型參數(shù)。
據(jù)機構不完全統(tǒng)計,目前中國10億參數(shù)規(guī)模以上的大模型已發(fā)布79個。在大參數(shù)內(nèi)卷的過程中,市場開始出現(xiàn)另一種聲音“不具備發(fā)展方向的參數(shù)提升是沒有意義的”。
為此,在發(fā)展方向上,當下一部分大模型已經(jīng)聚焦到垂類領域應用;诔汕先f的模型發(fā)展,底座或許會發(fā)生改變,但仔細一想,也總需要有人能夠在垂類行業(yè)中跑出來。
同時,在發(fā)展初期,雖然閉源大模型在質量上更優(yōu),也相對安全,但大模型生態(tài)終究需要一定程度的內(nèi)卷,開源實際上可以助長大模型的繁榮。另一個角度,基于開源眾多企業(yè)有了賽道參賽的資格,但也總有人輕易就倒在了第一關匣——算力短缺。
說到底,大模型數(shù)量是在以倍數(shù)的數(shù)量在增長,但如果片面的看待大模型日益增長的數(shù)量,那么某種程度上也會忽略掉背后部分公司對大模型的抉擇、掙扎,甚至是選擇后放棄的可能性。
眾所周知,人工智能三要素是:算力、算法和數(shù)據(jù)。開源只是處于算法階段,之后企業(yè)還需要對其進行大量的算力支持和數(shù)據(jù)訓練,這背后的成本是高昂的。
一、垂直大模型,創(chuàng)業(yè)公司還有盼頭嗎?
在開源大模型選擇上,基于成本和定制開發(fā)的原因,選擇小參數(shù)模型的創(chuàng)業(yè)型企業(yè)不在少數(shù),甚至是該類企業(yè)的首選。
一個是預訓練成本問題。
國盛證券曾經(jīng)估算,GPT-3訓練一次的成本約為140萬美元,對于一些更大的LLM模型,訓練成本介于200萬美元至1200萬美元之間。
包括在今年1月,平均每天約有1300萬獨立訪客使用ChatGPT,對應芯片需求為3萬多片英偉達A100GPU,初始投入成本約為8億美元,每日電費在5萬美元左右。
更何況,在大量資金投入之前,還需要大量的數(shù)據(jù)資源來支撐模型訓練。為此,另一個原因是預訓練需求問題。
有業(yè)內(nèi)也曾表達過對此的看法:“大模型本身的泛化能力仍受限于數(shù)據(jù)。”
因為如果一旦對大模型的高質量數(shù)據(jù)篩選和訓練得過少,大模型的輸出質量問題是很明顯的,在體驗上,用戶的體驗感也會大大降低。
可以說,在預訓練的過程中,僅僅是在數(shù)據(jù)的積累上就已經(jīng)花費了大量的資金與時間。
更何況,在大模型賽道中,大多數(shù)的創(chuàng)業(yè)公司都是圍繞在行業(yè)垂直領域進行發(fā)展,付出雖然相對少,但一定不輕松。
具體一點來說就是,如果大模型要改變行業(yè)的商業(yè)模式的話,那么對此最簡單的判定標準就是,該類大模型是否具備的行業(yè)數(shù)據(jù)足夠多,例如要對藏在暗處的黑產(chǎn)要有足夠的了解,才能不被黑產(chǎn)所用,處于安全被動的狀態(tài)。
另一個判定的標準就是,大模型在運行之時所處理的數(shù)據(jù),最終輸出的質量如何。
說到底,想要基于開源模型去打破模型壟斷,還需要對大量的數(shù)據(jù)進行足夠的優(yōu)化提升,并且對基礎設施的投入足夠完善。
如今的開源大模型實際上更像是網(wǎng)絡時代的Android,沒有大廠的落地場景、數(shù)據(jù)積累等優(yōu)勢的創(chuàng)業(yè)公司,發(fā)展起來很不容易,但仍然存在機會。
事實上,達摩院也曾將“大小模型協(xié)作發(fā)展”視為未來趨勢之一。
就連創(chuàng)業(yè)公司追一科技相信“垂直大模型是堅實的機會,就像發(fā)現(xiàn)美洲大陸這件事遠不只成就了一人而已”。
于是如今我們可以看到眾多創(chuàng)業(yè)公司開始選擇入局大模型賽道,其中包括毫末智行、創(chuàng)新奇智、元語智能等AI創(chuàng)業(yè)公司所推出的DriveGPT雪湖·海若、奇智孔明、ChatYuan元語等大模型。
不過,國內(nèi)雖然尚未有產(chǎn)品面向C端,但基于B端,大廠已經(jīng)開始實現(xiàn)初步落地的過程中。
據(jù)悉,目前大廠都在計劃通過云的方式對外輸出大模型的能力,云計算成為A大模型落地的最佳方式,模型即服務(MaaS)越發(fā)受到關注,而這也將帶來大模型成本的降低。
那么,創(chuàng)業(yè)公司還存在盼頭嗎?
二、勝負在于產(chǎn)品體驗與市場需求相匹配?
根據(jù)權威雜志《Fast Company》預測,OpenAI 2023年的收入將達到2億美元,包括提供API數(shù)據(jù)接口服務、聊天機器人訂閱服務費等。
很顯然,各行業(yè)對大模型的需求是存在的,但基于安全性的考慮,加之to B對大模型亦步亦趨的態(tài)度,大模型當下安全系數(shù)有限。于是,在相對基礎,需求量高的對話、文檔內(nèi)容生成、問答,包括協(xié)同辦公中對話、文檔生成等眾多場景,互聯(lián)網(wǎng)大廠也在優(yōu)先做。
例如,現(xiàn)在人類只需要把商品的信息告訴AI,讓AI自動生成多種風格的商品帶貨腳本和風格,再配個數(shù)字人主播,就可以幫企業(yè)把貨給賣出去。據(jù)百度介紹,相比真人直播,數(shù)字直播可實現(xiàn)7*24小時不間斷直播,轉化率為無人直播間的2倍。
在云上基礎設施作為大模型創(chuàng)業(yè)的必要底座下,擁有云計算的互聯(lián)網(wǎng)大廠具有一定的優(yōu)勢。
根據(jù)IDC發(fā)布的2022年全球云計算IaaS市場追蹤數(shù)據(jù)來看,市場份額TOP10玩家都是中美的大公司,包括美國的亞馬遜、谷歌、微軟、IBM,中國的阿里、華為、騰訊、百度等。
雖然大模型的開閉源之爭,終究不會是靠某一個或幾個產(chǎn)品的出現(xiàn)而終結,還要更多頂尖人才參與、技術迭代和資金支持。
但橫做對比,眾多AI創(chuàng)業(yè)公司也缺少了一份如同創(chuàng)業(yè)獨角獸公司MiniMax的運氣。(不同的是MiniMax注重的是通用大模型)
7月20日,騰訊云對外披露助力MiniMax研發(fā)大模型的最新進展。目前,騰訊云長期支持MiniMax的千卡級任務穩(wěn)定運行在騰訊云上,可用性達99.9%。
據(jù)悉,自2022年6月起,基于算力集群、云原生、大數(shù)據(jù)、安全等產(chǎn)品能力,騰訊云為MiniMax搭建了從資源層、數(shù)據(jù)層到業(yè)務層的云架構。
現(xiàn)實似乎再度證明了,拿到入場券是第一步,接下來考驗的是市場玩家們探索商業(yè)化和技術升級的能力。直白一點來說,AI創(chuàng)業(yè)公司想要在賽道中跑到最后,每一步都不能落下。
某種程度上來說,在大模型研發(fā)上創(chuàng)業(yè)公司也并非全無優(yōu)勢。
雖然部分互聯(lián)網(wǎng)大廠已經(jīng)實現(xiàn)初步場景落地,亦或是開始售賣服務獲得收入,但大廠以及MiniMax的目光更多是聚焦在通用大模型上。
而垂直大模型仍然是真空地帶。特別是對于傳統(tǒng)企業(yè)群體來說,考慮到自身業(yè)務的IT屬性低、投出產(chǎn)比低等問題,選擇自研大模型的概率較低。
例如創(chuàng)新奇智聚焦在工業(yè)大模型產(chǎn)品“奇智孔明”;擁有一定數(shù)據(jù)優(yōu)勢,往語言上發(fā)展的ChatYuan元語大模型;主打自動駕駛生成式大模型DriveGPT雪湖·海若。
不過有一說一 ,訓練的數(shù)據(jù)和方向不同,成本差別很大。
先是元語大模型從零開始做一次訓練的成本能做到千萬人民幣量級。而在自動駕駛生成式領域上,比ChatGPT 多設計一套新的語言,緊接著再把所有的真實道路駕駛數(shù)據(jù),并“翻譯”成統(tǒng)一的語言的DriveGPT雪湖·海若,也存在著一定的成本投入。
某種程度上,AI創(chuàng)業(yè)公司能夠實現(xiàn)對大模型的大量投入,更多的是得益于ChatGPT商業(yè)和營銷方面的成功,能夠瞬間讓人們目睹了大模型的可落地性,而不是繼續(xù)隱匿在漫長的技術迭代中。
為此,當下實現(xiàn)落地的第一步,就是大模型的訓練成本、推理成本一定能做到比搜索還要低,而且還能保證即時性。
三、從概念到落地,到底有多難?
有觀點認為,能跑出來的中國大模型創(chuàng)業(yè)公司,很可能是垂直整合型。
簡單來說就是,一邊在做底層大模型的同時,找準一個模型最終的主應用場景,一邊收集用戶數(shù)據(jù)并做出快速的迭代。
目測,元語智能更偏向于這一類?偨Y起來看,在很長的一段時間內(nèi)元語智能都聚焦在自然語言大模型業(yè)務上。
元語COO朱雷并表示,“不會為了跟風盲目拓展圖片、視頻業(yè)務,元語的目標是實現(xiàn)‘ChatGPT’等前沿語言大模型的全面國產(chǎn)化。語言大模型的生態(tài)已經(jīng)足夠大了,做好業(yè)務聚焦很重要。”
但對于其他往自動駕駛、工業(yè)生產(chǎn)等垂直大模型發(fā)展的創(chuàng)業(yè)公司來說,或許缺乏對一些特殊的行業(yè)數(shù)據(jù)掌握。
畢竟,在垂直大模型賽道,未來企業(yè)競爭的一個核心因素,就是私有數(shù)據(jù)和私有經(jīng)驗,個體公司的流程并不被大模型者知曉時,可能就會有獨特的競爭力。
另外,業(yè)務聚焦的過程中,還需要到數(shù)據(jù)從源頭到預訓練、輸出的準確性。
目前,生成式人工智能在監(jiān)管上也正在受到更多關注。近日國內(nèi)發(fā)布了 《生成式人工智能服務管理辦法(征求意見稿)》,明確要求不得出現(xiàn)歧視,生成內(nèi)容應當真實準確、防止生成虛假信息等,如果出現(xiàn),除內(nèi)容過濾外,還要通過模型優(yōu)化等進行優(yōu)化。
但如果是作為生成式人工智能的固有缺陷,這在從技術上難以保證和徹底解決。
此外,在更好的開源模型的出現(xiàn),保不齊會伴隨著更多躍躍欲試的公司會涌進來,這對于創(chuàng)業(yè)公司來說,有何嘗不是競爭?
例如當下的Llama 2,7月18日,Meta公司發(fā)布了首個開源人工智能模型Llama的商業(yè)版本 Llama 2。有企業(yè)認為,根據(jù)現(xiàn)在的各種評測文檔,除了代碼能力差一些,其實很多地方已經(jīng)開始接近ChatGPT。
或許未來開源社區(qū)的狂熱浪潮會讓具備基礎能力的大模型普及化,以后私有化大模型就是白菜價。直白一點來說就是,企業(yè)可能會非常便宜地使用私有化大模型。
更重要的一個點是,湯道生曾表示:“通用大模型有很強的能力,但并不能解決很多企業(yè)的具體問題,在100個場景中可以解決70%—80%的問題,但未必能100%滿足企業(yè)某個場景的需求。但企業(yè)如果基于行業(yè)大模型,再加上自身數(shù)據(jù)進行精調(diào),可以建構專屬模型,打造出高可用的智能服務。”
當然,這種私有化大模型還未到來,但賽道中的創(chuàng)業(yè)公司,一定是機遇和困境齊具。
參考:
獵云網(wǎng):爭搶垂直大模型機遇,創(chuàng)業(yè)公司們拼了
中國經(jīng)濟新聞網(wǎng):騰訊云助力MiniMax打造大模型:規(guī)模超千卡,可用性達99.9%
搜狐AI報道:超30個國產(chǎn)大模型混戰(zhàn):華為百度阿里騰訊,誰能成為“中國的OpenAI”?
連線Insight:大模型競速賽,已經(jīng)開始拼場景、搶客戶了
科技新知:大模型打響開閉源之戰(zhàn)
文章內(nèi)容僅供閱讀,不構成投資建議,請謹慎對待。投資者據(jù)此操作,風險自擔。
京東11.11采銷直播探廠為消費者揭開答案。近日,京東3C數(shù)碼采銷走進武漢攀升工廠、合肥聯(lián)想工廠和科大訊飛展廳,通過直播帶貨廠商爆款產(chǎn)品,并為消費者帶來超值低價與福利。
奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。
“以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關材料,僅幾秒鐘,重慶市民曾某的賬戶就打進了21600元。
華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實質性的幫助,雙十一期間低至2799元,性價比很高,簡直是創(chuàng)作者們的首選。
9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會——工業(yè)互聯(lián)網(wǎng)標識解析專題論壇在沈陽成功舉辦。