通用VS垂直，大模型走近第一個(gè)賽點(diǎn)

2023年05月18日 11:11:56 張未來(lái)源：深眸財(cái)經(jīng)(chutou0325)

　　作者：張未

　　原創(chuàng)：深眸財(cái)經(jīng)(chutou0325)

　　AI大模型的戰(zhàn)場(chǎng)正在分化。

　　Chatgpt作為導(dǎo)火索，打開(kāi)了AI2.0時(shí)代的大門(mén)，而AI2.0的特征便是“產(chǎn)業(yè)智能化、數(shù)字化”，能夠高效地替代人工，廣泛地運(yùn)用到各行各業(yè)，所以比起還在探索落地、已過(guò)了狂奔期的元宇宙，AI大模型的落地來(lái)得更實(shí)在些。

　　最典型的表現(xiàn)就是，AI大模型的出圈更廣泛，不止步于B端。比如，即便chatGPT發(fā)布半年有余，筆者在上海CBD樓下的咖啡廳還能聽(tīng)到打工人談?wù)揷hatGPT的聲音;據(jù)媒體報(bào)道，也有部分企業(yè)將AIGC作為生產(chǎn)力工具。

　　正如阿里巴巴集團(tuán)董事會(huì)主席兼CEO、阿里云智能集團(tuán)CEO張勇所說(shuō)：面向AI時(shí)代，所有產(chǎn)品都值得用大模型重做一次。

　　大廠、科研機(jī)構(gòu)和創(chuàng)業(yè)者，紛紛下場(chǎng)。

　　大廠有百度文心一言、華為盤(pán)古、360智腦、商湯日日新、阿里通義千問(wèn)、京東靈犀、昆侖萬(wàn)維天工等大模型先后登場(chǎng)，后續(xù)還有騰訊混元、科大訊飛星火等大模型排隊(duì)等著上線。

　　創(chuàng)業(yè)者也不乏名人，搜狗創(chuàng)始人王小川、美團(tuán)聯(lián)合創(chuàng)始人王慧文、創(chuàng)新工場(chǎng)董事長(zhǎng)李開(kāi)復(fù)等人高調(diào)入場(chǎng)AI大模型。

　　持續(xù)了幾月有余的AI大模型熱，衍生出了兩條道路。

　　1.AI軍備競(jìng)賽，大模型分化

　　AI大模型已經(jīng)進(jìn)入了競(jìng)賽階段，并且路徑逐漸分化。

　　隨著AI大模型逐漸加熱，有媒體統(tǒng)計(jì)，2月初，東方財(cái)富上“ChatGPT”板塊還只有29只股票，如今已經(jīng)達(dá)到61支，數(shù)量還在不斷攀升中。據(jù)不完全統(tǒng)計(jì)，截至目前，我國(guó)已有超過(guò)40家公司、機(jī)構(gòu)發(fā)布了大模型產(chǎn)品或公布了大模型計(jì)劃。

　　在其中，參與AI大模型這場(chǎng)“軍備競(jìng)賽”的玩家們也發(fā)展出了兩個(gè)發(fā)展方向。垂直大模型和通用大模型，正成為目前人工智能領(lǐng)域的兩個(gè)主要發(fā)展方向。

　　垂直大模型是指針對(duì)特定領(lǐng)域或任務(wù)進(jìn)行優(yōu)化設(shè)計(jì)的模型，例如語(yǔ)音識(shí)別、自然語(yǔ)言處理、圖像分類等。

　　當(dāng)前有越來(lái)越多的企業(yè)加入垂直大模型的賽道。學(xué)而思宣布正在進(jìn)行自研數(shù)學(xué)大模型的研發(fā)，命名為MathGPT，面向全球數(shù)學(xué)愛(ài)好者和科研機(jī)構(gòu);5月6日，淘云科技宣布推出兒童認(rèn)知大模型——阿爾法蛋兒童認(rèn)知大模型，為孩子在練表達(dá)、塑情商、啟創(chuàng)造、助學(xué)習(xí)等方面帶來(lái)全新交互體驗(yàn)。

　　通用大模型是指能夠處理多種任務(wù)和領(lǐng)域的模型，例如BERT、GPT等。

　　由于資金、人才等優(yōu)勢(shì)，大廠主要瞄準(zhǔn)通用大模型這個(gè)賽道。

　　大廠瞄準(zhǔn)通用大模型一方面是能夠?qū)I的能力與自身產(chǎn)品結(jié)合，比較有代表性的就是阿里、華為、百度等互聯(lián)網(wǎng)大廠和科技巨頭。

　　比如，繼微軟把GPT-4整合進(jìn)Office全家桶后，阿里“通義千問(wèn)”也開(kāi)始接入釘釘，用戶可以在文檔生成內(nèi)容，在視頻會(huì)議中能以參會(huì)者為單位，生成每個(gè)人的觀點(diǎn)和內(nèi)容。

　　像是百度的大模型也能結(jié)合自身業(yè)務(wù)，“文心一言”在對(duì)搜索引擎的迭代上能夠有質(zhì)的蛻變，能夠從用戶尋找答案，轉(zhuǎn)換為回答用戶問(wèn)題，包括騰訊“混元”、網(wǎng)易“玉言”、京東“ChatJD”均能夠優(yōu)先應(yīng)用于自身產(chǎn)業(yè)。

　　另一方面，通用性大模型的適用性較廣，先跑贏者能夠建立起先發(fā)優(yōu)勢(shì)，成為AI2.0時(shí)代的領(lǐng)路人。畢竟，“跑得快的有肉吃，跑得慢的只能吃剩下的邊角料”，這個(gè)道理誰(shuí)都懂。

　　垂直應(yīng)用大模型可謂是一股“清流”，由于垂直應(yīng)用大模型更符合垂類場(chǎng)景的需求、質(zhì)量比通用大模型更高，也讓眾多企業(yè)看到了其中的機(jī)會(huì)。比如深蘭、出門(mén)問(wèn)問(wèn)、有道等聚焦AI具體賽道的企業(yè)。

　　垂直大模型的發(fā)展主要體現(xiàn)在各個(gè)領(lǐng)域的模型性能持續(xù)提升，例如語(yǔ)音識(shí)別的錯(cuò)誤率逐年下降，自然語(yǔ)言處理的語(yǔ)義理解能力不斷提升等。通用大模型則在多任務(wù)學(xué)習(xí)、遷移學(xué)習(xí)等方面取得了顯著進(jìn)展，已經(jīng)成為自然語(yǔ)言處理領(lǐng)域的重要研究方向。

　　比如，生物大模型能夠提高AI制藥效率。國(guó)外的研究報(bào)告顯示，ai可以將新藥研發(fā)的成功率提高16.7%，ai輔助藥物研發(fā)每年能節(jié)約540億美元的研發(fā)費(fèi)用，并在研發(fā)主要環(huán)節(jié)節(jié)約40%至60%的時(shí)間成本。根據(jù)英偉達(dá)公開(kāi)資料，使用ai技術(shù)可使藥物早期發(fā)現(xiàn)所需時(shí)間縮短至三分之一，成本節(jié)省至兩百分之一。

　　在產(chǎn)業(yè)角度來(lái)看，通用模型就是“百科全書(shū)”，能夠有問(wèn)必答，能夠適用不同的產(chǎn)業(yè)土壤，而垂直模型類似于單領(lǐng)域的專家，雖然專業(yè)，但受眾注定是少數(shù)人。

　　2.數(shù)據(jù)是致命傷

　　垂直大模型的優(yōu)勢(shì)在于不夠“大”：算力不夠大、算法難度低。

　　王小川在入局大模型賽道后，就一直強(qiáng)調(diào)未來(lái)發(fā)力的方向并不是像OpenAI一樣去做AGI(通用人工智能)，而是垂直在某些特定的領(lǐng)域去做大模型，并實(shí)現(xiàn)落地應(yīng)用。

　　廣義上的大模型實(shí)際上是形容通用大模型，正如“大”模型之稱，大模型之所以“大”，就是因?yàn)閰?shù)眾多和數(shù)據(jù)量龐大，對(duì)算法、算力、數(shù)據(jù)存儲(chǔ)空間都有極大的要求，而這些不只是人才可以彌補(bǔ)的，還需要大量的資金。要知道，Open AI的成功也是微軟當(dāng)初用數(shù)十億美金堆出來(lái)的。巨大的資金需求，對(duì)大廠的研發(fā)決心也是一種考驗(yàn)。

　　過(guò)去5年，AI大模型的參數(shù)量幾乎每年提升一個(gè)數(shù)量級(jí)，例如GPT-4參數(shù)量是GPT-3的16倍，達(dá)到1.6萬(wàn)億個(gè);而隨著圖像、音視頻等多模態(tài)數(shù)據(jù)的引入，大模型的數(shù)據(jù)量也在飛速膨脹。這意味著想要玩轉(zhuǎn)大模型，必須擁有大算力。

　　做垂直大模型的企業(yè)，對(duì)比大廠來(lái)說(shuō)，資金、算力、數(shù)據(jù)較為匱乏，所以實(shí)際上和通用大模型玩家不在同一條起跑線上。

　　正如新能源車(chē)離不開(kāi)電機(jī)、電池、電控這三大件，AI大模型則離不開(kāi)算力、算法和數(shù)據(jù)的支持。

　　在算力、算法和數(shù)據(jù)中，數(shù)據(jù)是垂直大模型的難點(diǎn)。

　　三要素中，算法的研發(fā)難度相對(duì)較低，當(dāng)前的公司都有自己實(shí)現(xiàn)大模型的路徑算法，且有眾多開(kāi)源項(xiàng)目可參考。

　　芯片決定算力，AI大模型整體需要較高性能的芯片完成對(duì)整體模型神經(jīng)網(wǎng)絡(luò)的訓(xùn)練建構(gòu)，而當(dāng)前的芯片自研較少，還是以外采為主，像當(dāng)前最適應(yīng)ChatGPT的芯片就來(lái)自英偉達(dá)的旗艦芯片H100和次旗艦芯片A100。

　　難點(diǎn)在于數(shù)據(jù)。高質(zhì)量的數(shù)據(jù)是助力AI訓(xùn)練與調(diào)優(yōu)的關(guān)鍵，足夠多、足夠豐富的數(shù)據(jù)，是生成式AI大模型的根基。

　　據(jù)OpenAI此前披露，僅ChatGPT3參數(shù)數(shù)量已達(dá)到1750億，訓(xùn)練資料達(dá)到45TB。

　　由于中國(guó)移動(dòng)互聯(lián)網(wǎng)發(fā)展較為成熟，大量中文數(shù)據(jù)資源被存于各家企業(yè)或機(jī)構(gòu)里，較難共享。

　　“由于企業(yè)的很多業(yè)務(wù)數(shù)據(jù)、物流數(shù)據(jù)、財(cái)務(wù)數(shù)據(jù)等都是非常核心的私域數(shù)據(jù)，很難想象華星光電或者是中石油會(huì)把數(shù)據(jù)拿給人家去訓(xùn)練。”創(chuàng)新奇智CEO徐輝近日受證券時(shí)報(bào)采訪時(shí)也曾直言。

　　以AI制藥行業(yè)為例，生物大模型就面對(duì)被技術(shù)“卡脖子”的問(wèn)題。藥物研發(fā)對(duì)高精度實(shí)驗(yàn)數(shù)據(jù)獲取成本較高，且公開(kāi)數(shù)據(jù)庫(kù)中有大量無(wú)標(biāo)注數(shù)據(jù)，既要利用好大量無(wú)標(biāo)注數(shù)據(jù)，又要利用好少量高精度數(shù)據(jù)，所以對(duì)模型建構(gòu)提出了較高要求。

　　3.誰(shuí)先賺到第一桶金?

　　無(wú)論何種模式，商業(yè)化都是核心問(wèn)題。從目前擁有大模型的AI玩家來(lái)看，都在快速推進(jìn)賦能和商業(yè)化。

　　通用大模型和垂類大模型，雖走的路不同，但本質(zhì)還是“一家人”，處于同一個(gè)賽道中，所以避免不了競(jìng)爭(zhēng)這個(gè)問(wèn)題。

　　對(duì)于通用大模型而言，垂直大模型先落地，通用大模型的路會(huì)更窄。同樣，通用大模型先快速搶占市場(chǎng)后，業(yè)務(wù)線較窄的垂直大模型，要想賺錢(qián)就更為艱難。

　　在理想階段中，通用大模型無(wú)論是經(jīng)濟(jì)模型，還是普世價(jià)值，都是要優(yōu)于垂直大模型的�？墒�，現(xiàn)實(shí)生活不是烏托邦，通用大模型和垂類大模型誰(shuí)跑得更快，還得看各企業(yè)之間的比拼。

　　從去年大熱的AIGC來(lái)看。相比在C端讓用戶以較低的門(mén)檻使用AI生成內(nèi)容，B端被部分市場(chǎng)人士認(rèn)為將是AIGC更主要的商業(yè)模式。

　　華為也更注重于自己的ToB業(yè)務(wù)。在發(fā)布會(huì)上，華為表示，華為盤(pán)古大模型主要以AI賦能產(chǎn)業(yè)，運(yùn)用在電力、金融、農(nóng)業(yè)等多個(gè)行業(yè)，其中CV大模型落地礦山，NLP大模型落地智能文檔檢索。

　　像是以搜索引擎為所長(zhǎng)的百度，推出了類似GPT-3這樣具備搜索屬性的文心一言。

　　除了ChatGPT，實(shí)際上在AI大模型這陣風(fēng)吹起來(lái)之前就已有落地的場(chǎng)景了，這些“大”模型，實(shí)際以垂直大模型為主。

　　語(yǔ)言模型：如GPT、BERT等，主要應(yīng)用于自然語(yǔ)言處理領(lǐng)域，如機(jī)器翻譯、文本生成、情感分析等。

　　圖像模型：如ResNet、Inception等，主要應(yīng)用于計(jì)算機(jī)視覺(jué)領(lǐng)域，如圖像分類、目標(biāo)檢測(cè)、圖像分割等。

　　推薦模型：如DNN、RNN等，主要應(yīng)用于推薦系統(tǒng)領(lǐng)域，如商品推薦、廣告推薦等。

　　聊天機(jī)器人：如Seq2Seq、Transformer等，主要應(yīng)用于智能客服、智能助手等場(chǎng)景。

　　金融風(fēng)控：如XGBoost、LightGBM等，主要應(yīng)用于銀行、證券等金融機(jī)構(gòu)的風(fēng)控場(chǎng)景，如信用評(píng)分、反欺詐等。

　　醫(yī)療影像診斷：如DeepLung、DeepLesion等，主要應(yīng)用于醫(yī)療影像診斷領(lǐng)域，如肺癌診斷、病理學(xué)分析等。

　　比起落地，更重要的是賺錢(qián)。

　　據(jù)國(guó)盛證券報(bào)告《ChatGPT 需要多少算力》估算，GPT-3 訓(xùn)練一次的成本約為 140 萬(wàn)美元，對(duì)于一些更大的 LLM(大型語(yǔ)言模型)，訓(xùn)練成本介于 200 萬(wàn)美元至 1200 萬(wàn)美元之間。以 ChatGPT 在 1 月的獨(dú)立訪客平均數(shù) 1300 萬(wàn)計(jì)算，其對(duì)應(yīng)芯片需求為 3 萬(wàn)多片英偉達(dá)A100 GPU，初始投入成本約為 8 億美元，每日電費(fèi)在 5 萬(wàn)美元左右。

　　通用大模型在落地場(chǎng)景更廣泛毋庸置疑，對(duì)于有底氣地通用大模型的玩家來(lái)說(shuō)，商業(yè)化是其次，垂直類大模型，需要更快的商業(yè)化來(lái)兜底，所以垂直大模型的落地有更高的可能性和更快地普及速度。

　　誰(shuí)能先形成絕對(duì)優(yōu)勢(shì)還沒(méi)有肯定的答案。AI大模型的這場(chǎng)“軍備競(jìng)賽”，正如web1向web2的蝶變，企業(yè)爭(zhēng)分奪秒地向前跑，誰(shuí)先抓住了機(jī)會(huì)，就抓住了市場(chǎng)。

　　文章內(nèi)容僅供閱讀，不構(gòu)成投資建議，請(qǐng)謹(jǐn)慎對(duì)待。投資者據(jù)此操作，風(fēng)險(xiǎn)自擔(dān)。

[No. ]
分享到微信