大模型，開始“搶人”

2023年05月15日 18:15:47 來(lái)源：價(jià)值星球Planet

　　作者 | 沙拉醬

　　編輯 | 麻吉

　　大模型越來(lái)越火，搶人大戰(zhàn)愈演愈烈。

　　在AIGC、ChatGPT的帶動(dòng)下，大模型概念開始被廣泛討論。2023年還未過(guò)半，就已經(jīng)有包括百度、阿里、騰訊、商湯、京東、科大訊飛等多家互聯(lián)網(wǎng)、AI公司陸續(xù)宣布對(duì)大模型展開探索。

　　誠(chéng)然，在大模型的技術(shù)和商業(yè)化進(jìn)程上，國(guó)內(nèi)相較于國(guó)外仍有一定差距。因此，大廠們毫不吝嗇地開出百萬(wàn)年薪來(lái)爭(zhēng)奪算法、深度學(xué)習(xí)等高級(jí)技術(shù)人才。

　　除此之外，大模型在中國(guó)這片土壤上要如何生長(zhǎng)，其商業(yè)化進(jìn)程又需要突破哪些瓶頸呢?

　　越來(lái)越“大”的大模型

　　AIGC和ChatGPT等熱詞帶動(dòng)下，大模型概念逐漸被關(guān)注。不過(guò)，大模型到底是什么，又能做什么，對(duì)很多人來(lái)說(shuō)，這個(gè)問(wèn)題的答案似乎很模糊。

　　一位中國(guó)傳媒大學(xué)計(jì)算機(jī)技術(shù)碩士，在知乎上這樣描述了大模型：如果說(shuō)模型是一個(gè)盒子，那么普通模型就是一個(gè)小盒子，因?yàn)槿萘坑邢蓿云涮幚砗痛鎯?chǔ)的數(shù)據(jù)、信息也有限。因此，普通模型可以完成分類、預(yù)測(cè)、生成等簡(jiǎn)單任務(wù);相較之下，大模型就是一個(gè)超級(jí)大倉(cāng)庫(kù)，往往需要數(shù)十億，甚至上百億個(gè)參數(shù)組成，可以完成更高級(jí)的思考和決策。比如，自然語(yǔ)言理解、語(yǔ)音識(shí)別、圖像識(shí)別等。

　　而這個(gè)大模型，到底有多“大”?舉例來(lái)說(shuō)，GPT-4使用了1750億規(guī)模的參數(shù)，微軟推出的Turing-NLG有1000億參數(shù)，谷歌則推出號(hào)稱有1.6萬(wàn)億模型參數(shù)的switch transformer。作為對(duì)照，我們?nèi)粘Ｊ褂玫闹悄苷Z(yǔ)音通常只有幾個(gè)億的參數(shù)。

　　雖然，在模型參數(shù)的規(guī)模上，國(guó)內(nèi)產(chǎn)品似乎仍落后一步——例如，率先推出文心一言的百度有100億參數(shù)、華為盤古大模型使用1000億參數(shù)。不過(guò)，過(guò)去的幾個(gè)月，陸續(xù)加速布局大模型的國(guó)內(nèi)公司卻如雨后春筍，其中包括阿里的通義大模型、騰訊的混元大模型、科大訊飛的訊飛星火、京東的ChatJD等等。

　　從目前國(guó)內(nèi)推出的幾款大模型產(chǎn)品來(lái)看，我們似乎仍在等待和尋找自己的“iPhone時(shí)刻”。無(wú)論是百度的文心一言、華為的盤古大模型，還是科大訊飛的訊飛星火，似乎仍停留在從自己原本的優(yōu)勢(shì)入手的“集大成者”，相對(duì)缺少更多的創(chuàng)新。

　　像是以搜索引擎為所長(zhǎng)的百度，推出了類似GPT-3這樣具備搜索屬性的文心一言。

　　華為的盤古大模型則更加專注于自己比較有優(yōu)勢(shì)的TO B業(yè)務(wù)。在發(fā)布會(huì)上，華為也表示，在過(guò)去的2022年，華為盤古大模型主要是AI for Industry(AI賦能產(chǎn)業(yè))，為煤礦、水泥、電力、金融、農(nóng)業(yè)等行業(yè)創(chuàng)造了更多產(chǎn)業(yè)價(jià)值，其中CV大模型早就有了許多用武之地。

　　比如在與能源公司合作的盤古礦山大模型案例中，礦井現(xiàn)場(chǎng)是一個(gè)40米長(zhǎng)的采掘機(jī)，寬度僅2米左右，傳統(tǒng)相機(jī)很難一下子捕捉到全部畫面，只能用圖中的九宮格視頻畫面。而通過(guò)5G+AI全景視頻拼接綜采畫面卷，傳輸?shù)降孛妫孛婀ぷ魅藛T將來(lái)可以實(shí)現(xiàn)地面控制機(jī)器進(jìn)行采礦，實(shí)現(xiàn)礦下無(wú)人、少人安全作業(yè)。

　　科大訊飛則是在深度神經(jīng)網(wǎng)絡(luò)算法方面擁有豐富經(jīng)驗(yàn)，尤其在語(yǔ)音識(shí)別和圖文識(shí)別方面水平過(guò)硬，其訊飛火星的體驗(yàn)頁(yè)面，就包含語(yǔ)音合成、聽寫、翻譯、文字識(shí)別等功能。

　　人才之爭(zhēng)

　　艾瑞咨詢?cè)趫?bào)告《ChatGPT浪潮下，看中國(guó)大語(yǔ)言模型產(chǎn)業(yè)發(fā)展》中討論過(guò)中外大模型研發(fā)的差距，其中表示，“對(duì)百度等國(guó)內(nèi)大廠而言，則在數(shù)據(jù)、算力、工程化能力等關(guān)鍵要素上存在短板，短期內(nèi)難以對(duì)國(guó)外領(lǐng)先大模型實(shí)現(xiàn)趕超，為跟隨者角色，長(zhǎng)期更需要國(guó)內(nèi)AI全產(chǎn)業(yè)鏈整體進(jìn)化。”

　　要補(bǔ)充短板，一個(gè)重要的因素，就是人才。因此，大廠也都紛紛行動(dòng)起來(lái)。

　　BOSS直聘上，百度、騰訊、阿里、螞蟻集團(tuán)等紛紛發(fā)布了相關(guān)崗位的招聘信息。其中，百度以25-40k/月招聘AI大模型算法工程師、20-40k/月招聘模型構(gòu)架工程師;螞蟻集團(tuán)以45-75k/月招聘深度學(xué)習(xí)大模型GPT工程師;阿里以40-70k/月招聘大模型訓(xùn)練及算法工程師;騰訊則以30-60k/月招聘大模型預(yù)訓(xùn)練方向的工程師... ...

　　值得注意的是，這些崗位幾乎都在一日內(nèi)被回復(fù)了超過(guò)10次，負(fù)責(zé)招聘的聯(lián)絡(luò)人也幾乎都是“正在活躍”的狀態(tài)。由此可見，求職者對(duì)于大模型相關(guān)崗位充滿信心，且招聘者也正在如火如荼地爭(zhēng)奪人才。

　　而從脈脈發(fā)布的《AIGC⼈才趨勢(shì)報(bào)告》中可以看出，自O(shè)pen AI推出的2021年以來(lái)，對(duì)于AIGC相關(guān)的人才爭(zhēng)奪就已經(jīng)開始了。2021年1-2月，AIGC相關(guān)崗位招聘同比上升281.88%，而后的2022年和今年的1-2月，招聘數(shù)量分別保持了76.74%和31.3%的同比增幅。

　　這些招聘中，純互聯(lián)網(wǎng)大廠占比超過(guò)33%，處于人才爭(zhēng)奪的主導(dǎo)位置。而且，大廠并不吝嗇給錢，圖像識(shí)別、深度學(xué)習(xí)、算法研究工程師的平均年薪超過(guò)了100萬(wàn)元人民幣。

　　不過(guò)，在具體的崗位需求上，目前國(guó)內(nèi)大模型相關(guān)人才的供需出現(xiàn)了部分偏差。從招聘者的角度而言，大廠們最緊缺的是算法工程師、自然語(yǔ)言處理、算法研究員等技術(shù)人員;而從求職者角度而言，大家投遞最多的簡(jiǎn)歷傾向于產(chǎn)品經(jīng)理、用戶運(yùn)營(yíng)等后端崗位。這能從側(cè)面反應(yīng)兩個(gè)問(wèn)題：其一，目前大模型技術(shù)相關(guān)人員仍是供不應(yīng)求;其二，目前大廠們對(duì)大模型的布局仍側(cè)重于技術(shù)研發(fā)，而非市場(chǎng)推廣。

　　此外，相較國(guó)外，目前國(guó)內(nèi)大模型人才的學(xué)術(shù)背景似乎也略遜一籌。比如，在AIGC相關(guān)人才的學(xué)歷背景中，本科和碩士占據(jù)了幾乎90%，博士生占比僅4%。相比之下，由科技情報(bào)分析機(jī)構(gòu)AMiner和智譜研究發(fā)布的《ChatGPT團(tuán)隊(duì)背景研究報(bào)告》顯示，ChatGPT研發(fā)團(tuán)隊(duì)中，本科、碩士和博士的占比分別為33%、30%、37%。

　　前路很長(zhǎng)

　　誠(chéng)然，人才的爭(zhēng)奪只是第一步，對(duì)不少大廠來(lái)說(shuō)，積極投入研發(fā)的最終意義是賺錢。而大模型目前的商業(yè)化分成了C端與B端兩個(gè)路徑方向——對(duì)于C端來(lái)說(shuō)，以GPT為例，通過(guò)開源方式將用戶和數(shù)據(jù)引進(jìn)來(lái)，再逐漸轉(zhuǎn)化成訂閱制;而就B端而言，比如Open AI與微軟Azure的合作，間接實(shí)現(xiàn)“模型即服務(wù)”，小B開發(fā)者可以調(diào)用其大模型API。

　　商業(yè)模式上，ChatGPT已經(jīng)明確指向API、訂閱制和戰(zhàn)略合作(嵌入微軟Bing、Office等軟件)三種營(yíng)收方式，且已在用戶數(shù)據(jù)積累、產(chǎn)品布局和生態(tài)建設(shè)層面充分領(lǐng)先;Google雖有意追趕，但由于聊天機(jī)器人這樣的產(chǎn)品形態(tài)對(duì)于其主營(yíng)的搜索引擎業(yè)務(wù)的助益有限，因此在與搜索引擎結(jié)合方面較為審慎，更希望借助大模型能力開展“模型即服務(wù)”范式，開拓其當(dāng)前市占率較低的云服務(wù)業(yè)務(wù)的市場(chǎng)空間。

　　國(guó)內(nèi)大廠也幾乎是在這兩條路上摸索。比如百度的文心一言更傾向于C端市場(chǎng)的探索，而“文心千帆”產(chǎn)品則劍指B端市場(chǎng)，意圖進(jìn)一步帶動(dòng)云服務(wù)營(yíng)收。

　　不過(guò)無(wú)論是靠哪一條“腿”走路，想要實(shí)現(xiàn)商業(yè)化，大模型產(chǎn)品仍需要解決幾個(gè)緊迫的問(wèn)題。

　　比如，信息準(zhǔn)確性�？萍夹袠I(yè)投資觀察員林允告訴價(jià)值星球：“大模型所輸出的內(nèi)容準(zhǔn)確性其實(shí)絕大部分取決于其底層數(shù)據(jù)的質(zhì)量。我自己在測(cè)試了國(guó)內(nèi)某廠推出的類GPT產(chǎn)品后，最大的感觸是，底層數(shù)據(jù)質(zhì)量還是有一定差距。”林允還補(bǔ)充道，用中文訓(xùn)練模型相較于英文也是沒有語(yǔ)言優(yōu)勢(shì)的。

　　但是，消費(fèi)者不會(huì)體會(huì)研發(fā)者的難處，一旦產(chǎn)品開啟訂閱制，用戶就會(huì)對(duì)產(chǎn)品輸出的內(nèi)容要求極其嚴(yán)苛。免費(fèi)使用的時(shí)候，用戶還能將錯(cuò)誤反饋當(dāng)成吐槽的笑話，但收費(fèi)之后，這些錯(cuò)誤可能就成了投訴的理由。

　　除此之外，在目前大模型較多應(yīng)用的文字和圖形創(chuàng)作上，如何保證原創(chuàng)性也成了一個(gè)關(guān)鍵問(wèn)題。一位AI從業(yè)者就表示，以AIGC為例，目前很多AIGC系統(tǒng)仍缺乏創(chuàng)造力，甚至不能獨(dú)立生成原創(chuàng)內(nèi)容，只能根據(jù)給定的模板或者指導(dǎo)生成相關(guān)內(nèi)容。而這可能會(huì)牽扯原創(chuàng)的道德問(wèn)題，以及更實(shí)際的，涉及版權(quán)資金的問(wèn)題。

　　最重要的是，大模型由于所需要的數(shù)據(jù)規(guī)模巨大，因此對(duì)算法、算力、數(shù)據(jù)存儲(chǔ)空間都有極大的要求，而這些不止是人才可以彌補(bǔ)的，還需要大量的資金。要知道，Open AI的成功也是微軟當(dāng)初用數(shù)十億美金堆出來(lái)的。巨大的資金需求，對(duì)大廠的研發(fā)決心也是一種考驗(yàn)。

　　但毋庸置疑的是，大模型已經(jīng)開始改造很多應(yīng)用場(chǎng)景。林允就表示，“以ChatGPT為例，它將會(huì)徹底改變?nèi)藗児ぷ鞯姆绞�，所以不論是搜索引擎為主的百度，還是發(fā)展云業(yè)務(wù)的阿里、騰訊、華為，大廠們對(duì)大模型的探索是無(wú)法阻擋的大勢(shì)所趨。只是進(jìn)展和成效如何，要邊走邊看。”

　　*文中林允為化名

　　文章內(nèi)容僅供閱讀，不構(gòu)成投資建議，請(qǐng)謹(jǐn)慎對(duì)待。投資者據(jù)此操作，風(fēng)險(xiǎn)自擔(dān)。

[No. ]
分享到微信