焦慮的中國(guó)大客戶正“逼著”AI企業(yè)做大模型

2023年03月17日 14:43:58 文|黃幸怡編|石兆 來源：數(shù)智前線

　　中國(guó)行業(yè)龍頭和大用戶，對(duì)大模型創(chuàng)新和它帶來的新技術(shù)范式高度關(guān)注，甚至已經(jīng)開始倒逼國(guó)內(nèi)互聯(lián)網(wǎng)大公司和人工智能企業(yè)加速行動(dòng)。

　　文|黃幸怡

　　編|石兆

　　這兩天，大模型風(fēng)頭實(shí)在強(qiáng)勁。

　　3月15日，OpenAI剛帶著新出爐的GPT-4在全網(wǎng)刷屏，狂吸了一大波眼球，第二天，百度就帶著第一個(gè)中國(guó)版ChatGPT——文心一言亮相，又掀起一波熱潮。

　　雖然在朋友圈中，關(guān)于文心一言有不少吐槽，但不少業(yè)界人士也對(duì)數(shù)智前線表示，要對(duì)中國(guó)自己的大模型追趕者寬容一點(diǎn)，這其中不乏來自百度的競(jìng)爭(zhēng)對(duì)手。

　　而數(shù)智前線獲悉，中國(guó)行業(yè)龍頭和大用戶，對(duì)大模型創(chuàng)新和它帶來的新技術(shù)范式高度關(guān)注，甚至已經(jīng)開始倒逼國(guó)內(nèi)互聯(lián)網(wǎng)大公司和人工智能企業(yè)加速行動(dòng)。

　　發(fā)布會(huì)上，李彥宏也稱，文心一言還不能算完美，但為什么現(xiàn)在發(fā)布?是因?yàn)闊o論是百度內(nèi)部產(chǎn)品還是合作伙伴對(duì)大語言模型的需求都非常強(qiáng)烈，“大家都在催”。

　　文心一言謹(jǐn)慎發(fā)布

　　"千呼萬喚"中，文心一言終于亮相。3月16日下午兩點(diǎn)，百度創(chuàng)始人李彥宏帶著五個(gè)Demo(視頻短片)登臺(tái)展示，宣告了百度新一代大語言模型、生成式AI產(chǎn)品——文心一言的正式發(fā)布。

　　百度對(duì)于文心一言的預(yù)熱足足進(jìn)行了幾個(gè)月，卻在臨門一腳之際，碰上大洋彼岸的OpenAI 突然“插隊(duì)”發(fā)布多模態(tài)預(yù)訓(xùn)練大模型GPT-4 ，被搶了不少風(fēng)頭的同時(shí)，還難免被用來對(duì)比。

　　就比如，功能展示環(huán)節(jié)，百度使用提前錄好的Demo，就被不少人拿來和前一天OpenAI發(fā)布GPT-4 時(shí)的實(shí)時(shí)演示對(duì)比，被認(rèn)為“缺少了現(xiàn)場(chǎng)感”和“不太自信”。

　　GPT-4是ChatGPT之前使用的大模型GPT-3.5的升級(jí)版，與前代相比，文本輸入上限提升至2.5萬字，回復(fù)的準(zhǔn)確性提高，更重要的是，可以讀圖了，且很會(huì)“做題”，包括之前被吐槽的數(shù)學(xué)題。在SAT考試中，它拿下700分，GRE幾乎滿分，在律師模擬考試中能考到前10%，而GPT-3.5只考到倒數(shù)10%。而這些，很多其實(shí)也并不為文心一言所有。

　　“大家的期望值是要對(duì)標(biāo) ChatGPT，甚至要對(duì)標(biāo)GPT-4，這個(gè)門檻還是很高的。全球大廠還沒有一個(gè)做出來的，百度是第一個(gè)。”發(fā)布會(huì)上，李彥宏如是表示。

　　圍繞文學(xué)創(chuàng)作、商業(yè)文案創(chuàng)作、數(shù)理邏輯推算、中文理解、多模態(tài)生成五個(gè)使用場(chǎng)景，他在現(xiàn)場(chǎng)演示了文心一言的一些能力：

　　幫劉慈欣續(xù)寫《三體》，分析推理于和偉和張魯一誰更高，給公司起名、寫slogan、寫新聞稿;解決了此前難倒過ChatGPT的“雞兔同籠”問題，也能理解“洛陽紙貴”，并以此寫一首藏頭詩;幫2023世界智能交通大會(huì)生成海報(bào)和宣傳視頻，還以一口四川話回答問題……

　　文心一言雖然在一些方面還比不上OpenAI的GPT產(chǎn)品，但業(yè)內(nèi)認(rèn)為，它在中文理解、一些多模態(tài)生成場(chǎng)景上將有一定優(yōu)勢(shì)。在多模態(tài)生成方面，文心一言目前的版本，能生成文字、圖片和語音，而生成視頻是世界級(jí)難題，包括谷歌在內(nèi)的企業(yè)，實(shí)現(xiàn)的效果還差強(qiáng)人意，百度也未對(duì)所有用戶開放。

　　文心一言并未對(duì)全部用戶開放，采用了申請(qǐng)制，這是比較謹(jǐn)慎的做法。在新聞發(fā)布會(huì)后一小時(shí)內(nèi)，百度透露，排隊(duì)申請(qǐng)文心一言企業(yè)版API調(diào)用服務(wù)測(cè)試的企業(yè)用戶已達(dá)3萬多家，申請(qǐng)產(chǎn)品測(cè)試網(wǎng)頁多次被擠爆。

　　李彥宏稱，大語言模型一旦發(fā)布出來，就會(huì)獲得真實(shí)的反饋。有了用戶反饋之后，迭代速度、能力提升會(huì)加快。

　　中國(guó)客戶倒逼AI公司加快行動(dòng)

　　ChatGPT的爆火，最初引起國(guó)內(nèi)一眾人工智能企業(yè)和從業(yè)者的緊迫感，而現(xiàn)在，這種緊迫感，已經(jīng)傳導(dǎo)到了更廣闊的范圍，AI公司已經(jīng)開始被他們的客戶倒逼著開展一些行動(dòng)。

　　數(shù)智前線獲悉，國(guó)內(nèi)幾家大型互聯(lián)網(wǎng)公司和人工智能企業(yè)，最近幾乎都遇到過這樣的場(chǎng)景：來自各行各業(yè)的客戶紛紛找來，向他們咨詢和了解ChatGPT和大模型相關(guān)的內(nèi)容。

　　“而且?guī)缀跛腥硕际潜焕习灞浦鴣韱柕摹?rdquo;知情人士透露，尤其是行業(yè)龍頭企業(yè)和大型央國(guó)企，都有一種焦慮感。

　　大家普遍關(guān)注和擔(dān)心的點(diǎn)在于：這些人工智能企業(yè)和互聯(lián)網(wǎng)公司的大模型進(jìn)展情況如何?他們的技術(shù)是否跟上了潮流?客戶如果在業(yè)務(wù)中采用了這些公司做的人工智能技術(shù)，業(yè)務(wù)和創(chuàng)新能不能處于前沿?

　　這使得一些一開始并不打算“追風(fēng)”的人工智能企業(yè)，也在不得不在最近出來發(fā)聲，向外界和大客戶分享和介紹他們的大模型相關(guān)進(jìn)展。

　　實(shí)際上，如果單從大模型的數(shù)量和研發(fā)時(shí)間來看，中美并沒有不可逾越的距離。有數(shù)據(jù)顯示，自2020年起，中國(guó)的大模型數(shù)量驟增，僅2020年到2021年，中國(guó)大模型數(shù)量就從2個(gè)增至21個(gè)，和美國(guó)量級(jí)同等，大幅領(lǐng)先于其他國(guó)家。

　　具體到目前業(yè)界具有代表性的AI大模型上，國(guó)外的OpenAI在2021年發(fā)布120億參數(shù)的多模態(tài)大模型CLIP、DALL-E，同年谷歌發(fā)布ALIGN 、VIT-G/14時(shí)，國(guó)內(nèi)的百度已經(jīng)有了文心大模型，阿里也推出了國(guó)內(nèi)首個(gè)千億參數(shù)多模態(tài)大模型M6，華為和商湯紛紛在這年推出自己的大模型盤古和書生(INTERN)，騰訊則在2022年對(duì)外官宣了混元大模型。

　　參數(shù)規(guī)模上，國(guó)內(nèi)目前也已經(jīng)有不少能比肩ChatGPT的大模型，如百度的文心大模型參數(shù)量2600億，阿里的多模態(tài)大模型M6參數(shù)規(guī)模突破10萬億，據(jù)稱已經(jīng)遠(yuǎn)超谷歌、微軟的大模型參數(shù)規(guī)模，成為全球最大的AI預(yù)訓(xùn)練模型。

　　不過，不可否認(rèn)的是，從效果來看，國(guó)內(nèi)廠商的大模型距離領(lǐng)先的OpenAI仍然還有距離，需要國(guó)內(nèi)企業(yè)提速追趕。

　　曠視科技聯(lián)合創(chuàng)始人、CEO印奇認(rèn)為，國(guó)內(nèi)目前已經(jīng)公布的大模型，跟GPT-3.5還有較大差距。李開復(fù)也在最近表示，自己嘗試過一些所謂的中國(guó)ChatGPT，發(fā)現(xiàn)他們的確不如ChatGPT。

　　”這種差異歸咎于英語服務(wù)比中國(guó)競(jìng)爭(zhēng)者提供的數(shù)據(jù)更多、質(zhì)量更高。但在技術(shù)方面，有幾家公司給我留下了相當(dāng)深刻的印象“。李開復(fù)認(rèn)為，中國(guó)公司可能需要一年時(shí)間才能獲得同等或可能更大的數(shù)據(jù)量。

　　實(shí)際上，由于GPT-3之后，OpenAI的所有模型就沒有再開源，GPT-3.5、甚至GPT-4的運(yùn)行機(jī)制是什么，如何達(dá)成這種效果，仍需國(guó)內(nèi)企業(yè)進(jìn)一步去跑通。印奇認(rèn)為，中國(guó)攻堅(jiān) AI 大模型目前最重要的是要先能把GPT-3.5復(fù)現(xiàn)出來，"這是所有事情的起點(diǎn)"。

　　但這個(gè)過程并沒有想象的那么容易。相對(duì)于美國(guó)在基礎(chǔ)技術(shù)上的創(chuàng)新投入，中國(guó) AI 公司還是要面臨相對(duì)短周期商業(yè)化的壓力，而不可能像OpenAI和DeepMind一樣，“我們沒有那么奢侈的條件。”在印奇看來，中美在 AI 領(lǐng)域差距并沒有那么大，國(guó)內(nèi)只要迎頭趕上還是有優(yōu)勢(shì)的，但也“要有極強(qiáng)的危機(jī)感。”

　　大量小模型企業(yè)將要轉(zhuǎn)型

　　大模型出來之前，各行各業(yè)的小模型已經(jīng)運(yùn)行了一段時(shí)間。相比于大模型展現(xiàn)出的強(qiáng)大能力，做小模型的企業(yè)又將何去何從?

　　“咱們不能拿著錘子，看什么都是釘子，有些場(chǎng)景小模型已經(jīng)能滿足需求，就沒必要用大模型去解決它。”忻舟百度AI中臺(tái)總監(jiān)告訴數(shù)智前線，像門口閘機(jī)系統(tǒng)，基本上靠人臉識(shí)別就已經(jīng)用得很好了，就沒必要再用一個(gè)大模型去迭代。

　　但同時(shí)，忻舟和不少資深人士都認(rèn)為，大模型的確給碎片化場(chǎng)景和原來用小模型解決不好的場(chǎng)景，帶來改變。

　　在忻舟看來，大模型導(dǎo)致了AI產(chǎn)業(yè)應(yīng)用新范式的出現(xiàn)。"原來的范式是每個(gè)場(chǎng)景都有一個(gè)模型，需要專家做設(shè)計(jì)、標(biāo)注數(shù)據(jù)，新的范式卻是通用大模型加行業(yè)數(shù)據(jù)變成行業(yè)大模型，再針對(duì)不同場(chǎng)景使用少量數(shù)據(jù)就能得到場(chǎng)景的模型，場(chǎng)景的模型還可以做數(shù)據(jù)回流來增強(qiáng)行業(yè)大模型的能力。”

　　在他看來，這種新范式的出現(xiàn)，會(huì)給整個(gè)人工智能企業(yè)的服務(wù)生態(tài)帶來很大變化。例如，原來在一些單點(diǎn)為客戶提供服務(wù)，滿足他們某個(gè)領(lǐng)域如金融行業(yè)需求的創(chuàng)業(yè)公司，在大模型技術(shù)到來后，優(yōu)勢(shì)將大幅降低，這些企業(yè)如果想繼續(xù)活下去，就必須想辦法擁抱有大模型的企業(yè)，合作去做相關(guān)工作。

　　與此同時(shí)，大模型技術(shù)使得人工智能的門檻進(jìn)一步降低后，由于不需要每家企業(yè)從頭訓(xùn)練NLP或CV能力，會(huì)有更多的企業(yè)進(jìn)來，加劇整個(gè)行業(yè)的競(jìng)爭(zhēng)。這時(shí)，服務(wù)好、成本控制好、在大模型的基礎(chǔ)上有更多創(chuàng)新的企業(yè)，將被市場(chǎng)篩選出來，也會(huì)使原來亂報(bào)價(jià)的現(xiàn)象得到控制。

　　“我認(rèn)為他會(huì)給整個(gè)人工智能企業(yè)服務(wù)行業(yè)帶來一個(gè)正向結(jié)果。”忻舟表示。這是一個(gè)大的趨勢(shì)，尤其是創(chuàng)業(yè)企業(yè)，誰能最先擁抱這樣的趨勢(shì)來對(duì)自己的服務(wù)模式和商業(yè)模式做一定的改變，誰就更能夠在新AI時(shí)代活下來。

　　大模型的熱潮還將長(zhǎng)期持續(xù)。在大模型的落地部署上，此前一些問題正在出現(xiàn)一些新的解決方向。

　　比如大模型通常需要更大的算力消耗，尤其是昂貴的GPU，從而導(dǎo)致的高部署成本問題。數(shù)智前線獲悉，不少人工智能企業(yè)目前已經(jīng)可以通過一些方法探索如何更合理地控制成本。比如，推理時(shí)對(duì)模型進(jìn)行壓縮和蒸餾，使一個(gè)大的模型壓縮成一個(gè)小的模型，同時(shí)確保其效果不降或只降一點(diǎn)點(diǎn)，也能大幅節(jié)約成本。

　　事實(shí)上，據(jù)業(yè)內(nèi)人士透露，如何將模型做“小”正在成為大模型產(chǎn)業(yè)落地的一個(gè)重要課題。實(shí)在智能CEO孫林君此前就曾表示，大模型生態(tài)里，除了專用高質(zhì)量數(shù)據(jù)外，最重要的工作是基于預(yù)訓(xùn)練大模型跑出來的參數(shù)底座，去微調(diào)壓縮訓(xùn)練垂直領(lǐng)域內(nèi)的新的專用小模型，這可以降低算力和成本，同時(shí)提高自身產(chǎn)品的用戶體驗(yàn)。

　　又比如一些人擔(dān)心的大模型是否能私有化部署的問題。幾位業(yè)界人士告訴數(shù)智前線，大模型是可以支持私有云的。李彥宏也表示，圍繞文心一言，百度既有公有云服務(wù)，也可以做私有化部署。對(duì)于中國(guó)客戶青睞的私有化部署，國(guó)內(nèi)的企業(yè)都將提供和實(shí)踐性價(jià)比越來越高的方法。

　　文章內(nèi)容僅供閱讀，不構(gòu)成投資建議，請(qǐng)謹(jǐn)慎對(duì)待。投資者據(jù)此操作，風(fēng)險(xiǎn)自擔(dān)。

[No. ]
分享到微信