中國(guó)行業(yè)龍頭和大用戶,對(duì)大模型創(chuàng)新和它帶來的新技術(shù)范式高度關(guān)注,甚至已經(jīng)開始倒逼國(guó)內(nèi)互聯(lián)網(wǎng)大公司和人工智能企業(yè)加速行動(dòng)。
文|黃幸怡
編|石兆
這兩天,大模型風(fēng)頭實(shí)在強(qiáng)勁。
3月15日,OpenAI剛帶著新出爐的GPT-4在全網(wǎng)刷屏,狂吸了一大波眼球,第二天,百度就帶著第一個(gè)中國(guó)版ChatGPT——文心一言亮相,又掀起一波熱潮。
雖然在朋友圈中,關(guān)于文心一言有不少吐槽,但不少業(yè)界人士也對(duì)數(shù)智前線表示,要對(duì)中國(guó)自己的大模型追趕者寬容一點(diǎn),這其中不乏來自百度的競(jìng)爭(zhēng)對(duì)手。
而數(shù)智前線獲悉,中國(guó)行業(yè)龍頭和大用戶,對(duì)大模型創(chuàng)新和它帶來的新技術(shù)范式高度關(guān)注,甚至已經(jīng)開始倒逼國(guó)內(nèi)互聯(lián)網(wǎng)大公司和人工智能企業(yè)加速行動(dòng)。
發(fā)布會(huì)上,李彥宏也稱,文心一言還不能算完美,但為什么現(xiàn)在發(fā)布?是因?yàn)闊o論是百度內(nèi)部產(chǎn)品還是合作伙伴對(duì)大語言模型的需求都非常強(qiáng)烈,“大家都在催”。
01
文心一言謹(jǐn)慎發(fā)布
"千呼萬喚"中,文心一言終于亮相。3月16日下午兩點(diǎn),百度創(chuàng)始人李彥宏帶著五個(gè)Demo(視頻短片)登臺(tái)展示,宣告了百度新一代大語言模型、生成式AI產(chǎn)品——文心一言的正式發(fā)布。
百度對(duì)于文心一言的預(yù)熱足足進(jìn)行了幾個(gè)月,卻在臨門一腳之際,碰上大洋彼岸的OpenAI 突然“插隊(duì)”發(fā)布多模態(tài)預(yù)訓(xùn)練大模型GPT-4 ,被搶了不少風(fēng)頭的同時(shí),還難免被用來對(duì)比。
就比如,功能展示環(huán)節(jié),百度使用提前錄好的Demo,就被不少人拿來和前一天OpenAI發(fā)布GPT-4 時(shí)的實(shí)時(shí)演示對(duì)比,被認(rèn)為“缺少了現(xiàn)場(chǎng)感”和“不太自信”。
GPT-4是ChatGPT之前使用的大模型GPT-3.5的升級(jí)版,與前代相比,文本輸入上限提升至2.5萬字,回復(fù)的準(zhǔn)確性提高,更重要的是,可以讀圖了,且很會(huì)“做題”,包括之前被吐槽的數(shù)學(xué)題。在SAT考試中,它拿下700分,GRE幾乎滿分,在律師模擬考試中能考到前10%,而GPT-3.5只考到倒數(shù)10%。而這些,很多其實(shí)也并不為文心一言所有。
“大家的期望值是要對(duì)標(biāo) ChatGPT,甚至要對(duì)標(biāo)GPT-4,這個(gè)門檻還是很高的。全球大廠還沒有一個(gè)做出來的,百度是第一個(gè)。”發(fā)布會(huì)上,李彥宏如是表示。
圍繞文學(xué)創(chuàng)作、商業(yè)文案創(chuàng)作、數(shù)理邏輯推算、中文理解、多模態(tài)生成五個(gè)使用場(chǎng)景,他在現(xiàn)場(chǎng)演示了文心一言的一些能力:
幫劉慈欣續(xù)寫《三體》,分析推理于和偉和張魯一誰更高,給公司起名、寫slogan、寫新聞稿;解決了此前難倒過ChatGPT的“雞兔同籠”問題,也能理解“洛陽紙貴”,并以此寫一首藏頭詩;幫2023世界智能交通大會(huì)生成海報(bào)和宣傳視頻,還以一口四川話回答問題……
文心一言雖然在一些方面還比不上OpenAI的GPT產(chǎn)品,但業(yè)內(nèi)認(rèn)為,它在中文理解、一些多模態(tài)生成場(chǎng)景上將有一定優(yōu)勢(shì)。在多模態(tài)生成方面,文心一言目前的版本,能生成文字、圖片和語音,而生成視頻是世界級(jí)難題,包括谷歌在內(nèi)的企業(yè),實(shí)現(xiàn)的效果還差強(qiáng)人意,百度也未對(duì)所有用戶開放。
文心一言并未對(duì)全部用戶開放,采用了申請(qǐng)制,這是比較謹(jǐn)慎的做法。在新聞發(fā)布會(huì)后一小時(shí)內(nèi),百度透露,排隊(duì)申請(qǐng)文心一言企業(yè)版API調(diào)用服務(wù)測(cè)試的企業(yè)用戶已達(dá)3萬多家,申請(qǐng)產(chǎn)品測(cè)試網(wǎng)頁多次被擠爆。
李彥宏稱,大語言模型一旦發(fā)布出來,就會(huì)獲得真實(shí)的反饋。有了用戶反饋之后,迭代速度、能力提升會(huì)加快。
02
中國(guó)客戶倒逼AI公司加快行動(dòng)
ChatGPT的爆火,最初引起國(guó)內(nèi)一眾人工智能企業(yè)和從業(yè)者的緊迫感,而現(xiàn)在,這種緊迫感,已經(jīng)傳導(dǎo)到了更廣闊的范圍,AI公司已經(jīng)開始被他們的客戶倒逼著開展一些行動(dòng)。
數(shù)智前線獲悉,國(guó)內(nèi)幾家大型互聯(lián)網(wǎng)公司和人工智能企業(yè),最近幾乎都遇到過這樣的場(chǎng)景:來自各行各業(yè)的客戶紛紛找來,向他們咨詢和了解ChatGPT和大模型相關(guān)的內(nèi)容。
“而且?guī)缀跛腥硕际潜焕习灞浦鴣韱柕摹?rdquo;知情人士透露,尤其是行業(yè)龍頭企業(yè)和大型央國(guó)企,都有一種焦慮感。
大家普遍關(guān)注和擔(dān)心的點(diǎn)在于:這些人工智能企業(yè)和互聯(lián)網(wǎng)公司的大模型進(jìn)展情況如何?他們的技術(shù)是否跟上了潮流?客戶如果在業(yè)務(wù)中采用了這些公司做的人工智能技術(shù),業(yè)務(wù)和創(chuàng)新能不能處于前沿?
這使得一些一開始并不打算“追風(fēng)”的人工智能企業(yè),也在不得不在最近出來發(fā)聲,向外界和大客戶分享和介紹他們的大模型相關(guān)進(jìn)展。
實(shí)際上,如果單從大模型的數(shù)量和研發(fā)時(shí)間來看,中美并沒有不可逾越的距離。有數(shù)據(jù)顯示,自2020年起,中國(guó)的大模型數(shù)量驟增,僅2020年到2021年,中國(guó)大模型數(shù)量就從2個(gè)增至21個(gè),和美國(guó)量級(jí)同等,大幅領(lǐng)先于其他國(guó)家。
具體到目前業(yè)界具有代表性的AI大模型上,國(guó)外的OpenAI在2021年發(fā)布120億參數(shù)的多模態(tài)大模型CLIP、DALL-E,同年谷歌發(fā)布ALIGN 、VIT-G/14時(shí),國(guó)內(nèi)的百度已經(jīng)有了文心大模型,阿里也推出了國(guó)內(nèi)首個(gè)千億參數(shù)多模態(tài)大模型M6,華為和商湯紛紛在這年推出自己的大模型盤古和書生(INTERN),騰訊則在2022年對(duì)外官宣了混元大模型。
參數(shù)規(guī)模上,國(guó)內(nèi)目前也已經(jīng)有不少能比肩ChatGPT的大模型,如百度的文心大模型參數(shù)量2600億,阿里的多模態(tài)大模型M6參數(shù)規(guī)模突破10萬億,據(jù)稱已經(jīng)遠(yuǎn)超谷歌、微軟的大模型參數(shù)規(guī)模,成為全球最大的AI預(yù)訓(xùn)練模型。
不過,不可否認(rèn)的是,從效果來看,國(guó)內(nèi)廠商的大模型距離領(lǐng)先的OpenAI仍然還有距離,需要國(guó)內(nèi)企業(yè)提速追趕。
曠視科技聯(lián)合創(chuàng)始人、CEO印奇認(rèn)為,國(guó)內(nèi)目前已經(jīng)公布的大模型,跟GPT-3.5還有較大差距。李開復(fù)也在最近表示,自己嘗試過一些所謂的中國(guó)ChatGPT,發(fā)現(xiàn)他們的確不如ChatGPT。
”這種差異歸咎于英語服務(wù)比中國(guó)競(jìng)爭(zhēng)者提供的數(shù)據(jù)更多、質(zhì)量更高。但在技術(shù)方面,有幾家公司給我留下了相當(dāng)深刻的印象“。李開復(fù)認(rèn)為,中國(guó)公司可能需要一年時(shí)間才能獲得同等或可能更大的數(shù)據(jù)量。
實(shí)際上,由于GPT-3之后,OpenAI的所有模型就沒有再開源,GPT-3.5、甚至GPT-4的運(yùn)行機(jī)制是什么,如何達(dá)成這種效果,仍需國(guó)內(nèi)企業(yè)進(jìn)一步去跑通。印奇認(rèn)為,中國(guó)攻堅(jiān) AI 大模型目前最重要的是要先能把GPT-3.5復(fù)現(xiàn)出來,"這是所有事情的起點(diǎn)"。
但這個(gè)過程并沒有想象的那么容易。相對(duì)于美國(guó)在基礎(chǔ)技術(shù)上的創(chuàng)新投入,中國(guó) AI 公司還是要面臨相對(duì)短周期商業(yè)化的壓力,而不可能像OpenAI和DeepMind一樣,“我們沒有那么奢侈的條件。”在印奇看來,中美在 AI 領(lǐng)域差距并沒有那么大,國(guó)內(nèi)只要迎頭趕上還是有優(yōu)勢(shì)的,但也“要有極強(qiáng)的危機(jī)感。”
03
大量小模型企業(yè)將要轉(zhuǎn)型
大模型出來之前,各行各業(yè)的小模型已經(jīng)運(yùn)行了一段時(shí)間。相比于大模型展現(xiàn)出的強(qiáng)大能力,做小模型的企業(yè)又將何去何從?
“咱們不能拿著錘子,看什么都是釘子,有些場(chǎng)景小模型已經(jīng)能滿足需求,就沒必要用大模型去解決它。”忻舟百度AI中臺(tái)總監(jiān)告訴數(shù)智前線,像門口閘機(jī)系統(tǒng),基本上靠人臉識(shí)別就已經(jīng)用得很好了,就沒必要再用一個(gè)大模型去迭代。
但同時(shí),忻舟和不少資深人士都認(rèn)為,大模型的確給碎片化場(chǎng)景和原來用小模型解決不好的場(chǎng)景,帶來改變。
在忻舟看來,大模型導(dǎo)致了AI產(chǎn)業(yè)應(yīng)用新范式的出現(xiàn)。"原來的范式是每個(gè)場(chǎng)景都有一個(gè)模型,需要專家做設(shè)計(jì)、標(biāo)注數(shù)據(jù),新的范式卻是通用大模型加行業(yè)數(shù)據(jù)變成行業(yè)大模型,再針對(duì)不同場(chǎng)景使用少量數(shù)據(jù)就能得到場(chǎng)景的模型,場(chǎng)景的模型還可以做數(shù)據(jù)回流來增強(qiáng)行業(yè)大模型的能力。”
在他看來,這種新范式的出現(xiàn),會(huì)給整個(gè)人工智能企業(yè)的服務(wù)生態(tài)帶來很大變化。例如,原來在一些單點(diǎn)為客戶提供服務(wù),滿足他們某個(gè)領(lǐng)域如金融行業(yè)需求的創(chuàng)業(yè)公司,在大模型技術(shù)到來后,優(yōu)勢(shì)將大幅降低,這些企業(yè)如果想繼續(xù)活下去,就必須想辦法擁抱有大模型的企業(yè),合作去做相關(guān)工作。
與此同時(shí),大模型技術(shù)使得人工智能的門檻進(jìn)一步降低后,由于不需要每家企業(yè)從頭訓(xùn)練NLP或CV能力,會(huì)有更多的企業(yè)進(jìn)來,加劇整個(gè)行業(yè)的競(jìng)爭(zhēng)。這時(shí),服務(wù)好、成本控制好、在大模型的基礎(chǔ)上有更多創(chuàng)新的企業(yè),將被市場(chǎng)篩選出來,也會(huì)使原來亂報(bào)價(jià)的現(xiàn)象得到控制。
“我認(rèn)為他會(huì)給整個(gè)人工智能企業(yè)服務(wù)行業(yè)帶來一個(gè)正向結(jié)果。”忻舟表示。這是一個(gè)大的趨勢(shì),尤其是創(chuàng)業(yè)企業(yè),誰能最先擁抱這樣的趨勢(shì)來對(duì)自己的服務(wù)模式和商業(yè)模式做一定的改變,誰就更能夠在新AI時(shí)代活下來。
大模型的熱潮還將長(zhǎng)期持續(xù)。在大模型的落地部署上,此前一些問題正在出現(xiàn)一些新的解決方向。
比如大模型通常需要更大的算力消耗,尤其是昂貴的GPU,從而導(dǎo)致的高部署成本問題。數(shù)智前線獲悉,不少人工智能企業(yè)目前已經(jīng)可以通過一些方法探索如何更合理地控制成本。比如,推理時(shí)對(duì)模型進(jìn)行壓縮和蒸餾,使一個(gè)大的模型壓縮成一個(gè)小的模型,同時(shí)確保其效果不降或只降一點(diǎn)點(diǎn),也能大幅節(jié)約成本。
事實(shí)上,據(jù)業(yè)內(nèi)人士透露,如何將模型做“小”正在成為大模型產(chǎn)業(yè)落地的一個(gè)重要課題。實(shí)在智能CEO孫林君此前就曾表示,大模型生態(tài)里,除了專用高質(zhì)量數(shù)據(jù)外,最重要的工作是基于預(yù)訓(xùn)練大模型跑出來的參數(shù)底座,去微調(diào)壓縮訓(xùn)練垂直領(lǐng)域內(nèi)的新的專用小模型,這可以降低算力和成本,同時(shí)提高自身產(chǎn)品的用戶體驗(yàn)。
又比如一些人擔(dān)心的大模型是否能私有化部署的問題。幾位業(yè)界人士告訴數(shù)智前線,大模型是可以支持私有云的。李彥宏也表示,圍繞文心一言,百度既有公有云服務(wù),也可以做私有化部署。對(duì)于中國(guó)客戶青睞的私有化部署,國(guó)內(nèi)的企業(yè)都將提供和實(shí)踐性價(jià)比越來越高的方法。
文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請(qǐng)謹(jǐn)慎對(duì)待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。
2024年的Adobe MAX 2024發(fā)布會(huì)上,Adobe推出了最新版本的Adobe Creative Cloud。
奧維云網(wǎng)(AVC)推總數(shù)據(jù)顯示,2024年1-9月明火炊具線上零售額94.2億元,同比增加3.1%,其中抖音渠道表現(xiàn)優(yōu)異,同比有14%的漲幅,傳統(tǒng)電商略有下滑,同比降低2.3%。
“以前都要去窗口辦,一套流程下來都要半個(gè)月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。
華碩ProArt創(chuàng)藝27 Pro PA279CRV顯示器,憑借其優(yōu)秀的性能配置和精準(zhǔn)的色彩呈現(xiàn)能力,為您的創(chuàng)作工作帶來實(shí)質(zhì)性的幫助,雙十一期間低至2799元,性價(jià)比很高,簡(jiǎn)直是創(chuàng)作者們的首選。
9月14日,2024全球工業(yè)互聯(lián)網(wǎng)大會(huì)——工業(yè)互聯(lián)網(wǎng)標(biāo)識(shí)解析專題論壇在沈陽成功舉辦。