ChatGPT冷觀察：沒有大模型的土壤，開不出ChatBot的花

2023年02月17日 10:57:33 葉遠(yuǎn)風(fēng) 來源：智能相對論

　　文|智能相對論

　　作者|葉遠(yuǎn)風(fēng)

　　誰在跟風(fēng)，誰又有真本事能做出中國版的對標(biāo)產(chǎn)品來?

　　這恐怕是ChatGPT這股熱潮以來，關(guān)心中國AI發(fā)展的業(yè)界人士最想問的問題。

　　或者說，在中國人工智能不落后于全世界的當(dāng)下，業(yè)界也在普遍渴望一個真正有實力的ChatGPT類產(chǎn)品出現(xiàn)。

　　但是，在一個人人都有那么點AI底子、能說出一些AI技術(shù)成果的今天，如果沒有專業(yè)的、系統(tǒng)的判斷標(biāo)準(zhǔn)，這個問題可能很難有答案——風(fēng)潮下人人都像是跟風(fēng)的，也都像是有能力的。

　　不過，IDC剛剛發(fā)布的一個關(guān)于大模型的報告，卻某種程度上“附帶”解決了這個問題。

　　在《2022中國大模型發(fā)展白皮書》中，面向大模型的發(fā)展，IDC在行業(yè)首次提出大模型評估框架，通過多維度標(biāo)準(zhǔn)，對行業(yè)主要大模型的發(fā)展?fàn)顩r進(jìn)行了系統(tǒng)化的判斷和評分。

　　當(dāng)大模型能力的判斷有了較為權(quán)威的行業(yè)標(biāo)準(zhǔn)后，誰能做出真正的ChatGPT類產(chǎn)品，其實已經(jīng)有了答案。

　　ChatGPT是AI的一大步，但只是大模型的一小步

　　在問能不能之前，先要問是什么。

　　雖然ChatGPT的問世已經(jīng)有數(shù)個月的時間，但對多數(shù)人尤其是行業(yè)外的“吃瓜群眾”而言，除了知道這是AI領(lǐng)域的一大突破外，對它究竟是什么并沒有深入地了解。

　　實際上，ChatGPT就是一種大規(guī)模語言模型(LLM Large Language Model)，是大模型在NLP領(lǐng)域不斷發(fā)展的一種結(jié)果。

　　從技術(shù)角度看，目前大模型已經(jīng)深入各個AI領(lǐng)域，如NLP、CV、科學(xué)計算等，但它最早發(fā)端于NLP，以谷歌的BERT、OpenAI的GPT和百度文心大模型為代表，參數(shù)規(guī)模逐步提升至千億、萬億，同時用于訓(xùn)練的數(shù)據(jù)量級也顯著提升。

　　隨著“大本營”NLP領(lǐng)域大模型的不斷進(jìn)化，最終OpenAI的GPT率先開出了ChatGPT這朵花。

　　所謂GPT，即Generative Pre-Trained Transformer，就是通過Transformer為基礎(chǔ)模型，使用預(yù)訓(xùn)練技術(shù)得到通用的文本模型。

　　GPT家族已經(jīng)先后擁有GPT-1，GPT-2，GPT-3，以及圖像預(yù)訓(xùn)練iGPT等模型，ChatGPT本質(zhì)就是GPT-3.5，只不過因為強(qiáng)大的對話能力突然爆火起來。不同的是，ChatGPT采用了新的指示學(xué)習(xí)(Instruction Learning)和人工反饋的強(qiáng)化學(xué)習(xí)(Reinforcement Learning from Human Feedback，RLHF)來指導(dǎo)模型的訓(xùn)練，前者帶來了理解能力，后者增強(qiáng)了模型效果。

　　無論如何，大模型良好的通用性、泛化性，以及顯著降低人工智能應(yīng)用門檻的優(yōu)勢，在ChatGPT上得到了淋漓盡致的展示。

　　從這個意義上看，任何NLP領(lǐng)域的大模型，在良好的發(fā)展之后，都會、都可以生長出自己的ChatGPT，或者，更專業(yè)的概念稱為ChatBot類產(chǎn)品。

　　“智能相對論”總結(jié)目前市面上領(lǐng)先的NLP大模型以及ChatBot產(chǎn)品如下：

　　從這個列表可以看出兩件事：

　　1、所有成型的ChatBot都只能是大模型發(fā)展的一種產(chǎn)品化結(jié)果，國外Google的Bard、國內(nèi)百度的文心一言(ERNIE Bot)都是如此，其本質(zhì)都是前期大模型家族的最新產(chǎn)品。

　　2、不管哪個ChatBot，能做得怎么樣，幾乎都取決于前期大模型家族的發(fā)展情況。

　　對大多數(shù)缺乏優(yōu)秀大模型基礎(chǔ)的廠商而言，要么必須花長周期重走一遍類似從“文心”到“文心一言”的路徑，要么就繞過大模型直接做ChatBot——其質(zhì)量可想而知。

　　而判斷大模型家族的基礎(chǔ)究竟如何，IDC的報告剛好就起到了作用。

　　此次IDC為了充分評估大模型技術(shù)能力、功能豐富度與底層深度學(xué)習(xí)平臺開發(fā)能力，以及對各行業(yè)賦能的實際效果，并考慮到大模型的未來商業(yè)化前景，搭建起了大模型評估框架V1.0：

　　最終，IDC中國將大模型市場服務(wù)劃分成了L1-L5五個層級(層級越高，廠商在大模型市場梯隊越靠前)，最終評價結(jié)果是當(dāng)前大部分廠商能力處于L2-L3層級。其中，最為凸顯的是唯一處在第一梯隊的百度文心大模型，產(chǎn)品能力、生態(tài)能力達(dá)到L4水平，應(yīng)用能力達(dá)到L3水平：

　　目前，被IDC高度評價的文心大模型已經(jīng)建設(shè)了包括基礎(chǔ)大模型(NLP、CV、跨模態(tài))、任務(wù)大模型、行業(yè)大模型三大類在內(nèi)的36個大模型。IDC認(rèn)為，百度文心大模型在產(chǎn)品能力上呈現(xiàn)出較強(qiáng)技術(shù)實力和平臺積累，“文心大模型+深度學(xué)習(xí)平臺”創(chuàng)新了人工智能研發(fā)應(yīng)用范式，滿足市場大規(guī)模落地需求，達(dá)到行業(yè)前端水平。

　　IDC中國副總裁兼首席分析師武連峰表示，“大模型的背后蘊(yùn)藏著一場人工智能落地模式的變革。如今火爆全球的ChatGPT背后的技術(shù)支撐正是大模型。沒有對大模型的長期投入，就不會誕生ChatGPT這樣的應(yīng)用。在IDC提出的大模型評估框架下，百度文心大模型在本次評估中表現(xiàn)非常突出，是其打造文心一言的堅實基礎(chǔ)。”

　　因此，國內(nèi)已經(jīng)宣布要做ChatGPT類產(chǎn)品的科技大廠中，能夠最終做出類ChatGPT產(chǎn)品的，可能還是只有擁有中國科技企業(yè)最成熟的大模型開發(fā)工具和產(chǎn)品體系的百度。

　　當(dāng)然，這個結(jié)果并不意外，國內(nèi)長期堅持在大模型領(lǐng)域投入的，百度就是其中一。

　　大模型評估框架下，ChatBot兩種發(fā)展路徑顯現(xiàn)

　　既然IDC以權(quán)威、系統(tǒng)的方式證明了國內(nèi)(主要是百度文心、文心一言)有充分的推出ChatBot的大模型基礎(chǔ)能力，那么為什么最先走出來被廣泛關(guān)注到的還是ChatGPT?

　　如果從文心的發(fā)展與GPT的發(fā)展對比來看，大模型時代，ChatBot的兩種發(fā)展路徑的不同已經(jīng)顯現(xiàn)出來。

　　早在2019年3月，百度就做出了文心 ERNIE 1.0，這一技術(shù)創(chuàng)新與“同類”GPT-1、BERT的差距都只有幾個月，且百度積累的大規(guī)模知識和海量多元數(shù)據(jù)，讓文心得以快速發(fā)展。

　　到了2021年，ERNIE 3.0大模型即擁有千億參數(shù)，后來ERNIE 3.0 Titan更是達(dá)到了2600億。

　　這個發(fā)展過程，百度也逐漸構(gòu)建起一套包括文心大模型層、工具平臺層、產(chǎn)品與社區(qū)的三層體系，這就是IDC在報告中強(qiáng)調(diào)的，“模型+工具平臺+生態(tài)”三級協(xié)同加速產(chǎn)業(yè)智能化。

　　說白了，百度從一開始就在想著怎么讓文心大模型進(jìn)產(chǎn)業(yè)、怎么落地獲得商業(yè)價值，也是按照這個“總綱”在走、在設(shè)計其整個體系。

　　最典型如，文心已累計發(fā)布11個行業(yè)大模型，在金融、能源、制造、城市、傳媒、互聯(lián)網(wǎng)等行業(yè)擁有實際落地的標(biāo)桿案例，盯住的是解決客戶的實際痛點，把大模型能力應(yīng)用到客戶業(yè)務(wù)流程關(guān)鍵環(huán)節(jié)中，求技術(shù)效果突破、求產(chǎn)品創(chuàng)新、求生產(chǎn)流程變革、求降本增效，等等。

　　在這些行業(yè)大模型往下，還有任務(wù)大模型、基礎(chǔ)大模型的全力支撐;再往上，又有工具、產(chǎn)品的落地轉(zhuǎn)化。

　　這種體系化面向產(chǎn)業(yè)的做法，一方面源于中國獨特的產(chǎn)業(yè)智能化需求的大背景，另一方面與百度將AI的發(fā)展更多地轉(zhuǎn)向現(xiàn)實產(chǎn)業(yè)價值有關(guān)。

　　如果說這種做法有什么后果，那就是集中B端落地、晦澀的技術(shù)和產(chǎn)品帶來的技術(shù)認(rèn)知不足。

　　現(xiàn)在，大洋彼岸的ChatGPT突然搞出了“大新聞”，舉起了旗幟，文心基于此前的能力積累也能做出類ChatGPT的面向C端大眾的ChatBot產(chǎn)品文心一言，于是，這就成了百度彰顯自身技術(shù)能力的一個契機(jī)。

　　反過來看，ChatGPT則先面向C端做出了老少咸宜的大眾化可觸達(dá)產(chǎn)品，相似的技術(shù)底子下，聲量自然就更高。

　　毫無意外的是，在OpenAI的布局中，ChatGPT接下來也會嘗試走入更多垂直產(chǎn)業(yè)中發(fā)揮價值。

　　最終，兩種路徑都將殊途同歸，實現(xiàn)B、C的全覆蓋，只是所處階段不同而已。

　　技術(shù)層不可跟風(fēng)也跟不了風(fēng)，但ChatBot產(chǎn)業(yè)應(yīng)用卻值得廣泛嘗試

　　做ChatBot，在技術(shù)層面不應(yīng)該跟風(fēng)上馬，它只能是LLM的一種自然的結(jié)果。

　　用更直接的話說，如果認(rèn)為ChatBot真的有用，想要造福自身業(yè)務(wù)或者惠及伙伴、客戶，更多缺乏基礎(chǔ)的科技大廠應(yīng)該沉下心來做這件事，而不是大干快上、急著表態(tài)。

　　跟風(fēng)哄抬股價、刺激關(guān)注并不可取，最終欺騙的是投資者和關(guān)心企業(yè)的人。

　　不過，在這股風(fēng)潮中，于產(chǎn)業(yè)方而言，卻并不存在什么跟風(fēng)不跟風(fēng)。

　　作為AI領(lǐng)域好不容易等來的確確實實可能改變價值認(rèn)知的產(chǎn)品，ChatBot在任何產(chǎn)業(yè)都值得嘗試，只要有益于業(yè)務(wù)都可以探索這股AI的全新力量。

　　之前，在ChatGPT被歸入的AIGC(生成式AI)場景下，百度文心已經(jīng)有大量的產(chǎn)業(yè)實踐。

　　例如，ERNIE 3.0文本理解與創(chuàng)作API，覆蓋寫作文、摘要、文案、小說、對聯(lián)等多項生成能力，每天服務(wù)上萬用戶;而基于文心大模型的智能視頻合成平臺則讓用戶在一鍵輸入新聞圖文內(nèi)容鏈接后，就可以自動化完成視頻制作，這些都大大提升了內(nèi)容創(chuàng)造的效率和質(zhì)量。

　　在文心一言推出后，已有攜程、汽車之家、愛藝奇、大量媒體機(jī)構(gòu)等宣布接入。

　　最近，百度方面還宣布，未來會推出生態(tài)合作計劃，要吸引和支持更多伙伴加入進(jìn)來，一起拓展覆蓋范圍更廣的商業(yè)市場。

　　在熱烈的預(yù)期之下，真實的產(chǎn)業(yè)成果正在被探索、走向落地。

　　值得一提的是，作為基于百度智能云技術(shù)打造出來的大模型，文心一言未來也將通過百度智能云對外提供服務(wù)，為產(chǎn)業(yè)帶來真正的AI普惠，這也將根本性地改變云市場的游戲規(guī)則。之前選擇云廠商更多看算力、存儲等基礎(chǔ)云服務(wù)，以后用戶對云廠商的需求更加聚焦智能服務(wù)，會更多關(guān)注模型、框架、芯片以及應(yīng)用，這四層架構(gòu)之間的協(xié)同。云服務(wù)正從數(shù)字時代躍遷到智能時代，智能化對各行各業(yè)效率的提升將顯著顯現(xiàn)。

　　正如IDC所言，各行業(yè)技術(shù)買家都應(yīng)該盡早擁抱大模型，利用大模型進(jìn)行降本增效、產(chǎn)品革新，“越早開始將大模型與自身行業(yè)、任務(wù)相結(jié)合，模型與技術(shù)之間才有更多的時間進(jìn)行打磨優(yōu)化，在未來大模型深入各行各業(yè)的時候才能擁有話語權(quán)”。

　　除了“看熱鬧”，想要在ChatGPT帶來的風(fēng)潮中抓住商業(yè)機(jī)會的企業(yè)，以及對ChatBot真正有需求的產(chǎn)業(yè)主體，都應(yīng)該行動起來了。

　　文章內(nèi)容僅供閱讀，不構(gòu)成投資建議，請謹(jǐn)慎對待。投資者據(jù)此操作，風(fēng)險自擔(dān)。

[No. ]
分享到微信