行業(yè)大模型卷卷更健康

2023年06月15日 18:07:56 周享玥‍‍ 編輯：趙艷秋 來(lái)源：微信公眾號(hào)：數(shù)智前線(xiàn)

　　無(wú)論是巨頭，還是有點(diǎn)規(guī)模的企業(yè)，都在做行業(yè)大模型，未來(lái)幾個(gè)月將迎來(lái)密集發(fā)布期。但不得不正視的一個(gè)現(xiàn)實(shí)時(shí)，大多其實(shí)都還停留在講概念、講技術(shù)、進(jìn)行內(nèi)部測(cè)試或項(xiàng)目定制的階段。

　　本周，一位互聯(lián)網(wǎng)人士分享了一個(gè)小故事——幾天前，他曾遇見(jiàn)一幫創(chuàng)業(yè)青年，在交流的過(guò)程中，對(duì)方告訴他，他們搜集了一大堆修車(chē)相關(guān)的案例和知識(shí)，想問(wèn)問(wèn)他能不能提供通用大模型的能力基礎(chǔ)，來(lái)幫助他們?nèi)ビ?xùn)練一個(gè)修車(chē)行業(yè)的大模型出來(lái)，以便讓中國(guó)1000萬(wàn)修車(chē)工都能擁有20年老師傅的功力。

　　“這是一個(gè)典型的行業(yè)的能力。”在他看來(lái)，今天有太多垂直領(lǐng)域，其實(shí)是ChatGPT等通用大模型解決不了的，例如面對(duì)修車(chē)問(wèn)題，他們都只能泛泛而談，“未來(lái)大模型這個(gè)產(chǎn)業(yè)怎么發(fā)展，我覺(jué)得還得往垂直化、產(chǎn)業(yè)化、企業(yè)化，甚至個(gè)人化發(fā)展”。

　　實(shí)際上，相關(guān)企業(yè)都已摩拳擦掌。互聯(lián)網(wǎng)大廠(chǎng)百度、阿里紛紛官宣伙伴計(jì)劃和工具鏈，聲稱(chēng)要讓每一個(gè)行業(yè)都能夠用上自己的大模型。各行各業(yè)的龍頭企業(yè)、創(chuàng)業(yè)公司，同樣馬力十足。金融、教育、醫(yī)療、自動(dòng)駕駛、智能物流、安防等多個(gè)領(lǐng)域的行業(yè)公司都已相繼傳出要推行業(yè)大模型的消息。

　　“全國(guó)都在大煉行業(yè)大模型”， “現(xiàn)在只要是上市公司或規(guī)模稍微大一點(diǎn)的企業(yè)，他們都會(huì)有。”相關(guān)推出行業(yè)大模型的企業(yè)的多位員工告訴數(shù)智前線(xiàn)。“預(yù)計(jì)幾個(gè)月后，行業(yè)大模型將會(huì)迎來(lái)一波密集發(fā)布的小高潮。”多位業(yè)界人士稱(chēng)。

　　大模型的戰(zhàn)事，已經(jīng)開(kāi)始從通用大模型，迅速卷向面向垂直領(lǐng)域的行業(yè)大模型。

　　01 行業(yè)大模型卷起來(lái)了

　　“現(xiàn)在我們?nèi)ジ蛻?hù)談，很多客戶(hù)也不太了解什么是行業(yè)大模型，但是一上來(lái)就說(shuō)，我需要你們的行業(yè)大模型。”百度智能云AI平臺(tái)副總經(jīng)理李景秋告訴數(shù)智前線(xiàn)。

　　她最近和很多企業(yè)進(jìn)行過(guò)溝通，發(fā)現(xiàn)一般會(huì)存在兩種情況，一種需要的是SFT（有監(jiān)督精調(diào)）的大模型，只需基于工具鏈去標(biāo)注幾百到幾千或者上萬(wàn)條數(shù)據(jù)，就已經(jīng)能達(dá)到企業(yè)需要的效果。但還有一種，一定需要構(gòu)建行業(yè)的預(yù)訓(xùn)練模型才能解決，也即打造一個(gè)行業(yè)大模型。

　　李景秋發(fā)現(xiàn)，尤其是教育、金融、能源方向，很多有行業(yè)數(shù)據(jù)和場(chǎng)景積累的龍頭企業(yè)都希望和大廠(chǎng)合作，構(gòu)建行業(yè)大模型，并進(jìn)一步孵化行業(yè)應(yīng)用，廣泛去服務(wù)上下游相關(guān)企業(yè)。

　　行業(yè)大模型的重大意義在于，通用大模型雖然具備涌現(xiàn)的能力，但如果原始數(shù)據(jù)里一點(diǎn)行業(yè)數(shù)據(jù)都沒(méi)有，那它對(duì)行業(yè)理解還是會(huì)存在局限性，而一旦存在知識(shí)上的局限性，行業(yè)大模型一定會(huì)有需求。“而且國(guó)內(nèi)的數(shù)據(jù)生態(tài)沒(méi)有那么開(kāi)放，每個(gè)企業(yè)都有大量沉默的行業(yè)數(shù)據(jù)，這些數(shù)據(jù)的價(jià)值，要通過(guò)行業(yè)大模型才能激活并發(fā)揮出來(lái)。”李景秋解釋稱(chēng)。

　　中科深智CTO宋健認(rèn)為，不管是從一些行業(yè)對(duì)專(zhuān)業(yè)知識(shí)的要求，還是從安全性、成本和效率問(wèn)題來(lái)看，行業(yè)大模型都是必然存在的。“尤其對(duì)我們數(shù)字人領(lǐng)域來(lái)講，實(shí)時(shí)性非常關(guān)鍵，用戶(hù)問(wèn)的問(wèn)題它要在一秒以?xún)?nèi)能回答，這個(gè)是通用大模型達(dá)不到的。”

　　但生成式AI大模型的確為數(shù)字人這個(gè)行業(yè)帶來(lái)了巨大的想象空間。宋健透露，之前，一套好用或者可以達(dá)標(biāo)的數(shù)字人后端對(duì)話(huà)系統(tǒng)，對(duì)他們來(lái)說(shuō)一直是道難題，數(shù)字人一般只能做到有一套簡(jiǎn)單的問(wèn)答系統(tǒng)，很難滿(mǎn)足用戶(hù)需求。例如在電商直播間，用戶(hù)能問(wèn)的問(wèn)題和問(wèn)法基本是被限制的，一旦說(shuō)法發(fā)生變化，后端的問(wèn)答系統(tǒng)可能就無(wú)法匹配。但大模型強(qiáng)大的語(yǔ)義理解能力為這個(gè)問(wèn)題提供了解決方案，讓用戶(hù)可以從“和一個(gè)很傻的白癡在聊天”，進(jìn)化到“可能跟一個(gè)比較聰明的正常人在聊天”。

　　“這個(gè)區(qū)別是非常大的。”宋健告訴數(shù)智前線(xiàn)，這也是他們?yōu)槭裁磸?月份開(kāi)始做相關(guān)準(zhǔn)備，并在5月正式推出面向虛擬人這一垂直領(lǐng)域的行業(yè)大模型——數(shù)智姜尚的原因。中科深智是國(guó)內(nèi)一家虛擬人公司，有數(shù)據(jù)顯示，其虛擬主播產(chǎn)品已服務(wù)超2000家客戶(hù)，占據(jù)主流電商平臺(tái)虛擬主播近70%的份額。

　　無(wú)獨(dú)有偶，大量的行業(yè)企業(yè)也已經(jīng)開(kāi)始行動(dòng)。

　　今年6月初舉行的2023國(guó)際通信展上，中國(guó)移動(dòng)在展臺(tái)上，展出了他們的“九天”行業(yè)大模型在網(wǎng)絡(luò)運(yùn)維領(lǐng)域的應(yīng)用�，F(xiàn)場(chǎng)工作人員演示，在有多個(gè)線(xiàn)頭交錯(cuò)的一臺(tái)電信設(shè)備中，行業(yè)大模型可以識(shí)別幾百個(gè)插線(xiàn)接口的情況，從而讓運(yùn)維人員可快速進(jìn)行光纖線(xiàn)纜的接插。同時(shí)，中國(guó)移動(dòng)也正在研發(fā)和內(nèi)測(cè)的一個(gè)客服的行業(yè)模型，未來(lái)可能會(huì)對(duì)外提供，帶頭人是中國(guó)移動(dòng)首席科學(xué)家馮俊蘭。后者自2013年9月加入移動(dòng)以來(lái)，就創(chuàng)建并帶領(lǐng)了中國(guó)移動(dòng)人工智能團(tuán)隊(duì) “九天”，至今已近10年。

　　而在此前的5月29日，中國(guó)聯(lián)通研究院副院長(zhǎng)、首席科學(xué)家唐雄燕也曾向外透露，中國(guó)聯(lián)通正在打造一個(gè)通用的、可適用于各網(wǎng)絡(luò)體系的通信大模型。中國(guó)電信更是早在4月底召開(kāi)的2023云生態(tài)大會(huì)上就表示，天翼云正在自研預(yù)訓(xùn)練大模型，并已進(jìn)入內(nèi)部測(cè)試階段，將在近期適當(dāng)時(shí)候面向市場(chǎng)發(fā)布。

　　安防行業(yè)的企業(yè)們同樣動(dòng)作頻頻。前不久的2023安博會(huì)上，AI大模型的身影堪稱(chēng)“扎堆涌現(xiàn)”。據(jù)不完全統(tǒng)計(jì)，現(xiàn)場(chǎng)至少有包括商湯科技、宇視科技、360智慧生活、熵基科技、聯(lián)匯科技、算能等在內(nèi)的6家不同賽道的頭部企業(yè)，都展示了自己的通用或行業(yè)大模型，及相關(guān)的應(yīng)用Demo。

　　安防行業(yè)“海大宇”三巨頭中的宇視科技在5月推了宇視AIoT行業(yè)大模型“梧桐”，并在此次安博會(huì)上展示了該行業(yè)大模型在Vlog等場(chǎng)景的應(yīng)用。它可將景區(qū)專(zhuān)業(yè)設(shè)備抓拍的游客游覽視頻，自動(dòng)生成vlog，配上文字和表情包。

　　多模態(tài)生物識(shí)別企業(yè)熵基科技設(shè)了一個(gè)自研大模型及技術(shù)專(zhuān)區(qū)，專(zhuān)門(mén)展示自己涵蓋了140億、70億、13億等多個(gè)參數(shù)規(guī)模版本在內(nèi)的BioCV大模型矩陣;人工智能企業(yè)聯(lián)匯科技也用了大量筆墨介紹自己百億級(jí)參數(shù)的視覺(jué)語(yǔ)言大模型OmModel，并表示下半年還會(huì)有一個(gè)V3(OmModel V3 )版本的發(fā)布;算力提供商算能則專(zhuān)門(mén)用了一個(gè)位置，來(lái)展示其與算法合作伙伴千視通合作推出的AI大模型訓(xùn)推一體機(jī)，并將應(yīng)用場(chǎng)景定位在了智慧網(wǎng)點(diǎn)、智慧職場(chǎng)、智慧巡檢、風(fēng)控監(jiān)督。

　　而在金融領(lǐng)域，包括中國(guó)農(nóng)業(yè)銀行、江蘇銀行、度小滿(mǎn)、奇富科技等都宣布推出了行業(yè)大模型。教育領(lǐng)域傳出過(guò)要推行業(yè)大模型的也不在少數(shù)，包括網(wǎng)易有道、學(xué)而思、淘云科技、孩子王等。6月11日，中公教育也宣布要與新華網(wǎng)聯(lián)合推出全三維數(shù)智人及職業(yè)教育行業(yè)大模型。

　　自動(dòng)駕駛、醫(yī)療、房產(chǎn)經(jīng)紀(jì)、智能物聯(lián)等多個(gè)領(lǐng)域也相繼有行業(yè)大模型涌出。4月，毫末智行宣布發(fā)布全球*自動(dòng)駕駛生成式大模型DriveGPT;5月，我愛(ài)我家宣布聯(lián)合第四范式推出行業(yè)*房產(chǎn)經(jīng)紀(jì)大模型1.0版本，深信服也將自己自研的安全GPT大模型進(jìn)行了首秀;同月底，互聯(lián)網(wǎng)醫(yī)療公司醫(yī)聯(lián)發(fā)布自研的醫(yī)療大語(yǔ)言模型MedGPT……

　　一場(chǎng)行業(yè)大模型熱潮正在快速到來(lái)。

　　02 用開(kāi)源還是自研？

　　當(dāng)市場(chǎng)在短短幾個(gè)月內(nèi)，迅速涌現(xiàn)出大量通用大模型和行業(yè)大模型時(shí)，一些變化也在悄然發(fā)生。

　　"GPT的API調(diào)用成本在3月份之后下降到了1/10，更重要的是，開(kāi)源業(yè)界在過(guò)去幾個(gè)月里變得特別繁榮。”云蝠智能創(chuàng)始人魏佳星告訴數(shù)智前線(xiàn)，大量開(kāi)源大模型的出現(xiàn)，讓他們?cè)诖蛟烀嫦蛑悄芸头I(lǐng)域的行業(yè)大模型時(shí)有了幾種不同的路徑選擇方案——要么自研，要么基于開(kāi)源大模型進(jìn)行微調(diào)，又或是采用閉源但接口價(jià)格不貴的大模型。

　　在對(duì)比了市場(chǎng)上的各類(lèi)開(kāi)源和閉源大模型的使用效果及成本后，云蝠智能最終采用了“自研小模型+開(kāi)源大模型+垂直語(yǔ)料”的路徑，于近期上線(xiàn)了10億參數(shù)的NLP神鶴大模型，可支持問(wèn)法自動(dòng)擴(kuò)寫(xiě)，大幅提高智能客服回復(fù)邏輯的完善度。其中，自研小模型主要負(fù)責(zé)核心的匹配邏輯，清華系公司智譜AI的ChatGLM-6B開(kāi)源大模型則用于支撐小模型完成不了的邊緣部分工作，例如對(duì)問(wèn)題相似度算法進(jìn)行支撐。

　　也有不少公司選擇“幾條腿一起走路”。

　　“百度文心一言，以及其他的一些模型，我們也都在用，只是用的地方不太一樣。”中科深智CTO宋健告訴數(shù)智前線(xiàn)，在一些實(shí)時(shí)性、專(zhuān)業(yè)性以及數(shù)據(jù)安全性等要求較高的場(chǎng)景，例如虛擬助播，他們一般會(huì)用上自己自研行業(yè)大模型，但在一些通用場(chǎng)景，也會(huì)用到文心一言或其他大模型。

　　“這并不矛盾，這些大的互聯(lián)網(wǎng)公司的千億級(jí)通用大模型還是有它的優(yōu)勢(shì)的，我們并不會(huì)把所有的需求都在我們自己的模型上去滿(mǎn)足。”宋健說(shuō)。在他看來(lái)，在這個(gè)各種商業(yè)模型剛推出不久，尚未十分成熟的階段，很多企業(yè)都會(huì)去考慮“還有沒(méi)有其他選擇”。

　　熵基科技的一位人士也告訴數(shù)智前線(xiàn)，他們目前的行業(yè)大模型打造路徑，既有自研的，也會(huì)基于開(kāi)源大模型進(jìn)行微調(diào)，二者“互相借鑒”。

　　值得一提的是，多位業(yè)內(nèi)人士均認(rèn)為，在當(dāng)下的情況下，出于對(duì)成本、進(jìn)入門(mén)檻和速度等的考慮，開(kāi)源大概率會(huì)成為接下來(lái)一個(gè)非常關(guān)鍵的領(lǐng)域。一方面，從事大模型開(kāi)源的可能會(huì)越來(lái)越多;另一方面，在開(kāi)源大模型的基礎(chǔ)上去調(diào)試自己的東西，也會(huì)成為一個(gè)主流。

　　“我覺(jué)得90%以上的在未來(lái)都會(huì)用開(kāi)源模型。”一位業(yè)內(nèi)資深人士表示，這就像當(dāng)初的Web服務(wù)器、數(shù)據(jù)庫(kù)等互聯(lián)網(wǎng)基礎(chǔ)設(shè)施，最后在市場(chǎng)上留下來(lái)的，除了少量私有，其余絕大部分場(chǎng)景用的都是開(kāi)源的。

　　“但就現(xiàn)階段而言，你也不能對(duì)某個(gè)大模型依賴(lài)過(guò)重，畢竟戰(zhàn)局還沒(méi)有最后確認(rèn)下來(lái)。”魏佳星強(qiáng)調(diào)，這就好比10年前安卓、塞班、黑莓等一堆底層操作系統(tǒng)廠(chǎng)商在干架，一旦某家企業(yè)對(duì)某個(gè)操作系統(tǒng)過(guò)于依賴(lài)，后期它的方案又長(zhǎng)期跟不上迭代，這家企業(yè)就會(huì)吃虧。

　　在他看來(lái)，基于開(kāi)源大模型做行業(yè)大模型的企業(yè)，在盡可能跟市場(chǎng)上這些開(kāi)源大模型結(jié)合的同時(shí)，又要解耦。他舉例稱(chēng)，云蝠智能的行業(yè)大模型雖然與GLM是對(duì)接的，但都是用的提示詞的形式來(lái)對(duì)接，耦合度很低的，“我隨便換一個(gè)模型，一下就能換掉”。

　　上述熵基科技的人士也透露，他們自研的大模型參數(shù)目前會(huì)相對(duì)小一點(diǎn)，但其會(huì)將基于開(kāi)源大模型微調(diào)的模型作為老師或參照物，在對(duì)比學(xué)習(xí)中持續(xù)進(jìn)步，避免對(duì)開(kāi)源大模型形成過(guò)度依賴(lài)，且最終落到產(chǎn)品里面的，都會(huì)是他們的自研大模型。

　　在終局到來(lái)之前，行業(yè)大模型市場(chǎng)的玩家們都需要在謹(jǐn)慎中前行。

　　03 故事剛剛開(kāi)始

　　搞行業(yè)大模型的玩家一個(gè)接著一個(gè)，但就目前來(lái)看，大多其實(shí)都還停留在講概念、講技術(shù)、進(jìn)行內(nèi)部測(cè)試或項(xiàng)目定制的階段。

　　上述熵基科技的人士告訴數(shù)智前線(xiàn)，他們目前在探索落地上都還是項(xiàng)目制的，比如他們正和一家醫(yī)院一起，用自研大模型，做一個(gè)導(dǎo)診臺(tái)的問(wèn)詢(xún)機(jī)器人，但現(xiàn)在具體的成熟產(chǎn)品還沒(méi)有，“還在測(cè)”。而在2023安博會(huì)上，數(shù)智前線(xiàn)發(fā)現(xiàn)，現(xiàn)場(chǎng)強(qiáng)調(diào)了自己的大模型能力的企業(yè)，也大多只展示了他們的大模型技術(shù)或相關(guān)應(yīng)用場(chǎng)景的Demo。

　　一位互聯(lián)網(wǎng)大廠(chǎng)資深人士也透露，他們目前基本上都還在項(xiàng)目定制階段，著重在提煉需求，積累數(shù)據(jù)。

　　百度智能云AI平臺(tái)副總經(jīng)理李景秋則表示，現(xiàn)在來(lái)找到他們做行業(yè)大模型的，都是行業(yè)內(nèi)的龍頭，百度雖然在19年就和浦發(fā)銀行、國(guó)家電網(wǎng)一起推出了金融、能源行業(yè)大模型(非生成式)，且目前已有11個(gè)行業(yè)大模型(非生成式)的輸出，但具體到最新的生成式行業(yè)大模型的應(yīng)用落地上，還得等幾個(gè)月時(shí)間，預(yù)計(jì)會(huì)在今年之內(nèi)實(shí)現(xiàn)。

　　一個(gè)毋庸置疑的事實(shí)是，即使離落地還有一段距離，但大家的確都在奔著這一方向去努力。畢竟，國(guó)內(nèi)絕大部分企業(yè)的一大特色正是需要*時(shí)間考慮落地問(wèn)題，將做的東西盡快變現(xiàn)。而大模型也只有跟用戶(hù)的場(chǎng)景去進(jìn)行大量結(jié)合，才能不斷自我進(jìn)化、修正和完善。正如科大訊飛董事長(zhǎng)劉慶峰在6月9日的一場(chǎng)發(fā)布會(huì)上的斷言，在大模型領(lǐng)域，“誰(shuí)能在具備社會(huì)剛需的應(yīng)用場(chǎng)景落地，誰(shuí)就能*形成自我造血的良性循環(huán)。”

　　“我們首先要把目前已經(jīng)達(dá)到的能力，盡快去落地，其次則是在語(yǔ)言模型的基礎(chǔ)上去做多模態(tài)的擴(kuò)充。”宋健告訴數(shù)智前線(xiàn)，這是他們現(xiàn)階段*先級(jí)要解決的兩大問(wèn)題。為此，他們最近已經(jīng)在將一款基于自研大模型的產(chǎn)品——虛擬助播進(jìn)行市場(chǎng)推廣。據(jù)介紹，基于自有大語(yǔ)言模型GenSense數(shù)智姜尚，虛擬助播將可以與主播及評(píng)論區(qū)進(jìn)行順暢對(duì)話(huà)，并保證快速抓屏回答問(wèn)題、反饋低延時(shí)和高識(shí)別準(zhǔn)確率。

　　不過(guò)，宋健也發(fā)現(xiàn)，在行業(yè)大模型落地的過(guò)程中，仍然有不少困難和挑戰(zhàn)需要去解決。其中最關(guān)鍵的就在于，當(dāng)把大模型的能力落到某個(gè)實(shí)際場(chǎng)景的應(yīng)用產(chǎn)品上時(shí)，由于沒(méi)有參照，其實(shí)是并不好判斷具體該如何用這些模型的，“還是要做非常多的方法的革新，以及處理方式的變化”。

　　例如在將虛擬助播這個(gè)產(chǎn)品用到電商直播場(chǎng)景時(shí)，由于每個(gè)直播間并不一樣，賣(mài)的產(chǎn)品品類(lèi)也不盡相同，進(jìn)而導(dǎo)致促銷(xiāo)方式也大為不同，因此往往需要精確挖掘每個(gè)直播間的需求，探索在成本可控的情況下，如何更好地讓不同直播間的數(shù)據(jù)和語(yǔ)言大模型去做結(jié)合。“是利用微調(diào)，還是用外部數(shù)據(jù)，又或是通過(guò)插件的方式進(jìn)行，這些東西在不同場(chǎng)景下，用法其實(shí)是不一樣的，得到的結(jié)果也不一樣。”宋健解釋說(shuō)。

　　他判斷，在今年下半年，大部分的行業(yè)企業(yè)可能都會(huì)將主要的時(shí)間花在如何把大模型用下去上，反而是大模型本身怎么煉制這些東西不再是重點(diǎn)。

　　當(dāng)然，行業(yè)大模型的故事其實(shí)才剛剛開(kāi)始。各行各業(yè)的玩家們，都對(duì)它寄予了不小的期望。

　　宋健所在的數(shù)字人行業(yè)，寄希望于大模型能夠讓數(shù)字人成功邁入下一階段，即變得具有成長(zhǎng)性、全面?zhèn)€性化，而不是像以前一樣“千篇一律”。而魏佳星認(rèn)為，大模型短期內(nèi)有望提高智能客戶(hù)的智能度，并提高增強(qiáng)其事后的BI能力，長(zhǎng)期則有可能形成完全基于生成式的AI智能客服。更多的人，希望它能賦能工業(yè)質(zhì)檢、醫(yī)療導(dǎo)診、教學(xué)等諸多更廣泛的場(chǎng)景。

　　“但從邏輯上講，行業(yè)大模型一定會(huì)是在精度相對(duì)較低、容錯(cuò)率較高的行業(yè)先引用，再到精度要求高的地方去。”魏佳星表示。

　　文章內(nèi)容僅供閱讀，不構(gòu)成投資建議，請(qǐng)謹(jǐn)慎對(duì)待。投資者據(jù)此操作，風(fēng)險(xiǎn)自擔(dān)。

[No. ]
分享到微信